魔搭社區(qū)上線AI視頻生成工具Live Portait,可一鍵讓照片開口說(shuō)話

電商報(bào)
2023-08-16 14:15

阿里云在生成式AI領(lǐng)域又有新進(jìn)展。8月16日消息,阿里云推出數(shù)字人視頻生成工具Live Portait,上傳一張照片和一段文本或語(yǔ)音即可生成一段開口說(shuō)話的數(shù)字人視頻,可應(yīng)用于視頻直播、聊天機(jī)器人、企業(yè)營(yíng)銷等場(chǎng)景。目前,該工具已在魔搭社區(qū)創(chuàng)空間開放體驗(yàn)。

format-jpg

自對(duì)話大模型和AI繪畫模型相繼火熱后,業(yè)界對(duì)生成式AI的研究逐步朝更多模態(tài)的方向演進(jìn),AI視頻生成便是熱門技術(shù)之一。該技術(shù)可將文本或音頻等信息轉(zhuǎn)換為面部運(yùn)動(dòng)信息,進(jìn)而驅(qū)動(dòng)生成照片人物形象的動(dòng)畫,能有效降低視頻拍攝和制作門檻。

此次上線的Live Portait工具由運(yùn)動(dòng)模塊和生成模塊組成,其采用阿里云自研的口型預(yù)測(cè)算法,生成的口型準(zhǔn)確度相比傳統(tǒng)方法大幅提高;在訓(xùn)練階段,增加了姿態(tài)的顯式控制,無(wú)需底板視頻也可以生成任意動(dòng)作的視頻,大幅提升數(shù)字人說(shuō)話的真實(shí)感;此外,通過(guò)眼神主動(dòng)控制技術(shù),Live Portait可以為眼球增加一些自然運(yùn)動(dòng),使得生成結(jié)果在觀感上更接近真人效果。據(jù)介紹,Live Portait相關(guān)技術(shù)已被CVPR、ICCV等國(guó)際AI頂會(huì)收錄。

format-jpg

根據(jù)魔搭社區(qū)上的信息顯示,在Live Portait上傳照片后,用戶可選擇文本驅(qū)動(dòng)和音頻驅(qū)動(dòng)兩種方式,文本驅(qū)動(dòng)模式下,該工具提供了普通話、英語(yǔ)、粵語(yǔ)、童聲等28種聲音。此外,Live Portait還提供了輕量模型選擇,幫助用戶更快速生成視頻。

該工具算法負(fù)責(zé)人張邦表示:“ Live Portait集成了團(tuán)隊(duì)多項(xiàng)自研創(chuàng)新技術(shù),例如僅需單張圖片就能生成逼真的面部動(dòng)畫,突破了傳統(tǒng)對(duì)抗生成網(wǎng)絡(luò)的局限。隨著技術(shù)的進(jìn)一步迭代,圖生視頻有巨大的應(yīng)用空間,有望成為企業(yè)降本增效的生產(chǎn)工具?!?/span>

據(jù)悉,該團(tuán)隊(duì)研究方向涵蓋數(shù)字人、3D模型AI生成、高真實(shí)感渲染、自然人機(jī)交互等領(lǐng)域,目前已發(fā)表50多篇國(guó)際頂會(huì)論文。

1、該內(nèi)容為作者獨(dú)立觀點(diǎn),不代表電商報(bào)觀點(diǎn)或立場(chǎng),文章為作者本人上傳,版權(quán)歸原作者所有,未經(jīng)允許不得轉(zhuǎn)載。
2、電商號(hào)平臺(tái)僅提供信息存儲(chǔ)服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系:info@dsb.cn
相關(guān)閱讀
3月22日消息,阿里達(dá)摩院已在AI模型社區(qū)”ModelScope上線了“文本生成視頻大模型”。根據(jù)介紹,整體模型參數(shù)約17億,目前只支持英文輸入。擴(kuò)散模型采用Unet3D結(jié)構(gòu),通過(guò)從純高斯噪聲視頻中,迭代去噪的過(guò)程,實(shí)現(xiàn)視頻生成的功能。據(jù)了解,“”是阿里達(dá)摩院聯(lián)手CCF開源發(fā)展委員會(huì)在2022云棲大會(huì)推出的AI模型社區(qū),首批開源模型超過(guò)300個(gè),包括視覺、語(yǔ)音、自然語(yǔ)言處理、多模態(tài)等AI主要方向。
5月29日消息,2023中關(guān)村論壇期間,阿里云智能集團(tuán)CTO周靖人指出,“以模型為中心的開發(fā)范式 已成為行業(yè)標(biāo)準(zhǔn),未來(lái)應(yīng)用開發(fā)的整個(gè)鏈路都會(huì)基于這一理念來(lái)做?!比ツ?1月,阿里云率先在業(yè)界提出“Model as a service”概念,并推出開源AI社區(qū),進(jìn)一步降低了AI開發(fā)的門檻。據(jù)周靖人介紹,半年間,社區(qū)模型總量已超過(guò)900個(gè),總用戶量超150萬(wàn),模型總下載量超2000萬(wàn)。
9月8日消息,百川智能日起前發(fā)布第二代開源模型Baichuan 2,正式開源微調(diào)后的Baichuan 2-7B、Baichuan 2-13B、Baichuan 2-13B-Chat與其4bit量化版本。據(jù)了解,以上模型均免費(fèi)可商用,已在阿里云AI模型社區(qū)ModelScope首發(fā)上架,現(xiàn)已推出了模型部署相關(guān)教程,供開發(fā)者參考并快速上手。
6月15日消息,在2023開放原子全球開源峰會(huì)上,阿里云公布1+4開源戰(zhàn)略,在操作系統(tǒng)、云原生、數(shù)據(jù)庫(kù)、大數(shù)據(jù)四大開源領(lǐng)域之外,AI模型社區(qū)作為大模型方向的開源新勢(shì)力首次亮相。阿里云市場(chǎng)總裁劉湘雯在會(huì)上表示,未來(lái)阿里云將持續(xù)擁抱開源生態(tài),持續(xù)投入AI、云原生、數(shù)據(jù)庫(kù)、大數(shù)據(jù)、操作系統(tǒng)等領(lǐng)域的開源工作,持續(xù)提升開發(fā)者服務(wù)和企業(yè)創(chuàng)新支持。
阿里巴巴副總裁葉杰平在2023 ACM中國(guó)圖靈大會(huì)上發(fā)表演講。
AI2.0公司零一萬(wàn)物正式發(fā)布模型Yi-34B,并在阿里云社區(qū)ModelScope首發(fā)。
7月31日消息,據(jù)《科創(chuàng)板日?qǐng)?bào)》,阿里巴巴副總裁葉杰平表示,社區(qū)已集聚了1000多款AI模型和200多萬(wàn)AI開發(fā)者,模型累計(jì)下載超過(guò)4500萬(wàn)次,并與清華、北大、浙大等20多所高校展開學(xué)術(shù)合作,有50萬(wàn)開發(fā)者來(lái)自高校。目前,社區(qū)里的第三方模型包括清華和智譜共同研發(fā)的ChatGLM系列模型、清華大學(xué)人工智能創(chuàng)新團(tuán)隊(duì) TSAIL 研發(fā)的Unidiffuser系列模型、IDEA研究院封神榜姜子牙系列模型、浙江大學(xué)NLP和知識(shí)圖譜團(tuán)隊(duì)研發(fā)的智析模型等。
11月6日消息,由創(chuàng)新工場(chǎng)董事長(zhǎng)兼CEO李開復(fù)成立的AI公司“零一萬(wàn)物”發(fā)布了首款開源中英雙語(yǔ)大模型“Yi”。從知情人士處獲悉,零一萬(wàn)物已完成新一輪融資,由阿里云領(lǐng)投。目前,模型開放商用申請(qǐng),已在阿里云社區(qū)ModelScope首發(fā)。
12月20日消息,數(shù)據(jù)庫(kù)國(guó)際頂會(huì)VLDB2024今日公布新一批論文,阿里云新技術(shù)PilotScope成功入圍,該平臺(tái)技術(shù)可實(shí)現(xiàn)AI算法在數(shù)據(jù)庫(kù)的“一鍵部署”,極大降低數(shù)據(jù)庫(kù)中AI算法的應(yīng)用門檻,同日阿里云宣布將PilotScope全部技術(shù)免費(fèi)開源。目前,PilotScope已在阿里云內(nèi)部展開試點(diǎn)應(yīng)用,相關(guān)技術(shù)也通過(guò)GitHub及Modelscope社區(qū)對(duì)外免費(fèi)開源。
    亚洲无码高清自拍偷拍自慰av网站,免费高清无码黄色网,欧美一级片免费在线观看,午夜毛片在线观看