阿里云推出數(shù)字人視頻生成工具Live Portait

柏納
2023-08-16 15:26

8月16日消息,阿里云推出數(shù)字人視頻生成工具Live Portait,上傳一張照片和一段文本或語音即可生成一段開口說話的數(shù)字人視頻,可應(yīng)用于視頻直播、聊天機(jī)器人、企業(yè)營銷等場景。目前,該工具已在魔搭社區(qū)創(chuàng)空間開放體驗(yàn)。

根據(jù)魔搭社區(qū)上的信息顯示,在Live Portait上傳照片后,用戶可選擇文本驅(qū)動(dòng)和音頻驅(qū)動(dòng)兩種方式,文本驅(qū)動(dòng)模式下,該工具提供了普通話、英語、粵語、童聲等28種聲音。

format-jpg截自魔搭社區(qū)

這次上線的Live Portait工具由運(yùn)動(dòng)模塊和生成模塊組成,采用阿里云自研的口型預(yù)測算法,生成的口型準(zhǔn)確度相比傳統(tǒng)方法大幅提高。在訓(xùn)練階段,Live Portait增加了姿態(tài)的顯式控制,不需要底板視頻也可以生成任意動(dòng)作的視頻,大幅提升數(shù)字人說話的真實(shí)感。此外,通過眼神主動(dòng)控制技術(shù),Live Portait可以為眼球增加一些自然運(yùn)動(dòng),使得生成結(jié)果在觀感上更接近真人效果。據(jù)介紹,Live Portait相關(guān)技術(shù)已被CVPR、ICCV等國際AI頂會(huì)收錄。

該工具算法負(fù)責(zé)人張邦表示:“Live Portait集成了團(tuán)隊(duì)多項(xiàng)自研創(chuàng)新技術(shù),例如僅需單張圖片就能生成逼真的面部動(dòng)畫,突破了傳統(tǒng)對(duì)抗生成網(wǎng)絡(luò)的局限。隨著技術(shù)的進(jìn)一步迭代,圖生視頻有巨大的應(yīng)用空間,有望成為企業(yè)降本增效的生產(chǎn)工具?!?/p>

據(jù)悉,該團(tuán)隊(duì)研究方向涵蓋數(shù)字人、3D模型AI生成、高真實(shí)感渲染、自然人機(jī)交互等領(lǐng)域,目前已發(fā)表50多篇國際頂會(huì)論文。

format-jpg

截自魔搭社區(qū)

阿里巴巴集團(tuán)近日公布2023年六月底止季度業(yè)績。其中,云智能集團(tuán)(包括阿里云及釘釘)收入增長4%至251.23億元,經(jīng)調(diào)整EBITA利潤增長106%至3.87億元。財(cái)報(bào)顯示,阿里云本季度收入增長主要受到存儲(chǔ)、網(wǎng)絡(luò)和AI計(jì)算相關(guān)產(chǎn)品驅(qū)動(dòng),部分被CDN需求正?;窒龇?。從客戶分布維度,收入增長主要受到金融服務(wù)、教育、電力和汽車行業(yè)驅(qū)動(dòng),部分被主動(dòng)縮減項(xiàng)目式收入的舉措所抵消。

報(bào)告期內(nèi),阿里云正把促進(jìn)大模型的生態(tài)繁榮作為首要目標(biāo),積極發(fā)展大模型的開源社區(qū)。財(cái)報(bào)透露,截至7月底,旗下魔搭社區(qū)集聚了200多萬AI開發(fā)者、1000多個(gè)優(yōu)質(zhì)AI模型,模型累計(jì)下載總量超過4500萬。

format-jpg

截自阿里巴巴2023年六月底止季度業(yè)績公告

1、該內(nèi)容為作者獨(dú)立觀點(diǎn),不代表電商報(bào)觀點(diǎn)或立場,文章為作者本人上傳,版權(quán)歸原作者所有,未經(jīng)允許不得轉(zhuǎn)載。
2、電商號(hào)平臺(tái)僅提供信息存儲(chǔ)服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對(duì)本稿件有異議或投訴,請聯(lián)系:info@dsb.cn
相關(guān)閱讀
阿里推出數(shù)字視頻生成工具Live Portait
阿里推出NFT解決方案
阿里巴巴旗下阿里官方在社交媒體上宣布其已推出NFT解決方案。
10月31日消息,2023棲大會(huì)上,阿里首席技術(shù)官周靖發(fā)布阿里高校計(jì)劃“工開物”,計(jì)劃將為中國所有在校大學(xué)生免費(fèi)提供一臺(tái)服務(wù)器,所有高校學(xué)生可享受300元免費(fèi)額度。此外,阿里還將為簽約高校提供更大規(guī)模的算力資源支持。目前,清華大學(xué)、北京大學(xué)、浙江大學(xué)、上海交通大學(xué)、中國科學(xué)技術(shù)大學(xué)和華南理工大學(xué)等高校已首批達(dá)成合作。
6月13日消息,今日,阿里智能總裁張建鋒在2022年阿里峰會(huì)上正式發(fā)布CIPU ,這是為新型數(shù)據(jù)中心設(shè)計(jì)的專用處理器,未來將替代CPU成為計(jì)算的管控和加速中心。據(jù)介紹,在這個(gè)全新體系架構(gòu)下,CIPU向下對(duì)數(shù)據(jù)中心的計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)資源快速化并進(jìn)行硬件加速,向上接入飛天操作系統(tǒng),將全球數(shù)百萬臺(tái)服務(wù)器連成一臺(tái)超級(jí)計(jì)算機(jī)。
近日,阿里教育結(jié)合課后服務(wù)的政策要求和現(xiàn)實(shí)需求,推出業(yè)內(nèi)首個(gè)數(shù)字化課后服務(wù)平臺(tái)。
8月8日消息,阿里在萬網(wǎng)煥新發(fā)布會(huì)上,宣布域名產(chǎn)品服務(wù)完成AI化系列改造,推出首個(gè)基于通義大模型的域名AI應(yīng)用,并上線“.ai”等40余個(gè)全新的熱門域名后綴、2000萬個(gè)全球域名資源。升級(jí)后的阿里萬網(wǎng),實(shí)現(xiàn)了智能起名。用戶輸入只需輸入品牌信息與所屬行業(yè),一鍵點(diǎn)擊后,基于通義大模型就能批量生成創(chuàng)意域名。同時(shí),大模型將會(huì)自動(dòng)進(jìn)行語義解析,輸出域名含義,并通過多維評(píng)估與可用性篩查,提供可用選擇。
7月24日消息,Meta開源最新Llama 3.1系列,包括4050億參數(shù) “超大杯”模型。阿里魔搭社區(qū)已上架全系列3款模型,同時(shí),阿里百煉平臺(tái)在國內(nèi)推出針對(duì)Llama 3.1系列的訓(xùn)練、部署、推理服務(wù),企業(yè)和開發(fā)者即日起可在阿里上基于其打造自己的專屬大模型。
    亚洲无码高清自拍偷拍自慰av网站,免费高清无码黄色网,欧美一级片免费在线观看,午夜毛片在线观看