淘寶公布數(shù)字人專利 可模擬用戶聲音
3月16日消息,天眼查知識(shí)產(chǎn)權(quán)信息顯示,3月15日,淘寶(中國(guó))軟件有限公司申請(qǐng)的“基于數(shù)字人的視頻生成與交互方法、設(shè)備、存儲(chǔ)介質(zhì)與程序產(chǎn)品”專利公布。
摘要顯示,本申請(qǐng)實(shí)施例基于用戶的聲音特征和情感標(biāo)簽進(jìn)行文本轉(zhuǎn)語(yǔ)音處理,以及基于用戶的聲音特征和表情系數(shù)之間的映射關(guān)系進(jìn)行語(yǔ)音轉(zhuǎn)表情處理,并基于語(yǔ)音信號(hào)和表情系數(shù)渲染數(shù)字人模型,以得到數(shù)字人模型的視頻數(shù)據(jù)。該專利精準(zhǔn)地模擬用戶的聲音特征,確保了數(shù)字人的語(yǔ)音輸出不僅聽起來(lái)自然,而且實(shí)現(xiàn)數(shù)字人的個(gè)性化驅(qū)動(dòng),提高數(shù)字人在聲音和動(dòng)態(tài)形象方面的逼真度,進(jìn)而提高用戶體驗(yàn),提升了數(shù)字人的互動(dòng)性、真實(shí)感和沉浸感。
淘寶(中國(guó))軟件有限公司專利信息 圖源:天眼查APP
在去年11月,淘寶推出全網(wǎng)首次數(shù)字人拍賣。AI數(shù)字人度曉曉與真人拍賣師尹晨陽(yáng)進(jìn)行全網(wǎng)首次數(shù)字人拍賣。作為國(guó)內(nèi)首個(gè)可交互虛擬偶像,度曉曉于2020年首次亮相,是百度基于百度大腦7.0核心技術(shù)驅(qū)動(dòng),整合了多模態(tài)交互技術(shù)、3D數(shù)字人建模、機(jī)器翻譯、語(yǔ)音識(shí)別、自然語(yǔ)言理解等多項(xiàng)技術(shù)匯聚而成。其還產(chǎn)出過(guò)唱作歌曲,并且登上過(guò)央視舞臺(tái)。
數(shù)字人度曉曉也在去年開啟了個(gè)人主理的“曉曉AI萬(wàn)事屋”淘寶店,除了看圖測(cè)MBTI bot,還有朋友圈神器、彩虹屁小天使等服務(wù),都是來(lái)自于知識(shí)增強(qiáng)大語(yǔ)言模型產(chǎn)品——文心一言APP端內(nèi)的AI功能。店內(nèi)商品價(jià)格標(biāo)價(jià)0.01元起,其中最貴的是定制數(shù)字人bot商品,承諾永久質(zhì)保,定金價(jià)格高達(dá)30萬(wàn)元。
圖源:AI度曉曉微博
同在去年11月,阿里巴巴國(guó)際站發(fā)布了數(shù)字人虛擬主播直播管理規(guī)則。若商家想通過(guò)數(shù)字人虛擬主播在阿里巴巴國(guó)際站直播開播,需滿足平臺(tái)制定的管理流程和規(guī)則。關(guān)于準(zhǔn)予直播類型,目前平臺(tái)僅支持?jǐn)?shù)字人驅(qū)動(dòng),即由真人驅(qū)動(dòng)的數(shù)字人虛擬主播,僅限擬真人形象在國(guó)際站報(bào)備后可以在平臺(tái)開播。另外,適用直播類型有工位接待、日常營(yíng)銷、活動(dòng)直播。
官方介紹,數(shù)字人虛擬主播指的是非真人,而僅以數(shù)字人虛擬主播形象出鏡進(jìn)行直播。數(shù)字人虛擬主播形象即擬真人形象。同時(shí),該規(guī)則只適用于Chinese Gold Supplier。需要注意的是,Global Gold Supplier暫不允許數(shù)字人虛擬直播,且僅允許使用阿里巴巴外貿(mào)服務(wù)市場(chǎng)入駐的數(shù)字人虛擬直播服務(wù)商進(jìn)行國(guó)際站數(shù)字人直播,非外貿(mào)市場(chǎng)入駐的數(shù)字人直播一經(jīng)發(fā)現(xiàn)立刻關(guān)停且凍結(jié)直播權(quán)限7天。
阿里巴巴國(guó)際站發(fā)布數(shù)字人虛擬主播直播管理規(guī)則 圖源:Alibaba.com規(guī)則中心
2、電商號(hào)平臺(tái)僅提供信息存儲(chǔ)服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系:info@dsb.cn