淘寶公布數(shù)字人專利 可模擬用戶聲音
3月16日消息,天眼查知識產(chǎn)權(quán)信息顯示,3月15日,淘寶(中國)軟件有限公司申請的“基于數(shù)字人的視頻生成與交互方法、設(shè)備、存儲介質(zhì)與程序產(chǎn)品”專利公布。
摘要顯示,本申請實(shí)施例基于用戶的聲音特征和情感標(biāo)簽進(jìn)行文本轉(zhuǎn)語音處理,以及基于用戶的聲音特征和表情系數(shù)之間的映射關(guān)系進(jìn)行語音轉(zhuǎn)表情處理,并基于語音信號和表情系數(shù)渲染數(shù)字人模型,以得到數(shù)字人模型的視頻數(shù)據(jù)。該專利精準(zhǔn)地模擬用戶的聲音特征,確保了數(shù)字人的語音輸出不僅聽起來自然,而且實(shí)現(xiàn)數(shù)字人的個性化驅(qū)動,提高數(shù)字人在聲音和動態(tài)形象方面的逼真度,進(jìn)而提高用戶體驗(yàn),提升了數(shù)字人的互動性、真實(shí)感和沉浸感。
淘寶(中國)軟件有限公司專利信息 圖源:天眼查APP
在去年11月,淘寶推出全網(wǎng)首次數(shù)字人拍賣。AI數(shù)字人度曉曉與真人拍賣師尹晨陽進(jìn)行全網(wǎng)首次數(shù)字人拍賣。作為國內(nèi)首個可交互虛擬偶像,度曉曉于2020年首次亮相,是百度基于百度大腦7.0核心技術(shù)驅(qū)動,整合了多模態(tài)交互技術(shù)、3D數(shù)字人建模、機(jī)器翻譯、語音識別、自然語言理解等多項(xiàng)技術(shù)匯聚而成。其還產(chǎn)出過唱作歌曲,并且登上過央視舞臺。
數(shù)字人度曉曉也在去年開啟了個人主理的“曉曉AI萬事屋”淘寶店,除了看圖測MBTI bot,還有朋友圈神器、彩虹屁小天使等服務(wù),都是來自于知識增強(qiáng)大語言模型產(chǎn)品——文心一言APP端內(nèi)的AI功能。店內(nèi)商品價格標(biāo)價0.01元起,其中最貴的是定制數(shù)字人bot商品,承諾永久質(zhì)保,定金價格高達(dá)30萬元。
圖源:AI度曉曉微博
同在去年11月,阿里巴巴國際站發(fā)布了數(shù)字人虛擬主播直播管理規(guī)則。若商家想通過數(shù)字人虛擬主播在阿里巴巴國際站直播開播,需滿足平臺制定的管理流程和規(guī)則。關(guān)于準(zhǔn)予直播類型,目前平臺僅支持?jǐn)?shù)字人驅(qū)動,即由真人驅(qū)動的數(shù)字人虛擬主播,僅限擬真人形象在國際站報備后可以在平臺開播。另外,適用直播類型有工位接待、日常營銷、活動直播。
官方介紹,數(shù)字人虛擬主播指的是非真人,而僅以數(shù)字人虛擬主播形象出鏡進(jìn)行直播。數(shù)字人虛擬主播形象即擬真人形象。同時,該規(guī)則只適用于Chinese Gold Supplier。需要注意的是,Global Gold Supplier暫不允許數(shù)字人虛擬直播,且僅允許使用阿里巴巴外貿(mào)服務(wù)市場入駐的數(shù)字人虛擬直播服務(wù)商進(jìn)行國際站數(shù)字人直播,非外貿(mào)市場入駐的數(shù)字人直播一經(jīng)發(fā)現(xiàn)立刻關(guān)停且凍結(jié)直播權(quán)限7天。
阿里巴巴國際站發(fā)布數(shù)字人虛擬主播直播管理規(guī)則 圖源:Alibaba.com規(guī)則中心
2、電商號平臺僅提供信息存儲服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn