小米公開識別媒體文件中人聲配音類型相關(guān)專利
宋妤
2021-10-19 17:05
10月19日消息,天眼查信息顯示,今天,北京小米移動軟件有限公司公開“識別媒體文件中人聲配音類型的方法、裝置及存儲介質(zhì)”專利,申請公布號為CN113516154A,申請日期為2021年4月。
專利摘要顯示,本公開是關(guān)于一種識別媒體文件中人聲配音類型的方法、裝置及存儲介質(zhì)。一種識別媒體文件中人聲配音類型的方法,包括:獲取待識別的媒體文件,媒體文件至少包括音頻數(shù)據(jù),音頻數(shù)據(jù)至少包括人聲配音數(shù)據(jù)。基于預(yù)先訓(xùn)練得到的類型識別模型,確定人聲配音數(shù)據(jù)中的人聲配音的配音類型,配音類型包括真實人聲和模擬人聲。
通過本公開提供的識別媒體文件中人聲配音類型的方法,能夠通過預(yù)先訓(xùn)練得到的類型識別模型將媒體文件中人聲配音數(shù)據(jù)中的人聲配音進行識別,進而確定該人聲配音的配音類型屬于真實人聲還是模擬人聲,從而提高音頻分類的辨識度,解決無法有效分辨人聲配音的配音類型的問題。
信息顯示,北京小米移動軟件有限公司成立于2012年5月8日,注冊資本為148800萬人民幣,法定代表人為王川,經(jīng)營范圍包括計算機系統(tǒng)服務(wù);設(shè)計、制作、代理、發(fā)布廣告;承辦展覽展示活動;市場調(diào)查;貨物進出口、技術(shù)進出口、代理進出口等。
專利信息顯示,近日,該公司還公開了“屏幕顯示的方法及裝置”、“智能設(shè)備的操作方法、裝置及存儲介質(zhì)”、“智能設(shè)備的管理方法、裝置及存儲介質(zhì)”等專利。
聲明
1、該內(nèi)容為作者獨立觀點,不代表電商派觀點或立場,文章為作者本人上傳,版權(quán)歸原作者所有,未經(jīng)允許不得轉(zhuǎn)載。
2、電商號平臺僅提供信息存儲服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責任由作者本人承擔。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn
2、電商號平臺僅提供信息存儲服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責任由作者本人承擔。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn