阿里巴巴聯(lián)合中科院研發(fā)AI“聽音識人”
王小孟
2021-03-25 09:36
3月25日消息,阿里巴巴聯(lián)手中科院,實現(xiàn)AI“聽音識人”。通過訓(xùn)練AI模型,研究表情和聲音的關(guān)系。給定一段聲音和僅有一張正確人臉的若干張圖片,AI將為該聲音找到“主人”。經(jīng)驗證明,準確率達到90%。在“1對N”的匹配實驗中,AI還能對聲音歸屬人臉的“可能性”進行排序。
值得一提的是,在2020云棲大會上,阿里達摩院曾公布了語音AI技術(shù)的最新突破:端上語音識別和語音合成能力首次達到媲美云端的水平,這意味著未來個人用戶在移動終端即可輕松體驗逼近真人的語音技術(shù)。
據(jù)介紹,在語音識別方面,達摩院提出SAN-M網(wǎng)絡(luò)結(jié)構(gòu)及基于SCAMA的流式端到端語音識別框架,提升計算效率的同時,還將高難度場景中的語音識別錯誤率降低近三成。
彼時,達摩院最新的語音技術(shù)已在淘寶直播、釘釘會議、高德導(dǎo)航等場景大規(guī)模應(yīng)用,正全面對外開放。
聲明
1、該內(nèi)容為作者獨立觀點,不代表電商報觀點或立場,文章為作者本人上傳,版權(quán)歸原作者所有,未經(jīng)允許不得轉(zhuǎn)載。
2、電商號平臺僅提供信息存儲服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責任由作者本人承擔。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn
2、電商號平臺僅提供信息存儲服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責任由作者本人承擔。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn
王小孟
1
推薦閱讀