阿里巴巴聯(lián)合中科院研發(fā)AI“聽音識人”

王小孟
2021-03-25 09:36

3月25日消息,阿里巴巴聯(lián)手中科院,實現(xiàn)AI“聽音識人”。通過訓(xùn)練AI模型,研究表情和聲音的關(guān)系。給定一段聲音和僅有一張正確人臉的若干張圖片,AI將為該聲音找到“主人”。經(jīng)驗證明,準確率達到90%。在“1對N”的匹配實驗中,AI還能對聲音歸屬人臉的“可能性”進行排序。

值得一提的是,在2020云棲大會上,阿里達摩院曾公布了語音AI技術(shù)的最新突破:端上語音識別和語音合成能力首次達到媲美云端的水平,這意味著未來個人用戶在移動終端即可輕松體驗逼近真人的語音技術(shù)。

據(jù)介紹,在語音識別方面,達摩院提出SAN-M網(wǎng)絡(luò)結(jié)構(gòu)及基于SCAMA的流式端到端語音識別框架,提升計算效率的同時,還將高難度場景中的語音識別錯誤率降低近三成。

彼時,達摩院最新的語音技術(shù)已在淘寶直播、釘釘會議、高德導(dǎo)航等場景大規(guī)模應(yīng)用,正全面對外開放。

1、該內(nèi)容為作者獨立觀點,不代表電商報觀點或立場,文章為作者本人上傳,版權(quán)歸原作者所有,未經(jīng)允許不得轉(zhuǎn)載。
2、電商號平臺僅提供信息存儲服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責任由作者本人承擔。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn
相關(guān)閱讀
2月1日消息,據(jù)36氪報道,阿里巴巴達摩院表示,目前其已設(shè)立14個實驗室,在AI、量子、芯片、自動駕駛等領(lǐng)域獲得60多項世界第一,在國際學術(shù)會議和期刊發(fā)表論文1000多篇,并先后孵化平頭哥和小蠻驢兩家技術(shù)公司。資料顯示,阿里巴巴達摩院阿里在全球多點設(shè)立的科研機構(gòu),立足基礎(chǔ)科學、顛覆性技術(shù)和應(yīng)用技術(shù)的研究。
2月8日消息,澎湃新聞編輯從阿里巴巴處獲悉,阿里版聊天機器人ChatGPT正在研發(fā)中,目前處于內(nèi)測階段。阿里方面人士表示:“后續(xù)如有更多信息,會第一時間同步。”此前,有媒體報道稱,阿里達摩院正在研發(fā)類ChatGPT的對話機器人,目前已開放給公司內(nèi)員工測試。從曝光截圖來看,阿里巴巴可能將AI大模型技術(shù)與釘釘生產(chǎn)力工具深度結(jié)合。
阿里巴巴達摩院(杭州)科技有限公司發(fā)生工商變更,注冊資本由1000萬人民幣增至3億人民幣。
阿里巴巴達摩院近日公開一項“人機協(xié)同對話交互系統(tǒng)及方法”專利。
阿里巴巴達摩院近日公開一項“機器客服訓(xùn)練系統(tǒng)及其方法、語音回復(fù)方法和電子設(shè)備”專利。
阿里巴巴達摩院7月1日公開一項“人機對話系統(tǒng)及方法”專利。
阿里巴巴達摩院近日公開一項“模型處理方法、預(yù)測方法、裝置、設(shè)備及存儲介質(zhì)”專利。
阿里巴巴達摩院6月28日公開一項“數(shù)據(jù)處理方法、裝置和電子設(shè)備”專利。
阿里巴巴達摩院近日公開一項“預(yù)測交通流量的方法、車輛和可讀存儲介質(zhì)”專利。
阿里巴巴達摩院近日公開一項“駕駛避險方法、裝置、設(shè)備、介質(zhì)及產(chǎn)品”專利。
    亚洲无码高清自拍偷拍自慰av网站,免费高清无码黄色网,欧美一级片免费在线观看,午夜毛片在线观看