小米自研聲音識別算法性能國際排名第一

云合
2023-09-13 11:38

9月13日消息,小米自研聲音識別算法近日取得了最新進(jìn)展,算法模型領(lǐng)先其他機(jī)構(gòu),性能國際排名第一。

小米是在Google發(fā)布的AudioSet音頻標(biāo)記任務(wù)中獲得的這一突破。它是音頻標(biāo)記任務(wù)影響力最大的數(shù)據(jù)集,被認(rèn)為是聲音領(lǐng)域的ImageNet (注:計算機(jī)視覺領(lǐng)域最著名的數(shù)據(jù)集,由著名學(xué)者李飛飛等主持發(fā)布),有較高的權(quán)威性。

format-jpg

圖源:小米公司公眾號

Google將AudioSet數(shù)據(jù)集分為三個子集,前兩個子集用于訓(xùn)練,被合并稱為 “AudioSet-2M”。正是在這個合并后的訓(xùn)練集中,小米的聲音識別算法模型首次在業(yè)界突破了50mAP,刷新了音頻標(biāo)記技術(shù)指標(biāo),成為截至目前性能最好的模型。此外,小米還發(fā)布了一個Mini版模型,適合資源受限的場景。該模型的參數(shù)量被壓縮到了原模型的約九分之一,遠(yuǎn)小于其他機(jī)構(gòu)的模型,但性能卻優(yōu)于其他所有機(jī)構(gòu)。

這項技術(shù)的突破意味著小米的聲音識別算法能力再次精進(jìn),小米的眾多智能硬件設(shè)備應(yīng)用此項技術(shù)后,可以更敏銳地捕捉和識別環(huán)境聲音,大幅提升硬件的智能化程度,從而為用戶創(chuàng)造更加便捷的智能生活體驗。

format-jpg

圖源:小米公司公眾號

這項算法技術(shù)還廣泛應(yīng)用于小米機(jī)器人的研發(fā)中,大幅提升了機(jī)器人的感知能力。小米歷時10個月全棧自研的第一代全尺寸人形機(jī)器人CyberOne,可以識別85種環(huán)境聲音,能夠通過聽覺感知6類、45種人類情緒。而小米第二代仿生四足機(jī)器人CyberDog 2則可以識別38種環(huán)境聲音,實現(xiàn)更強(qiáng)大的動態(tài)響應(yīng)能力。

目前,小米的聲學(xué)語音團(tuán)隊已將自研聲學(xué)語音技術(shù)全面應(yīng)用于小米手機(jī)、音箱、電視、耳機(jī)、手表、機(jī)器人等79個品類,共計5000多款智能產(chǎn)品中。而小愛同學(xué)的月活躍用戶數(shù)量則達(dá)到了1.15億,是世界上最忙的語音助手之一。

據(jù)悉,小米自2016年組建AI團(tuán)隊以來,人工智能團(tuán)隊經(jīng)過7年6次擴(kuò)展,人員規(guī)模已達(dá)3000多人。同時,小米AI的技術(shù)能力目前已經(jīng)覆蓋了視覺、聲學(xué)、語音、NLP、知識圖譜、機(jī)器學(xué)習(xí)、大模型、多模態(tài)等眾多方向,并全面賦能了手機(jī)、汽車、AIoT、機(jī)器人等多個業(yè)務(wù)板塊。今年4月,小米還正式組建了AI大模型團(tuán)隊,全面擁抱大模型,目前陸續(xù)有了一些應(yīng)用嘗試。其中第一個應(yīng)用大模型,就是將智能語音助理小愛同學(xué)升級了大模型版本,并開啟邀請測試。

format-jpg

圖源:小米公司公眾號

值得一提的是,9月11日,小米正式成立集團(tuán)科協(xié)暨院士專家工作站。

中國工程院院士丁文華成為小米院士專家工作站的首位進(jìn)站院士。他指出,在以手機(jī)鏡頭為代表的成像技術(shù)領(lǐng)域,小米實現(xiàn)了光學(xué)鏡頭小型化的重大突破,是行業(yè)的佼佼者。小米已經(jīng)牽頭成立了智能圖像處理北京市工程研究中心,他希望未來能夠努力升級為國家工程研究中心。

1、該內(nèi)容為作者獨立觀點,不代表電商派觀點或立場,文章為作者本人上傳,版權(quán)歸原作者所有,未經(jīng)允許不得轉(zhuǎn)載。
2、電商號平臺僅提供信息存儲服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn
相關(guān)閱讀
9月13日消息,小米聲音識別算法近日取得了最新進(jìn)展,算法模型領(lǐng)先其他機(jī)構(gòu),性能國際排名第一小米是在Google發(fā)布的AudioSet音頻標(biāo)記任務(wù)中獲得的這一突破。它是音頻標(biāo)記任務(wù)影響力最大的數(shù)據(jù)集,被認(rèn)為是聲音領(lǐng)域的ImageNet,有較高的權(quán)威性。
9月1日消息,小米汽車宣布,車外喚醒防御功能正式上線小米SU7。據(jù)介紹,基于小米聲音大模型,針對車外語音喚醒行為抑制率達(dá)99%。
7月11日消息,中國網(wǎng)絡(luò)安全審查技術(shù)與認(rèn)證中心 近日向小米智能終端可信執(zhí)行環(huán)境操作系統(tǒng)2.0頒發(fā)國內(nèi)首張最高安全認(rèn)證等級EAL5+證書。通過認(rèn)證,表明MiTEE OS的信息安全保障能力已達(dá)到行業(yè)領(lǐng)先水平,體現(xiàn)了小米以用戶為中心的發(fā)展理念以及引領(lǐng)行業(yè)合規(guī)穩(wěn)健發(fā)展的使命感。據(jù)了解,中國網(wǎng)絡(luò)安全審查技術(shù)與認(rèn)證中心為國家市場監(jiān)督管理總局直屬正司局級事業(yè)單位。
天眼查App顯示,近日,上海玄戒技術(shù)有限公司發(fā)生工商變更,注冊資本由15億人民幣增至19.2億人民幣,增幅28%。
12月24日消息,小米將于12月28日召開新品發(fā)布會,發(fā)布小米首款充電芯片也是小米的第三款芯片——澎湃P1,首次實現(xiàn)120W單電芯充電方案。據(jù)悉,小米稱這款芯片歷經(jīng)18個月,旗下四大研發(fā)中心通力合作,耗資過億。
5月25日消息,針對哲庫關(guān)停事件,在小米財報會議上,小米集團(tuán)總裁盧偉冰表示,小米芯片的投入決心不會動搖,要充分意識到芯片投入的長期性、復(fù)雜性,尊重芯片行業(yè)的發(fā)展規(guī)律,做好持久戰(zhàn)的準(zhǔn)備,做長期奮斗10年、20年的準(zhǔn)備;此外,芯片的目的是為了提升終端產(chǎn)品的競爭力、用戶體驗。
11月27日消息,小米IoT生態(tài)伙伴大會近日在北京舉辦,宣布小米物聯(lián)網(wǎng)嵌入式操作系統(tǒng)Vela面向全球軟硬件開發(fā)者正式開源,并面向全球啟動合作計劃。兆易創(chuàng)新作為首批全球合作伙伴,受邀出席Xiaomi Vela生態(tài)合作計劃啟動儀式,這標(biāo)志著小米與兆易創(chuàng)新將共同為全球開發(fā)者構(gòu)建科技引領(lǐng)的IoT智能生態(tài)。
12月12日消息,小米公司發(fā)言人發(fā)布澄清聲明稱:近日,余承東先生無端針對我司“龍骨轉(zhuǎn)軸”技術(shù)發(fā)布不實言論,與事實嚴(yán)重不符。聲明稱,無論是設(shè)計思路,還是機(jī)械結(jié)構(gòu),小米的龍骨轉(zhuǎn)軸與余承東所宣稱的所謂雙旋水滴鉸鏈,都完全不同。
12月29日消息,在昨日舉辦的小米新品發(fā)布會上,小米正式發(fā)布小米12系列手機(jī),售價3699元起。據(jù)官方介紹,小米12 Pro搭載小米充電芯片澎湃P1,可實現(xiàn)大容量單電芯120W安全快充。此外,小米還發(fā)布了MIUI 13,小米手表S1,小米真無線降噪耳機(jī)3。雷軍在個人微博表示,目前小米新品已可在小米商城、京東商城、天貓預(yù)定。
    亚洲无码高清自拍偷拍自慰av网站,免费高清无码黄色网,欧美一级片免费在线观看,午夜毛片在线观看