螞蟻集團(tuán)AntInsBert模型登頂CLUE閱讀理解榜 打破歷史記錄
8月10日消息,日前,中文語(yǔ)言理解測(cè)評(píng)基準(zhǔn)(CLUE)閱讀理解排行榜顯示,螞蟻集團(tuán)保險(xiǎn)科技團(tuán)隊(duì)的AntInsBert模型以92.475的得分,打破了CLUE閱讀理解榜的歷史紀(jì)錄,排名第一。
據(jù)了解,機(jī)器閱讀理解技術(shù)一直是語(yǔ)義理解領(lǐng)域最為關(guān)鍵的能力之一。機(jī)器閱讀理解技術(shù)難度高、理解復(fù)雜,不僅要求AI對(duì)內(nèi)容進(jìn)行閱讀和理解,還需要針對(duì)相關(guān)問(wèn)題,推理總結(jié)出正確答案。
據(jù)悉,憑借多年來(lái)在自然語(yǔ)言處理方面的深耕,螞蟻保險(xiǎn)科技團(tuán)隊(duì)自主研發(fā)了預(yù)訓(xùn)練語(yǔ)言模型——AntInsBert。該模型僅包含十億參數(shù)量,是業(yè)界百億大模型的十分之一,主要在兩個(gè)技術(shù)上進(jìn)行了升級(jí)。
首先,AntInsBert對(duì)傳統(tǒng)語(yǔ)言模型預(yù)訓(xùn)練方案做了改進(jìn),設(shè)計(jì)了基于Prompt的知識(shí)增強(qiáng)預(yù)訓(xùn)練方案,將海量知識(shí)圖譜內(nèi)容引入到預(yù)訓(xùn)練模型當(dāng)中。
其次,為進(jìn)一步挖掘AntInsBert在機(jī)器閱讀理解算法上的潛力,該方案將文本分類、信息抽取、指代消解等常見的中文語(yǔ)義理解任務(wù),通過(guò)模板轉(zhuǎn)化為閱讀理解任務(wù),進(jìn)一步提升了模型的范化性。
此前,在第11屆CCF自然語(yǔ)言處理與中文計(jì)算會(huì)議(NLPCC)上,螞蟻集團(tuán)保險(xiǎn)科技團(tuán)隊(duì)?wèi){借多年來(lái)在保險(xiǎn)領(lǐng)域?qū)υ捓斫獾募夹g(shù)積累,獲得“細(xì)粒度對(duì)話社會(huì)偏見識(shí)別”評(píng)測(cè)任務(wù)第一名。
目前,AntInsBert模型已經(jīng)在螞蟻?!敖疬x”和“安心賠”等保險(xiǎn)服務(wù)環(huán)節(jié)得到了應(yīng)用。例如,為了降低消費(fèi)者決策難度,螞蟻保險(xiǎn)團(tuán)隊(duì)借助機(jī)器閱讀理解系統(tǒng)對(duì)保險(xiǎn)條款進(jìn)行閱讀,將用戶最關(guān)心的投保門檻、保障范圍、價(jià)格等因素進(jìn)行結(jié)構(gòu)化,并組織專家團(tuán)隊(duì)橫向?qū)Ρ攘耸袌?chǎng)上數(shù)千款保險(xiǎn)產(chǎn)品,盡量保證螞蟻?!敖疬x”篩選出平臺(tái)上綜合競(jìng)爭(zhēng)力最強(qiáng)的保險(xiǎn)產(chǎn)品。
與此同時(shí),機(jī)器閱讀理解也運(yùn)用在螞蟻?!鞍残馁r”服務(wù)中,通過(guò)對(duì)用戶上傳的理賠材料的理解,實(shí)現(xiàn)了理賠流程的自動(dòng)化與智能化,大幅縮短傳統(tǒng)人工審核的耗時(shí)。以人保健康承保的好醫(yī)保長(zhǎng)期醫(yī)療險(xiǎn)為例,對(duì)于理賠金額小于2萬(wàn)元的理賠案件,90%以上都可保證實(shí)現(xiàn)安心賠“2日快賠”。
(圖源 螞蟻保微博)
2、電商號(hào)平臺(tái)僅提供信息存儲(chǔ)服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系:info@dsb.cn
