阿里巴巴達(dá)摩院發(fā)布中文社區(qū)首個(gè)表格預(yù)訓(xùn)練模型SDCUP
12月2日消息,據(jù)天下網(wǎng)商消息,今天,阿里巴巴達(dá)摩院深度語言模型體系A(chǔ)liceMind發(fā)布中文社區(qū)首個(gè)表格預(yù)訓(xùn)練模型SDCUP,該模型在全球權(quán)威表格數(shù)據(jù)集WikiSQL、SQuALL上取得了業(yè)界最優(yōu)效果,且模型和訓(xùn)練代碼均已對外開源。
據(jù)介紹,表格是應(yīng)用普遍的結(jié)構(gòu)化數(shù)據(jù),也是智能對話系統(tǒng)和搜索引擎的重要答案來源。新興的表格問答技術(shù),可將自然語言轉(zhuǎn)換為查詢語句,使用戶能通過簡單問句直接與表格數(shù)據(jù)庫交互,具有廣泛應(yīng)用前景。
本次,達(dá)摩院對話智能團(tuán)隊(duì)提出了首個(gè)中文表格預(yù)訓(xùn)練模型SDCUP,其基于“模式依存”方法,通過模型直接預(yù)測自然語言與表格結(jié)構(gòu)內(nèi)容的關(guān)鍵詞映射,提升了表格問答的準(zhǔn)確率。
據(jù)達(dá)摩院資深算法專家李永彬介紹,SDCUP模型是達(dá)摩院表格對話技術(shù)系列研發(fā)的一部分,后續(xù)將持續(xù)對外開源。其相關(guān)技術(shù)先后在四大國際公開數(shù)據(jù)集WikiSQL、Spider、SParC、CoSQL上取得第一。
值得注意的是,目前,該技術(shù)完成了產(chǎn)品化,已通過阿里云智能客服為政務(wù)、金融、零售等行業(yè)客戶提供表格問答和數(shù)據(jù)庫自然交互服務(wù)。
值得一提的是,近來阿里巴巴達(dá)摩院在新產(chǎn)品研究方面取得了許多成果。10月下旬,在杭州云棲大會上,阿里巴巴達(dá)摩院發(fā)布軟硬件結(jié)合語音產(chǎn)品“聽悟”。
據(jù)介紹,相比只能逐字轉(zhuǎn)寫的上一代語音產(chǎn)品,“聽悟”是面向未來會議的AI助理,其集成了達(dá)摩院最新語音及自然語言處理技術(shù),不僅“聽”得準(zhǔn),且“悟”性高,可秒速生成智能會議紀(jì)要及待辦。
2、電商號平臺僅提供信息存儲服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn