阿里達(dá)摩院在機(jī)器視覺問答VQA榜單中首次超越人類
8月12日消息,在國際權(quán)威機(jī)器視覺問答榜單VQA Leaderboard上,阿里巴巴達(dá)摩院以81.26%的準(zhǔn)確率創(chuàng)造了新紀(jì)錄,讓AI在“讀圖會(huì)意”上首次超越人類基準(zhǔn)。
今年6月,阿里達(dá)摩院在VQA 2021 Challenge的55支提交隊(duì)伍中奪冠,成績領(lǐng)先第二名約1個(gè)百分點(diǎn)、去年冠軍3.4個(gè)百分點(diǎn)。此次達(dá)摩院再次以81.26%的準(zhǔn)確率創(chuàng)造VQA Leaderboard全球紀(jì)錄,首次超越人類基準(zhǔn)線80.83%。
據(jù)了解,VQA是AI領(lǐng)域難度最高的挑戰(zhàn)之一。在測試中,AI需根據(jù)給定圖片及自然語言問題生成正確的自然語言回答。這意味著單個(gè)AI模型需融合復(fù)雜的計(jì)算機(jī)視覺及自然語言技術(shù):首先對所有圖像信息進(jìn)行掃描,再結(jié)合對文本問題的理解,利用多模態(tài)技術(shù)學(xué)習(xí)圖文的關(guān)聯(lián)性、精準(zhǔn)定位相關(guān)圖像信息,最后根據(jù)常識及推理回答問題。
值得一提的是,這不是阿里達(dá)摩院第一次在AI關(guān)鍵領(lǐng)域超越人類基準(zhǔn)。2018年,達(dá)摩院曾在斯坦福SQuAD挑戰(zhàn)賽中歷史性地讓機(jī)器閱讀理解首次超越人類,引發(fā)海媒體體關(guān)注。
今年以來,達(dá)摩院在AI底層技術(shù)領(lǐng)域動(dòng)作頻頻,先后發(fā)布了中國科技公司中首個(gè)超大規(guī)模多模態(tài)預(yù)訓(xùn)練模型M6及首個(gè)超大規(guī)模中文語言模型PLUG,并開源了歷經(jīng)3年打造的深度語言模型體系A(chǔ)liceMind,其曾登頂GLUE等六大國際權(quán)威NLP榜單。
2、電商號平臺僅提供信息存儲服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn
