阿里巴巴發(fā)布“通義”大模型系列,推動(dòng)AI從單一智能向通用智能進(jìn)化
9月2日,阿里巴巴達(dá)摩院主辦世界人工智能大會(huì)“大規(guī)模預(yù)訓(xùn)練模型”主題論壇。會(huì)上,達(dá)摩院副院長(zhǎng)周靖人發(fā)布阿里巴巴最新“通義”大模型系列,并宣布相關(guān)核心模型向全球開(kāi)發(fā)者開(kāi)源開(kāi)放。面向大模型通用性與易用性仍欠缺的難題,通義打造了業(yè)界首個(gè)AI統(tǒng)一底座,并構(gòu)建了大小模型協(xié)同的層次化人工智能體系,將為AI從感知智能邁向知識(shí)驅(qū)動(dòng)的認(rèn)知智能提供先進(jìn)基礎(chǔ)設(shè)施。
近年來(lái),大模型表現(xiàn)出前所未有的理解與創(chuàng)造能力,且打破了傳統(tǒng)AI只能處理單一任務(wù)的限制,讓人類離通用人工智能的目標(biāo)近了一步。但大模型在實(shí)現(xiàn)全模態(tài)和全任務(wù)的通用性上仍存在許多技術(shù)難點(diǎn),同時(shí)受算力資源限制,其訓(xùn)練與落地應(yīng)用頗具挑戰(zhàn)。
2021年,阿里巴巴達(dá)摩院先后發(fā)布多個(gè)版本的多模態(tài)及語(yǔ)言大模型,在超大模型、低碳訓(xùn)練技術(shù)、平臺(tái)化服務(wù)、落地應(yīng)用等方面實(shí)現(xiàn)突破,引領(lǐng)了中文大模型的發(fā)展。尤其引發(fā)關(guān)注的是,達(dá)摩院團(tuán)隊(duì)使用512卡V100 GPU即實(shí)現(xiàn)10萬(wàn)億參數(shù)大模型M6,同等參數(shù)規(guī)模能耗僅為此前業(yè)界標(biāo)桿的1%,極大降低了大模型訓(xùn)練門檻。
今年,阿里巴巴在解決大模型通用性及易用性難題上繼續(xù)發(fā)力。達(dá)摩院副院長(zhǎng)周靖人介紹,為了讓大模型更加“融會(huì)貫通”,達(dá)摩院在國(guó)內(nèi)率先構(gòu)建了AI統(tǒng)一底座,在業(yè)界首次實(shí)現(xiàn)模態(tài)表示、任務(wù)表示、模型結(jié)構(gòu)的統(tǒng)一。通義統(tǒng)一底座中M6-OFA模型,作為單一模型,在不引入新增結(jié)構(gòu)的情況下,可同時(shí)處理圖像描述、視覺(jué)定位、文生圖、視覺(jué)蘊(yùn)含、文檔摘要等10余項(xiàng)單模態(tài)和跨模態(tài)任務(wù),且效果達(dá)到國(guó)際領(lǐng)先水平。這一突破最大程度打通了AI的感官,受到學(xué)界和工業(yè)界廣泛關(guān)注。近期M6-OFA完成升級(jí)后,可處理超過(guò)30種跨模態(tài)任務(wù)。
“大模型模仿了人類構(gòu)建認(rèn)知的過(guò)程,這是當(dāng)下我們面臨的重要機(jī)遇。通過(guò)融合AI在語(yǔ)言、語(yǔ)音、視覺(jué)等不同模態(tài)和領(lǐng)域的知識(shí)體系,我們期望多模態(tài)大模型能成為下一代人工智能算法的基石,讓AI從只能使用‘單一感官’到‘五官全開(kāi)’,且能調(diào)用儲(chǔ)備豐富知識(shí)的大腦來(lái)理解世界和思考,最終實(shí)現(xiàn)接近人類水平的認(rèn)知智能。”周靖人表示。
同時(shí),以統(tǒng)一底座為基礎(chǔ),達(dá)摩院構(gòu)建了層次化的模型體系,其中通用模型層覆蓋自然語(yǔ)言處理、多模態(tài)、計(jì)算機(jī)視覺(jué),專業(yè)模型層深入電商、醫(yī)療、法律、金融、娛樂(lè)等行業(yè)。通用與專業(yè)領(lǐng)域大小模型協(xié)同,讓通義大模型系列可兼顧性能最優(yōu)化與低成本落地。為加快大模型規(guī)?;瘧?yīng)用,達(dá)摩院還研發(fā)了超大模型落地關(guān)鍵技術(shù)S4框架,百億參數(shù)大模型在壓縮率達(dá)99%的情況下多任務(wù)精度可接近無(wú)損。
通過(guò)部署超大模型及輕量化版本,阿里巴巴通義大模型系列已在超過(guò)200個(gè)場(chǎng)景中提供服務(wù),實(shí)現(xiàn)了2%~10%的應(yīng)用效果提升。典型使用場(chǎng)景包括電商跨模態(tài)搜索、AI輔助設(shè)計(jì)、開(kāi)放域人機(jī)對(duì)話、法律文書學(xué)習(xí)、醫(yī)療文本理解等。
與本次發(fā)布同步,通義大模型系列中語(yǔ)言大模型AliceMind-PLUG、多模態(tài)理解與生成統(tǒng)一模型AliceMind-mPLUG、多模態(tài)統(tǒng)一底座模型M6-OFA、超大模型落地關(guān)鍵技術(shù)S4框架等核心模型及能力已面向全球開(kāi)發(fā)者開(kāi)源,最新文生圖大模型近期將開(kāi)放體驗(yàn)。(開(kāi)源鏈接:https://github.com/alibaba/AliceMind/; https://github.com/OFA-Sys/OFA)
2、電商號(hào)平臺(tái)僅提供信息存儲(chǔ)服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系:info@dsb.cn