百度首席技術(shù)官王海峰談文心大模型3.5
7月30日消息,主題為“通用智能,人機(jī)共生”的學(xué)術(shù)會(huì)議ACM中國(guó)圖靈大會(huì)于7月28日-30日在武漢舉辦,百度首席技術(shù)官、深度學(xué)習(xí)技術(shù)及應(yīng)用國(guó)家工程研究中心主任王海峰解讀文心大模型的核心技術(shù),闡述人工智能產(chǎn)業(yè)模式。
據(jù)介紹,百度在“芯片-框架-模型-應(yīng)用”人工智能四層技術(shù)棧全面布局,自研的深度學(xué)習(xí)平臺(tái)飛槳支撐了文心大模型的高效訓(xùn)練和推理,截至目前飛槳平臺(tái)開(kāi)發(fā)者數(shù)量已達(dá)到750萬(wàn)。IDC報(bào)告顯示,百度穩(wěn)居中國(guó)深度學(xué)習(xí)平臺(tái)市場(chǎng)綜合份額第一。根據(jù)中國(guó)信通院發(fā)布的《深度學(xué)習(xí)平臺(tái)報(bào)告(2022)》,飛槳是中國(guó)深度學(xué)習(xí)市場(chǎng)應(yīng)用規(guī)模第一的深度學(xué)習(xí)框架和賦能平臺(tái)。
圖源:百度AI公眾號(hào)
文心一言是百度自主研制的知識(shí)增強(qiáng)大語(yǔ)言模型,首先從數(shù)萬(wàn)億數(shù)據(jù)和數(shù)千億知識(shí)中融合學(xué)習(xí)得到預(yù)訓(xùn)練大模型,在此基礎(chǔ)上采用有監(jiān)督精調(diào)、人類反饋的強(qiáng)化學(xué)習(xí)和提示等技術(shù),并具備知識(shí)增強(qiáng)、檢索增強(qiáng)和對(duì)話增強(qiáng)等技術(shù)優(yōu)勢(shì)。
王海峰解讀了文心大模型3.5的核心技術(shù)創(chuàng)新,通過(guò)飛槳與文心協(xié)同優(yōu)化,文心大模型3.5實(shí)現(xiàn)了基礎(chǔ)模型升級(jí)、精調(diào)技術(shù)創(chuàng)新、知識(shí)點(diǎn)增強(qiáng)、邏輯推理增強(qiáng)等,模型效果提升50%,訓(xùn)練速度提升2倍,推理速度提升30倍。
在基礎(chǔ)模型訓(xùn)練上,采用了飛槳最先進(jìn)的自適應(yīng)混合并行訓(xùn)練技術(shù)及混合精度計(jì)算策略,并采用多種策略優(yōu)化數(shù)據(jù)源及數(shù)據(jù)分布,加快了模型迭代速度,顯著提升了模型效果和安全性。同時(shí),百度研發(fā)團(tuán)隊(duì)創(chuàng)新了多類型多階段有監(jiān)督精調(diào)、多層次多粒度獎(jiǎng)勵(lì)模型、多損失函數(shù)混合優(yōu)化策略、雙飛輪結(jié)合的模型優(yōu)化等技術(shù),進(jìn)一步提升模型效果及場(chǎng)景適配能力。
百度文心大模型全景圖;圖源:百度AI公眾號(hào)
在知識(shí)增強(qiáng)和檢索增強(qiáng)基礎(chǔ)上,文心大模型3.5提出了“知識(shí)點(diǎn)增強(qiáng)技術(shù)”,使得模型能夠更好地利用精細(xì)的知識(shí)點(diǎn)來(lái)提升理解生成等方面的能力,進(jìn)而提升對(duì)世界知識(shí)的掌握和運(yùn)用。
在推理方面,通過(guò)大規(guī)模邏輯數(shù)據(jù)構(gòu)建、邏輯知識(shí)建模、多粒度語(yǔ)義知識(shí)組合以及符號(hào)神經(jīng)網(wǎng)絡(luò)技術(shù),提升文心大模型3.5在邏輯推理、數(shù)學(xué)計(jì)算及代碼生成等任務(wù)上的表現(xiàn)。
文心大模型3.5還新增了插件機(jī)制,包括官方插件百度搜索和ChatFile,使得文心一言能夠生成實(shí)時(shí)準(zhǔn)確信息和長(zhǎng)文本摘要,拓展了大模型能力邊界。
根據(jù)IDC最新發(fā)布的《AI大模型技術(shù)能力評(píng)估報(bào)告,2023》,百度文心大模型3.5在14個(gè)參評(píng)模型中拿下12項(xiàng)指標(biāo)的7個(gè)滿分,得到“綜合評(píng)分第一,算法模型第一,行業(yè)覆蓋第一”三個(gè)絕對(duì)第一。
圖源:百度AI公眾號(hào)
王海峰在演講中展示了文心一言的問(wèn)答對(duì)話、文案生成、行程規(guī)劃等能力,以及在辦公、會(huì)議、編碼等場(chǎng)景的應(yīng)用。
工作中,文心一言化身“超級(jí)助理”,幫助總結(jié)工作溝通要點(diǎn),實(shí)時(shí)記錄會(huì)議內(nèi)容,形成會(huì)議議題、摘要及總結(jié)等關(guān)鍵信息,可以通過(guò)各類插件完成指令任務(wù),包括查詢?nèi)粘獭?chuàng)建會(huì)議、設(shè)置待辦、申請(qǐng)休假等,也可以在工程師編碼過(guò)程中自動(dòng)推薦和生成代碼。據(jù)悉,目前這些功能已通過(guò)智能工作平臺(tái)“如流”應(yīng)用于百度的工作流程中,Comate智能編碼伙伴幫助80%百度工程師提升編程效率,吸引100多家合作伙伴。
對(duì)于大模型的產(chǎn)業(yè)模式,王海峰表示,在文心一言這類大模型產(chǎn)業(yè)落地的進(jìn)程中,可以采用“集約化生產(chǎn),平臺(tái)化應(yīng)用”的模式,即具有算法、算力和數(shù)據(jù)綜合優(yōu)勢(shì)的企業(yè)將模型生產(chǎn)的復(fù)雜過(guò)程封裝起來(lái),通過(guò)低門檻、高效率的生產(chǎn)平臺(tái),為千行百業(yè)提供大模型服務(wù),支撐產(chǎn)業(yè)智能化升級(jí)。
2、電商號(hào)平臺(tái)僅提供信息存儲(chǔ)服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系:info@dsb.cn