百度首席技術(shù)官王海峰談文心大模型3.5

柏納
2023-07-30 16:49

7月30日消息,主題為“通用智能,人機(jī)共生”的學(xué)術(shù)會(huì)議ACM中國(guó)圖靈大會(huì)于7月28日-30日在武漢舉辦,百度首席技術(shù)官、深度學(xué)習(xí)技術(shù)及應(yīng)用國(guó)家工程研究中心主任王海峰解讀文心大模型的核心技術(shù),闡述人工智能產(chǎn)業(yè)模式。

據(jù)介紹,百度在“芯片-框架-模型-應(yīng)用”人工智能四層技術(shù)棧全面布局,自研的深度學(xué)習(xí)平臺(tái)飛槳支撐了文心大模型的高效訓(xùn)練和推理,截至目前飛槳平臺(tái)開(kāi)發(fā)者數(shù)量已達(dá)到750萬(wàn)。IDC報(bào)告顯示,百度穩(wěn)居中國(guó)深度學(xué)習(xí)平臺(tái)市場(chǎng)綜合份額第一。根據(jù)中國(guó)信通院發(fā)布的《深度學(xué)習(xí)平臺(tái)報(bào)告(2022)》,飛槳是中國(guó)深度學(xué)習(xí)市場(chǎng)應(yīng)用規(guī)模第一的深度學(xué)習(xí)框架和賦能平臺(tái)。

format-jpg

圖源:百度AI公眾號(hào)

文心一言是百度自主研制的知識(shí)增強(qiáng)大語(yǔ)言模型,首先從數(shù)萬(wàn)億數(shù)據(jù)和數(shù)千億知識(shí)中融合學(xué)習(xí)得到預(yù)訓(xùn)練大模型,在此基礎(chǔ)上采用有監(jiān)督精調(diào)、人類反饋的強(qiáng)化學(xué)習(xí)和提示等技術(shù),并具備知識(shí)增強(qiáng)、檢索增強(qiáng)和對(duì)話增強(qiáng)等技術(shù)優(yōu)勢(shì)。

王海峰解讀了文心大模型3.5的核心技術(shù)創(chuàng)新,通過(guò)飛槳與文心協(xié)同優(yōu)化,文心大模型3.5實(shí)現(xiàn)了基礎(chǔ)模型升級(jí)、精調(diào)技術(shù)創(chuàng)新、知識(shí)點(diǎn)增強(qiáng)、邏輯推理增強(qiáng)等,模型效果提升50%,訓(xùn)練速度提升2倍,推理速度提升30倍。

在基礎(chǔ)模型訓(xùn)練上,采用了飛槳最先進(jìn)的自適應(yīng)混合并行訓(xùn)練技術(shù)及混合精度計(jì)算策略,并采用多種策略優(yōu)化數(shù)據(jù)源及數(shù)據(jù)分布,加快了模型迭代速度,顯著提升了模型效果和安全性。同時(shí),百度研發(fā)團(tuán)隊(duì)創(chuàng)新了多類型多階段有監(jiān)督精調(diào)、多層次多粒度獎(jiǎng)勵(lì)模型、多損失函數(shù)混合優(yōu)化策略、雙飛輪結(jié)合的模型優(yōu)化等技術(shù),進(jìn)一步提升模型效果及場(chǎng)景適配能力。

format-jpg

百度文心大模型全景圖;圖源:百度AI公眾號(hào)

在知識(shí)增強(qiáng)和檢索增強(qiáng)基礎(chǔ)上,文心大模型3.5提出了“知識(shí)點(diǎn)增強(qiáng)技術(shù)”,使得模型能夠更好地利用精細(xì)的知識(shí)點(diǎn)來(lái)提升理解生成等方面的能力,進(jìn)而提升對(duì)世界知識(shí)的掌握和運(yùn)用。

在推理方面,通過(guò)大規(guī)模邏輯數(shù)據(jù)構(gòu)建、邏輯知識(shí)建模、多粒度語(yǔ)義知識(shí)組合以及符號(hào)神經(jīng)網(wǎng)絡(luò)技術(shù),提升文心大模型3.5在邏輯推理、數(shù)學(xué)計(jì)算及代碼生成等任務(wù)上的表現(xiàn)。

文心大模型3.5還新增了插件機(jī)制,包括官方插件百度搜索和ChatFile,使得文心一言能夠生成實(shí)時(shí)準(zhǔn)確信息和長(zhǎng)文本摘要,拓展了大模型能力邊界。

根據(jù)IDC最新發(fā)布的《AI大模型技術(shù)能力評(píng)估報(bào)告,2023》,百度文心大模型3.5在14個(gè)參評(píng)模型中拿下12項(xiàng)指標(biāo)的7個(gè)滿分,得到“綜合評(píng)分第一,算法模型第一,行業(yè)覆蓋第一”三個(gè)絕對(duì)第一。

format-jpg

圖源:百度AI公眾號(hào)

王海峰在演講中展示了文心一言的問(wèn)答對(duì)話、文案生成、行程規(guī)劃等能力,以及在辦公、會(huì)議、編碼等場(chǎng)景的應(yīng)用。

工作中,文心一言化身“超級(jí)助理”,幫助總結(jié)工作溝通要點(diǎn),實(shí)時(shí)記錄會(huì)議內(nèi)容,形成會(huì)議議題、摘要及總結(jié)等關(guān)鍵信息,可以通過(guò)各類插件完成指令任務(wù),包括查詢?nèi)粘獭?chuàng)建會(huì)議、設(shè)置待辦、申請(qǐng)休假等,也可以在工程師編碼過(guò)程中自動(dòng)推薦和生成代碼。據(jù)悉,目前這些功能已通過(guò)智能工作平臺(tái)“如流”應(yīng)用于百度的工作流程中,Comate智能編碼伙伴幫助80%百度工程師提升編程效率,吸引100多家合作伙伴。

對(duì)于大模型的產(chǎn)業(yè)模式,王海峰表示,在文心一言這類大模型產(chǎn)業(yè)落地的進(jìn)程中,可以采用“集約化生產(chǎn),平臺(tái)化應(yīng)用”的模式,即具有算法、算力和數(shù)據(jù)綜合優(yōu)勢(shì)的企業(yè)將模型生產(chǎn)的復(fù)雜過(guò)程封裝起來(lái),通過(guò)低門檻、高效率的生產(chǎn)平臺(tái),為千行百業(yè)提供大模型服務(wù),支撐產(chǎn)業(yè)智能化升級(jí)。

1、該內(nèi)容為作者獨(dú)立觀點(diǎn),不代表電商報(bào)觀點(diǎn)或立場(chǎng),文章為作者本人上傳,版權(quán)歸原作者所有,未經(jīng)允許不得轉(zhuǎn)載。
2、電商號(hào)平臺(tái)僅提供信息存儲(chǔ)服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系:info@dsb.cn
相關(guān)閱讀
百度首席技術(shù)海峰參加了第三屆中國(guó)國(guó)際軟件發(fā)展大會(huì)暨中國(guó)軟件行業(yè)協(xié)會(huì)成立四十周年慶典。
百度首席技術(shù)海峰近日做客 CCTV-10《創(chuàng)新中國(guó)說(shuō)》,展示大語(yǔ)言模型文心一言的能力。
百度首席技術(shù)海峰在2023世界人工智能大會(huì)上解讀文心大模型3.5版核心技術(shù),發(fā)布飛槳生態(tài)最新進(jìn)展。
百度首席技術(shù)海峰詳細(xì)解讀了文心3.5在技術(shù)和工程上的升級(jí)。
百度首席技術(shù)海峰表示,當(dāng)前規(guī)?;腁I大生產(chǎn)已然形成。
6月27日消息,百度首席技術(shù)海峰近日詳細(xì)解讀了文心3.5在技術(shù)和工程上的升級(jí)。對(duì)比數(shù)據(jù)顯示,文心大模型3.5的訓(xùn)練速度提升2倍,推理速度提升17倍。功能方面,文心大模型最大的一個(gè)變化是新增了插件機(jī)制。海峰表示,下一階段,文心一言將發(fā)布更多優(yōu)質(zhì)的百度官方和第三方插件,讓用戶能夠更好地應(yīng)用文心大模型。
百度WAVE SUMMIT+深度學(xué)習(xí)開(kāi)發(fā)者大會(huì)2023上,百度首席技術(shù)海峰宣布,目前文心一言的用戶累計(jì)數(shù)量已經(jīng)超過(guò)1個(gè)億。
9月13日消息,2023百度十大科技前沿發(fā)明發(fā)布會(huì)上,百度首席技術(shù)海峰表示,大語(yǔ)言模型具備了理解、生成、邏輯、記憶等人工智能的核心基礎(chǔ)能力,為通用人工智能帶來(lái)曙光。百度大模型專利申請(qǐng)量、授權(quán)量都是國(guó)內(nèi)第一,深度學(xué)習(xí)專利申請(qǐng)量全球第一。十大科技前沿發(fā)明涉及大模型、基于大模型的端到端搜索、飛槳、AI芯片等,超過(guò)70%的發(fā)明都涉及到大模型和重構(gòu)創(chuàng)新。
中國(guó)電子學(xué)會(huì)副理事長(zhǎng)、百度首席技術(shù)海峰出席主論壇并做報(bào)告,闡釋了大模型技術(shù)發(fā)展與產(chǎn)業(yè)模式。海峰展示了文心一言的對(duì)話問(wèn)答、文學(xué)創(chuàng)作、多模態(tài)生成等能力。海峰表示,新一代知識(shí)增強(qiáng)大語(yǔ)言模型文心一言是百度多年技術(shù)積累和產(chǎn)業(yè)實(shí)踐的水到渠成。百度自2019年開(kāi)始深耕預(yù)訓(xùn)練模型研發(fā),經(jīng)過(guò)近4年積累和迭代,文心大模型已經(jīng)形成了系統(tǒng)性的大模型技術(shù)體系,包括自然語(yǔ)言處理、視覺(jué)、跨模態(tài)、生物計(jì)算等大模型。
    亚洲无码高清自拍偷拍自慰av网站,免费高清无码黄色网,欧美一级片免费在线观看,午夜毛片在线观看