百度王海峰發(fā)布人才培養(yǎng)星河計劃

周興

2023-10-20 04:30

10月20日消息，以“生成未來”為主題的百度世界2023近日在北京首鋼園舉辦，百度首席技術(shù)官王海峰解讀文心大模型4.0背后的關(guān)鍵技術(shù)和最新進展。王海峰表示，文心大模型4.0的理解、生成、邏輯、記憶四大能力都有顯著提升，9月已開始小流量上線，過去一個多月效果又提升了近30%。8月31日文心一言面向全社會開放至今，用戶規(guī)模已經(jīng)達到4500萬，開發(fā)者5.4萬，場景4300個，應用825個，插件超過500個。

據(jù)了解，百度在3月16日發(fā)布知識增強大語言模型文心一言。文心一言從數(shù)萬億數(shù)據(jù)和數(shù)千億知識中融合學習，得到預訓練大模型，在此基礎(chǔ)上采用有監(jiān)督精調(diào)、人類反饋強化學習、提示等技術(shù)，具備知識增強、檢索增強和對話增強的技術(shù)優(yōu)勢。

文心一言的基礎(chǔ)模型5月升級至文心大模型3.5，在基礎(chǔ)模型升級、精調(diào)技術(shù)創(chuàng)新、知識點增強、邏輯推理增強、插件機制等方面創(chuàng)新突破，取得效果和效率的提升。

format-jpg

圖注：百度首席技術(shù)官王海峰

（圖源百度AI公眾號，下同）

10月17日發(fā)布的文心大模型4.0，相比3.5版本，理解、生成、邏輯、記憶四大能力都有顯著提升。其中理解和生成能力的提升幅度相近，而邏輯和記憶能力的提升則更大，邏輯的提升幅度達到理解的近3倍，記憶的提升幅度也達到了理解的2倍多。百度基于文心大模型研制了智能代碼助手 Comate，從內(nèi)部應用效果來看，整體的代碼采納率達到40%，高頻用戶的代碼采納率達到60%。

據(jù)悉，文心大模型4.0在9月已開始小流量上線，過去一個多月效果又提升了近30%。訓練算法效率自3月以來已累計提升3.6倍，周均的訓練有效率超過98%。文心大模型4.0基本技術(shù)架構(gòu)與3.0和3.5版本一脈相承，并在多個關(guān)鍵技術(shù)方向上進一步創(chuàng)新突破。

在萬卡算力上運行飛槳平臺，通過集群基礎(chǔ)設(shè)施和調(diào)度系統(tǒng)、飛槳框架的軟硬協(xié)同優(yōu)化，支持了大模型的穩(wěn)定高效訓練。建設(shè)了多維數(shù)據(jù)體系，形成了數(shù)據(jù)挖掘、分析、合成、標注、評估閉環(huán)，充分釋放數(shù)據(jù)價值，大幅提升模型效果。基于有監(jiān)督精調(diào)、偏好學習、強化學習等技術(shù)進行多階段對齊，保證模型更好地與人類的判斷和選擇對齊?？稍偕柧毤夹g(shù)通過增量式的參數(shù)調(diào)優(yōu)，有效節(jié)省了訓練資源和時間，加快了模型迭代速度。

format-jpg

此外，文心大模型4.0在輸入和輸出階段都進行知識點增強。一方面，對用戶輸入的問題進行理解，并拆解出回答問題所需的知識點，然后在搜索引擎、知識圖譜、數(shù)據(jù)庫中查找準確知識，最后把這些找到的知識組裝進 Prompt 送入大模型，準確率好，效率也高；另一方面，對大模型的輸出進行反思，從生成結(jié)果中拆解出知識點，然后再利用搜索引擎、知識圖譜、數(shù)據(jù)庫，以及大模型本身進行確認，進而對有差錯的點進行修正。

在強大的基礎(chǔ)大模型的基礎(chǔ)上，百度進一步研制了智能體機制，包括理解、規(guī)劃、反思和進化，能夠做到可靠執(zhí)行、自我進化，并一定程度上將思考過程白盒化，讓機器像人一樣思考和行動，自主完成復雜任務，在環(huán)境中持續(xù)學習實現(xiàn)自主進化。

format-jpg

此外，王海峰在現(xiàn)場還公布了百度人工智能人才培養(yǎng)的最新數(shù)據(jù)，百度在2020年提出5年為全社會培養(yǎng)500萬AI人才，截至目前，百度已經(jīng)培養(yǎng)了420萬 AI 人才。

當下，大模型成為人工智能發(fā)展的熱點方向，進一步加速產(chǎn)業(yè)變革，AI 人才培養(yǎng)也需與時俱進。王海峰發(fā)布了百度人才培養(yǎng)星河計劃，他表示，“我們將與產(chǎn)學研各界密切合作，深化產(chǎn)教融合，為社會再培養(yǎng)500萬大模型人才，讓人工智能科技的‘創(chuàng)新之花’，結(jié)出更多‘產(chǎn)業(yè)之果’，服務國家戰(zhàn)略，服務社會發(fā)展，服務人民福祉！”

百度王海峰演講人才培養(yǎng)星河計劃

聲明

1、該內(nèi)容為作者獨立觀點，不代表電商派觀點或立場，文章為作者本人上傳，版權(quán)歸原作者所有，未經(jīng)允許不得轉(zhuǎn)載。
2、電商號平臺僅提供信息存儲服務，如發(fā)現(xiàn)文章、圖片等侵權(quán)行為，侵權(quán)責任由作者本人承擔。
3、如對本稿件有異議或投訴，請聯(lián)系：info@dsb.cn

相關(guān)閱讀

百度王海峰：飛槳開發(fā)者數(shù)量達800萬，創(chuàng)建模型80萬個

2023-08-18 04:30:00

百度首席技術(shù)官、深度學習技術(shù)及應用國家工程研究中心主任王海峰做了主題演講。

百度CTO王海峰：人工智能技術(shù)創(chuàng)新和產(chǎn)業(yè)發(fā)展進入“深度學習+”階段

2023-02-28 13:54:44

在中國人工智能學會首屆智能融合產(chǎn)業(yè)論壇上，百度CTO王海峰發(fā)表了題為《“深度學習+”創(chuàng)新發(fā)展新引擎》的演講。

百度王海峰談通用人工智能：技術(shù)通用、能力全面

2024-07-01 11:01:28

王海峰認為，可以從兩個角度解讀，一是人工智能技術(shù)的通用性，二是能力的全面性。

百度王海峰：文心一言用戶累計數(shù)量已超1個億

2023-12-29 04:30:00

在百度WAVE SUMMIT+深度學習開發(fā)者大會2023上，百度首席技術(shù)官王海峰宣布，目前文心一言的用戶累計數(shù)量已經(jīng)超過1個億。

百度王海峰：知識增強大語言模型具備人工智能四項基礎(chǔ)能力

2023-09-26 04:30:00

百度首席技術(shù)官、深度學習技術(shù)及應用國家工程研究中心主任王海峰以《人工智能技術(shù)生態(tài)與產(chǎn)業(yè)模式》為題作主旨報告。

百度王海峰：鼓勵培養(yǎng)AI原生思維，創(chuàng)新AI原生應用

2023-09-13 16:28:00

“2023百度十大科技前沿發(fā)明”發(fā)布會日前在北京召開。百度首席技術(shù)官（CTO）王海峰在會上致辭。

百度王海峰：技術(shù)創(chuàng)新過程就是要挑戰(zhàn)沒人做過的事

2023-08-30 04:30:00

百度首席技術(shù)官王海峰近日做客 CCTV-10《創(chuàng)新中國說》，展示大語言模型文心一言的能力。

百度王海峰：大語言模型為通用人工智能帶來曙光

2023-08-17 09:34:28

8月17日消息，由深度學習技術(shù)及應用國家工程研究中心主辦的WAVE SUMMIT深度學習開發(fā)者大會2023于日前在北京舉行。王海峰首次對外表示，大語言模型具備了理解、生成、邏輯、記憶等人工智能的核心基礎(chǔ)能力，為通用人工智能帶來曙光。以解題為例，從讀懂題目、解答題目到最后寫出答案，需要理解、記憶、邏輯及生成能力的綜合運用。

百度王海峰：文心一言將發(fā)布更多優(yōu)質(zhì)的百度官方和第三方插件

2023-07-07 09:16:00

百度首席技術(shù)官王海峰在2023世界人工智能大會上解讀文心大模型3.5版核心技術(shù)，發(fā)布飛槳生態(tài)最新進展。

周興

1

推薦閱讀

劉強東，和胖東來聯(lián)手了

劉強東，和胖東來聯(lián)手了

亚洲无码高清自拍偷拍自慰av网站,免费高清无码黄色网,欧美一级片免费在线观看,午夜毛片在线观看