百度王海峰發(fā)布人才培養(yǎng)星河計(jì)劃

周興
2023-10-20 04:30

10月20日消息,以“生成未來(lái)”為主題的百度世界2023近日在北京首鋼園舉辦,百度首席技術(shù)官王海峰解讀文心大模型4.0背后的關(guān)鍵技術(shù)和最新進(jìn)展。王海峰表示,文心大模型4.0的理解、生成、邏輯、記憶四大能力都有顯著提升,9月已開(kāi)始小流量上線,過(guò)去一個(gè)多月效果又提升了近30%。8月31日文心一言面向全社會(huì)開(kāi)放至今,用戶規(guī)模已經(jīng)達(dá)到4500萬(wàn),開(kāi)發(fā)者5.4萬(wàn),場(chǎng)景4300個(gè),應(yīng)用825個(gè),插件超過(guò)500個(gè)。

據(jù)了解,百度在3月16日發(fā)布知識(shí)增強(qiáng)大語(yǔ)言模型文心一言。文心一言從數(shù)萬(wàn)億數(shù)據(jù)和數(shù)千億知識(shí)中融合學(xué)習(xí),得到預(yù)訓(xùn)練大模型,在此基礎(chǔ)上采用有監(jiān)督精調(diào)、人類反饋強(qiáng)化學(xué)習(xí)、提示等技術(shù),具備知識(shí)增強(qiáng)、檢索增強(qiáng)和對(duì)話增強(qiáng)的技術(shù)優(yōu)勢(shì)。

文心一言的基礎(chǔ)模型5月升級(jí)至文心大模型3.5,在基礎(chǔ)模型升級(jí)、精調(diào)技術(shù)創(chuàng)新、知識(shí)點(diǎn)增強(qiáng)、邏輯推理增強(qiáng)、插件機(jī)制等方面創(chuàng)新突破,取得效果和效率的提升。

format-jpg

圖注:百度首席技術(shù)官王海峰

(圖源百度AI公眾號(hào),下同)

10月17日發(fā)布的文心大模型4.0,相比3.5版本,理解、生成、邏輯、記憶四大能力都有顯著提升。其中理解和生成能力的提升幅度相近,而邏輯和記憶能力的提升則更大,邏輯的提升幅度達(dá)到理解的近3倍,記憶的提升幅度也達(dá)到了理解的2倍多。百度基于文心大模型研制了智能代碼助手 Comate,從內(nèi)部應(yīng)用效果來(lái)看,整體的代碼采納率達(dá)到40%,高頻用戶的代碼采納率達(dá)到60%。

據(jù)悉,文心大模型4.0在9月已開(kāi)始小流量上線,過(guò)去一個(gè)多月效果又提升了近30%。訓(xùn)練算法效率自3月以來(lái)已累計(jì)提升3.6倍,周均的訓(xùn)練有效率超過(guò)98%。文心大模型4.0基本技術(shù)架構(gòu)與3.0和3.5版本一脈相承,并在多個(gè)關(guān)鍵技術(shù)方向上進(jìn)一步創(chuàng)新突破。

在萬(wàn)卡算力上運(yùn)行飛槳平臺(tái),通過(guò)集群基礎(chǔ)設(shè)施和調(diào)度系統(tǒng)、飛槳框架的軟硬協(xié)同優(yōu)化,支持了大模型的穩(wěn)定高效訓(xùn)練。建設(shè)了多維數(shù)據(jù)體系,形成了數(shù)據(jù)挖掘、分析、合成、標(biāo)注、評(píng)估閉環(huán),充分釋放數(shù)據(jù)價(jià)值,大幅提升模型效果。基于有監(jiān)督精調(diào)、偏好學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等技術(shù)進(jìn)行多階段對(duì)齊,保證模型更好地與人類的判斷和選擇對(duì)齊??稍偕?xùn)練技術(shù)通過(guò)增量式的參數(shù)調(diào)優(yōu),有效節(jié)省了訓(xùn)練資源和時(shí)間,加快了模型迭代速度。

format-jpg

此外,文心大模型4.0在輸入和輸出階段都進(jìn)行知識(shí)點(diǎn)增強(qiáng)。一方面,對(duì)用戶輸入的問(wèn)題進(jìn)行理解,并拆解出回答問(wèn)題所需的知識(shí)點(diǎn),然后在搜索引擎、知識(shí)圖譜、數(shù)據(jù)庫(kù)中查找準(zhǔn)確知識(shí),最后把這些找到的知識(shí)組裝進(jìn) Prompt 送入大模型,準(zhǔn)確率好,效率也高;另一方面,對(duì)大模型的輸出進(jìn)行反思,從生成結(jié)果中拆解出知識(shí)點(diǎn),然后再利用搜索引擎、知識(shí)圖譜、數(shù)據(jù)庫(kù),以及大模型本身進(jìn)行確認(rèn),進(jìn)而對(duì)有差錯(cuò)的點(diǎn)進(jìn)行修正。

在強(qiáng)大的基礎(chǔ)大模型的基礎(chǔ)上,百度進(jìn)一步研制了智能體機(jī)制,包括理解、規(guī)劃、反思和進(jìn)化,能夠做到可靠執(zhí)行、自我進(jìn)化,并一定程度上將思考過(guò)程白盒化,讓機(jī)器像人一樣思考和行動(dòng),自主完成復(fù)雜任務(wù),在環(huán)境中持續(xù)學(xué)習(xí)實(shí)現(xiàn)自主進(jìn)化。

format-jpg

此外,王海峰在現(xiàn)場(chǎng)還公布了百度人工智能人才培養(yǎng)的最新數(shù)據(jù),百度在2020年提出5年為全社會(huì)培養(yǎng)500萬(wàn)AI人才,截至目前,百度已經(jīng)培養(yǎng)了420萬(wàn) AI 人才。

當(dāng)下,大模型成為人工智能發(fā)展的熱點(diǎn)方向,進(jìn)一步加速產(chǎn)業(yè)變革,AI 人才培養(yǎng)也需與時(shí)俱進(jìn)。王海峰發(fā)布了百度人才培養(yǎng)星河計(jì)劃,他表示,“我們將與產(chǎn)學(xué)研各界密切合作,深化產(chǎn)教融合,為社會(huì)再培養(yǎng)500萬(wàn)大模型人才,讓人工智能科技的‘創(chuàng)新之花’,結(jié)出更多‘產(chǎn)業(yè)之果’,服務(wù)國(guó)家戰(zhàn)略,服務(wù)社會(huì)發(fā)展,服務(wù)人民福祉!”

1、該內(nèi)容為作者獨(dú)立觀點(diǎn),不代表電商報(bào)觀點(diǎn)或立場(chǎng),文章為作者本人上傳,版權(quán)歸原作者所有,未經(jīng)允許不得轉(zhuǎn)載。
2、電商號(hào)平臺(tái)僅提供信息存儲(chǔ)服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系:info@dsb.cn
相關(guān)閱讀
百度首席技術(shù)官、深度學(xué)習(xí)技術(shù)及應(yīng)用國(guó)家工程研究中心主任海峰做了主題演講。
在中國(guó)人工智能學(xué)會(huì)首屆智能融合產(chǎn)業(yè)論壇上,百度CTO海峰發(fā)表了題為《“深度學(xué)習(xí)+”創(chuàng)新發(fā)展新引擎》的演講
海峰認(rèn)為,可以從兩個(gè)角度解讀,一是人工智能技術(shù)的通用性,二是能力的全面性。
百度WAVE SUMMIT+深度學(xué)習(xí)開(kāi)發(fā)者大會(huì)2023上,百度首席技術(shù)官海峰宣布,目前文心一言的用戶累計(jì)數(shù)量已經(jīng)超過(guò)1個(gè)億。
百度首席技術(shù)官、深度學(xué)習(xí)技術(shù)及應(yīng)用國(guó)家工程研究中心主任海峰以《人工智能技術(shù)生態(tài)與產(chǎn)業(yè)模式》為題作主旨報(bào)告。
“2023百度十大科技前沿發(fā)明”發(fā)布會(huì)日前在北京召開(kāi)。百度首席技術(shù)官(CTO)海峰在會(huì)上致辭。
百度首席技術(shù)官海峰近日做客 CCTV-10《創(chuàng)新中國(guó)說(shuō)》,展示大語(yǔ)言模型文心一言的能力。
8月17日消息,由深度學(xué)習(xí)技術(shù)及應(yīng)用國(guó)家工程研究中心主辦的WAVE SUMMIT深度學(xué)習(xí)開(kāi)發(fā)者大會(huì)2023于日前在北京舉行。海峰首次對(duì)外表示,大語(yǔ)言模型具備了理解、生成、邏輯、記憶等人工智能的核心基礎(chǔ)能力,為通用人工智能帶來(lái)曙光。以解題為例,從讀懂題目、解答題目到最后寫(xiě)出答案,需要理解、記憶、邏輯及生成能力的綜合運(yùn)用。
百度首席技術(shù)官海峰在2023世界人工智能大會(huì)上解讀文心大模型3.5版核心技術(shù),發(fā)布飛槳生態(tài)最新進(jìn)展。
    亚洲无码高清自拍偷拍自慰av网站,免费高清无码黄色网,欧美一级片免费在线观看,午夜毛片在线观看