百度CTO王海峰:文心一言是百度技術(shù)積累和產(chǎn)業(yè)實踐的水到渠成

劉峰
2023-03-17 09:22

3月17日消息,百度日前在北京總部召開新聞發(fā)布會,百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏和百度首席技術(shù)官(CTO)王海峰出席。

會上,李彥宏展示了新一代知識增強大語言模型文心一言在文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯推算、中文理解、多模態(tài)生成五個使用場景中的綜合能力,王海峰解讀了文心一言的技術(shù)特性及其背后的技術(shù)積累。

format-jpg

王海峰認(rèn)為,文心一言是百度多年技術(shù)積累和產(chǎn)業(yè)實踐的水到渠成,尤其是飛槳深度學(xué)習(xí)平臺和文心大模型的聯(lián)合優(yōu)化,為文心一言提供了堅實的技術(shù)支撐。據(jù)介紹,文心大模型從2019年發(fā)布以來,已經(jīng)從最初的自然語言理解大模型,發(fā)展成了跨語言、跨模態(tài)、跨任務(wù)、跨行業(yè)的能力完備的大模型平臺。

據(jù)了解,文心一言是新一代知識增強大語言模型,也是百度繼文心一格之后的又一個生成式AI產(chǎn)品,具備對話交互、內(nèi)容創(chuàng)作、知識推理、多模態(tài)生成等能力。王海峰表示,新一代知識增強大語言模型文心一言,是在ERNIE及PLATO系列模型的基礎(chǔ)上研發(fā)的。

王海峰介紹,文心一言的關(guān)鍵技術(shù)包括有監(jiān)督精調(diào)、人類反饋的強化學(xué)習(xí)、提示、知識增強、檢索增強和對話增強。前三項是這類大語言模型都會采用的技術(shù),ERNIE和PLATO中已經(jīng)有應(yīng)用和積累,在文心一言中又有了進(jìn)一步強化和打磨;后三項則是百度已有技術(shù)優(yōu)勢的再創(chuàng)新,也是文心一言未來越來越強大的基礎(chǔ)。

format-jpg

圖源:百度官微,下同

在知識增強方面,文心一言的知識增強主要是通過知識內(nèi)化和知識外用兩種方式。知識內(nèi)化,是從大規(guī)模知識和無標(biāo)注數(shù)據(jù)中,基于語義單元學(xué)習(xí),利用知識構(gòu)造訓(xùn)練數(shù)據(jù),將知識學(xué)習(xí)到模型參數(shù)中;知識外用,是引入外部多源異構(gòu)知識,做知識推理、提示構(gòu)建等。

在檢索增強方面,文心一言的檢索增強,來自以語義理解與語義匹配為核心技術(shù)的新一代搜索架構(gòu)。通過引入搜索結(jié)果,可以為大模型提供時效性強、準(zhǔn)確率高的參考信息,更好地滿足用戶需求。

在對話增強方面,基于對話技術(shù)和應(yīng)用積累,文心一言具備記憶機(jī)制、上下文理解和對話規(guī)劃能力,實現(xiàn)更好的對話連貫性、合理性和邏輯性。

format-jpg

王海峰強調(diào),飛槳深度學(xué)習(xí)平臺支撐文心一言效果更好、效率更高、性能更強。他表示,文心大模型加上飛槳深度學(xué)習(xí)平臺,夯實了產(chǎn)業(yè)智能化基座。隨著文心一言與飛槳平臺的進(jìn)一步融合發(fā)展,人工智能技術(shù)和應(yīng)用的研發(fā)將越來越標(biāo)準(zhǔn)化、自動化和模塊化,加速人工智能的工業(yè)大生產(chǎn),同時也反哺文心一言加速迭代進(jìn)化,落地更多場景和行業(yè),為千行百業(yè)智能化升級帶來不竭動力。

據(jù)王海峰介紹,如今,飛槳平臺已凝聚535萬開發(fā)者,服務(wù)20萬企事業(yè)單位,基于飛槳創(chuàng)建了67萬個模型。

1、該內(nèi)容為作者獨立觀點,不代表電商報觀點或立場,文章為作者本人上傳,版權(quán)歸原作者所有,未經(jīng)允許不得轉(zhuǎn)載。
2、電商號平臺僅提供信息存儲服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn
相關(guān)閱讀
中國電子學(xué)會副理事長、百度首席技術(shù)官海峰出席主論壇并做報告,闡釋了大模型技術(shù)發(fā)展與產(chǎn)業(yè)模式。海峰展示了文心的對話問答、文學(xué)創(chuàng)作、多模態(tài)生成等能力。海峰表示,新一代知識增強大語言模型文心百度多年技術(shù)積累和產(chǎn)業(yè)實踐的水到渠成。百度自2019年開始深耕預(yù)訓(xùn)練模型研發(fā),經(jīng)過近4年積累和迭代,文心大模型已經(jīng)形成了系統(tǒng)性的大模型技術(shù)體系,包括自然語言處理、視覺、跨模態(tài)、生物計算等大模型。
36氪獨家獲悉,目前百度籌備“文心”的團(tuán)隊主要由TPG(技術(shù)中臺事業(yè)群)、MEG(移動生態(tài)事業(yè)群)兩大部門協(xié)同。
12月28日消息,在百度WAVE SUMMIT+深度學(xué)習(xí)開發(fā)者大會2023上,百度首席技術(shù)官海峰宣布,目前文心的用戶累計數(shù)量已經(jīng)超過1個億。
11月10日消息,2023年世界互聯(lián)網(wǎng)大會烏鎮(zhèn)峰會上,百度首席技術(shù)官、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心主任海峰出席前沿數(shù)字技術(shù)創(chuàng)新與安全論壇和人工智能賦能產(chǎn)業(yè)發(fā)展論壇,解讀文心大模型4.0最新技術(shù),闡述大模型產(chǎn)業(yè)模式,海峰披露,文心用戶規(guī)?,F(xiàn)已達(dá)到7000萬,場景4300個。
6月27日消息,百度首席技術(shù)官海峰近日詳細(xì)解讀了文心3.5在技術(shù)和工程上的升級。對比數(shù)據(jù)顯示,文心大模型3.5的訓(xùn)練速度提升2倍,推理速度提升17倍。功能方面,文心大模型最大的一個變化是新增了插件機(jī)制。海峰表示,下一階段,文心將發(fā)布更多優(yōu)質(zhì)的百度官方和第三方插件,讓用戶能夠更好地應(yīng)用文心大模型。
截至目前,文心用戶規(guī)模已破3億,文心大模型日均調(diào)用次數(shù)超7億,日均處理文本Tokens超1萬億。
2月28日消息,中國人工智能學(xué)會首屆智能融合產(chǎn)業(yè)論壇日前在成都舉辦。海峰表示,深度學(xué)習(xí)在技術(shù)、生態(tài)、產(chǎn)業(yè)等多個維度已逐漸成熟,人工智能的技術(shù)創(chuàng)新和產(chǎn)業(yè)發(fā)展進(jìn)入“深度學(xué)習(xí)+”階段,正引領(lǐng)新一輪技術(shù)更迭。海峰表示,百度文心產(chǎn)業(yè)級知識增強大模型,具備跨模態(tài)、跨語言的深度語義理解與生成能力,已應(yīng)用于搜索、信息流、智能音箱等互聯(lián)網(wǎng)產(chǎn)品,并通過飛槳深度學(xué)習(xí)平臺賦能制造、能源、金融、通信、媒體等各行各業(yè)。
近日,百度首席技術(shù)官(CTO海峰做客人民網(wǎng)《人民會客廳》視頻訪談。
    亚洲无码高清自拍偷拍自慰av网站,免费高清无码黄色网,欧美一级片免费在线观看,午夜毛片在线观看