百度王海峰:文心一言將發(fā)布更多優(yōu)質的百度官方和第三方插件

周興
2023-07-07 09:16

7月7日消息,2023世界人工智能大會于7月6日在上海世博中心開幕,眾多專家學者、科技領軍人才、企業(yè)代表共同探討人工智能賦能產業(yè)發(fā)展的全新變化,展望技術新趨勢。百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰解讀文心大模型3.5版核心技術,發(fā)布飛槳生態(tài)最新進展,闡述人工智能產業(yè)模式,為人工智能技術及產業(yè)最新發(fā)聲。

王海峰表示,當前,以大語言模型為代表的人工智能技術在全球掀起科技和產業(yè)創(chuàng)新浪潮,加速產業(yè)升級和經濟增長,各行各業(yè)都將發(fā)生巨大變化。IT技術棧發(fā)生根本性改變,從芯片、操作系統(tǒng)和應用三層架構,轉變?yōu)樾酒?、框架、模型、應用四層架構。深度學習框架和大模型構成了產業(yè)智能化基座,將支撐各行各業(yè)的應用智能化重構,促進經濟高質量發(fā)展。

據了解,百度在人工智能四層技術棧均有布局和領先的自研技術,尤其在位于四層架構核心的框架層和模型層。文心大模型的最新成果,也得益于飛槳深度學習平臺和文心的聯合優(yōu)化。飛槳是我國第一個自主研發(fā)的產業(yè)級深度學習開源開放平臺,在中國深度學習平臺綜合市場份額上連續(xù)兩年位居第一。王海峰現場透露,截至目前飛槳已凝聚750萬名開發(fā)者,這也是百度2023年以來首次對外披露飛槳生態(tài)最新數據。

format-jpg

圖注:百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰

(圖源飛漿公眾號,下同)

百度自2019年3月文心大模型發(fā)布1.0版后,歷經四年技術深耕和研發(fā)迭代,現已升級到文心大模型3.5。王海峰表示,文心大模型3.5效果、功能、性能全面提升,實現了基礎模型升級、精調技術創(chuàng)新、知識點增強、邏輯推理增強等,模型效果提升50%,訓練速度提升2倍,推理速度提升30倍。

今年3月,百度在全球大型科技公司中第一個發(fā)布了大語言模型文心一言。文心一言是知識增強的大語言模型,首先從數萬億數據和數千億知識中融合學習得到預訓練大模型,在此基礎上采用有監(jiān)督精調、人類反饋的強化學習和提示等技術,并具備知識增強、檢索增強和對話增強等技術優(yōu)勢。

王海峰解讀了文心大模型3.5的核心技術創(chuàng)新,在基礎模型訓練上,采用了飛槳最先進的自適應混合并行訓練技術及混合精度計算策略,并采用多種策略優(yōu)化數據源及數據分布,加快了模型迭代速度,顯著提升了模型效果和安全性。同時,創(chuàng)新了多類型多階段有監(jiān)督精調、多層次多粒度獎勵模型、多損失函數混合優(yōu)化策略、雙飛輪結合的模型優(yōu)化等技術,進一步提升模型效果及場景適配能力。

format-jpg

在知識增強和檢索增強基礎上,文心大模型3.5提出了“知識點增強技術”,對用戶輸入的查詢、問題等進行分析理解,解析出生成答案所需要的相關知識點,之后運用知識圖譜和搜索引擎為這些知識點找到相應答案,最后再用這些知識點構造輸入給大模型的提示,為大模型注入更具體、更詳細、更專業(yè)的知識點,顯著提升大模型對世界知識的掌握和運用。在推理方面,通過大規(guī)模邏輯數據構建、邏輯知識建模、多粒度語義知識組合以及符號神經網絡技術,提升文心大模型3.5在邏輯推理、數學計算及代碼生成等任務上的表現。

據了解,文心大模型3.5新增了插件機制,文心一言已經于6月17日對外發(fā)布官方插件百度搜索和ChatFile。百度搜索是默認的內置插件,使得文心一言具備生成實時準確信息的能力。ChatFile是長文本摘要和問答插件,支持超長文本輸入。

王海峰表示,文心一言將發(fā)布更多優(yōu)質的百度官方和第三方插件,讓用戶能夠更好地應用文心大模型,同時也將逐步開放插件生態(tài),幫助開發(fā)者基于文心大模型打造自己的應用。

format-jpg

現場王海峰展現了文心一言在辦公、會議、編碼等場景的應用,文心一言成為工作中的“超級助理”,幫助總結工作溝通要點,實時記錄會議內容,形成會議議題、摘要及總結等關鍵信息,可以通過各類插件完成指令任務,包括查詢日程、創(chuàng)建會議、設置待辦、申請休假等,也可以在工程師編碼過程中自動推薦和生成代碼。據悉,目前這些功能已通過智能工作平臺“如流”應用于百度的工作流程中,幫助提升工作效率,提高決策質量。

王海峰表示,凡是要跟語言文字或程序代碼打交道的應用場景,都可能有文心一言的用武之地。已經有很多在積極應用文心一言的場景,例如能源、金融、教育、辦公、媒體,等等。在文心一言這類大模型產業(yè)落地的進程中,可以采用“集約化生產,平臺化應用”的模式,即具有算法、算力和數據綜合優(yōu)勢的企業(yè)將模型生產的復雜過程封裝起來,通過低門檻、高效率的生產平臺,為千行百業(yè)提供大模型服務。

1、該內容為作者獨立觀點,不代表電商報觀點或立場,文章為作者本人上傳,版權歸原作者所有,未經允許不得轉載。
2、電商號平臺僅提供信息存儲服務,如發(fā)現文章、圖片等侵權行為,侵權責任由作者本人承擔。
3、如對本稿件有異議或投訴,請聯系:info@dsb.cn
相關閱讀
6月27日消息,百度首席技術官海峰近日詳細解讀了文心3.5在技術和工程上的升級。對比數據顯示,文心模型3.5的訓練速度提升2倍,推理速度提升17倍。功能方面,文心模型最大的一個變化是新增了插件機制。海峰表示,下一階段,文心一言將發(fā)布更多優(yōu)質的百度官方和第三方插件,讓用戶能夠更好地應用文心模型。
百度首席技術官海峰解讀文心模型的核心技術,闡述人工智能產業(yè)模式。
截至目前,文心一言用戶規(guī)模已破3億,文心模型日均調用次數超7億,日均處理文本Tokens超1萬億。
2月28日消息,百度官方宣布,計劃于3月16日在北京總部召開新聞發(fā)布會,主題圍繞文心一言。值得注意的是,這是百度首次明確該產品發(fā)布具體日期。屆時,百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏,百度首席技術官海峰將出席。此前2月7日,百度宣布推出類ChatGPT應用文心一言。百度官方表示,在人工智能四層架構中,有全棧布局,包括底層的芯片、深度學習框架、模型以及最上層的搜索等應用。文心一言位于模型層。
3月16日消息,百度今日14時在北京總部召開新聞發(fā)布會,宣布正式推出基于百度新一代語言模型的生成式AI 產品文心一言。百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏、百度首席技術官海峰出席發(fā)布會,圍繞文心一言進行介紹。
中國電子學會副理事長、百度首席技術官海峰出席主論壇并做報告,闡釋了模型技術發(fā)展與產業(yè)模式。海峰展示了文心一言的對話問答、文學創(chuàng)作、多模態(tài)生成等能力。海峰表示,新一代知識增強語言模型文心一言是百度多年技術積累和產業(yè)實踐的水到渠成。百度自2019年開始深耕預訓練模型研發(fā),經過近4年積累和迭代,文心模型已經形成了系統(tǒng)性的模型技術體系,包括自然語言處理、視覺、跨模態(tài)、生物計算等模型。
11月10日消息,2023年世界互聯網大會烏鎮(zhèn)峰會上,百度首席技術官、深度學習技術及應用國家工程研究中心主任海峰出席前沿數字技術創(chuàng)新與安全論壇和人工智能賦能產業(yè)發(fā)展論壇,解讀文心模型4.0最新技術,闡述模型產業(yè)模式,海峰披露,文心一言用戶規(guī)模現已達到7000萬,場景4300個。
以“生成未來”為主題的百度世界2023近日在北京首鋼園舉辦,百度首席技術官海峰解讀文心模型4.0背后的關鍵技術和最新進展。
11月9日消息,2023年世界互聯網大會烏鎮(zhèn)峰會近日正式開幕,會上,百度知識增強語言模型關鍵技術獲“世界互聯網大會領先科技獎”,百度首席技術官、深度學習技術及應用國家工程研究中心主任海峰現場發(fā)布了文心模型的關鍵技術成果。
    亚洲无码高清自拍偷拍自慰av网站,免费高清无码黄色网,欧美一级片免费在线观看,午夜毛片在线观看