騰訊吳運聲:產(chǎn)業(yè)場景已經(jīng)成為大模型的最佳練兵場
7月7日消息,在2023年世界人工智能大會期間,騰訊舉辦以“無限可能”為主題的論壇。騰訊云副總裁、騰訊云智能負責人、優(yōu)圖實驗室負責人吳運聲發(fā)表《騰訊云MaaS,激活產(chǎn)業(yè)發(fā)展新動能》主題演講,分享了關(guān)于大模型行業(yè)應(yīng)用觀點,同時介紹了騰訊云行業(yè)大模型技術(shù)解決方案的最新進展。
吳運聲認為,產(chǎn)業(yè)場景已經(jīng)成為大模型的最佳練兵場,但企業(yè)在應(yīng)用大模型時,又會面臨計算資源少、數(shù)據(jù)質(zhì)量差、投入成本高、專業(yè)經(jīng)驗少等現(xiàn)實問題的挑戰(zhàn)。
對此,騰訊云不久前公布了行業(yè)大模型技術(shù)解決方案。該方案依托騰訊云TI平臺打造行業(yè)大模型精選商店,為客戶提供MaaS一站式服務(wù),客戶只需要加入自己獨有的場景數(shù)據(jù),就可以快速生成專屬模型,結(jié)合實際業(yè)務(wù)場景需求,開發(fā)低成本、高可用的智能應(yīng)用和服務(wù)。
圖注:騰訊云副總裁、騰訊云智能負責人、優(yōu)圖實驗室負責人吳運聲
據(jù)吳運聲介紹,繼6月19日公布解決方案后,騰訊云MaaS平臺能力敏捷迭代,在行業(yè)大模型技術(shù)底座、應(yīng)用場景、助力科學計算等方向,均有所優(yōu)化和提升。
在技術(shù)底座層面,騰訊不久前發(fā)布了自研星脈高性能計算網(wǎng)絡(luò)、向量數(shù)據(jù)庫,為大模型的行業(yè)應(yīng)用提供更充沛的算力基礎(chǔ)設(shè)施;在應(yīng)用創(chuàng)新方面,騰訊云也將行業(yè)大模型的能力,應(yīng)用到金融風控、交互翻譯、數(shù)智人客服等場景中,提升智能應(yīng)用效率;在科學計算方面,騰訊云始終堅持“AI for Science”,今年將大模型技術(shù),應(yīng)用在天文探索、甲骨文考釋等科研場景。
吳運聲最后強調(diào), AI大模型技術(shù)發(fā)展和產(chǎn)業(yè)探索,離不開產(chǎn)業(yè)鏈協(xié)同和生態(tài)共建,騰訊希望與行業(yè)伙伴攜手,共同推進大模型在產(chǎn)業(yè)領(lǐng)域的創(chuàng)新和落地。
(圖源騰訊云公眾號)
以下為吳運聲主題演講全文:
尊敬的各位嘉賓、媒體朋友們,大家下午好,歡迎來到騰訊論壇。我是騰訊的吳運聲。
作為國內(nèi)規(guī)格最高、影響力最大的技術(shù)盛會,世界人工智能大會已經(jīng)連續(xù)舉辦六屆,很多新的技術(shù)趨勢、創(chuàng)新方案、產(chǎn)業(yè)成果在這里發(fā)布,已經(jīng)成為人工智能技術(shù)發(fā)展的風向標。回顧人工智能發(fā)展歷史,這項技術(shù)自誕生之初,就始終伴隨人們的期待與失望,呈螺旋式上升的發(fā)展趨勢。今天,大語言模型驅(qū)動“智慧涌現(xiàn)”,又一次將人工智能技術(shù)推到了一個新的制高點。
在過去這段時間里,我們發(fā)現(xiàn)大語言模型在智能問答、內(nèi)容創(chuàng)作、智能決策、智能風控等很多業(yè)務(wù)場景,表現(xiàn)出令人驚艷的應(yīng)用效果。尤其是廣泛的產(chǎn)業(yè)場景,已經(jīng)成為大模型的最佳練兵場。
快速了解、應(yīng)用大模型能力,是新一輪人工智能技術(shù)浪潮中,保持市場核心競爭力的關(guān)鍵。這也成為越來越多企業(yè)家共同思考的方向,同時也存在一些焦慮。
實際上,大模型雖好,但用起來還是有很高的門檻。尤其對一些傳統(tǒng)領(lǐng)域企業(yè)而言,通用大模型無法精準適配、達到降本增效的預期。企業(yè)需要的,是在實際場景中真正解決某個問題,而不是在100個場景中解決了70%-80%的問題。
相比之下,訓練和部署專屬行業(yè)大模型,讓“通才”變“專才”,對企業(yè)來說或許是一個可行路徑,但又普遍存在計算資源少、數(shù)據(jù)質(zhì)量差、投入成本高、專業(yè)經(jīng)驗少等現(xiàn)實挑戰(zhàn)。此外,安全、合規(guī),也是企業(yè)需要考慮的關(guān)鍵因素。
針對這些問題,我們在6月19日推出了騰訊云MaaS一站式行業(yè)大模型解決方案:基于騰訊云TI平臺,打造一站式行業(yè)大模型精選商店,TI平臺內(nèi)置多個行業(yè)高質(zhì)量大模型,同時支持客戶多模型訓練任務(wù),客戶只需要加入自己獨有的場景數(shù)據(jù),就可以快速生成自己的“專屬模型”,結(jié)合實際業(yè)務(wù)場景需求,開發(fā)低成本、高可用的智能應(yīng)用和服務(wù)。
目前,我們已經(jīng)聯(lián)合金融、文旅、政務(wù)、傳媒、教育等十多個行業(yè)頭部客戶,共同打造了超過50個行業(yè)大模型解決方案。
在金融領(lǐng)域,我們助力中金所技術(shù)公司,打造自有模型,降低技術(shù)開發(fā)與運營成本,支撐多部門業(yè)務(wù)。 針對資源、開發(fā)等需求,基于騰訊云TI平臺能力,實現(xiàn)資源統(tǒng)一調(diào)度,按需擴縮容,降低開發(fā)門檻、成本,提高模型開發(fā)效率,支持投服部等部門的輿情數(shù)據(jù)分析場景,每日調(diào)用峰值高達1億次,整體調(diào)用成功率超過99%。
在文旅領(lǐng)域,我們聯(lián)合一家線上旅游OTA公司,共同探索文旅行業(yè)大模型的應(yīng)用。過去,傳統(tǒng)智能客服需要人工進行對話配置:知識維護量大、耗時長,但運營人力有限、人力配置成本高,涉及訂單等復雜業(yè)務(wù)場景,在無配置的情況下無法通過機器人閉環(huán)解決問題。精調(diào)后的客戶專屬模型,無需配置對話流程,即可實現(xiàn)端到端解決業(yè)務(wù)問題。提升任務(wù)完成率,降低對話構(gòu)建成本。
在傳媒領(lǐng)域,我們聯(lián)合央視總臺,打造了傳媒大模型方案。央視總臺積累了海量的音視頻、圖片、文稿等信息資源,但人工編目低效且成本高,傳統(tǒng)檢索方式召回率低,無法滿足時效性和高質(zhì)量需求。通過騰訊云智能媒體AI中臺的大模型能力,央視總臺實現(xiàn)智能標簽理解、泛化能力提升,以及人臉、圖像、視頻和自然語言描述的精準檢索,提高了資源管理效率和準確性,推動了媒體內(nèi)容生產(chǎn)與傳播的智能化進程。
騰訊云MaaS行業(yè)大模型精調(diào)解決方案,具備五大優(yōu)勢?;隍v訊深耕產(chǎn)業(yè)互聯(lián)網(wǎng)的行業(yè)經(jīng)驗積累,我們在TI平臺內(nèi)置了高質(zhì)量的行業(yè)大模型,同時我們提供完善的平臺工具,成熟的流程方法,全面配套服務(wù),領(lǐng)先的安全能力保障,可以為客戶提供從模型選擇、到落地部署的一站式服務(wù)。
同時,在過去兩周多時間里,我們也在不斷優(yōu)化和升級騰訊云MaaS平臺能力,旨在為客戶提供更普惠的行業(yè)大模型解決方案。在技術(shù)底座層面,我們前幾天剛剛發(fā)布了自研星脈高性能計算網(wǎng)絡(luò)、向量數(shù)據(jù)庫,為大模型的行業(yè)應(yīng)用提供更充沛的算力基礎(chǔ)設(shè)施。在應(yīng)用創(chuàng)新方面,我們也將行業(yè)大模型能力,應(yīng)用到金融風控、交互翻譯、數(shù)智人客服等場景中,極大提升了智能應(yīng)用效率。在科學計算方向,AI for Science一直是我們關(guān)注的重要方向。今年,我們也將大模型技術(shù),應(yīng)用在天文探索、甲骨文考釋等科研場景,取得了不錯的成果。
首先,行業(yè)大模型加持的金融風控解決方案,相比之前有了10倍效率提升。騰訊云風控大模型融合了騰訊過去20多年黑灰產(chǎn)對抗經(jīng)驗,和上千個真實業(yè)務(wù)場景,整體反欺詐效果比傳統(tǒng)模式有20%左右的提升。企業(yè)可以基于prompt模式,迭代風控能力,從樣本收集、模型訓練到部署上線,實現(xiàn)全流程零人工參與,建模時間也從2周減少到僅需2天。
同時,很多企業(yè)受限于積累的樣本有限,或者是新品剛剛上線,面臨“零樣本”搭建風控體系,制定策略非常困難。我們也可以基于騰訊云風控大模型豐富的場景樣本快速搭建能力,助力客戶跳過“冷啟動”過程。
行業(yè)大模型在交互翻譯場景,也有不錯的提升效果。過去的同傳技術(shù),往往需要大量樣本數(shù)據(jù)進行訓練,尤其涉及一些特別專業(yè)領(lǐng)域的翻譯,也需要人工加持進行調(diào)優(yōu),才能保障翻譯效果?;谛袠I(yè)大模型技術(shù),不再需要百萬級的訓練數(shù)據(jù),使用小樣本訓練便也可以獲得不錯的翻譯結(jié)果,讓每一次交互翻譯,都對下一句的翻譯提升發(fā)揮實時作用,目前已經(jīng)在多個垂直行業(yè)落地。大家看到今天會場,以及世界人工智能大會開幕式、主論壇的同傳翻譯,都是由騰訊同傳進行的技術(shù)支持,我們已經(jīng)連續(xù)6年為大會提供同傳翻譯服務(wù)。
今年早些時候,我們推出了小樣本數(shù)智人工廠,僅需少量數(shù)據(jù)、24小時即可復刻2D數(shù)字分身,大幅提升了生產(chǎn)效率。接下來,我們依托AI生成算法,提升3D形象復刻速度,推進生成式動作驅(qū)動,結(jié)合行業(yè)大模型能力,讓企業(yè)獲得更“個性化、專業(yè)、自然逼真”的數(shù)智員工,讓“面對面”專業(yè)服務(wù)成為可能。這幾天,我們在展臺設(shè)置了小樣本數(shù)智人體驗,現(xiàn)場拍攝3分鐘素材,24小時就可以領(lǐng)取專屬數(shù)字分身。
與此同時,我們也看到大模型在科學計算方面,也有非常驚艷的表現(xiàn)。在關(guān)注AI產(chǎn)業(yè)落地同時,AI for Science是我們一直關(guān)注的方向。早在2021年,我們將AI技術(shù)應(yīng)用在天文領(lǐng)域,聯(lián)合國家天文臺、復旦大學計算機科學技術(shù)學院,發(fā)起“探星計劃”,旨在通過人工智能技術(shù),提升天文發(fā)現(xiàn)和科研的效率,已經(jīng)幫助Fast發(fā)現(xiàn)30顆脈沖星。
在今年,我們首次通過AI技術(shù)助力,從巡天觀測數(shù)據(jù)中發(fā)現(xiàn)了2顆快速射電暴。相比脈沖星,快速射電暴因為發(fā)現(xiàn)時間晚、AI訓練數(shù)據(jù)少、出現(xiàn)頻率低,發(fā)現(xiàn)難度相比脈沖星要大很多。為此,團隊通過全新設(shè)計的端到端AI算法,提升數(shù)據(jù)運算速度。引入多示例學習、注意力機制,同時結(jié)合騰訊云行業(yè)大模型輔助AI訓練,通過自監(jiān)督預訓練 +數(shù)據(jù)精調(diào),提升模型精度,降低數(shù)據(jù)標注成本。
在文化領(lǐng)域,我們與內(nèi)外部多個部門攜手合作,首次將文字檢測、摹本生成、字形匹配等多種AI算法,綜合應(yīng)用于甲骨文研究。截至目前,已建立覆蓋143萬字的全球最大甲骨文單字數(shù)據(jù)庫,提升甲骨內(nèi)容提取、甲骨文識別與考釋等效率,探索甲骨文研究的人機協(xié)同新模式。
大模型訓練,算力是基礎(chǔ)。騰訊云在大模型算力方面擁有領(lǐng)先優(yōu)勢,今年早些時候,我們發(fā)布了面向大模型訓練新一代HCC高性能計算集群,整體性能比過去提升了3倍。就在過去一周,騰訊云首次完整披露了自研星脈高性能計算網(wǎng)絡(luò),能提升40%的GPU利用率,節(jié)省30%~60%的模型訓練成本,為AI大模型帶來10倍通信性能提升。基于騰訊云新一代算力集群HCC,可支持10萬卡的超大計算規(guī)模。
最新發(fā)布的AI原生向量數(shù)據(jù)庫最高支持10億級向量檢索規(guī)模,延遲控制在毫秒級,相比傳統(tǒng)單機插件式數(shù)據(jù)庫檢索規(guī)模提升10倍,同時具備百萬級每秒查詢(QPS)的峰值能力。這些技術(shù)底座能力的持續(xù)提升,將為客戶的模型訓練提供強大的支持和動力。
當然,AI大模型技術(shù)發(fā)展和產(chǎn)業(yè)探索,離不開產(chǎn)業(yè)鏈協(xié)同和生態(tài)共建,這也是騰訊在AI發(fā)展方面一直堅持的態(tài)度。為此,我們也在早些時候發(fā)布了騰訊云行業(yè)大模型共建計劃。我們愿與行業(yè)伙伴攜手,去探索無限的可能性。謝謝大家。
2、電商號平臺僅提供信息存儲服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責任由作者本人承擔。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn