搜狗王小川:年底做出中國最好的大語言模型
“我們有信心,在年底做出中國最好的大語言模型?!?/strong>
面對熙熙攘攘的入局者,搜狗創(chuàng)始人王小川氣魄雄壯地放下一句豪言。
距離2021年10月騰訊與搜狐完成收購交易、王小川正式卸任搜狗CEO,已經(jīng)過去了一年半的時間。
這段時間里,王小川身上幾乎沒有新聞。即使他曾經(jīng)在馬云與馬化騰之間周旋談判,與周鴻祎、李彥宏針鋒相對,但互聯(lián)網(wǎng)已經(jīng)開始遺忘這位曾經(jīng)的天才少年。
直到這次,AI的風(fēng)猛烈吹動,大模型的機會擺在眼前,王小川重新站回了互聯(lián)網(wǎng)的賽道上。能不能拼進中心,還不得而知。
“只是你們都忘了搜狗是一家AI公司,但我沒有忘?!?/strong>
但擺在王小川面前的,是一個競爭高度激烈的賽道。
百度率先釋出了“文心一言”
一眾國內(nèi)廠商中,百度最先推出了大模型產(chǎn)品“文心一言”。這些年來,李彥宏曾在多個場合強盜,百度十年間向人工智能技術(shù)的研發(fā)投了1000億資金。
對于逐漸掉隊的百度來說,AI領(lǐng)域的技術(shù)積累是這家老牌互聯(lián)網(wǎng)企業(yè)僅剩不多的優(yōu)勢項目。無論是因為技術(shù)積累足夠,還是背水一戰(zhàn)沒有退路的原因,百度做了第一個吃螃蟹的人。
從觀望到轉(zhuǎn)身押注,各大廠商的動作都不算慢。360創(chuàng)始人周鴻祎不想落于人后緊隨其后抱出一款“剛出生的孩子”。
逍遙子張勇宣布,阿里旗下所有產(chǎn)品,都將用AI重做一遍。阿里云和達摩院的技術(shù)實力,對此志在必讀。
此外還有美團聯(lián)合創(chuàng)始人王慧文帶著數(shù)億風(fēng)投高調(diào)入局。商湯科技的“商量”、昆侖萬維的“天工”,正在面世的途中一路狂奔。
字節(jié)也緊趕慢趕,旗下飛書推出了AI助手“My AI”,能以對話形式提供多種辦公功能,支持創(chuàng)建日程、自動匯總會議紀要、優(yōu)化與續(xù)寫文字內(nèi)容......雖然字節(jié)在大模型上的進展依然模糊,My AI這款產(chǎn)品也仍處在設(shè)計、開發(fā)階段,但字節(jié)方面追熱點的心思曝露無疑。
國內(nèi)頭部廠商齊聚,各路大佬出山,好不熱鬧。
但另一方面,是每一家廠商的準備,都還不夠充足。
李彥宏高調(diào)宣布,百度的“文心一言”距離ChatGPT-3.5,只有2個月的差距。
王小川則毫不客氣地“打臉”李彥宏,“怎么可能只差2個月!”
“用時間衡量的話,OpenAI比我們應(yīng)該領(lǐng)先三年時間是有的。之前我們說追上GPT-3.5,可能一年時間是有機會的。但人家已經(jīng)到4了,還有5在訓(xùn)練當(dāng)中,所以我覺得有3年。”
王小川在公開信中寫道:“這一次,百川智能將借助語言AI的突破,構(gòu)建中國最好的大模型底座,并在搜索、多模態(tài)、教育、醫(yī)療等方面增強,幫助大眾輕松、普惠的獲取世界知識和專業(yè)服務(wù)?!?/p>
如果要達到這樣的高度,目前來看,以O(shè)penAI旗下產(chǎn)品為標準,國內(nèi)技術(shù)水平還處在追趕狀態(tài)。
除了技術(shù)和時間上的落后,更多難題困擾著新入局者。
前段時期牽頭聯(lián)署公開信,呼吁暫停人工智能開發(fā)6個月的馬斯克,都做起了雙面人的準備:馬斯克緊急搶購了1萬塊GPU,用來訓(xùn)練大模型。
顯示核心GPU又稱圖形芯片,是NVIDIA公司推出的一種特殊類型處理器,具有數(shù)百或數(shù)千個內(nèi)核,經(jīng)過優(yōu)化,可并行運行大量計算。
曾經(jīng)它被當(dāng)做游戲和繪圖等功能的主力,用來呈現(xiàn)復(fù)雜、逼真的視覺效果,但隨著互聯(lián)網(wǎng)時代的新技術(shù)爆發(fā),人們對GPU的關(guān)注從消費電子領(lǐng)域轉(zhuǎn)移到了更多維度。
挖礦讓GPU在大眾視角中爆紅了一把。隨后從加密貨幣到自動駕駛再到云端AI服務(wù)器,GPU的產(chǎn)量愈加走俏,價格水漲船高。
對于有志于訓(xùn)練大模型的互聯(lián)網(wǎng)公司來說,算力極為關(guān)鍵,GPU是一切夢開始的地方。
“現(xiàn)在還能買到芯片嗎?算力、數(shù)據(jù)對你來說是個困難的事兒嗎?”
面對這樣的發(fā)問,王小川在最近的采訪中面露難色:“那太多困難了,你講的每一個都是難點,都要解決?!?/strong>
馬斯克搶購的1萬塊GPU,絕不是個小數(shù)目。他收購的推特公司為此支付了數(shù)千萬美元。
根據(jù)最近的官宣內(nèi)容,王小川創(chuàng)立的“百川智能”啟動資金為5000萬美元,恰好也就是馬斯克買GPU的花費。
王小川和王慧文這些官宣大模型創(chuàng)業(yè)的互聯(lián)網(wǎng)大佬,雖然有著還算豐厚的家底和行業(yè)資源優(yōu)勢,但相較于投入巨大的大模型項目來說,這些啟動資金可能并不夠看。
在大語言模型的風(fēng)口上,王小川也不敢妄言超車:我們首先是要講先活下來,再追得上去。
美團聯(lián)合創(chuàng)始人王慧文在朋友圈廣發(fā)英雄帖:“我的人工智能宣言:5000萬美元,帶資入組,不在意崗位、薪資和title,求組隊?!本驮獾搅诵袠I(yè)內(nèi)人士的批評
海通證券的電子研究首席分析師鄭宏達也在朋友圈發(fā)文,稱:
“5000萬美元夠干什么的?”
“互聯(lián)網(wǎng)的人啥都不懂,就只會營銷,一點都不踏實?!?/p>
這樣的評論也不無道理,OpenAI一次大模型訓(xùn)練就花費了500萬美元。這意味著5000萬美元的資金,只夠10次大模型訓(xùn)練。
還有人才。搜狗有著強AI、語言核心的背景,但頂尖人才并不容易尋覓。
“今天大模型的成功,核心是語言方向的成功,AI是貫穿始終的能力。我們做輸入法、語音識別、搜索、同傳、數(shù)字人,背后都是大量的AI的東西,從識別到生成,都在干。”
搜狗曾經(jīng)走在行業(yè)之前,但隨著搜索行業(yè)見頂,更多人才與王小川失之交臂。挖人,成了當(dāng)下的難關(guān)。如何讓人才人盡其才,在一個新創(chuàng)組織中發(fā)揮效能,則考驗著創(chuàng)業(yè)者的管理水平。
“我們是要去挖人,但挖了人不代表能打贏這場仗,不是零零散散湊幾個人、收個團隊就能做成的?!?/p>
“你們能在文章里放上我們的招聘郵箱嗎?”在最近的一次采訪中,王小川發(fā)問媒體。
這個時候,他的幽默和焦慮同時顯露無疑。
招人、找錢、買芯片,每一件事都任重而道遠。但面對大模型、人工智能奇點這樣的宏大圖景,一切困難又顯得微不足道。
2、電商號平臺僅提供信息存儲服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn