周鴻祎談DeepSeek成功原因:資源緊張但足夠聚焦
2月4日消息,周鴻祎日前發(fā)文談到DeepSeek能夠取得巨大技術(shù)突破的原因。周鴻祎認(rèn)為,首先在人才策略上,DeepSeek研究人員都是年輕人,且為國(guó)內(nèi)名校碩博畢業(yè)五年內(nèi);其次,組織架構(gòu)上,DeepSeek是扁平研究的文化,團(tuán)隊(duì)一百多人,只有梁文鋒、小組長(zhǎng)和一線員工三層,并且很多組長(zhǎng)不打績(jī)效,不會(huì)過(guò)度分工;第三,梁文鋒對(duì)創(chuàng)新的渴求很高,鼓勵(lì)突破式創(chuàng)新。而且DeepSeek用自己的錢,“不用看任何人臉色”;第四,目標(biāo),DeepSeek最重要的是專注,它的資源很緊張,但是足夠聚焦。

圖源:周鴻祎微博
以下是周鴻祎全文(有部分刪改):
很多人問(wèn)我說(shuō)為什么deepseek能取得如此大的技術(shù)突破,以至于以一己之力撼動(dòng)了全球的ai工業(yè)。別的公司為什么研究不出來(lái)?
我覺得分成這么幾點(diǎn)吧。
第一,人才策略上,deepseek的研究人員是清一色的年輕人,都是國(guó)內(nèi)名校碩博畢業(yè)五年內(nèi)的。梁文峰也說(shuō)過(guò)自己的招聘標(biāo)準(zhǔn),聰明加熱愛,不要經(jīng)驗(yàn)多的,與大廠要經(jīng)驗(yàn)完全不同,沒有行業(yè)老人,沒有十年以上所謂的資深ai研究員。因?yàn)榇竽P?7年才出來(lái),國(guó)內(nèi)正式研究大模型23 年才開始,所以以前積累的所謂的人工智能經(jīng)驗(yàn),什么自然語(yǔ)言處理經(jīng)驗(yàn),基本都是負(fù)資產(chǎn)。很多大廠的老研究人員因?yàn)橛袣v史的包袱,還停留在哪里不懂就標(biāo)注哪里的階段,沒有scaling規(guī)?;睦砟睢?/p>
不客氣的講,在巨大的技術(shù)變革面前,經(jīng)驗(yàn)更多的是束縛,一張白紙加上第一性原理才是創(chuàng)新的源頭。
第二,組織結(jié)構(gòu)上,是扁平化研究的文化,deepseek團(tuán)隊(duì)也就一百來(lái)人,就三層,梁文峰、小組長(zhǎng)和一線員工,并且很多組長(zhǎng)也不打績(jī)效,主要協(xié)調(diào)下面的資源,也不會(huì)過(guò)度分工,大家一起為最終模型的效果負(fù)責(zé)。日常都在一些群里討論,主打一個(gè)自由寬松的研究風(fēng)格。
反觀互聯(lián)網(wǎng)大廠,一線到一把手少的五層多的八層,傳話就夠累的,更別提高效決策了。分工也分的特別細(xì),就像我要吃個(gè)炒雞蛋,有人打蛋,有人切蔥花,有人倒油,有人架鍋,有人炒蛋,還有人端盤子。分工分的細(xì)呢就導(dǎo)致每個(gè)人都不對(duì)結(jié)果負(fù)責(zé),每個(gè)人都要背一個(gè)自己的kpi,短期壓力很大,即使有能力也沒有勇氣創(chuàng)新,半年沒產(chǎn)出就要給你降級(jí)了。
那為什么創(chuàng)業(yè)公司也不行呢?那就要聊聊文化。
其實(shí)公司的文化核心就是老板的文化,在小公司更是如此。梁峰對(duì)創(chuàng)新的渴求很高,小創(chuàng)新他根本看不上,會(huì)鼓勵(lì)突破式創(chuàng)新。同時(shí)也親自為高風(fēng)險(xiǎn)負(fù)責(zé),失敗了也不用你背鍋。而其他公司哪個(gè)老板能做到呢?
這里還有一個(gè)重要的點(diǎn),deepseek用自己的錢,不用看任何人臉色,就不用被VC或者CEO牽著鼻子轉(zhuǎn),想咋干就咋干。所以一個(gè)懂技術(shù)、有理想、財(cái)富自由的老板才是核心。
第四個(gè),目標(biāo),deepseek最重要的是專注。其實(shí)deepseek的資源是非常緊張的,應(yīng)該也就一萬(wàn)來(lái)張卡吧,肯定不止兩千張卡了,但是它足夠聚焦。

圖源:周鴻祎微博
2、電商號(hào)平臺(tái)僅提供信息存儲(chǔ)服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系:info@dsb.cn