DeepSeek深夜整活，Google、OpenAI有點慌了

李迎

2025-03-27 09:03

在任何行業(yè)，一但有中國公司殺入，氣氛就開始緊張，DeepSeek的一舉一動，都牽動著老美科技的那根筋。

一、DeepSeek、Google及OpenAI突發(fā)更新

深夜，當人們已經(jīng)進入夢鄉(xiāng)之時，AI領(lǐng)域的競爭卻絲毫未減。

3月25日晚，DeepSeek突然在Hugging Face平臺發(fā)布了新版本DeepSeek-V3-0324模型。

這次更新延續(xù)了DeepSeek一貫低調(diào)的風(fēng)格，沒有高調(diào)的宣傳，只有模型權(quán)重和一個空白的README文件。

而此次更新也一如既往地在AI社區(qū)內(nèi)引發(fā)了不小的震動。

圖源：Hugging Face

從技術(shù)層面來看，DeepSeek-V3-0324很可能被視為DeepSeek即將推出的推理模型DeepSeek-R2的基礎(chǔ)。

此前，路透社曾透露，DeepSeek正在加快R1模型的后續(xù)產(chǎn)品R2的研發(fā)和發(fā)布進程，原計劃在5月初發(fā)布，但公司現(xiàn)在希望能夠盡早推出。

不過，在隨后不久，DeepSeek官方迅速否認了該傳聞，表示消息不實。

業(yè)內(nèi)人士推測，DeepSeek-R2模型預(yù)計將在代碼生成和除英語外的更多語種推理能力方面有不小的提升。

這也是為什么R2在全球都有人期待其快速到來。

而就在DeepSeek深夜更新其v3模型后一天時間內(nèi)，AI領(lǐng)域的另一巨頭Google也突然在深夜發(fā)布了一項重磅更新——正式推出了全新的Gemini 2.5 Pro模型，并聲稱這是迄今為止最智能的AI模型。

Google強調(diào)，Gemini 2.5 Pro是一款具備“思考”能力的模型，能夠逐步分析任務(wù)，做出更明智的決策，從而在處理復(fù)雜提示時能夠給出更準確和更符合上下文的回復(fù)。

圖源：X平臺

Google選擇與DeepSeek幾乎在同一天發(fā)布其最新、最強大的模型，無疑是對市場競爭格局變化的積極回應(yīng)。

然而，面對如此激烈的市場競爭，OpenAI并沒有選擇避其鋒芒。

這一次，OpenAI暫時放棄了在基座或推理模型方面的競爭，而是另辟蹊徑，對GPT-4o和Sora進行了重大升級，并推出了全新的文生圖模型。

OpenAI的CEO奧特曼親自站臺，稱這一新模型為“令人難以置信的產(chǎn)品”。

圖源：X平臺

在這場看似突然的三方混戰(zhàn)中，實則每個巨頭都有著自己的戰(zhàn)略重點。

DeepSeek此次更新專注于基座模型的優(yōu)化。

眾所周知，目前主流的大模型一般分為兩種，一種是“基座模型”，字面意思就像是各種大模型的“地基”；

而另一種是“推理模型”，DeepSeek-R1就是其中之一。

此次更新的Gemini 2.5 Pro則也是推理模型中的一種。

谷歌這一次的發(fā)力，不僅打破了多項跑分記錄，該模型的實際體驗也十分出色，這點我們后續(xù)再說。

OpenAI的文生圖模型則類似處于另一維度，雖然都幾乎同步更新，也都給行業(yè)帶來了震撼，但OpenAI此次更新的時間實在是意味深長。

二、實測對比，誰更勝一籌？

盡管DeepSeek-V3-0324的發(fā)布方式非常低調(diào)，但其在技術(shù)上的進步卻不容忽視。

根據(jù)Artificial Analysis Intelligence Index的評估，DeepSeek-V3-0324已經(jīng)成為得分最高的非推理模型。

在基準測試中超越了包括Google的Gemini 2.0 Pro、Anthropic的Claude 3.7 Sonnet以及Meta的Llama 3.3 70B等一眾明星模型。

圖源：Artificial Analysis Intelligence Index

此外，在面對復(fù)雜問題時，DeepSeek-V3-0324的表現(xiàn)也可圈可點，特別是編程能力大幅提升。

根據(jù)Aider LLM的多語言基準測試，V3-0324的得分從之前的不到50%一舉提升到了55%。

尤其是在代碼生成方面，V3-0324已經(jīng)能夠與Claude 3.7 Sonnet一決高下，甚至在某些任務(wù)上超越了DeepSeek自家的R1模型。

并且，作為咱中國自己的AI模型，這次更新后其中文寫作能力也得到了提升，風(fēng)格和內(nèi)容質(zhì)量更加接近R1的標準，在中長篇文章的寫作方面也有所進步。

為什么這一點要單拎出來說？

因為大家都知道，DeepSeek的R1深度思考模型時常會出現(xiàn)服務(wù)器繁忙的現(xiàn)象，極度影響使用體驗。

而當我們把“深度思考（R1）”關(guān)閉后，使用的則是DeepSeek-V3。

因此在這一次更新過后，對于那些需要用DeepSeek寫文案的中國用戶來說，關(guān)閉R1使用V3或許是個不錯的選擇。

圖源：新華社

Google發(fā)布的Gemini 2.5 Pro同樣不容小覷。

根據(jù)公開測試結(jié)果，Gemini 2.5 Pro在多項測試中超越了現(xiàn)有主流模型。

它不僅在數(shù)學(xué)、科學(xué)和編碼基準測試中擊敗了DeepSeek-R1、Grok 3和Claude 3.7，還幾乎全面優(yōu)于OpenAI家的兩款模型——o3-mini和GPT4.5。

Gemini 2.5 Pro現(xiàn)在在競技排行榜上位居第一，這是有史以來最大的分數(shù)跳躍，比Grok-3/GPT-4.5高出40分。

圖源：鯨AI

在模型正式上線后，許多外網(wǎng)網(wǎng)友實際體驗后表示，Gemini 2.5 Pro在處理復(fù)雜的編程任務(wù)時展現(xiàn)了過硬的實力，不僅速度很快，生成的結(jié)果質(zhì)量也非常高。

為了更直觀地感受該模型的性能，這里編輯進行了一項對比測驗。

實測中，編輯使用同一提示詞：

隨后分別讓Gemini 2.5 Pro、DeepSeek-R1及更新后的DeepSeek-V3來完成這次任務(wù)。

實驗結(jié)果顯示，Gemini 2.5 Pro在輸出質(zhì)量上表現(xiàn)最為出色。

它生成的游戲不僅具備完整的功能按鈕，實際操作體驗也非常良好。

圖源：Gemini

相比之下，DeepSeek-R1在輸出質(zhì)量上稍遜一籌，生成的游戲雖然能夠運行，但在體驗卻有所欠缺。

生成的貪吃蛇游戲會經(jīng)常直接判罰，且無重新開始的按鈕，只能自行創(chuàng)新網(wǎng)頁。

圖源：DeepSeek

反觀DeepSeek-V3給出的游戲則更加亮眼，同樣具備了功能性按鈕及正常的游戲操作體驗，用來空閑打發(fā)時間或者摸魚都是一把好手。

圖源：DeepSeek

在響應(yīng)時間上，Gemini 2.5 Pro也最為出色。

多次實驗后發(fā)現(xiàn)，谷歌Gemini 2.5 Pro的響應(yīng)時間幾乎都在1分鐘以內(nèi)，推理及生成的速度都極快，當然這也與這次的任務(wù)比較簡單有關(guān)聯(lián)。

但DeepSeek方面，R1模型的響應(yīng)速度平均在1-3分鐘之間，V3模型的響應(yīng)速度則不太穩(wěn)定，平均在2分鐘開外。

不過，DeepSeek也有自己的優(yōu)點，用DeepSeek生成的網(wǎng)頁游戲可以一鍵加載，哪怕是部署到本地步驟也十分簡單。

圖源：DeepSeek

相比之下，Gemini 2.5 Pro生成的游戲部署則較為復(fù)雜。

但對于那些只需要代碼生成的用戶來說，這根本不算什么缺點。

圖源：Gemini

通過上述對比實驗，我們可以看到，雖然DeepSeek的更新有著顯著進步，但在性能及體驗上，Gemini 2.5 Pro帶來的震撼更勝一籌。

當然，DeepSeek-R2尚未到來，用早已更新的R1和V3來與谷歌的推理模型相比顯然不占優(yōu)勢。

未來R2與Gemini 2.5 Pro的交鋒才是亮點。

三、OpenAI的文生圖模型，顛覆想象還是營銷噱頭？

另一方面，OpenAI此次發(fā)布的GPT-4o文生圖模型，單從官方演示的效果來看或許也是一款爆炸性顛覆的產(chǎn)品。

官方演示中，給出的提示詞是：

“這是用手機拍攝的玻璃白板的廣角圖像，拍攝地點是一間俯瞰海灣大橋的房間。視野中可以看到一位女士正在寫字，她身穿一件印有大型OpenAI標志的T恤。筆跡看起來很自然，但有點凌亂，我們可以看到攝影師的倒影?！?/span>

這樣的描述聽起來十分復(fù)雜，而最后生成的圖像質(zhì)量之高卻令人難以置信。

從反射的畫面到密密麻麻的文字，每一個細節(jié)都處理得恰到好處，幾乎無法讓人相信這是AI生成的圖像。

圖源：OpenAI

第二步演示則更加驚艷，一句簡單的“攝影師的自拍照，她轉(zhuǎn)身與他擊掌”，最后得到的圖片不僅保留了原來的背景，圖片中的人物形象也十分貼合。

可以說，該模型完全理解了官方給出的提示詞，極大降低了普通用戶的使用門檻。

圖源：OpenAI

不過，這里也要暫時潑大家一盆冷水，正如一些從業(yè)者質(zhì)疑的那樣，這段演示是否由官方特調(diào)還有待考量。

只有在更多用戶實際體驗的檢測下，才能判斷這款模型是否真的做到了“一句話完美P圖”。

但有一點不得不說，在DeepSeek和Google依然聚焦于基座模型和推理能力的傳統(tǒng)競爭時，OpenAI的文生圖模型則徹底跳出了這個框架。

通過視覺內(nèi)容生成，OpenAI開辟了全新的應(yīng)用場景，為行業(yè)帶來了更大的想象空間。

這種差異化競爭的策略不僅避免了與對手的正面沖突，還為OpenAI又一次開辟了新的市場空間。

隨著技術(shù)的不斷迭代，未來還將有怎樣的驚喜？讓我們拭目以待。

OpenAI DeepSeek

聲明

1、該內(nèi)容為作者獨立觀點，不代表電商派觀點或立場，文章為作者本人上傳，版權(quán)歸原作者所有，未經(jīng)允許不得轉(zhuǎn)載。
2、電商號平臺僅提供信息存儲服務(wù)，如發(fā)現(xiàn)文章、圖片等侵權(quán)行為，侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對本稿件有異議或投訴，請聯(lián)系：info@dsb.cn

相關(guān)閱讀

OpenAI即將拿下2900億史上最大融資，估值飆升至2萬億

2025-03-27 21:00:15

網(wǎng)友：DeepSeek梁文鋒還未出手，更牛逼的還在后面。

DeepSeek、阿里接連打出王炸，AI行業(yè)徹底變天了

2025-03-03 10:08:17

敢開源才是真的OpenAI！

DeepSeek月訪問量超ChatGPT

2025-03-31 12:15:23

3月31日消息，據(jù)AI分析平臺aitools.xyz，DeepSeek已經(jīng)成為全球增長最快的AI工具，其每月新增網(wǎng)站訪問量已經(jīng)超過OpenAI的ChatGPT。報告稱，DeepSeek 2025年2月訪問量達到5.25億次，超過ChatGPT 5億次。目前，DeepSeek市場份額6.58%，僅次于ChatGPT和Canva，二者分別占比43.16%和8.27%。

李開復(fù)：中國大模型未來大概率只剩下DeepSeek、阿里和字節(jié)跳動三家主要公司

2025-03-21 09:17:55

3月21日消息，零一萬物創(chuàng)始人兼CEO 李開復(fù)在參與一檔對話節(jié)目時公開表示，DeepSeek掀起的行業(yè)變革徹底顛覆了人工智能行業(yè)的發(fā)展模式，“可能讓OpenAI創(chuàng)始人輾轉(zhuǎn)難眠”。他同時預(yù)測，中國市場最終可能只剩下DeepSeek、阿里巴巴和字節(jié)跳動三家主要的AI模型公司，其中DeepSeek目前勢頭最強。

OpenAI在ChatGPT中推出購物功能

2025-04-29 17:58:03

當ChatGPT用戶搜索商品時，聊天機器人會推薦一些商品圖片和評論，并附上鏈接，用戶可以通過這些鏈接直接購買商品。目前，該功能僅適用于有限數(shù)量的產(chǎn)品類別，隨著時間的推移將擴展到更多類別。據(jù)用戶反饋，這項最新嵌入的購物功能對ChatGPT的5億活躍用戶以及未登錄的AI聊天機器人免費訪客全部開放。

OpenAI打出王炸，Sora視頻AI太猛了

2024-12-11 09:22:03

山姆·奧特曼開始上硬貨。

前OpenAI聯(lián)合創(chuàng)始人單飛創(chuàng)業(yè)

2024-06-21 17:41:41

一場好戲即將上演。

李迎

你好，我是李迎

推薦閱讀

劉強東，和胖東來聯(lián)手了

劉強東，和胖東來聯(lián)手了

亚洲无码高清自拍偷拍自慰av网站,免费高清无码黄色网,欧美一级片免费在线观看,午夜毛片在线观看