張一鳴藏了一手,抖音AI沖上全球第一梯隊(duì)
字節(jié)跳動(dòng)按下了AI智能體發(fā)展的快進(jìn)鍵。
豆包1.5深度思考模型發(fā)布
隨著 AI 技術(shù)的快速發(fā)展,AI 已經(jīng)快速邁入 Agentic AI 時(shí)代。
近日,火山引擎總裁譚待宣布,火山引擎正式發(fā)布豆包1.5·深度思考模型。

圖源:火山引擎公眾號(hào)
深度思考模型是讓 AI 模擬人類的思維過(guò)程,對(duì)復(fù)雜問(wèn)題進(jìn)行精準(zhǔn)分析和邏輯推導(dǎo)。
對(duì)于這一點(diǎn),火山引擎團(tuán)隊(duì)表示,豆包1.5·深度思考模型在數(shù)學(xué)、代碼、科學(xué)等專業(yè)領(lǐng)域推理任務(wù)中,已經(jīng)達(dá)到或接近全球第一梯隊(duì)水平;在創(chuàng)意寫作等非推理任務(wù)中,可以適配廣泛和復(fù)雜的使用場(chǎng)景。

圖源:火山引擎公眾號(hào)
就技術(shù)層面而言,豆包1.5·深度思考模型采用 MoE 架構(gòu),總參數(shù)為2000億,激活參數(shù)僅200億,比同等類型的大模型省了近一半的資源。
與此同時(shí),豆包1.5·深度思考模型的響應(yīng)速度卻并未縮水,API延遲低至20毫秒。

圖源:百度
就解決問(wèn)題層面而言,豆包1.5·深度思考模型通過(guò)定向訓(xùn)練,在查詢互聯(lián)網(wǎng)信息,進(jìn)行多輪搜索和思考時(shí),已經(jīng)可以做到“邊想邊搜”。
區(qū)別于其他推理模型的“先搜索再思考”,豆包可以更高效精準(zhǔn)地解決用戶的問(wèn)題,如同和人面對(duì)面交流一般。

圖源:百度
就理解能力層面而言,豆包1.5·深度思考模型具備視覺(jué)理解能力,能跟人一樣對(duì)文字和畫面進(jìn)行思考,使思考結(jié)果更加綜合立體,如同擁有了“大腦”和“眼睛”。

圖源:百度
不難看出,豆包1.5·深度思考模型拓寬了AI的想象力空間,給用戶提供了更便捷的AI選擇,讓AI與人的交互更為親密了。
此外,在發(fā)布豆包1.5·深度思考模型的同時(shí),火山引擎還對(duì)豆包·文生圖模型3.0和豆包·視覺(jué)理解模型進(jìn)行了升級(jí)。

圖源:火山引擎公眾號(hào)
升級(jí)后的豆包·文生圖模型3.0,優(yōu)化了文字排版表現(xiàn),擁有了實(shí)拍級(jí)的圖像生成效果,還能生成2K 的高清圖片,幾乎涵蓋了各類圖片使用場(chǎng)景。
因此,豆包·文生圖模型3.0直接在最新的文生圖領(lǐng)域權(quán)威榜單上進(jìn)入了全球第一梯隊(duì)。

圖源:火山引擎公眾號(hào)
而升級(jí)后的豆包·視覺(jué)理解模型具備更強(qiáng)的視覺(jué)定位能力,可以更精準(zhǔn)定位,滿足各類定位需求。
與此同時(shí),豆包·視覺(jué)理解模型的視頻理解能力更智能了,可以直接進(jìn)行語(yǔ)義搜索,以及對(duì)食品進(jìn)行記憶理解等。

圖源:火山引擎公眾號(hào)
值得一提的是,火山引擎還針對(duì)不同需求,發(fā)布了對(duì)應(yīng)的模型來(lái)解決更具體的場(chǎng)景問(wèn)題——
面向Agent服務(wù),發(fā)布OS Agent解決方案、GUI Agent大模型——豆包1.5·UI-TARS模型;面向大規(guī)模推理,發(fā)布AI云原生·ServingKit推理套件。

圖源:火山引擎公眾號(hào)

圖源:火山引擎公眾號(hào)
正如火山引擎CEO譚待所言:“深度思考模型是構(gòu)建Agent的基礎(chǔ),模型要有能力做好思考、計(jì)劃和反思,并且一定要支持多模態(tài),就像人類具備視覺(jué)和聽覺(jué)一樣,Agent才能更好地處理復(fù)雜任務(wù)。”
顯而易見,字節(jié)跳動(dòng)對(duì)于布局AI產(chǎn)業(yè)生態(tài)和持續(xù)發(fā)展是認(rèn)真的,或許是想趁著AI的風(fēng)口,尋找新的增長(zhǎng)點(diǎn)。
字節(jié)跳動(dòng)布局AI
字節(jié)跳動(dòng)對(duì)于AI的布局早已開始,其AI布局已涉獵多個(gè)板塊,由一張圖即可看出——

圖源:百度
可見,字節(jié)跳動(dòng)的AI產(chǎn)品覆蓋聊天、創(chuàng)作、教育等場(chǎng)景,包括聊天機(jī)器人豆包、AI視頻即夢(mèng)、AI寫真星繪、AI搜題Gauth、AI修圖醒圖等20+應(yīng)用,其中半數(shù)產(chǎn)品同步在海外市場(chǎng)進(jìn)行布局。?
其中,截至2025年3月底,豆包大模型日均tokens調(diào)用量已超過(guò)12.7萬(wàn)億。

圖源:火山引擎公眾號(hào)
IDC報(bào)告顯示,2024年中國(guó)公有云大模型調(diào)用量激增,火山引擎以46.4%的市場(chǎng)份額位居中國(guó)市場(chǎng)第一。

圖源:百度??
顯而易見,字節(jié)跳動(dòng)的AI布局已經(jīng)在AI市場(chǎng)上不僅是占據(jù)一席之地,還可以說(shuō)是全面開花。
而這些都與字節(jié)跳動(dòng)逐步的鋪墊和積累息息相關(guān)——
2016年,字節(jié)跳動(dòng)成立?AI Lab?,設(shè)立計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、語(yǔ)音處理等團(tuán)隊(duì),早期聚焦推薦算法優(yōu)化,支撐今日頭條和抖音的精準(zhǔn)推送。
雖然當(dāng)時(shí)字節(jié)跳動(dòng)并未將重心放在AI方面,卻也積累了算法、模型等技術(shù),為后來(lái)布局AI埋下了伏筆。
2023年,字節(jié)跳動(dòng)成立?Seed團(tuán)隊(duì)?,啟動(dòng)大模型自主研發(fā),構(gòu)建三層技術(shù)架構(gòu)—— ?
Stone?(技術(shù)中臺(tái)):整合算法資源,支撐多業(yè)務(wù)線協(xié)同?; ?
Seed?(大模型研發(fā)):推進(jìn)豆包大模型開發(fā);
?Flow?(應(yīng)用開發(fā)):快速落地AI產(chǎn)品。?
2024年,字節(jié)跳動(dòng)開始進(jìn)入全面開花階段——
一面布局C端產(chǎn)品矩陣,推出豆包、星繪、Gauth等軟件;
一面布局硬件生態(tài),發(fā)布首款A(yù)I智能耳機(jī)?OlaFriend?,支持語(yǔ)音喚醒豆包大模型,聯(lián)合李未可推出AI眼鏡?Meta Lens Chat?,集成AR導(dǎo)航與實(shí)時(shí)翻譯。
2025年,字節(jié)跳動(dòng)更是宣布?1600億元AI投資計(jì)劃?,其中900億用于GPU采購(gòu)(60%算力預(yù)算投向國(guó)產(chǎn)芯片),同時(shí)已建成萬(wàn)卡A100/A800集群,支撐大規(guī)模訓(xùn)練需求。
回顧字節(jié)跳動(dòng)的AI布局發(fā)展,不難看出,其目的是想要開辟新的增長(zhǎng)曲線,在AI方向?qū)ふ倚碌耐黄婆c創(chuàng)新,并且取得了一定的成效——
AI算法驅(qū)動(dòng)抖音、今日頭條用戶使用時(shí)間增加;AI賦能電商直播GMV增加;AI工具增加收入;開拓AI短劇、虛擬陪伴等新付費(fèi)場(chǎng)景……
不過(guò),字節(jié)跳動(dòng)的AI發(fā)展依舊存在一定隱憂,比如,豆包大模型在復(fù)雜推理、長(zhǎng)文本處理等場(chǎng)景仍落后于OpenAI等頭部廠商;AI硬件銷量未達(dá)預(yù)期,硬件營(yíng)收不足,難以支撐研發(fā)投入等。
要解決這些問(wèn)題,在AI市場(chǎng)中創(chuàng)造新的增長(zhǎng)點(diǎn),字節(jié)跳動(dòng)或許需要更多的技術(shù)創(chuàng)新。
AI之爭(zhēng)如火如荼
如今AI的風(fēng)頭正盛,各大企業(yè)都想要分一杯AI的時(shí)代紅利——
就巨頭企業(yè)方面,字節(jié)跳動(dòng)依托豆包大模型構(gòu)建閉環(huán)生態(tài),但復(fù)雜推理能力仍落后頭部廠商。?
阿里通過(guò)AI優(yōu)化電商搜索與推薦,但技術(shù)深度不及垂直AI企業(yè),更多依賴與第三方模型合作。?????
騰訊和百度?則是以“接入替代自研”的策略擁抱DeepSeek-R1模型,降低開發(fā)成本并快速補(bǔ)齊能力短板。
就創(chuàng)業(yè)公司方面,“大模型六小虎”戰(zhàn)略分化,?智譜沖擊IPO、零一萬(wàn)物轉(zhuǎn)向產(chǎn)業(yè)大模型、MiniMax收縮B端業(yè)務(wù),部分企業(yè)面臨邊緣化風(fēng)險(xiǎn)。
DeepSeek異軍突起?,開源模型性能超越頭部大廠,7天獲取1億用戶,成為行業(yè)新星。
不難看出,多家公司押注的AI行業(yè)已是未來(lái)發(fā)展的重頭戲,而對(duì)于未來(lái)AI市場(chǎng)的發(fā)展,或許會(huì)更注重于便捷與情感——
AI營(yíng)銷工具爆火,伴隨著AI技術(shù)融入互聯(lián)網(wǎng),無(wú)論是企業(yè),還是消費(fèi)者,都能享受到AI帶來(lái)的創(chuàng)作便捷性?。
抖音虛擬陪伴產(chǎn)品“貓箱”用戶突破3000萬(wàn),35%用戶日均互動(dòng)超2小時(shí),或?qū)⒋呱孪M(fèi)市場(chǎng)。
此外,值得一提的是,DeepSeek的開源策略像在AI界復(fù)刻安卓模式,不斷催生技術(shù)迭代和進(jìn)步創(chuàng)新,AI的發(fā)展速度日新月異,不斷激發(fā)著人們的想象。
在未來(lái),或許AI與人的交互會(huì)譜寫出一個(gè)又一個(gè)新的創(chuàng)意與發(fā)展的可能。
不過(guò),在AI這片新的市場(chǎng)之中,到底誰(shuí)能笑到最后,仍待時(shí)間驗(yàn)證。?????
2、電商號(hào)平臺(tái)僅提供信息存儲(chǔ)服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系:info@dsb.cn
