張一鳴藏了一手,抖音AI沖上全球第一梯隊(duì)

科技頭版
2025-04-21 11:45

字節(jié)跳動(dòng)按下了AI智能體發(fā)展的快進(jìn)鍵。

豆包1.5深度思考模型發(fā)布

隨著 AI 技術(shù)的快速發(fā)展,AI 已經(jīng)快速邁入 Agentic AI 時(shí)代。

近日,火山引擎總裁譚待宣布,火山引擎正式發(fā)布豆包1.5·深度思考模型。

11.1-800.png

圖源:火山引擎公眾號(hào)

深度思考模型是讓 AI 模擬人類的思維過(guò)程,對(duì)復(fù)雜問(wèn)題進(jìn)行精準(zhǔn)分析和邏輯推導(dǎo)。

對(duì)于這一點(diǎn),火山引擎團(tuán)隊(duì)表示,豆包1.5·深度思考模型在數(shù)學(xué)、代碼、科學(xué)等專業(yè)領(lǐng)域推理任務(wù)中,已經(jīng)達(dá)到或接近全球第一梯隊(duì)水平;在創(chuàng)意寫作等非推理任務(wù)中,可以適配廣泛和復(fù)雜的使用場(chǎng)景。

11.2-800.png

圖源:火山引擎公眾號(hào)

就技術(shù)層面而言,豆包1.5·深度思考模型采用 MoE 架構(gòu),總參數(shù)為2000億,激活參數(shù)僅200億,比同等類型的大模型省了近一半的資源。

與此同時(shí),豆包1.5·深度思考模型的響應(yīng)速度卻并未縮水,API延遲低至20毫秒。

11.3-800.png

圖源:百度

就解決問(wèn)題層面而言,豆包1.5·深度思考模型通過(guò)定向訓(xùn)練,在查詢互聯(lián)網(wǎng)信息,進(jìn)行多輪搜索和思考時(shí),已經(jīng)可以做到“邊想邊搜”。

區(qū)別于其他推理模型的“先搜索再思考”,豆包可以更高效精準(zhǔn)地解決用戶的問(wèn)題,如同和人面對(duì)面交流一般。

11.4-800.png

圖源:百度

就理解能力層面而言,豆包1.5·深度思考模型具備視覺(jué)理解能力,能跟人一樣對(duì)文字和畫面進(jìn)行思考,使思考結(jié)果更加綜合立體,如同擁有了“大腦”和“眼睛”。

11.5-800.png

圖源:百度

不難看出,豆包1.5·深度思考模型拓寬了AI的想象力空間,給用戶提供了更便捷的AI選擇,讓AI與人的交互更為親密了。

此外,在發(fā)布豆包1.5·深度思考模型的同時(shí),火山引擎還對(duì)豆包·文生圖模型3.0和豆包·視覺(jué)理解模型進(jìn)行了升級(jí)。

11.6-800.png

圖源:火山引擎公眾號(hào)

升級(jí)后的豆包·文生圖模型3.0,優(yōu)化了文字排版表現(xiàn),擁有了實(shí)拍級(jí)的圖像生成效果,還能生成2K 的高清圖片,幾乎涵蓋了各類圖片使用場(chǎng)景。

因此,豆包·文生圖模型3.0直接在最新的文生圖領(lǐng)域權(quán)威榜單上進(jìn)入了全球第一梯隊(duì)。

11.7-800.png

圖源:火山引擎公眾號(hào)

而升級(jí)后的豆包·視覺(jué)理解模型具備更強(qiáng)的視覺(jué)定位能力,可以更精準(zhǔn)定位,滿足各類定位需求。

與此同時(shí),豆包·視覺(jué)理解模型的視頻理解能力更智能了,可以直接進(jìn)行語(yǔ)義搜索,以及對(duì)食品進(jìn)行記憶理解等。

11.8-800.png

圖源:火山引擎公眾號(hào)

值得一提的是,火山引擎還針對(duì)不同需求,發(fā)布了對(duì)應(yīng)的模型來(lái)解決更具體的場(chǎng)景問(wèn)題——

面向Agent服務(wù),發(fā)布OS Agent解決方案、GUI Agent大模型——豆包1.5·UI-TARS模型;面向大規(guī)模推理,發(fā)布AI云原生·ServingKit推理套件。

11.9-800.png

圖源:火山引擎公眾號(hào)

11.10-800.png

圖源:火山引擎公眾號(hào)

正如火山引擎CEO譚待所言:“深度思考模型是構(gòu)建Agent的基礎(chǔ),模型要有能力做好思考、計(jì)劃和反思,并且一定要支持多模態(tài),就像人類具備視覺(jué)和聽覺(jué)一樣,Agent才能更好地處理復(fù)雜任務(wù)。”

顯而易見,字節(jié)跳動(dòng)對(duì)于布局AI產(chǎn)業(yè)生態(tài)和持續(xù)發(fā)展是認(rèn)真的,或許是想趁著AI的風(fēng)口,尋找新的增長(zhǎng)點(diǎn)。

字節(jié)跳動(dòng)布局AI

字節(jié)跳動(dòng)對(duì)于AI的布局早已開始,其AI布局已涉獵多個(gè)板塊,由一張圖即可看出——

11.11-800.png

圖源:百度

可見,字節(jié)跳動(dòng)的AI產(chǎn)品覆蓋聊天、創(chuàng)作、教育等場(chǎng)景,包括聊天機(jī)器人豆包、AI視頻即夢(mèng)、AI寫真星繪、AI搜題Gauth、AI修圖醒圖等20+應(yīng)用,其中半數(shù)產(chǎn)品同步在海外市場(chǎng)進(jìn)行布局。?

其中,截至2025年3月底,豆包大模型日均tokens調(diào)用量已超過(guò)12.7萬(wàn)億。

11.12-800.png

圖源:火山引擎公眾號(hào)

IDC報(bào)告顯示,2024年中國(guó)公有云大模型調(diào)用量激增,火山引擎以46.4%的市場(chǎng)份額位居中國(guó)市場(chǎng)第一。

11.13-800.png

圖源:百度??

顯而易見,字節(jié)跳動(dòng)的AI布局已經(jīng)在AI市場(chǎng)上不僅是占據(jù)一席之地,還可以說(shuō)是全面開花。

而這些都與字節(jié)跳動(dòng)逐步的鋪墊和積累息息相關(guān)——

2016年,字節(jié)跳動(dòng)成立?AI Lab?,設(shè)立計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、語(yǔ)音處理等團(tuán)隊(duì),早期聚焦推薦算法優(yōu)化,支撐今日頭條和抖音的精準(zhǔn)推送。

雖然當(dāng)時(shí)字節(jié)跳動(dòng)并未將重心放在AI方面,卻也積累了算法、模型等技術(shù),為后來(lái)布局AI埋下了伏筆。

2023年,字節(jié)跳動(dòng)成立?Seed團(tuán)隊(duì)?,啟動(dòng)大模型自主研發(fā),構(gòu)建三層技術(shù)架構(gòu)—— ?

Stone?(技術(shù)中臺(tái)):整合算法資源,支撐多業(yè)務(wù)線協(xié)同?; ?

Seed?(大模型研發(fā)):推進(jìn)豆包大模型開發(fā);

?Flow?(應(yīng)用開發(fā)):快速落地AI產(chǎn)品。?

2024年,字節(jié)跳動(dòng)開始進(jìn)入全面開花階段——

一面布局C端產(chǎn)品矩陣,推出豆包、星繪、Gauth等軟件;

一面布局硬件生態(tài),發(fā)布首款A(yù)I智能耳機(jī)?OlaFriend?,支持語(yǔ)音喚醒豆包大模型,聯(lián)合李未可推出AI眼鏡?Meta Lens Chat?,集成AR導(dǎo)航與實(shí)時(shí)翻譯。

2025年,字節(jié)跳動(dòng)更是宣布?1600億元AI投資計(jì)劃?,其中900億用于GPU采購(gòu)(60%算力預(yù)算投向國(guó)產(chǎn)芯片),同時(shí)已建成萬(wàn)卡A100/A800集群,支撐大規(guī)模訓(xùn)練需求。

回顧字節(jié)跳動(dòng)的AI布局發(fā)展,不難看出,其目的是想要開辟新的增長(zhǎng)曲線,在AI方向?qū)ふ倚碌耐黄婆c創(chuàng)新,并且取得了一定的成效——

AI算法驅(qū)動(dòng)抖音、今日頭條用戶使用時(shí)間增加;AI賦能電商直播GMV增加;AI工具增加收入;開拓AI短劇、虛擬陪伴等新付費(fèi)場(chǎng)景……

不過(guò),字節(jié)跳動(dòng)的AI發(fā)展依舊存在一定隱憂,比如,豆包大模型在復(fù)雜推理、長(zhǎng)文本處理等場(chǎng)景仍落后于OpenAI等頭部廠商;AI硬件銷量未達(dá)預(yù)期,硬件營(yíng)收不足,難以支撐研發(fā)投入等。

要解決這些問(wèn)題,在AI市場(chǎng)中創(chuàng)造新的增長(zhǎng)點(diǎn),字節(jié)跳動(dòng)或許需要更多的技術(shù)創(chuàng)新。

AI之爭(zhēng)如火如荼

如今AI的風(fēng)頭正盛,各大企業(yè)都想要分一杯AI的時(shí)代紅利——

就巨頭企業(yè)方面,字節(jié)跳動(dòng)依托豆包大模型構(gòu)建閉環(huán)生態(tài),但復(fù)雜推理能力仍落后頭部廠商。?

阿里通過(guò)AI優(yōu)化電商搜索與推薦,但技術(shù)深度不及垂直AI企業(yè),更多依賴與第三方模型合作。?????

騰訊和百度?則是以“接入替代自研”的策略擁抱DeepSeek-R1模型,降低開發(fā)成本并快速補(bǔ)齊能力短板。

就創(chuàng)業(yè)公司方面,“大模型六小虎”戰(zhàn)略分化,?智譜沖擊IPO、零一萬(wàn)物轉(zhuǎn)向產(chǎn)業(yè)大模型、MiniMax收縮B端業(yè)務(wù),部分企業(yè)面臨邊緣化風(fēng)險(xiǎn)。

DeepSeek異軍突起?,開源模型性能超越頭部大廠,7天獲取1億用戶,成為行業(yè)新星。

不難看出,多家公司押注的AI行業(yè)已是未來(lái)發(fā)展的重頭戲,而對(duì)于未來(lái)AI市場(chǎng)的發(fā)展,或許會(huì)更注重于便捷與情感——

AI營(yíng)銷工具爆火,伴隨著AI技術(shù)融入互聯(lián)網(wǎng),無(wú)論是企業(yè),還是消費(fèi)者,都能享受到AI帶來(lái)的創(chuàng)作便捷性?。

抖音虛擬陪伴產(chǎn)品“貓箱”用戶突破3000萬(wàn),35%用戶日均互動(dòng)超2小時(shí),或?qū)⒋呱孪M(fèi)市場(chǎng)。

此外,值得一提的是,DeepSeek的開源策略像在AI界復(fù)刻安卓模式,不斷催生技術(shù)迭代和進(jìn)步創(chuàng)新,AI的發(fā)展速度日新月異,不斷激發(fā)著人們的想象。

在未來(lái),或許AI與人的交互會(huì)譜寫出一個(gè)又一個(gè)新的創(chuàng)意與發(fā)展的可能。

不過(guò),在AI這片新的市場(chǎng)之中,到底誰(shuí)能笑到最后,仍待時(shí)間驗(yàn)證。?????

1、該內(nèi)容為作者獨(dú)立觀點(diǎn),不代表電商派觀點(diǎn)或立場(chǎng),文章為作者本人上傳,版權(quán)歸原作者所有,未經(jīng)允許不得轉(zhuǎn)載。
2、電商號(hào)平臺(tái)僅提供信息存儲(chǔ)服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系:info@dsb.cn
相關(guān)閱讀
3月15日消息,據(jù)藍(lán)鯨新聞消息,搜索近日上線深度思考功能,部分用戶在上可以看到一則信息“搜索上線了AI深度思考功能”,打開會(huì)跳轉(zhuǎn)至應(yīng)用商店,引導(dǎo)下載搜索APP。相關(guān)負(fù)責(zé)人回復(fù)稱,AI搜索已上線“深度思考模型”,幫助用戶獲取更高質(zhì)量的回答,該功能由豆包大模型提供技術(shù)支持。
“即夢(mèng)AI”上線各大應(yīng)用商店,顯然是主動(dòng)出擊,直面市場(chǎng)壓力。
AI是認(rèn)真的,多款軟件齊上陣。
張一鳴的商業(yè)眼光,實(shí)在毒辣。
程一笑:快手堅(jiān)定執(zhí)行AI戰(zhàn)略。
張一鳴志在必得,一旦看準(zhǔn)方向,就決不收手。
AI后來(lái)居上,一鳴驚人。
AI搜”位于APP的搜索界面內(nèi),與商品、團(tuán)購(gòu)、用戶、視頻等服務(wù)位于同一權(quán)重的位置。
本次共新上架了26款AI特效,用戶只需要相冊(cè)上傳或者實(shí)時(shí)拍攝一張個(gè)人照片,并選取自己喜歡的AI特效,就能一鍵生成自己的數(shù)字分身。
科技頭版
一起見證改變世界的力量
    亚洲无码高清自拍偷拍自慰av网站,免费高清无码黄色网,欧美一级片免费在线观看,午夜毛片在线观看