抖音AI越搞越猛,硬剛阿里快手
勝者為王。
1.抖音“即夢AI”移動端上線蘋果商店
現(xiàn)在,市面上的AI工具越來越多,功能也更加強大了。從圖片生成、視頻生成,再到故事創(chuàng)作,各大互聯(lián)網(wǎng)公司對AI技術(shù)的更新迭代,讓創(chuàng)作變得簡單。
比如,字節(jié)跳動旗下剪映推出的AI創(chuàng)作平臺“即夢AI”,集圖片生成、智能畫布、視頻生成、故事創(chuàng)作4大功能,用戶可以用AI作圖,輸入提示詞生成圖片,也可以生成視頻,畫面栩栩如生。
近日,據(jù)鈦媒體AGI獨家獲悉,“即夢AI”移動端已上架蘋果APP Store應(yīng)用商店。更早之前的7月31日,即夢AI安卓版已上架小米等各大安卓應(yīng)用商店,版本號為1.0.0,可供用戶下載使用。
而在今年5月,即夢AI網(wǎng)頁版已上線。
應(yīng)用介紹顯示,即夢AI是一個專為創(chuàng)意愛好者打造的AI表達平臺,讓你的想象力成為現(xiàn)實。
主頁面功能包括圖片生成與視頻生成,其中,圖片創(chuàng)作可選擇八款通用模型,視頻生成也可以選擇運鏡角度,包括隨機、推近、拉遠、順時針、逆時針,而視頻速度則有快中慢三檔。底部Tab鍵還可進入靈感社區(qū),一鍵創(chuàng)作同款作品。
截至目前,“即夢AI”已上線會員服務(wù),用戶可選擇連續(xù)包月每月69元、單月79元,或連續(xù)包年659元,對應(yīng)購買505個積分/月,從而生成約2020張圖片或168個AI視頻。每天登陸即夢AI可獲得66積分,并在當天后清零。
至于即夢AI背后的開發(fā)團隊是“深圳市臉萌科技有限公司”,該公司是字節(jié)跳動在2018年收購的相機拍照工具《Faceu激萌》團隊,交易總價約3億美元。
目前,臉萌科技隸屬于字節(jié)跳動旗下的剪映業(yè)務(wù),由剪映業(yè)務(wù)負責(zé)人張楠(Kelly Zhang)領(lǐng)導(dǎo)。
話又說回來,在抖音的AI產(chǎn)品矩陣當中,即夢AI算是推出比較晚的AI產(chǎn)品。在此之前,抖音已經(jīng)有豆包、Cici、MagicVideo、MagicAnimate等產(chǎn)品和模型。
MagicVideo- V2于今年1月發(fā)布,是一款ai視頻生成模型,可以文生視頻、圖生視頻,也可以用來給視頻換風(fēng)格;而MagicAnimate于去年12月上線,可以讓圖片生成逼真的視頻動態(tài)效果。
抖音各種大模型項目遍地開花,與其加大投入大模型業(yè)務(wù)有關(guān)。去年2月,抖音開始組建大模型團隊,由TikTok產(chǎn)品技術(shù)負責(zé)人朱文佳帶隊,主要發(fā)力語言和圖像兩種模態(tài)。
緊接著11月,又有消息稱,抖音成立新部門Flow,發(fā)力AI應(yīng)用層,仍然由朱文佳擔(dān)任業(yè)務(wù)負責(zé)人。
如今,即夢AI移動端上線各大應(yīng)用商店,表明抖音AI業(yè)務(wù)得到進一步發(fā)展。依托剪映在圖片和視頻創(chuàng)作領(lǐng)域的優(yōu)勢,即夢AI將可以迅速出圈。
2.視頻生成大模型,抖音也不想落下
今年2月,全球知名人工智能公司OpenAI上線文生視頻大模型Sora。一經(jīng)發(fā)布,該款產(chǎn)品迅速火遍全球,成為大家的關(guān)注重點。
只要給Sora一些提示詞,它就可以生成1分鐘的Ai視頻內(nèi)容。當時Sora生成的視頻中最典型的案例,是一位時尚的女士穿著黑色皮夾克、長紅裙和黑色靴子,手拿黑色手袋,在東京一條燈光溫暖、霓虹燈閃爍、帶有動感城市標志的街道上自信而隨意地行走。
如果不提前告訴你這是由Ai生成的,你絕對不會發(fā)現(xiàn)。Sora的上線引起的轟動效果可謂顯著,國內(nèi)各大互聯(lián)網(wǎng)科技企業(yè)都不想掉隊,爭相加大投入視頻生成模型。
而在此之前,國內(nèi)互聯(lián)網(wǎng)公司已經(jīng)有所成績。比如阿里巴巴自研的視頻生成模型 AnimateAnyone,可以讓一張照片生成一段舞蹈視頻,就有網(wǎng)友用這個AI模型讓兵馬俑跳科目三。
而早在去年11月底,該研究論文便已經(jīng)在海外視頻播放量超 1 億。今年3月,阿里一個高保真圖像視頻生成框架AtomoVideo,能讓生成的視頻更加逼真。
此前2月份,阿里還推出了AI圖片-音頻-視頻模型EMO,僅需一張人物肖像和音頻,就可以肖像人物開口唱歌。
另外還有騰訊的視頻生成模型AnimateZero,可以實現(xiàn)精準地控制視頻的外觀和運動,比如更改車的顏色,或者將動漫人物的圖片生成的視頻,并融入眼睛變色、頭發(fā)蓬松等細節(jié)。
快手方面,今年7月初,在2024世界人工智能大會上,快手大模型首次集體亮相,其中就有視頻生成大模型“可靈”。
今年6月,快手自研的“可靈”視頻生成大模型官網(wǎng)正式上線,至今不到兩個月就已經(jīng)迎來三次迭代升級。據(jù)了解,初次亮相的可靈大模型全面對標Sora,并在內(nèi)容生產(chǎn)方面取得了新突破。
比如此前Sora僅能生成60秒左右的高清視頻,而可靈AI則將生成視頻時長拉長至2分鐘。可靈的畫質(zhì)、鏡頭控制、首尾幀控制也隨著產(chǎn)品升級,而有了實質(zhì)性的飛躍。
值得一提的是,在騰訊、阿里、抖音都沒有向用戶開放視頻大模型的使用權(quán)限時,可靈率先全面開放內(nèi)測,在快手旗下的快影App開放邀測體驗。
可以看出,國內(nèi)其他互聯(lián)網(wǎng)公司在視頻生成模型方面取得一項又一項突破,這不免給抖音帶來壓力。抖音“即夢AI”上線各大應(yīng)用商店,顯然是主動出擊,直面市場壓力。
我們也能看到,視頻生成模型的功能和效果已經(jīng)發(fā)生了翻天覆地的變化,場景識別和情感分析則能夠更深入地理解視頻內(nèi)容,為用戶創(chuàng)造出了前所未有的視覺體驗。
3.成本依舊是難題
盡管大模型賽道十分火熱,但成本依舊是困擾絕大多數(shù)人工智能企業(yè)的難題。相較于大型語言模型,像Sora這樣的視頻生成模型涉及到更復(fù)雜的數(shù)據(jù)處理和更高的計算要求,訓(xùn)練成本更高。
據(jù)國盛證券報告《ChatGPT 需要多少算力》估算,大型語言模型(LLM)如GPT-3的單次訓(xùn)練成本約為140萬美元。然而,對于更大規(guī)模的LLM,訓(xùn)練成本會顯著增加,介于200萬美元至1200萬美元之間。
LLM的訓(xùn)練需要使用大量的高端GPU,如英偉達的A100等。這些GPU的價格昂貴,且需要配置相應(yīng)的服務(wù)器和存儲設(shè)備。此外,由于訓(xùn)練過程中需要持續(xù)運行大量的計算任務(wù),因此電費也是一項不可忽視的成本。
以 ChatGPT 在1月的獨立訪客平均數(shù)1300萬計算,其對應(yīng)芯片需求為3萬多片英偉達A100 GPU,初始投入成本約為8億美元,每日電費在5萬美元左右。
同時,據(jù)澎湃新聞報道,Sora在訓(xùn)練階段至少需要4200~10500塊英偉達H100 GPU,并持續(xù)訓(xùn)練1個月。去年也有消息傳出,抖音向英偉達訂購了超過10億美元的GPU。
據(jù)虎嗅報道,按照某國內(nèi)AI公司最近公布的AI圖片生成最大折扣價算,生成1張圖片的價格最低0.06元,1秒25幀,花費1.5元,120秒的視頻成本高達180元。
總之,AI視頻生成的高成本是限制大模型企業(yè)的重要因素。因此,企業(yè)還需要探索多樣化的商業(yè)模式以平衡成本與收益。
2、電商號平臺僅提供信息存儲服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn