快手張迪:可靈讓每一個(gè)人都能夠用AI講出一個(gè)好故事
4月20日消息,2025(第十七屆)商界木蘭年會(huì)近日在北京舉辦。圍繞可靈AI的技術(shù)進(jìn)展和實(shí)際應(yīng)用,快手科技副總裁、大模型團(tuán)隊(duì)負(fù)責(zé)人張迪發(fā)表了主題演講。
他提到,可靈AI這個(gè)業(yè)務(wù)的愿景是建設(shè)全球領(lǐng)先的AI視覺(jué)與表達(dá)平臺(tái),讓每一個(gè)人都能夠用AI講出一個(gè)好故事,“這是我們做這件事情的初衷,我們想讓每一個(gè)人都可以把自己的創(chuàng)意轉(zhuǎn)化成一個(gè)好的視覺(jué)的故事”。

圖源:中國(guó)企業(yè)家雜志公眾號(hào)
據(jù)介紹,可靈已經(jīng)發(fā)展成了一個(gè)全球化的產(chǎn)品,在全球范圍之內(nèi)累計(jì)超過(guò)2200萬(wàn)的用戶,用戶使用可靈生成了1.68億個(gè)視頻,其中包括3.44億張圖片,可靈在阿根廷、智利等8個(gè)國(guó)家和地區(qū)的iOS應(yīng)用市場(chǎng)下載排到了第一,在北美市場(chǎng)的分類下載也排到了第一。
4月15日,快手發(fā)布了可靈2.0,在可靈發(fā)布的時(shí)候有兩個(gè)最核心的模型,一個(gè)是可圖大模型2.0,做的是圖像生成的工作,用戶輸入一段文字,其就可以按照文字指令生成一個(gè)圖片;第二個(gè)是可靈視頻生成大模型,用戶輸入一段文字或者輸入一張圖片,就可以生成對(duì)應(yīng)的想要的視頻片段。
張迪表示:“從指標(biāo)上來(lái)說(shuō),我們發(fā)布的新版本在全球范圍之內(nèi),在這個(gè)領(lǐng)域仍然是行業(yè)領(lǐng)先的,包括我們的可圖在評(píng)測(cè)上超過(guò)了我們的競(jìng)品,包括大家比較了解的Midjourney,我們可靈大模型在模型的性能上比谷歌Veo2和OpenAI的Sora,包括非常知名的Runway要更好一點(diǎn),這是一個(gè)模型指標(biāo)的參考?!?/p>
2、電商號(hào)平臺(tái)僅提供信息存儲(chǔ)服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系:info@dsb.cn
