快手大模型“可靈”正式推出圖生視頻功能
6月23日消息,快手視頻生成大模型“可靈”再度進(jìn)化,于6月21日正式推出圖生視頻功能,支持用任意靜態(tài)圖像生成5s視頻,并且可搭配不同的文本內(nèi)容,實現(xiàn)豐富的視覺敘事 。同時,可靈還發(fā)布了視頻續(xù)寫功能,可為已生成的視頻(含文生視頻及圖生視頻)提供便捷的一鍵續(xù)寫和連續(xù)多次續(xù)寫,將視頻最長可延伸至約3分鐘,拓展了視頻大模型的創(chuàng)作邊界。
此前,“可靈”在文生視頻方面已經(jīng)展現(xiàn)出了創(chuàng)造逼真運(yùn)動場景、精確模擬物理特性的強(qiáng)大能力,以及將復(fù)雜概念巧妙融合的高超技藝,其輸出堪比電影級畫質(zhì),并允許用戶自由調(diào)節(jié)視頻的縱橫比。而這些特性,如今都被融入到了圖生視頻模型。用戶只需上傳一張圖片,“可靈”即能基于對圖像的深度解析,變靜為動,賦予其5秒的鮮活生命力。

圖源:快手官微
此外,可靈圖生視頻模型支持不同風(fēng)格的圖像輸入,不論是自然寫實還是風(fēng)格化圖像都能輕松處理,同時兼容各種長寬比的圖像輸入,展示出強(qiáng)大的靈活性和適應(yīng)性。
可靈大模型還新推出了視頻續(xù)寫功能,用戶只需一鍵操作,即可在已生成視頻的基礎(chǔ)上延續(xù)生成約5秒內(nèi)容,該功能同時適用于文生視頻和圖生視頻。通過連續(xù)多次續(xù)寫,還能夠最長生產(chǎn)約3分鐘的連貫視頻?;趯ξ锢磉\(yùn)動的深入理解,視頻續(xù)寫不僅確保新生成部分與原視頻間的運(yùn)動連貫性及物理合理性,還能巧妙融入大幅度的動作變化,提升視頻的生動性。

圖源:快手官微
此次升級的一大亮點(diǎn)是集成文本控制機(jī)制于視頻續(xù)寫中,這意味著用戶能夠通過自定義提示詞,為每段視頻續(xù)寫注入個性化創(chuàng)意。得益于此,模型利用高效的提示詞融合技術(shù),平滑地在場景間過渡,響應(yīng)用戶的每一個靈感。
6月6日,可靈文生視頻大模型正式亮相,不僅在效果上比肩Sora,還即時在快影App上啟動了邀測體驗,截至目前,已有累計超過14萬人排隊申請。
快手還將在下月召開的2024世界人工智能大會(WAIC)上,舉辦以“新AI·新應(yīng)用·新生態(tài)”為主題的大模型技術(shù)生態(tài)論壇。屆時,快手將發(fā)布最新的大模型技術(shù)與應(yīng)用戰(zhàn)略,包括快手大模型技術(shù)矩陣全景、基座模型技術(shù)創(chuàng)新、應(yīng)用和落地情況等。
2、電商號平臺僅提供信息存儲服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn
