OpenAI打出王炸,Sora視頻AI太猛了
山姆·奧特曼開始上硬貨。
一、“正版 Sora” 震撼發(fā)布
等了將近10個月,OpenAI終于給大家?guī)砹似煜乱曨l生成大模型Sora的消息。
就在今天(12月10日)凌晨,OpenAI再次震驚世界,以一場直播宣布了正式向用戶開放其人工智能視頻生成模型Sora。

Sora直播發(fā)布會的嘉賓由OpenAI CEO山姆·奧特曼(Sam Altman)、Sora團(tuán)隊(duì)負(fù)責(zé)人比爾·皮布爾斯(Bill Peebles)和阿迪亞·拉梅什(Aditya Ramesh)三人組成,共進(jìn)行了一場約20分鐘的直播。
在這場直播中,他們不僅詳細(xì)介紹了Sora的新功能,更是展示了AI技術(shù)在視頻創(chuàng)作上的無限可能。
據(jù)直播介紹,此次推出的 Sora 不同于 2 月份的演示版本,而是更高級的新版本Sora Turbo;
該版本稱較2月版本生成速度顯著加快,并且可以生成最長達(dá)20秒的視頻,還能提供這些視頻的多種變體。
據(jù)悉,新版Sora具有替換、刪除或新增元素、重新剪輯、擴(kuò)展及合并視頻等功能。
具體操作中,OpenAI把他們分成了多個“按鈕”。
比如,Remix(重混)功能允許用戶替換、刪除或重構(gòu)視頻中的元素,為視頻創(chuàng)作提供了更多的靈活性。
Re-cut(重新切割)功能則能夠讓用戶找到最佳的一幀視頻,并在此基礎(chǔ)上進(jìn)行延展,創(chuàng)造出全新的視頻內(nèi)容。

圖源:OpenAI直播
Loop(混合)功能則可以將兩個視頻進(jìn)行無縫合并剪輯,創(chuàng)造出流暢的視頻過渡效果。
Storyboard(故事板剪輯)功能則允許用戶精準(zhǔn)指定每個幀的輸入,為視頻創(chuàng)作提供了更高的精確度。
而Style presets(風(fēng)格預(yù)設(shè))功能則允許用戶預(yù)設(shè)視頻的風(fēng)格,一鍵生成具有特定風(fēng)格的視頻內(nèi)容……
Sora一經(jīng)發(fā)布,OpenAI的服務(wù)器瞬間就被“擠爆”,官方網(wǎng)站(Sora.com)甚至直接崩潰,停止一切注冊登錄。
而已經(jīng)開始使用的網(wǎng)友也發(fā)現(xiàn)了在發(fā)布會直播結(jié)束后,Sora的視頻生成速度開始明顯變慢。
對此,Altman 急忙出面安撫用戶:“由于需求超出預(yù)期,我們將不得不間歇性地關(guān)閉新用戶注冊,并且生成內(nèi)容的速度會在一段時間內(nèi)減慢。我們正在全力以赴!”

回顧今年2月,OpenAI首次發(fā)布有關(guān)Sora的預(yù)告,聲稱Sora是一項(xiàng)理解和模擬現(xiàn)實(shí)的基礎(chǔ)性AI技術(shù),是開發(fā)能夠與物理世界互動模型的重要一步。
然而,在早期測試中,Sora卻表現(xiàn)出了一些明顯的局限性。
例如,在物理模擬方面,模型對物體運(yùn)動的理解還不夠深入,常常出現(xiàn)動作不協(xié)調(diào)、一些物體突然消失等問題。
此外,還有信息透露在某一次測試中,Sora存在“多余肢體”的問題,生成的生物不是多一只手指就是少一只眼睛。
另一方面,此次Sora的發(fā)布可以說只是OpenAI為期12天的產(chǎn)品直播活動的其中一個部分。
上周,OpenAI剛推出了更昂貴的ChatGPT Pro訂閱選項(xiàng),可無限制訪問OpenAI最強(qiáng)大的AI模型。
至于Sora的收費(fèi)方面,官方介紹顯示:即日起,Sora Turbo已向訂閱OpenAI Plus和Pro的會員開放全部功能,無需額外付費(fèi)。
不過,不同的會員所擁有的使用額度則不太一致。

據(jù)悉,官方頁面顯示,每月付費(fèi)20美元的OpenAI Plus會員,單月共有50次視頻生成額度(1000積分),生成的視頻分辨率最高為720p,單條視頻時長為5秒;
而每月付費(fèi)200美元的Pro會員,單月可慢速無限次生成視頻,加速生成視頻500次(10000積分),并且Pro會員可同時生成5條視頻,分辨率最高可達(dá)到1080p,時長則提升到20秒。
Altman自己也發(fā)文宣傳:“初期Sora的使用仍然受限,ChatGPT Plus訂閱用戶可以每月生成50個低分辨率視頻,而ChatGPT Pro訂閱用戶則可以無限制地‘較慢’生成高分辨率視頻,以及500個快速生成的視頻?!?/span>
簡單來說,就是會員通用,購買了ChatGPT的會員也可以使用對應(yīng)的Sora Turbo。
此外,有不少朋友可能注意到了,或許是受其他競品的啟發(fā),此次OpenAI對Sora采用了靈活的積分制定價策略。
據(jù)了解,如果你已是 ChatGPT Plus 和 Pro 會員,那么當(dāng)你需要生成一個 480p、5s 的視頻只需要消耗 25 個積分;
生成 480p、20s 的視頻則需要 150 個積分;

此外,當(dāng)你使用Re-cut、Remix、Blend或者Loop這些功能或生成的作品超過5s時,需要支付額外積分,功能用得越多、時長越長扣得也越多。

因此,縱使Sora帶來了許多顛覆性的AI功能,想要注意體驗(yàn)也需要付出一定的代價。
有些用過多家視頻AI的用戶則表示,Sora是他們用過最貴的文生視頻大模型。
二、“對標(biāo) Sora”成為現(xiàn)實(shí)
隨著Sora Turbo的正式發(fā)布,“對標(biāo)Sora”的話題又一次引起了關(guān)注。
自2月份Sora預(yù)告發(fā)布以來,Sora一度銷聲匿跡,OpenAI對外界也一直保持沉默。
與此同時,國內(nèi)市場上卻涌現(xiàn)出了眾多文生視頻大模型,如快手可靈AI、智譜清影AI、海螺AI等。
在這些國產(chǎn)視頻AI發(fā)布時,不少科技媒體第一時間將它們廣泛地與Sora進(jìn)行對比,并打上了“對標(biāo)Sora”、“國產(chǎn)Sora”等標(biāo)簽。
但一些業(yè)內(nèi)人士對此并不認(rèn)同,他們始終認(rèn)為,這些AI與Sora并非同一概念,之間有著本質(zhì)上的差別。
如今,隨著更高級的Sora Turbo正式亮相,是時候通過具體的效果展示為這場"對標(biāo)"爭論畫一個句號。
那就先來聚焦官方的直播演示。
在長達(dá)數(shù)十分鐘Sora的功能展示中,OpenAI通過直播向外界展示了Sora的強(qiáng)大能力:
能夠生成最高1080p分辨率、最長20秒、支持16:9/1:1/9:16等多種畫面比例的視頻。

圖源:Sora官網(wǎng)
用戶可以輸入文字或上傳圖像,利用全新上線的UI界面對生成的視頻進(jìn)行修改、創(chuàng)建、擴(kuò)展、循環(huán)、混合,甚至完全基于文本生成全新的內(nèi)容。
OpenAI強(qiáng)調(diào),Sora無法實(shí)現(xiàn)一鍵生成一段故事片,而是需要不斷優(yōu)化。
例如,如果用戶需要生成一段較長的視頻,則需要打開分鏡(Storyboard)功能,該功能打開后將在頁面上展示四個視頻,用戶可以從不同視角了解視頻細(xì)節(jié)。

點(diǎn)擊分鏡中的視頻,用戶可以在描述框輸入具體的提示詞,也可以設(shè)置風(fēng)格、畫面比例、時長、分鏡個數(shù)、分辨率等元素。
一切就緒后,一條完整的視頻隨即就能生成。
如果說聽上去依然很空洞,別著急,接下來給大家展示OpenAI直播中演示的具體案例。
直播中,OpenAI團(tuán)隊(duì)在描述框中輸入了“一只黃尾白鶴站在小溪里”的提示詞,并把生成出的視頻放在了時間軸的前面部分;
隨后,他們又在新的描述框中輸入提示詞“這只鶴將頭探入水中并叼出一條魚”,并把這段視頻放在了同一個時間軸的后半部分。
兩段視頻并不連續(xù),但Sora可以自行生成中間的過渡片段,使之成為一段完整的視頻。

在另一個演示中,OpenAI展示了如何用Remix工具改變視頻中的物體,從而優(yōu)化你想要的視頻。
例如,在前面分鏡部分的演示中,OpenAI給出的提示詞為“長毛猛犸象走過沙漠景觀”;
而在后續(xù)的優(yōu)化提示框中,可以直接輸入“把猛犸象變成「機(jī)械猛犸」”,就得到了下面這樣一條視頻。

更多奇妙的功能等待著用戶們自行去探索,這里不做過多贅述。
小編更希望聊一聊的是,Sora是否真的“遠(yuǎn)遠(yuǎn)超越”咱們國產(chǎn)自己的視頻AI。
事實(shí)上,好奇這一點(diǎn)的網(wǎng)友非常多,在短短不到一天的體驗(yàn)中,外網(wǎng)就爆出了不少Sora的不足之處:
在用戶輸入提示詞“一只鵜鶘沿著俯瞰港口的沿海小徑騎自行車”后,Sora對應(yīng)生成了一段視頻,但在該視頻畫面中,鵜鶘卻像突然吃了云南菌子一樣,在中途莫名其妙地變?yōu)橄蛳喾吹姆较蝌T行。

還有外網(wǎng)網(wǎng)友爆料,Sora對于性別的概念比較模糊,當(dāng)提示詞過長的時候,會出現(xiàn)把“一男一女”生成為“兩個女孩”的畫面。
不過,當(dāng)我們把同一段提示詞交給各家AI進(jìn)行生成時,它們各自的問題也隨之暴露。
據(jù)了解,有用戶反饋,當(dāng)提示詞為“維京演員的情感表演。當(dāng)演員皺眉時,鏡頭推到臉上”,Sora、快手可靈、MiniMax海螺表現(xiàn)各有不同。
具體來說,Sora的視頻鏡頭氛圍出色,粗看有電影大片風(fēng)范,但無法體現(xiàn)“演員皺眉”、“鏡頭推到臉上”。

快手可靈AI的表現(xiàn)則較為嚴(yán)謹(jǐn),基本一比一根據(jù)提示詞生成視頻,但畫面也相對較為死板。

而MiniMax海螺生成的視頻也有好有壞,亮點(diǎn)在于表情變化更加明顯,缺點(diǎn)則是運(yùn)鏡提示詞完全理解錯誤,變成了“鏡頭逐漸拉遠(yuǎn)”。

總的來說,這些視頻大模型都具有各自的優(yōu)勢,當(dāng)然也存在屬于它們自己的不足等待被解決。
隨著Sora Turbo的正式發(fā)布,國內(nèi)外視頻AI的競爭將更加激烈。
哪怕是OpenAI,也需要繼續(xù)學(xué)習(xí)與進(jìn)步,讓技術(shù)優(yōu)勢變成真正的產(chǎn)品優(yōu)勢。
2、電商號平臺僅提供信息存儲服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn
