OpenAI打出王炸，Sora視頻AI太猛了

李迎

2024-12-11 09:22

山姆·奧特曼開始上硬貨。

一、“正版 Sora” 震撼發(fā)布

等了將近10個月，OpenAI終于給大家?guī)砹似煜乱曨l生成大模型Sora的消息。

就在今天（12月10日）凌晨，OpenAI再次震驚世界，以一場直播宣布了正式向用戶開放其人工智能視頻生成模型Sora。

Sora直播發(fā)布會的嘉賓由OpenAI CEO山姆·奧特曼（Sam Altman）、Sora團(tuán)隊(duì)負(fù)責(zé)人比爾·皮布爾斯（Bill Peebles）和阿迪亞·拉梅什（Aditya Ramesh）三人組成，共進(jìn)行了一場約20分鐘的直播。

在這場直播中，他們不僅詳細(xì)介紹了Sora的新功能，更是展示了AI技術(shù)在視頻創(chuàng)作上的無限可能。

據(jù)直播介紹，此次推出的 Sora 不同于 2 月份的演示版本，而是更高級的新版本Sora Turbo；

該版本稱較2月版本生成速度顯著加快，并且可以生成最長達(dá)20秒的視頻，還能提供這些視頻的多種變體。

據(jù)悉，新版Sora具有替換、刪除或新增元素、重新剪輯、擴(kuò)展及合并視頻等功能。

具體操作中，OpenAI把他們分成了多個“按鈕”。

比如，Remix（重混）功能允許用戶替換、刪除或重構(gòu)視頻中的元素，為視頻創(chuàng)作提供了更多的靈活性。

Re-cut（重新切割）功能則能夠讓用戶找到最佳的一幀視頻，并在此基礎(chǔ)上進(jìn)行延展，創(chuàng)造出全新的視頻內(nèi)容。

圖源：OpenAI直播

Loop（混合）功能則可以將兩個視頻進(jìn)行無縫合并剪輯，創(chuàng)造出流暢的視頻過渡效果。

Storyboard（故事板剪輯）功能則允許用戶精準(zhǔn)指定每個幀的輸入，為視頻創(chuàng)作提供了更高的精確度。

而Style presets（風(fēng)格預(yù)設(shè)）功能則允許用戶預(yù)設(shè)視頻的風(fēng)格，一鍵生成具有特定風(fēng)格的視頻內(nèi)容……

Sora一經(jīng)發(fā)布，OpenAI的服務(wù)器瞬間就被“擠爆”，官方網(wǎng)站（Sora.com）甚至直接崩潰，停止一切注冊登錄。

而已經(jīng)開始使用的網(wǎng)友也發(fā)現(xiàn)了在發(fā)布會直播結(jié)束后，Sora的視頻生成速度開始明顯變慢。

對此，Altman 急忙出面安撫用戶：“由于需求超出預(yù)期，我們將不得不間歇性地關(guān)閉新用戶注冊，并且生成內(nèi)容的速度會在一段時間內(nèi)減慢。我們正在全力以赴！”

回顧今年2月，OpenAI首次發(fā)布有關(guān)Sora的預(yù)告，聲稱Sora是一項(xiàng)理解和模擬現(xiàn)實(shí)的基礎(chǔ)性AI技術(shù)，是開發(fā)能夠與物理世界互動模型的重要一步。

然而，在早期測試中，Sora卻表現(xiàn)出了一些明顯的局限性。

例如，在物理模擬方面，模型對物體運(yùn)動的理解還不夠深入，常常出現(xiàn)動作不協(xié)調(diào)、一些物體突然消失等問題。

此外，還有信息透露在某一次測試中，Sora存在“多余肢體”的問題，生成的生物不是多一只手指就是少一只眼睛。

另一方面，此次Sora的發(fā)布可以說只是OpenAI為期12天的產(chǎn)品直播活動的其中一個部分。

上周，OpenAI剛推出了更昂貴的ChatGPT Pro訂閱選項(xiàng)，可無限制訪問OpenAI最強(qiáng)大的AI模型。

至于Sora的收費(fèi)方面，官方介紹顯示：即日起，Sora Turbo已向訂閱OpenAI Plus和Pro的會員開放全部功能，無需額外付費(fèi)。

不過，不同的會員所擁有的使用額度則不太一致。

據(jù)悉，官方頁面顯示，每月付費(fèi)20美元的OpenAI Plus會員，單月共有50次視頻生成額度（1000積分），生成的視頻分辨率最高為720p，單條視頻時長為5秒；

而每月付費(fèi)200美元的Pro會員，單月可慢速無限次生成視頻，加速生成視頻500次（10000積分），并且Pro會員可同時生成5條視頻，分辨率最高可達(dá)到1080p，時長則提升到20秒。

Altman自己也發(fā)文宣傳：“初期Sora的使用仍然受限，ChatGPT Plus訂閱用戶可以每月生成50個低分辨率視頻，而ChatGPT Pro訂閱用戶則可以無限制地‘較慢’生成高分辨率視頻，以及500個快速生成的視頻?！?/span>

簡單來說，就是會員通用，購買了ChatGPT的會員也可以使用對應(yīng)的Sora Turbo。

此外，有不少朋友可能注意到了，或許是受其他競品的啟發(fā)，此次OpenAI對Sora采用了靈活的積分制定價策略。

據(jù)了解，如果你已是 ChatGPT Plus 和 Pro 會員，那么當(dāng)你需要生成一個 480p、5s 的視頻只需要消耗 25 個積分；

生成 480p、20s 的視頻則需要 150 個積分；

此外，當(dāng)你使用Re-cut、Remix、Blend或者Loop這些功能或生成的作品超過5s時，需要支付額外積分，功能用得越多、時長越長扣得也越多。

因此，縱使Sora帶來了許多顛覆性的AI功能，想要注意體驗(yàn)也需要付出一定的代價。

有些用過多家視頻AI的用戶則表示，Sora是他們用過最貴的文生視頻大模型。

二、“對標(biāo) Sora”成為現(xiàn)實(shí)

隨著Sora Turbo的正式發(fā)布，“對標(biāo)Sora”的話題又一次引起了關(guān)注。

自2月份Sora預(yù)告發(fā)布以來，Sora一度銷聲匿跡，OpenAI對外界也一直保持沉默。

與此同時，國內(nèi)市場上卻涌現(xiàn)出了眾多文生視頻大模型，如快手可靈AI、智譜清影AI、海螺AI等。

在這些國產(chǎn)視頻AI發(fā)布時，不少科技媒體第一時間將它們廣泛地與Sora進(jìn)行對比，并打上了“對標(biāo)Sora”、“國產(chǎn)Sora”等標(biāo)簽。

但一些業(yè)內(nèi)人士對此并不認(rèn)同，他們始終認(rèn)為，這些AI與Sora并非同一概念，之間有著本質(zhì)上的差別。

如今，隨著更高級的Sora Turbo正式亮相，是時候通過具體的效果展示為這場"對標(biāo)"爭論畫一個句號。

那就先來聚焦官方的直播演示。

在長達(dá)數(shù)十分鐘Sora的功能展示中，OpenAI通過直播向外界展示了Sora的強(qiáng)大能力：

能夠生成最高1080p分辨率、最長20秒、支持16:9/1:1/9:16等多種畫面比例的視頻。

圖源：Sora官網(wǎng)

用戶可以輸入文字或上傳圖像，利用全新上線的UI界面對生成的視頻進(jìn)行修改、創(chuàng)建、擴(kuò)展、循環(huán)、混合，甚至完全基于文本生成全新的內(nèi)容。

OpenAI強(qiáng)調(diào)，Sora無法實(shí)現(xiàn)一鍵生成一段故事片，而是需要不斷優(yōu)化。

例如，如果用戶需要生成一段較長的視頻，則需要打開分鏡（Storyboard）功能，該功能打開后將在頁面上展示四個視頻，用戶可以從不同視角了解視頻細(xì)節(jié)。

點(diǎn)擊分鏡中的視頻，用戶可以在描述框輸入具體的提示詞，也可以設(shè)置風(fēng)格、畫面比例、時長、分鏡個數(shù)、分辨率等元素。

一切就緒后，一條完整的視頻隨即就能生成。

如果說聽上去依然很空洞，別著急，接下來給大家展示OpenAI直播中演示的具體案例。

直播中，OpenAI團(tuán)隊(duì)在描述框中輸入了“一只黃尾白鶴站在小溪里”的提示詞，并把生成出的視頻放在了時間軸的前面部分；

隨后，他們又在新的描述框中輸入提示詞“這只鶴將頭探入水中并叼出一條魚”，并把這段視頻放在了同一個時間軸的后半部分。

兩段視頻并不連續(xù)，但Sora可以自行生成中間的過渡片段，使之成為一段完整的視頻。

在另一個演示中，OpenAI展示了如何用Remix工具改變視頻中的物體，從而優(yōu)化你想要的視頻。

例如，在前面分鏡部分的演示中，OpenAI給出的提示詞為“長毛猛犸象走過沙漠景觀”；

而在后續(xù)的優(yōu)化提示框中，可以直接輸入“把猛犸象變成「機(jī)械猛犸」”，就得到了下面這樣一條視頻。

更多奇妙的功能等待著用戶們自行去探索，這里不做過多贅述。

小編更希望聊一聊的是，Sora是否真的“遠(yuǎn)遠(yuǎn)超越”咱們國產(chǎn)自己的視頻AI。

事實(shí)上，好奇這一點(diǎn)的網(wǎng)友非常多，在短短不到一天的體驗(yàn)中，外網(wǎng)就爆出了不少Sora的不足之處：

在用戶輸入提示詞“一只鵜鶘沿著俯瞰港口的沿海小徑騎自行車”后，Sora對應(yīng)生成了一段視頻，但在該視頻畫面中，鵜鶘卻像突然吃了云南菌子一樣，在中途莫名其妙地變?yōu)橄蛳喾吹姆较蝌T行。

還有外網(wǎng)網(wǎng)友爆料，Sora對于性別的概念比較模糊，當(dāng)提示詞過長的時候，會出現(xiàn)把“一男一女”生成為“兩個女孩”的畫面。

不過，當(dāng)我們把同一段提示詞交給各家AI進(jìn)行生成時，它們各自的問題也隨之暴露。

據(jù)了解，有用戶反饋，當(dāng)提示詞為“維京演員的情感表演。當(dāng)演員皺眉時，鏡頭推到臉上”，Sora、快手可靈、MiniMax海螺表現(xiàn)各有不同。

具體來說，Sora的視頻鏡頭氛圍出色，粗看有電影大片風(fēng)范，但無法體現(xiàn)“演員皺眉”、“鏡頭推到臉上”。

快手可靈AI的表現(xiàn)則較為嚴(yán)謹(jǐn)，基本一比一根據(jù)提示詞生成視頻，但畫面也相對較為死板。

而MiniMax海螺生成的視頻也有好有壞，亮點(diǎn)在于表情變化更加明顯，缺點(diǎn)則是運(yùn)鏡提示詞完全理解錯誤，變成了“鏡頭逐漸拉遠(yuǎn)”。

總的來說，這些視頻大模型都具有各自的優(yōu)勢，當(dāng)然也存在屬于它們自己的不足等待被解決。

隨著Sora Turbo的正式發(fā)布，國內(nèi)外視頻AI的競爭將更加激烈。

哪怕是OpenAI，也需要繼續(xù)學(xué)習(xí)與進(jìn)步，讓技術(shù)優(yōu)勢變成真正的產(chǎn)品優(yōu)勢。

OpenAI Sora

聲明

1、該內(nèi)容為作者獨(dú)立觀點(diǎn)，不代表電商派觀點(diǎn)或立場，文章為作者本人上傳，版權(quán)歸原作者所有，未經(jīng)允許不得轉(zhuǎn)載。
2、電商號平臺僅提供信息存儲服務(wù)，如發(fā)現(xiàn)文章、圖片等侵權(quán)行為，侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對本稿件有異議或投訴，請聯(lián)系：info@dsb.cn

相關(guān)閱讀

周鴻祎再談Sora：通用人工智能可能兩三年就會實(shí)現(xiàn)

2024-02-22 09:30:02

2月22日消息，在2024亞布力中國企業(yè)家論壇第二十四屆年會上，360集團(tuán)創(chuàng)始人、董事長周鴻祎表示，最近OpenAI推出Sora大模型，這不是AIGC工具的產(chǎn)生這么簡單，也不是AI能夠做視頻這么簡單。這暗示著，過去我們認(rèn)為通用人工智能需要10年、20年才能到來，現(xiàn)在可能會縮短至兩三年。很多企業(yè)需要抓住這個機(jī)遇。

國泰君安：看好跨境電商、教育等AI應(yīng)用方向

2024-03-07 10:32:12

3月7日消息，國泰君安研報指出，多模態(tài)AI大模型進(jìn)展提速，下游應(yīng)用方向有望受益。1)近期海外AI創(chuàng)新成果不斷涌現(xiàn)，從OpenAI發(fā)布Sora，到谷歌發(fā)布基礎(chǔ)世界模型，再到Claude3，AI多模態(tài)大模型進(jìn)展加速且性能、成本等方面均有持續(xù)優(yōu)化，從而將進(jìn)一步推動AI產(chǎn)業(yè)迭代提速及應(yīng)用落地進(jìn)程提速；2)跨境電商、教育等均是AI重要的落地場景。

周鴻祎談Sora：對短視頻顛覆巨大，但未必能擊敗TikTok

2024-02-16 17:23:09

OpenAI今日推出一款全新的文本到視頻生成模型Sora，該模型允許用戶創(chuàng)建長達(dá)一分鐘的逼真視頻——所有這些都基于他們編寫的提示。

谷歌視頻大模型VideoPoet前負(fù)責(zé)人蔣路加入TikTok

2024-02-22 11:05:17

2月22日消息，據(jù)報道，谷歌高級科學(xué)家、卡內(nèi)基梅隆大學(xué) 計算機(jī)學(xué)院兼職教授蔣路，已經(jīng)加入TikTok。據(jù)了解，蔣路是谷歌VideoPoet項(xiàng)目負(fù)責(zé)人，VideoPoet是谷歌在2023年12月推出的視頻生成大模型，類似OpenAI剛剛發(fā)布的Sora。

360周鴻祎稱Sora工作原理像人做夢

2024-02-20 10:52:48

360創(chuàng)始人、董事長周鴻祎在今日上午發(fā)布視頻分享自己對Open AI最新的文生視頻大模型Sora的見解。

周鴻祎稱Sora工作原理像人做夢

2024-02-20 10:43:36

2月20日消息，360創(chuàng)始人、董事長周鴻祎發(fā)布視頻分享自己對Open AI最新的文生視頻大模型Sora的見解，他寫道：“Sora工作原理像人做夢，未來AGI比的就是算力和對世界的理解?！彼€把近期人們關(guān)注的Sora在視頻中出現(xiàn)的Bug等比做人在做夢時同樣會產(chǎn)生的幻覺等違背現(xiàn)實(shí)規(guī)律的情況。

前OpenAI聯(lián)合創(chuàng)始人單飛創(chuàng)業(yè)

2024-06-21 17:41:41

一場好戲即將上演。

美國支付公司Stripe與OpenAI合作，將ChatGPT商業(yè)化

2023-03-16 10:18:40

本周，OpenAI發(fā)布最新版GPT-4技術(shù)，稱Stripe將為支付提供計費(fèi)和結(jié)賬功能，以及自動化和稅務(wù)合規(guī)技術(shù)。Stripe首席技術(shù)官David Singleton表示，Stripe將從通過OpenAI旗下平臺所進(jìn)行的交易中抽成一小部分。這次合作也意味著Stripe將把OpenAI的新技術(shù)整合到自己的產(chǎn)品和服務(wù)中，目前Stripe正在對14個GPT基礎(chǔ)設(shè)施進(jìn)行試驗(yàn)。這對Stripe來說是個利好消息。

李迎

你好，我是李迎

OpenAI打出王炸，Sora視頻AI太猛了

OpenAI打出王炸，Sora視頻AI太猛了