openai視頻生成模型sora爆火 OpenAI王炸模型官方技術(shù)報告解讀
一幅逼真的云朵圖像生成視頻,上面寫著“SORA”;在一個華麗的歷史大廳里,一股巨大的浪潮達(dá)到頂峰,并開始崩散,兩個沖浪者抓住時機,巧妙地在海浪表面飛馳
擴展生成視頻
Sora不僅具備生成視頻的能力,更能在時間維度上實現(xiàn)向前或向后的無限擴展。以下三個視頻便是從同一生成視頻片段出發(fā),逐步向后擴展的示例。盡管它們的起始部分各異,但結(jié)局卻出奇地一致。
視頻到視頻編輯
隨著擴散模型的發(fā)展,我們已經(jīng)開發(fā)出多種方法來編輯基于文本提示的圖像和視頻。在此,我們將其中一種名為SDEdit 32的技術(shù)應(yīng)用于Sora。這項技術(shù)賦予了Sora轉(zhuǎn)換零拍攝輸入視頻風(fēng)格和環(huán)境的能力,為視頻編輯領(lǐng)域帶來了革命性的變革。
視頻的無縫連接
更令人驚嘆的是,Sora還能在兩個截然不同的輸入視頻之間實現(xiàn)無縫過渡。通過逐漸插入技術(shù),我們能夠在具有完全不同主題和場景構(gòu)圖的視頻之間創(chuàng)建出流暢自然的過渡效果。
圖片生成能力
Sora的出色能力不止于數(shù)據(jù)處理和分析,它現(xiàn)在還能生成圖像!這一創(chuàng)新功能的實現(xiàn)得益于一種獨特的算法,該算法在一個精確的時間范圍內(nèi),巧妙地在空間網(wǎng)格中排列高斯噪聲補丁。
值得一提的是,Sora的圖像生成功能不僅限于特定大小的圖像。它可以根據(jù)用戶需求,生成可變大小的圖像,最高可達(dá)驚人的2048 × 2048分辨率。
圖注:一個女人在秋天的特寫肖像,每一個細(xì)節(jié)都被捕捉得淋漓盡致,淺景深的應(yīng)用使得主體脫穎而出
圖注:充滿生機的珊瑚礁吸引了五顏六色的魚類和海洋生物
新的模擬能力
在大規(guī)模訓(xùn)練過程中,我們發(fā)現(xiàn)視頻模型展現(xiàn)出了許多令人興奮的新能力。這些功能使得Sora能夠模擬現(xiàn)實世界中的人物、動物和環(huán)境等某些方面。值得注意的是,這些屬性的出現(xiàn)并沒有依賴于任何明確的3D建模、物體識別等歸納偏差,而是純粹通過模型的尺度擴展而自然涌現(xiàn)的。
3D一致性:在3D一致性方面,Sora能夠生成帶有動態(tài)攝像頭運動的視頻。隨著攝像頭的移動和旋轉(zhuǎn),人物和場景元素在三維空間中始終保持一致的運動規(guī)律。
較長視頻的連貫性和對象持久性:視頻生成領(lǐng)域面對的一個重要挑戰(zhàn)就是,在生成的較長視頻中保持時空連貫性和一致性。Sora,雖然不總是,但經(jīng)常能夠有效地為短期和長期物體間的依賴關(guān)系建模。例如,在生成的視頻中,人物、動物和物體即使在被遮擋或離開畫面后,仍能被準(zhǔn)確地保存和呈現(xiàn)。同樣地,Sora能夠在單個樣本中生成同一角色的多個鏡頭,并在整個視頻中保持其外觀的一致性。
與世界互動:Sora有時還能以簡單的方式模擬影響世界狀態(tài)的行為。例如,畫家可以在畫布上留下新的筆觸。隨著時間的推移,一個人吃漢堡時也能在上面留下咬痕。
模擬數(shù)字世界:Sora還能夠模擬人工過程,比如視頻游戲。它可以在高保真度渲染世界及其動態(tài)的同時,用基本策略控制《我的世界》中的玩家。這些功能都無需額外的訓(xùn)練數(shù)據(jù)或調(diào)整模型參數(shù),只需向Sora提示“我的世界”即可實現(xiàn)。
這些新能力表明,視頻模型的持續(xù)擴展為開發(fā)高性能的物理和數(shù)字世界模擬器提供了一條充滿希望的道路。通過模擬生活在這些世界中的物體、動物和人等實體,我們可以更深入地理解現(xiàn)實世界的運行規(guī)律,并開發(fā)出更加逼真、自然的視頻生成技術(shù)。
局限性與展望
盡管Sora在模擬能力方面已經(jīng)取得了顯著的進(jìn)展,但它目前仍然存在許多局限性。例如,它不能準(zhǔn)確地模擬許多基本相互作用的物理過程,如玻璃破碎等。此外,在某些交互場景中,比如吃東西時,Sora并不能總是產(chǎn)生正確的對象狀態(tài)變化。我們在發(fā)布頁面中列舉了模型的其他常見故障模式,包括在長時間樣本中發(fā)展的不一致性或某些對象不受控的出現(xiàn)等。
然而,我們相信隨著技術(shù)的不斷進(jìn)步和創(chuàng)新,Sora所展現(xiàn)出的能力預(yù)示著視頻模型持續(xù)擴展的巨大潛力。未來,我們期待看到更加先進(jìn)的視頻生成技術(shù),能夠更準(zhǔn)確地模擬現(xiàn)實世界中的各種現(xiàn)象和行為,并為我們帶來更加逼真、自然的視覺體驗。
02
圈內(nèi)人如何看Sora?
最后再來看看各位技術(shù)大牛和內(nèi)容行業(yè)從業(yè)者如何評價Sora?
馬斯克評OpenAI視頻模型:人類認(rèn)賭服輸,但AI增強的人類將創(chuàng)造出最好作品
OpenAI周四發(fā)布了首個視頻生成模型Sora。馬斯克的前女友格萊姆斯發(fā)布了一連串帖子,討論這項新技術(shù)對電影以及更廣泛的藝術(shù)創(chuàng)作的影響。
馬斯克在其中一條帖子下回應(yīng)稱:“AI增強的人類將在未來幾年里創(chuàng)造出最好的作品?!?
值得注意的是,馬斯克和格萊姆斯在過去大約半年時間里一直在就他們?nèi)齻€子女的撫養(yǎng)權(quán)問題對薄公堂。兩人之間在X平臺上這次罕見的互動引發(fā)了人們對他們目前關(guān)系狀態(tài)的猜測。
稍早,一位X用戶分享了Sora生成的一名女子在東京街頭漫步的視頻,并評論稱:“OpenAI今天宣布了Sora,它使用混合擴散和變壓器模型架構(gòu)生成長達(dá)1分鐘的視頻。他們似乎又領(lǐng)先了其他所有人1-2年?!绷硪晃籜用戶評論稱:“gg皮克斯?!?
馬斯克回應(yīng)稱:“gg人類?!?注:gg是網(wǎng)絡(luò)游戲用語“good games”的縮寫,主要用于游戲結(jié)束后,輸贏雙方都可以用,但現(xiàn)在多由失敗方發(fā)出,表示認(rèn)賭服輸、心服口服的意思。)在馬斯克帖子的評論區(qū)里,還有用戶附和道:“gg好萊塢”。
Jim Fan感嘆:Sora是一個數(shù)據(jù)驅(qū)動的物理引擎
英偉達(dá)人工智能研究院Jim Fan表示“如果你還是把Sora當(dāng)做DALLE那樣的生成式玩具,還是好好想想吧,這是一個數(shù)據(jù)驅(qū)動的物理引擎。”Jim Fan大神的言下之意是,我們不能忽略Sora背后,“世界模型”更進(jìn)一步,AI已經(jīng)可以讀懂物理規(guī)律。
YouTube大V :動畫師和3D藝術(shù)家的工作可能有危險了
YouTube大V Paddy Galloway感慨:“內(nèi)容創(chuàng)作永遠(yuǎn)改變了。這不是夸張。我在YouTube世界已經(jīng)15年了,OpenAI剛剛展示的東西讓我說不出話來…”他認(rèn)為,Sora將帶來以下這些改變:
● 動畫師和3D藝術(shù)家的工作可能有危險了庫存素材網(wǎng)站將變得無關(guān)緊要
● 任何人都可以立即擁有出色的B-roll(輔助鏡頭)
● 制作精美視頻的門檻降至零
● 在一個每個人都能制作出美麗視頻的世界里,內(nèi)容背后的“想法”和故事變得更加重要
● Sora將真正顛覆教育、視頻論文和解說視頻的細(xì)分市場
AI創(chuàng)業(yè)公司創(chuàng)始人:五年之后,你將能夠生成完全沉浸式的世界,并實時體驗它們
Takeoff AI是專注于AI Tools的創(chuàng)業(yè)公司,它的創(chuàng)始人認(rèn)為這一波OpenAI新技術(shù)的最大受益者可能是虛擬現(xiàn)實。“在兩周內(nèi),我們連續(xù)有了蘋果的Vision Pro和OpenAI的Sora文本到視頻AI模型。五年之后,你將能夠生成完全沉浸式的世界,并實時體驗它們。Holodeck(應(yīng)該是指今年火爆的掌機Steamdeck的虛擬現(xiàn)實版本)很快就要來了?!?
除了這些技術(shù)上的猜測和對產(chǎn)業(yè)影響的正面預(yù)測外,也有老反對派指出Sora的潛在問題不那么容易糾正。
Gary Marcus:Sora奇怪的物理故障可能不是數(shù)據(jù)中出現(xiàn)的
紐約大學(xué)教授Gary Marcus以其對AI領(lǐng)域的深刻見解和對現(xiàn)有技術(shù)的批判性思考而聞名,他的觀點和研究對AI社區(qū)產(chǎn)生了重要影響。他表示“Sora奇怪的物理故障(例如動物和人在人群中自發(fā)出現(xiàn)和消失)令人著迷:這些錯誤可能不是數(shù)據(jù)中出現(xiàn)的。這種小故障在某些方面類似于LLM“幻覺”,即從有損壓縮中(大致)解壓縮產(chǎn)生的偽影,而不是來自這個世界的東西?!?
而且這種錯誤在他看來是一種“與現(xiàn)實世界物理學(xué)的系統(tǒng)性偏差,可能很難糾正?!?
不過此刻最悲傷的應(yīng)該是Google,今天本來拿來翻盤用的的Gemini1.5發(fā)布風(fēng)頭完全被Sora壓過。作為AI界的汪峰,它對此沒有評論。
以上就是openai視頻生成模型sora爆火 OpenAI王炸模型官方技術(shù)報告解讀全部內(nèi)容,希望對你有幫助。想查找更多游戲資訊,歡迎持續(xù)關(guān)注游戲鳥查看。-
- 《絕區(qū)零》聯(lián)動芬達(dá)PV公布,還有限定周邊!
- 卡繆2025-07-02 17:55:35
-
- 像素火影網(wǎng)頁版一周年入口 像素火影一周年網(wǎng)頁版鏈接
- 技能魔法師2025-07-01 10:35:12
-
- 送完P(guān)S5PRO又送NS2!《劍星》開發(fā)商為慶祝游戲大賣贈送每位員工一臺NS2!
- 卡繆2025-06-18 15:22:28
-
- 開啟卡牌新紀(jì)元,《影之詩》新資料片“超凡世界”正式上線!
- QQlove2025-06-18 15:10:19
-
- 魔獸世界冰dk天賦加點推薦
- 阿姆羅2025-04-07 17:11:51
-
- NS2發(fā)布會匯總:港版售價3450港幣,馬車新作首發(fā)護(hù)航,支持4K120FPS輸出!
- 卡繆2025-04-03 10:14:35
-
- 可能漲價?CDPR稱《GTA6》漲價對他們來說是有利的。
- 卡繆2025-03-28 17:31:44
-
- 期待不?巴西博主曝Faker的S14冠軍皮膚選擇為永恩!
- 卡繆2025-03-21 17:04:15
-
- 逆水寒手游元宵節(jié)時裝怎么獲得 2024元宵節(jié)時裝獲取方法
- 亡靈指揮官2024-03-25 15:31:16
-
- 逆水寒手游鏡天閣閑游特質(zhì)怎么獲得 鏡天閣閑游特質(zhì)獲取攻略
- 破碎之王2024-04-13 20:58:42
- 1 《絕區(qū)零》聯(lián)動芬達(dá)PV公布,還有限定周邊!
- 2 像素火影網(wǎng)頁版一周年入口 像素火影一周年網(wǎng)頁版鏈接
- 3 送完P(guān)S5PRO又送NS2!《劍星》開發(fā)商為慶祝游戲大賣贈送每位員工一臺NS2!
- 4 開啟卡牌新紀(jì)元,《影之詩》新資料片“超凡世界”正式上線!
- 5 魔獸世界冰dk天賦加點推薦
- 6 NS2發(fā)布會匯總:港版售價3450港幣,馬車新作首發(fā)護(hù)航,支持4K120FPS輸出!
- 7 可能漲價?CDPR稱《GTA6》漲價對他們來說是有利的。
- 8 期待不?巴西博主曝Faker的S14冠軍皮膚選擇為永恩!
-
地獄之吻國際服
地獄之吻國際服(Kiss in Hell)是充滿黑暗魅力的乙女戀愛手游,你將闖入地獄,與傲嬌惡魔們展開禁忌的愛情故事。每個選擇都將改變命運,帶你走向不同結(jié)局。從相遇、試探、拉扯,到彼此救贖,玩家將一步步揭開地獄的真相,并親手書寫屬于自己的黑暗系愛情童話。 -
少女樂團夢想?yún)f(xié)奏曲
少女樂團夢想?yún)f(xié)奏曲是結(jié)合了二次元畫風(fēng)與節(jié)奏玩法的音樂養(yǎng)成游戲,又稱BanG Dream少女樂團派對,是廣受好評的音樂手游。少女樂團夢想?yún)f(xié)奏曲的玩家將在游戲中協(xié)助少女樂隊打造人氣舞臺,培養(yǎng)她們參與LIVE演出、互動養(yǎng)成,體驗沉浸式的音樂演奏盛宴體驗。 -
GINKA
GINKA是畫風(fēng)精致、劇情感人的人氣戀愛劇情游戲,你將與神秘歸來的青梅竹馬GINKA銀花在寧靜島嶼上共度盛夏,展開一段奇幻而溫柔的童話故事。GINKA游戲支持多結(jié)局探索,適合喜歡劇情互動和視覺小說的玩家體驗,踏上這場找回記憶與幸福的旅程。 -
冒險島楓之傳說手游
冒險島楓之傳說手游是延續(xù)經(jīng)典的Q版冒險RPG手游,擁有豐富職業(yè)、可愛寵物、多樣副本與自由成長系統(tǒng),帶你重返那個熟悉又新鮮的冒險世界。冒險島楓之傳說手游更具有精致畫風(fēng)、輕松操作,再加上滿滿的童年回憶,無論是新玩家還是老島民都能找到屬于自己的快樂冒險節(jié)奏。 -
旅行熊貓
旅行熊貓(Panda Journey)是畫風(fēng)清新可愛、玩法簡單的治愈系放置手游,以旅行放置玩法為核心,主打輕松休閑體驗。旅行熊貓游戲沒有繁雜任務(wù)、沒有激烈對抗,只需陪著一只呆萌小熊貓,看看它宅家發(fā)呆、外出旅行,收集明信片和小驚喜。玩家只需每天采點竹子、整理行李即可,讓你在佛系節(jié)奏中找回寧靜的快樂時光。 -
餅干酷跑烤箱大逃亡
餅干酷跑烤箱大逃亡,又名CookieRun: OvenBreak,是節(jié)奏輕快的卡通跑酷手游。玩家可在獨特的餅干人世界中操控各種可愛的姜餅人穿越烤箱世界,挑戰(zhàn)各種障礙關(guān)卡,收集金幣、寵物與寶藏。餅干酷跑烤箱大逃亡更有多種角色等你解鎖,感受不一樣的冒險樂趣! -
動物家園手機版
動物家園手機版是充滿治愈感的經(jīng)營模擬游戲。動物家園手機版內(nèi)容充滿創(chuàng)意、畫風(fēng)治愈可愛,并設(shè)置了多樣的玩法和輕松的節(jié)奏氛圍,為玩家打造了一個充滿愛與歡樂的樂園世界。動物家園手機版的下載玩家可在動物世界中體驗各種有趣的活動,包括種花、養(yǎng)魚等,體驗充滿樂趣的放松體驗,創(chuàng)建全新的動物家園。 -
神奇之地中文版
神奇之地中文版,也叫做Magic Zoo,是充滿樂趣和創(chuàng)意的動物園經(jīng)營與收集游戲。神奇之地中文版通過豐富的合成玩法和自由的養(yǎng)成系統(tǒng),讓下載玩家能夠創(chuàng)造屬于自己的神奇動物園,通過收集各式各樣的萌寵,并通過任務(wù)和活動不斷擴展自己的動物王國,為玩家提供了持久的游戲樂趣,開啟獨特的動物收集之旅。 -
跳躍吧鯉魚王
跳躍吧鯉魚王(Magikarp)不僅是玩法簡單的放置類培育手游,更是以獨特的題材進(jìn)行設(shè)計打造的鯉魚王養(yǎng)成游戲。跳躍吧鯉魚王手游以輕松的玩法和豐富的趣味性,成功俘獲了大量玩家的心,并通過幽默搞笑的方式,讓玩家感受到逆襲成長的快樂,體驗輕松休閑、快樂成長的獨特培育故事。 -
春姑娘你在哪
春姑娘你在哪憑借其溫馨的畫風(fēng)、治愈的音樂以及巧妙的解謎設(shè)計,成為了一個令人耳目一新的休閑益智手游。春姑娘你在哪游戲不僅僅是簡單的數(shù)字關(guān)卡挑戰(zhàn),更是一段關(guān)于成長、希望與學(xué)習(xí)的心靈旅程。春姑娘你在哪休閑簡單的玩法適合玩家放松心情,玩家也可通過關(guān)卡挑戰(zhàn)智慧,踏上尋找春天的治愈之旅。