香港中評網：顛覆影視行業？Sora能做到嗎

【大中小】【打印】

【第1頁第2頁第3頁】

顛覆影視行業？Sora能做到嗎

http://www.CRNTT.tw 2024-02-28 10:13:38

（圖源：齊魯晚報）

　　中評社北京2月28日電／據齊魯晚報報導，在ChatGPT問世一年多後，OpenAI再度“進化”，日前發布首個AI文字生成視頻模型Sora。使用者只需通過文字描述場景，Sora就能生成類似電影的逼真場景，涵蓋多個角色、不同類型動作和背景細節等，最高能生成1分鐘左右的1080P高清視頻，引發業界極大的震撼。Sora的出現被看作“人工智能領域的一次重大突破”，顯著提高了AI文字生成視頻的能力上限，為今後的文明進步帶來更多樣的可能性。Sora究竟是什麼？未來將給影視行業帶來哪些變化與挑戰？
效果媲美“大片”

　　近日，由Sora生成的一段時長59秒的視頻，在社交網絡上廣為流傳。畫面中，一位戴墨鏡、身穿紅裙皮衣、踩著皮靴的女人，漫步在東京街頭，鏡頭流暢地推到了她的臉部，可以清晰地看到她臉上的雀斑和皮膚紋理。這個一鏡到底的視頻不需要人來拍攝和剪輯，只要把一段文字描述輸入Sora後由AI直接生成。此外，OpenAI還公布了其他幾段視頻，幾只巨大的毛茸茸的猛獁象踏著白雪皚皚的草地走近、一個毛茸茸的小怪物跪在融化的紅蠟燭旁邊……視頻質量媲美“大片”，視覺效果也十分逼真。

　　除了生成的畫面高度接近現實物理世界，OpenAI介紹，Sora可以實現視頻中的主題始終保持一致，即使暫時離開視野也不會發生變化，並可以一次性生成多機位視頻，還可以依靠對語言的深入理解準確地解釋提示詞，保留角色和視覺風格。有網友感慨，“它將把視頻內容帶入‘零基礎創作’時代”。

　　電影學者李超在接受齊魯晚報採訪時，向記者展示了一段由AI提煉的相關背景介紹：Sora模型的核心是擴散模型，它從“隨機噪聲”開始，經過上百個細致的處理階段，最終演化成為一個連貫且生動的視頻場景。此外，Sora還結合了語言理解和視覺生成技術，能夠創建複雜的場景和角色。“Sora實際上是物理世界通用模擬器。”李超進一步解釋說。

　　不少科技從業人員也從不同角度對Sora進行點評。馬斯克在社交平台上踴躍發言，“人類願賭服輸”“人類借助AI之力將創造出卓越作品”；AI文生視頻創企Runway聯合創始人克里斯托瓦爾·巴倫蘇埃拉感慨後浪拍前浪，以前需要花費一年的進展，變成了幾個月就能實現，又變成了幾天、幾小時；出門問問創始人李志飛在朋友圈感嘆：“LLM（大型語言模型）ChatGPT是虛擬思維世界的模擬器，以LLM為基礎的視頻生成模型Sora是物理世界的模擬器，物理和虛擬世界都被建模和模擬了，到底什麼是現實？”

【第1頁第2頁第3頁】　

【大中小】【打印】【評論】

相關新聞：

Sora恐顛覆影視業　文本轉影片場景逼真 (2024-02-22 16:03:43)
國家廣電總局新規：不得製造虛假收視收聽率 (2020-04-25 11:09:41)
告別天價片酬　讓影視行業重回理性　 (2018-09-27 11:15:25)