時時頭條
  • 娛樂
  • 體育
  • 財經
  • 科技
  • 旅遊
  • 軍事
  • 育兒
  • 時尚
  • 遊戲
  • 歷史
  1. 首頁
  2. 科技

Sora成功是站在谷歌肩膀上嗎?業內:關鍵是人才、算力和資料的堆砌

2024-02-21 09:23:44

近日,AI(人工智慧)新銳巨頭OpenAI推出文生影片模型Sora,掀起了全球範圍內的熱烈討論。

由於在AI生成影片的時長上成功突破到一分鐘,再加上演示影片的高度逼真和高質量,Sora立刻引起了轟動,並引發外界的種種猜測:能在釋出ChatGPT不到兩年後就推出Sora,OpenAI是否“藏了一手”?表現驚豔的Sora是否已經具有世界模型的特點?

不過,OpenAI尚未宣佈Sora對公眾正式開放的日期,目前也只向安全團隊、一些視覺藝術家、設計師和電影製作人開放了Sora的使用許可權。除了內部人士不斷放出的演示片段外,OpenAI還在Sora的官網上放出了其技術報告。

首先,與GPT模型類似,Sora使用Transformer架構,這被許多研究者視為其強大能力背後的主要功臣。

本質上,Sora和Pika、Runway等文生影片模型採用了相似的底層模型,即Diffusion擴散模型。不同之處在於,Sora把其中的實現邏輯進行了變化,將U-Net架構替換成了Transformer架構。

北京郵電大學智慧互動設計專業副教授譚劍為澎湃新聞記者介紹,與其他AI模型架構相比,Transformer架構有兩大理論優勢:“它的核心能力是能自動構建不同維度、不同層級的知識網路或資訊網路,也就是一張無縫的思維導圖……權重關聯機制(attention機制)也是它核心能力的另一種體現,就是它會根據任何資料的上下文,來理解相關的高低維度資訊。”

譚劍強調,要充分發揮Transformer架構的核心能力,一個必要條件就是輸入資料足夠多、維度足夠大。

一位AI大模型從業人士告訴澎湃新聞記者,Sora的主要技術思路是“用視覺塊編碼(Visual Patch)的方式,把不同格式的影片進行統一編碼,然後用Transformer架構進行訓練,並引入類似Diffusion的Unet方式在降維和升維的過程中做加噪和去噪”。

透過細節上的設計,Sora解決了“閃爍”(幀間細節跳變)的問題,還能直接生成高解析度(1080p)的影象、長達60秒的影片,說明“訓練的序列也比較長,訓練時候的視窗至少也有五秒”。

不過,目前看來,OpenAI的Sora報告中依然藏有許多謎團。

浙江大學百人計劃研究員、博士生導師趙俊博對澎湃新聞記者表示,Sora所採用的擴散Transformer架構“可能是成功的關鍵之一”,但OpenAI目前放出的內容基本上也沒有涉及更多的技術細節:“從第一性原理出發,其實我們目前對於Transformer神經網路架構的理解是非常不夠的,尤其是為什麼這個模型在scale up(擴大規模)之後能有如此大的魔力。”

此外,趙俊博也強調,資料是一個巨大的問題。對於Sora採用了怎樣的資料進行訓練,圈內依然眾說紛紜,推測可能是運用了遊戲引擎生成的大規模資料:“可能是遊戲引擎裡面吐出來這種資料,但是它這個資料到底是怎麼收集、如何生產加工,最後如何喂到Sora裡面進行管線化的預訓練,我們確實不知道。”

那麼,Sora的出現會給AI業界和學界帶來怎樣的影響?

趙俊博表示,因為Sora在技術上仍有許多有待驗證的地方,應該“讓子彈再飛一會兒”:“Sora確實會對AI影片領域內的研究者和競品產生很大沖擊,但那畢竟只是一小部分人。目前從生成模型的應用層面看,可控性依然是個很大的問題......所以說如果要討論產業衝擊,還是要搞清楚玩家是誰,什麼場景,解決什麼痛點和需求,這些產業化的落地思維在這裡也是一樣的。”

譚劍提到,OpenAI已經用ChatGPT和Sora充分驗證了納什嵌入定律。所謂納什嵌入定律,簡單來說,就是指高維資訊世界一定能無縫相容低維世界,用口語來表達就是“降維打擊”:“雖然這種高維AI模型的資料和硬體等門檻很高,但已經有了第一個跨越的公司,那麼後面還會有更多團體可能成功,我對這一點保持樂觀。”

值得注意的是,就在OpenAI於2月15日釋出Sora的幾小時前,谷歌也釋出了旗下大模型Gemini的1.5版本,其中首個登場的多模態通用模型Gemini 1.5 Pro,把穩定處理上下文的上限擴大至100萬tokens。然而,Gemini 1.5一出場就被Sora搶盡了風頭。

再加上,OpenAI在Sora報告中提到的多篇核心論文都是由谷歌科研團隊提出的,也由此引發了對於這兩家企業“恩怨情仇”的調侃,以及OpenAI是“站在谷歌肩膀上”的說法。

對此,趙俊博認為,理論的相互分享雖然很重要,但是現代科技的發展環境下,單打獨鬥、“一人成英雄”的時代已經結束了:“關鍵是人才團隊、算力和資料的堆砌,以及時間上的積累,光靠一個idea就能實現一個這麼驚豔的系統已經不現實了,把它當成一個‘大裝置’來看的話,裡面‘工藝’的探索和形成是最為關鍵的。”

最後,對於Sora的出現是否和AGI(通用人工智慧)有關聯,趙俊博幾天前也在朋友圈撰文表示:“我反對很多自媒體把這個技術類比在AGI上面,我們距離AGI還差得遠……我覺得一個世界模型需要有能力去輸出動作,輸出對未來的預測,輸出對當前所處狀態的判斷。Sora大機率是學到了一些世界運轉的模式,但是否具備其他上述能力我們不知道。但是它的embedding(嵌入)如果有一天能開出來,或許我們能知道更多。”

熱門資訊
  • 比太陽亮500萬億倍!科學家發現宇宙最亮天體,吸積盤直徑達7光年 | 2024-02-21 17:12:44
  • 雷軍曬小米14 Ultra北京雪夜實拍:網友直呼不像手機拍的 進步太大 | 2024-02-21 17:13:46
  • 蘋果釋出 iOS 17.4 beta4 測試版,新增電池迴圈次數 | 2024-02-21 17:13:49
  • 愛因斯坦是如何思考出偉大的相對論的?不得不佩服它的天才大腦 | 2024-02-21 17:13:58
  • 開發者將Quest 3魔改成Vision Pro外觀 | 2024-02-21 17:14:17
  • 小米14 Ultra全方位提升,華為有的,小米全部跟上了 | 2024-02-21 17:14:31
  • 中國廣電已建成60萬座5G基站 5G使用者已超過2300萬 | 2024-02-21 17:14:37
  • 蘋果:iPhone15電池比舊款都更耐用! | 2024-02-21 17:18:39
  • 直降300元!華為MatePad 11迎來低價,PC級WPS加持! | 2024-02-21 17:18:43
  • 助攻澳大利亞量子計算突破,NVIDIA超級晶片落地超算中心 | 2024-02-21 17:26:39
  • 直擊高合鹽城工廠,比亞迪理想等面試挖人 | 2024-02-21 17:33:45
  • 4年總生存率22.2%!全球首款實體瘤TIL療法獲批上市,單次治療51.5萬美元【附細胞與基因治療行業發展現狀分析】 | 2024-02-21 17:33:47
  • 華為、中興、星網銳捷等中標!中國移動3省份2024 Q1家庭閘道器集採 | 2024-02-21 17:43:38
  • 小米平板2023年四季度出貨量排名前5 小米平板6S Pro即將登場 | 2024-02-21 17:46:04
  • 小米史上第一款!小米14 Ultra支援雙向衛星通訊:永不斷聯 | 2024-02-21 18:01:25
  • 【新機】華為Pocket2曝光,洛可可白配色復刻 | 2024-02-21 18:01:28
  • 【新機】透明後蓋新機,售價不便宜 | 2024-02-21 18:01:32
  • 驍龍8S Gen3晶片曝光丨小米14Ultra要漲價了? | 2024-02-21 18:05:18
  • 微軟將釋出Windows任務管理器更新:為AMD Ryzen 8000系列新增NPU監控功能 | 2024-02-21 18:05:21
  • 距離地球 2760 光年,我國天文學家觀測發現史上最小恆星 | 2024-02-21 18:11:14
  • 小米官宣澎湃T1訊號增強晶片 小米14 Ultra首發搭載 | 2024-02-21 18:11:18
  • C919首次飛出國門,哪些上市公司搶食大飛機萬億產業鏈? | 2024-02-21 18:13:09
  • 馬斯克繼續高調宣揚腦機介面技術進展,但安全普及仍需時日 | 2024-02-21 18:13:16
  • 數字王國獲得兩項美國專利認證,進一步提升數字角色真實度 | 2024-02-21 18:14:03
  • 曾差點被樂視收購,這家電視大廠被沃爾瑪以23億美元拿下 | 2024-02-21 18:15:57
  • 聯發科天璣之王!天璣9400效能首度曝光:領先蘋果A17 Pro | 2024-02-21 18:16:02
  • MWC 2024洞見丨中興通訊總裁徐子陽:未來進行時 | 2024-02-21 18:16:10
  • Redmi Book Pro 2024明天發:3.1K高刷旗艦LCD屏 | 2024-02-21 18:18:59
  • 聯發科天璣 9400 旗艦晶片設計效能曝光,CPU 多核提升超 20% | 2024-02-21 18:25:48
  • 我國著名物理化學家、中科院院士朱起鶴同志逝世 | 2024-02-21 18:28:51
最近發布
突發!TVB知名女星毫無預警宣佈與未婚夫分手,結束長達八年情 面對被黑,蘭姐強勢迴歸。小菲狀態好轉,發宣告。更多內幕揭曉! 中國男籃決戰日本隊,首發五人曝光,廣東隊大贏家,徐傑第一後衛 孫穎莎奪女單冠軍!採訪謙遜立足拼,劉國樑給中國選手頒獎笑開花 分析 馬威交易取消後的影響:湖人還有什麼選擇?只能等休賽期? 火箭vs猛龍前瞻:範弗裡特有望復出戰舊主,火箭欲終結六連敗 梅西轟動宏都拉斯!當地媒體:這是世紀體育盛事! 登記開啟!金中、29中、13中等校動了! 開年暴擊!南京又一家機構跑路了? TechInsights:AI PC未能提振筆記本市場 2024年僅增長5% 睡覺時突然腿抽筋,就是缺鈣?錯!還有這4個原因,別輕易忽視了 泡泡瑪特又贏麻了!此前被調侃是“境內最大的博彩公司” 再也不用扎手指!5億糖尿病患者有福了 傳《尼爾:機械紀元》續作、新《古墓麗影》今年公佈 有工作經驗的畫素畫師如何寫簡歷? 離譜!Xun被搶3條龍,JDG仍然獲勝!Peyz力挽狂瀾,WBG痛失好局 將耗死在國際空間站?59歲美滯留女宇航員求救:喪失重要身體機能 華為FreeClip耳機玫瑰金開售 開放式聆聽設計 CBA俱樂部杯-山西淘汰北控晉級4強 原帥18分 小紅書上移民的中產:曾經北京七套房, 羨慕海外一張床, 如今卻...... 不可抗力停課2天以上退一半保教費,佛山幼兒園收費新規釋出 紅棉襯醉美,2020番順醉美青餅評測 華為FreeClip耳夾耳機玫瑰金配色開售:1299元 64歲寧波老闆,跨界無數次,給員工發8億,即將擁有第三家IPO? 卡友資訊股東持股情況變動 廣州“城市合夥人”:城市與人才的雙向奔赴 有人說孫穎莎粉絲是飯圈文化的時候 卻有些人用真金白銀愛孫穎莎! 男生剪“短髮”髮型乾淨利落,試試這3款,剪完帥氣提升顏值! 7個臀部訓練最佳動作,打造迷人的蜜桃臀! 偉大的4-2!林詩棟奪冠:新科世界第1誕生、超越王楚欽,狂攬3冠 新疆完美了!新小外強於皮特森+黑根斯,承認補強大外良性競爭! 林詩棟奪男單冠軍!採訪大談不容易太謙遜,單獨拍照露出笑容! 國乒最新戰報!林詩棟第2局11-8,衝3冠王,梁靖崑救2局點仍輸球 替補奇兵!快船大將5記3分助隊贏球 哈登好幫手 爆冷!北控男籃吊打奪冠大熱門球隊,外援決定比賽的走向 官宣離任,胡明軒宣佈重要決定,廣東宏遠遺憾,杜鋒祝福 又一個賈德松!崔康熙看人很準,魯媒:卡約又要錯過中國聯賽了 劉國樑憔悴!黑眼圈很重,擋住蒯曼被提醒,孫穎莎王楚欽被裁判整 林詩棟逆轉梁靖崑奪冠,成就三冠王,綜合實力更加突出 CBA最新外援註冊資訊,遼籃4人,新疆補充新援,廣東男籃放棄萊斯 大滿貫收官獎金排名:林詩棟三冠60萬第1,孫穎莎第2王曼昱10萬第9 臺灣律師分析大S遺產劃分,S媽要錢得看汪小菲臉色,打臉光頭安排 臺媒曝大S家人鬆手,讓出撫養權給汪小菲,希望馬筱梅善待孩子 二線白酒暴雷,狼真的來了! 搭上比亞迪,自動駕駛獨角獸,利潤大增170%! 炸裂!外資吹響“加倉中國”集結號背後:科技格局重塑與資產重估 這波夢幻西遊副本積分兌換真是血虧,四賜福的山賊值得買嗎? 《星戰亡命之徒》高階美工又回到CDPR 開發《巫師4》 《哪吒2》登陸北美,首映禮現好萊塢!有觀眾哭花眼妝:特效超預期,買票靠搶 曝張蘭被封年損失近4億,麻六記絕地自救太壯觀,員工曬張蘭近況

©2024 時時頭條 版權所有

隱私政策 | 服務條款 | 聯繫我們