時時頭條
  • 娛樂
  • 體育
  • 財經
  • 科技
  • 旅遊
  • 軍事
  • 育兒
  • 時尚
  • 遊戲
  • 歷史
  1. 首頁
  2. 科技

速度放緩!OpenAI新旗艦模型進步幅度沒那麼大

2024-11-11 15:24:10

11月11日訊息,儘管使用聊天機器人ChatGPT等人工智慧產品的人數在激增,但支撐這些技術的底層模組的改進速度似乎正在放緩。為此,ChatGPT的開發者OpenAI正在開發新技術,以增強大語言模型等核心模組,從而應對這一挑戰。

OpenAI即將推出的旗艦模型“獵戶座”(Orion)所面臨的挑戰突顯了公司當前遇到的難題。今年5月,OpenAI執行長薩姆·奧特曼(Sam Altman)在內部透露,他預計正在訓練中的獵戶座將顯著優於一年前釋出的上一代旗艦模型。據知情人士稱,儘管獵戶座的訓練進度僅完成20%,但其智慧和任務完成能力已與GPT-4不相上下。

不過,一些使用或測試過獵戶座的OpenAI員工表示,儘管其效能確實超越了前代模型,但提升幅度遠不及從GPT-3到GPT-4的躍升。一些研究人員指出,獵戶座在處理特定任務時未必穩定優於前代模型。一位員工表示,獵戶座在語言任務上表現出色,但在編碼等任務中可能不如之前的模型。這種情況可能會帶來問題,因為與OpenAI近期釋出的其他模型相比,獵戶座在資料中心的執行成本更高。

獵戶座的表現正在考驗人工智慧領域的核心假設——縮放定律,即只要資料量和計算能力持續增加,大語言模型就能不斷改進。面對GPT改進速度放緩帶來的挑戰,業界似乎正將重點轉向初始訓練後的模型最佳化,這可能會產生一種新的縮放定律。

Facebook母公司Meta執行長馬克·扎克伯格(Mark Zuckerberg)在內的一些科技領袖認為,即使在技術未能進一步突破的最壞情況下,基於當前技術仍然有很大的開發空間來建立面向消費者和企業的產品。

OpenAI正在應對競爭對手Anthropic的威脅,將更多的程式碼編寫功能嵌入其模型中,並開發能夠模擬人類操作計算機的軟體,以完成涉及瀏覽器和應用程式操作的白領任務,如點選、游標移動和文字輸入等。

這些產品屬於能夠執行多步驟任務的AI代理範疇,其革命性可能與ChatGPT的首次釋出相當。

扎克伯格、奧特曼及其他人工智慧開發者的高管表示,他們尚未觸及傳統縮放定律的極限。也因此,包括OpenAI在內的公司依舊投資數十億美元建設資料中心,以儘可能提高預訓練模型的效能。

然而,OpenAI研究員諾姆·布朗(Noam Brown)在上月的TEDAI大會上提出警告,認為開發更先進的模型可能在經濟上變得不可持續。他表示:“我們真的會投入數千億甚至萬億美元來訓練模型嗎?縮放模式在某個時刻會失效。”

在公開發布獵戶座之前,OpenAI仍需完成複雜的安全測試。據員工透露,獵戶座可能會在明年初發布,並可能放棄傳統的“GPT”命名方式,以突顯大語言模型改進的新特性。對此,OpenAI發言人未予置評。

資料匱乏成為模型訓練的瓶頸

OpenAI的員工和研究人員指出,GPT進步放緩的原因之一在於高質量文字和其他資料的供應日益減少。大語言模型在預訓練階段需要這些資料來理解世界和不同概念之間的關係,以解決如撰寫博文或修復編碼錯誤等問題。

近年來,大語言模型主要依賴於網站、書籍等來源的公開文字資料進行預訓練,但開發者已幾乎耗盡了這類資料的潛力。為此,OpenAI組建了由曾負責預訓練的尼克·賴德(Nick Ryder)領導的基礎團隊,致力於研究如何應對資料短缺問題,並探索縮放定律的持續適用性。

據OpenAI員工透露,獵戶座部分使用了由其他OpenAI模型(如GPT-4和最近釋出的推理模型)生成的AI資料進行訓練。然而,這種合成數據也帶來了新問題,可能導致獵戶座在某些方面與前代模型過於相似。

OpenAI的研究人員正在利用其他工具,透過改進特定任務的處理方式來最佳化模型後期的表現。他們採用一種稱為強化學習的方法,讓模型從大量已正確解決的問題中學習,如數學和編碼問題。

此外,研究人員還邀請人類評估員在編碼或問題解決任務上測試預訓練模型,並對其答案進行評分,這有助於研究人員調整模型,使其在寫作和編碼等請求上的表現更佳。這一過程稱為帶有人類反饋的強化學習,也曾幫助過早期的AI模型改進。

OpenAI及其他AI開發商通常依賴初創公司,如Scale AI和Turing,來管理成千上萬名承包商,以處理這些評估工作。

OpenAI還開發了一種名為o1的推理模型,該模型在回答前會花費更多時間“思考”訓練資料,這一過程稱為測試時間計算。這意味著,即使不改變底層模型,給o1分配更多計算資源,也可以持續提高其響應質量。據知情人士透露,即使底層模型改進速度較慢,若OpenAI能保持持續改進,仍然可以實現更好的推理效果。

“這為模型擴充套件開闢了新維度,”布朗在TED大會上說。他補充道,研究人員可以透過“每次查詢成本從1美分提高到10美分”來提升模型響應質量。

奧特曼也強調了推理模型的重要性,認為它可與大語言模型結合使用。“我希望推理能力能夠解鎖我們多年未能實現的突破,比如讓模型在科學研究和複雜程式碼編寫中做出貢獻,”奧特曼在一場應用開發者活動中表示。

在最近接受Y Combinator執行長陳嘉興(Garry Tan)採訪時,奧特曼透露:“我們基本上知道如何實現通用人工智慧——一種能達到人類能力的技術,其中一部分是創造性地運用現有模型。”

數學家和科學家們表示,o1對他們的研究工作有幫助,能作為合作伙伴提供反饋和啟發。然而,據兩位知情員工透露,由於o1的價格是非推理模型的六倍,因此其客戶基礎尚未普及。

突破瓶頸,提升推理能力

一些對AI開發商投資數千萬美元的投資者疑慮大語言模型的改進速度是否開始趨於平穩。

風險投資家本·霍洛維茨(Ben Horowitz)在YouTube一段影片中表示:“我們正以相同的速度增加訓練AI的圖形處理單元,但在智慧提升方面未見顯著改善。”霍洛維茨的風投公司不僅是OpenAI的股東,還投資了Mistral和Safe Superintelligence等競爭對手。

霍洛維茨的同事馬克·安德森(Marc Andreessen)在同一影片中指出:“許多聰明人在致力於突破瓶頸,探索如何提升推理能力。”

企業軟體公司Databricks聯合創始人兼主席伊翁·斯托伊卡(Ion Stoica)表示,大語言模型在某些方面可能已趨於穩定,但在其他領域仍有改進空間。他還開發了一個網站,供應用開發者評估不同的大語言模型。

斯托伊卡稱,儘管AI在編碼和解決複雜問題上不斷進步,但在執行通用任務(如分析文字情感或描述醫療症狀)時,進展似乎放緩。

“在常識性問題上,我們似乎看到大語言模型的表現趨於平穩。為實現進一步突破,我們需要更多的事實性資料,而合成數據幫助有限。”(小小)

熱門資訊
  • 不能查餘額也不能退費,20年前流行的通話工具你還在用嗎? | 2024-11-19 00:23:58
  • “天穹”綜合反無人機作戰體系亮相航展 | 2024-11-19 00:29:13
  • 科學家精心調配鯨糞便配方,再排到海里!為何要往海里倒“屎”? | 2024-11-19 00:41:11
  • Cancer Discovery綜述丨抗體偶聯藥物(ADC)的歷程:40年發展的經驗教訓 | 2024-11-19 00:41:13
  • 製造一把光劍需要什麼樣的電池? | 2024-11-19 00:43:49
  • 打通異構算力之間的高速網路通道是構建多元智算體系的關鍵 | 2024-11-19 00:43:50
  • 又一款大國重器亮相珠海航展,昊龍飛船,彌補我國下行載荷不足 | 2024-11-19 00:44:22
  • 貓貓運動方程,首次被物理學家破解 |《美國物理學雜誌》正經研究 | 2024-11-19 00:44:28
  • “人民科學家”國家榮譽稱號獲得者趙忠賢:讓中國高溫超導躋身國際前列 | 2024-11-19 00:48:20
  • RTX 40光速清庫存!RTX 50還沒來 它就賣完了 | 2024-11-19 00:53:36
  • 三星電視有望支援Color Booster Pro 商標正在申請中 | 2024-11-19 00:53:42
  • Intel不放棄顯示卡!二代銳炫B580首次露面 | 2024-11-19 01:14:09
  • 電梯晃一下,是故意的嗎?——揭開電梯小抖動的神秘面紗 | 2024-11-19 01:26:29
  • 免費不復存在,移動這項功能要全面收費了 | 2024-11-19 01:50:21
  • 撼與釋出新款Intel銳炫A310亮機小卡:一字排開四個HDMI | 2024-11-19 01:56:30
  • 高通和聯發科旗艦芯機型出貨量資料曝光 猜猜誰更多? | 2024-11-19 02:51:16
  • 飛行汽車競速加劇,上海企業佔據半壁江山,掉隊者是誰 | 2024-11-19 02:54:10
  • 宇宙人(1626期)中國航天科技集團商業火箭公司在閔行揭牌;SpaceX總裁:星鏈已經很賺錢了,但星艦價值更大 | 2024-11-19 03:10:29
  • NVIDIA首批Blackwell GB200 NVL72伺服器機架頂著散熱問題報告發貨 | 2024-11-19 03:22:09
  • 東芝一體式桌上型電腦將點陣式印表機和3分鐘後備電源塞進50磅的裝置中 | 2024-11-19 03:22:11
  • 港媒:必須加快國產零部件自主化,C919訂單激增,供應鏈壓力凸顯 | 2024-11-19 03:43:53
  • Rapidus將於12月接收首臺EUV光刻機,ASML計劃在當地設立服務中心提供支援 | 2024-11-19 04:29:16
  • LeCun 的世界模型初步實現!基於預訓練視覺特徵,零樣本規劃 | 2024-11-19 04:43:02
  • 下一代Wi-Fi 8標準要來了! | 2024-11-19 04:58:29
  • 比克電池分享高容量圓柱電池研發進展,2170電芯容量向6.5Ah發起挑戰 | 2024-11-19 05:26:02
  • M4 Max在Blender GPU基準測試中落後RTX 4090近30% 但超越RTX 4070和3080 Ti | 2024-11-19 06:20:08
  • 臺積電先進製程:加速赴美,10座工廠同時開建 | 2024-11-19 06:25:13
  • 6G 最強悍的特性,竟提前被這些手機廠商用上! | 2024-11-19 06:25:17
  • 諾獎得主巴里·馬歇爾來到廣雅,他給了學子這些建議 | 2024-11-19 06:31:43
  • Genome Biol | 腺嘌呤鹼基編輯器引發小鼠胚胎和人類T細胞脫靶結構變異:基因編輯安全性再引關注 | 2024-11-19 06:35:31
最近發布
突發!TVB知名女星毫無預警宣佈與未婚夫分手,結束長達八年情 面對被黑,蘭姐強勢迴歸。小菲狀態好轉,發宣告。更多內幕揭曉! 中國男籃決戰日本隊,首發五人曝光,廣東隊大贏家,徐傑第一後衛 孫穎莎奪女單冠軍!採訪謙遜立足拼,劉國樑給中國選手頒獎笑開花 分析 馬威交易取消後的影響:湖人還有什麼選擇?只能等休賽期? 火箭vs猛龍前瞻:範弗裡特有望復出戰舊主,火箭欲終結六連敗 梅西轟動宏都拉斯!當地媒體:這是世紀體育盛事! 登記開啟!金中、29中、13中等校動了! 開年暴擊!南京又一家機構跑路了? TechInsights:AI PC未能提振筆記本市場 2024年僅增長5% 睡覺時突然腿抽筋,就是缺鈣?錯!還有這4個原因,別輕易忽視了 泡泡瑪特又贏麻了!此前被調侃是“境內最大的博彩公司” 再也不用扎手指!5億糖尿病患者有福了 傳《尼爾:機械紀元》續作、新《古墓麗影》今年公佈 有工作經驗的畫素畫師如何寫簡歷? 離譜!Xun被搶3條龍,JDG仍然獲勝!Peyz力挽狂瀾,WBG痛失好局 將耗死在國際空間站?59歲美滯留女宇航員求救:喪失重要身體機能 華為FreeClip耳機玫瑰金開售 開放式聆聽設計 CBA俱樂部杯-山西淘汰北控晉級4強 原帥18分 小紅書上移民的中產:曾經北京七套房, 羨慕海外一張床, 如今卻...... 不可抗力停課2天以上退一半保教費,佛山幼兒園收費新規釋出 紅棉襯醉美,2020番順醉美青餅評測 華為FreeClip耳夾耳機玫瑰金配色開售:1299元 64歲寧波老闆,跨界無數次,給員工發8億,即將擁有第三家IPO? 卡友資訊股東持股情況變動 廣州“城市合夥人”:城市與人才的雙向奔赴 有人說孫穎莎粉絲是飯圈文化的時候 卻有些人用真金白銀愛孫穎莎! 男生剪“短髮”髮型乾淨利落,試試這3款,剪完帥氣提升顏值! 7個臀部訓練最佳動作,打造迷人的蜜桃臀! 偉大的4-2!林詩棟奪冠:新科世界第1誕生、超越王楚欽,狂攬3冠 新疆完美了!新小外強於皮特森+黑根斯,承認補強大外良性競爭! 林詩棟奪男單冠軍!採訪大談不容易太謙遜,單獨拍照露出笑容! 國乒最新戰報!林詩棟第2局11-8,衝3冠王,梁靖崑救2局點仍輸球 替補奇兵!快船大將5記3分助隊贏球 哈登好幫手 爆冷!北控男籃吊打奪冠大熱門球隊,外援決定比賽的走向 官宣離任,胡明軒宣佈重要決定,廣東宏遠遺憾,杜鋒祝福 又一個賈德松!崔康熙看人很準,魯媒:卡約又要錯過中國聯賽了 劉國樑憔悴!黑眼圈很重,擋住蒯曼被提醒,孫穎莎王楚欽被裁判整 林詩棟逆轉梁靖崑奪冠,成就三冠王,綜合實力更加突出 CBA最新外援註冊資訊,遼籃4人,新疆補充新援,廣東男籃放棄萊斯 大滿貫收官獎金排名:林詩棟三冠60萬第1,孫穎莎第2王曼昱10萬第9 臺灣律師分析大S遺產劃分,S媽要錢得看汪小菲臉色,打臉光頭安排 臺媒曝大S家人鬆手,讓出撫養權給汪小菲,希望馬筱梅善待孩子 二線白酒暴雷,狼真的來了! 搭上比亞迪,自動駕駛獨角獸,利潤大增170%! 炸裂!外資吹響“加倉中國”集結號背後:科技格局重塑與資產重估 這波夢幻西遊副本積分兌換真是血虧,四賜福的山賊值得買嗎? 《星戰亡命之徒》高階美工又回到CDPR 開發《巫師4》 《哪吒2》登陸北美,首映禮現好萊塢!有觀眾哭花眼妝:特效超預期,買票靠搶 曝張蘭被封年損失近4億,麻六記絕地自救太壯觀,員工曬張蘭近況

©2024 時時頭條 版權所有

隱私政策 | 服務條款 | 聯繫我們