時時頭條
  • 娛樂
  • 體育
  • 財經
  • 科技
  • 旅遊
  • 軍事
  • 育兒
  • 時尚
  • 遊戲
  • 歷史
  1. 首頁
  2. 科技

OpenAI華人VP翁荔離職:北大校友,掌管安全,最近B站分享被熱議

2024-11-09 19:31:21

金磊 發自 凹非寺量子位 | 公眾號 QbitAI

就在剛剛,那個掌管OpenAI安全的北大校友,OpenAI研究副總裁(安全)翁荔,離職了。

翁荔是OpenAI華人科學家、ChatGPT的貢獻者之一。

北大畢業後,翁荔在2018年加入OpenAI,後來在GPT-4專案中主要參與預訓練、強化學習和對齊、模型安全等方面的工作。

最著名的Agent公式也由她提出,即:Agent=大模型+記憶+主動規劃+工具使用。

而就在前不久,她還剛剛現身2024 Bilibili 超級科學晚活動,發表了《AI安全與“培養”之道》的主題演講。

在她宣佈離職訊息之後,包括OpenAI在內的眾多同事發來了祝福:

翁荔的離職信

在推文中,翁荔也分享了他跟團隊做的最後的道別。

以下為離職信的完整內容。

親愛的朋友們:

我做出了一個非常艱難的決定,將於11月15日離開OpenAI,這將是我在公司最後一天。

OpenAI是我成長為科學家和領導者的地方,我將永遠珍惜在這裡與每一位共事的夥伴度過的時光。OpenAI團隊一直是我的知己、導師以及我身份的一部分。

我仍然記得2017年初加入OpenAI時的那份好奇和熱情。當時我們是一群懷抱著不可能與科幻未來夢想的人。

我在這裡開始了我的全棧機器人挑戰之旅——從深度強化學習演算法,到感知,再到韌體開發——目標是教會一個簡單的機械手如何解開魔方。這花費了整個團隊兩年時間,但最終我們成功了。

當OpenAI進入GPT領域時,我們開始探索如何將最先進的AI模型應用於現實世界。我建立了第一個應用研究團隊,推出了初始版本的微調API、嵌入API和稽核端點,為應用安全工作奠定了基礎,還為早期的API客戶開發了許多新穎的解決方案。

在GPT-4釋出後,我被要求承擔新的挑戰,重新考慮OpenAI的安全系統願景,並將所有工作集中到一個負責整個安全體系的團隊。

這是我經歷過的最困難、最緊張又令人興奮的事情之一。如今,安全系統團隊擁有超過80位出色的科學家、工程師、專案經理、政策專家,我為我們作為一個團隊所取得的一切成就感到極為自豪。

我們見證了每次釋出的核心——從GPT-4及其視覺和Turbo版本,到GPT Store、語音功能以及01版本。我們在訓練這些模型以達到負責任和有益的目標上設立了新的行業標準。

我特別為我們最新的成就o1預覽版感到自豪,它是我們迄今為止最安全的模型,展現了出色的抗破解能力,同時保持了模型的有用性。

我們的集體成就令人矚目:

我們訓練模型如何處理敏感或不安全的請求,包括何時拒絕或不拒絕,並透過遵循一套明確的模型安全行為政策,達成安全與實用之間的良好平衡。我們在每次模型釋出中提升了對抗性魯棒性,包括針對破解的防禦、指令層次結構,並透過推理大幅增強了魯棒性。我們設計了嚴格且富有創意的測試方法,使模型與《準備框架》保持一致,併為每個前沿模型進行了全面的安全測試和紅隊測試。我們在詳細的模型系統卡中強化了對透明性的承諾。我們開發了業內領先的稽核模型,具有多模式能力,並免費向公眾共享。我們當前在一個更通用的監控框架和增強安全推理能力的方向上工作,將賦能更多的安全工作流。我們為安全資料日誌、度量、儀表盤、主動學習管道、分類器部署、推理時間過濾以及一種新的快速響應系統奠定了工程基礎。

回顧我們所取得的成就,我為安全系統團隊的每一個人感到無比自豪,並極為確信這個團隊將繼續蓬勃發展。我愛你們。

在OpenAI的七年之後,我準備好重新出發,探索一些新的領域。OpenAI正沿著火箭般的軌跡前進,我衷心祝願這裡的每一個人一切順利。

附註:我的部落格將繼續更新。我或許會有更多時間來更新它 & 可能也會有更多時間編寫程式碼 。

愛你們的,Lilian

鐵打的OpenAI,流水的安全主管

自OpenAI成立以來,安全主管這個關鍵職位歷經多次更替。

最早在2016年,OpenAI的安全主管由達里奧·阿莫代伊(Dario Amodei)擔任,在他的領導下,安全系統團隊專注於減少現有模型和產品的濫用風險,尤其是圍繞GPT-3的安全性開展了深入研究。

阿莫代伊主導了GPT-3的全面安全評估,以確保模型在釋出前經過嚴格的安全測試和評估,最大限度地降低潛在的濫用風險。

他在OpenAI的工作為後來人工智慧的安全治理奠定了重要基礎。

2021年,阿莫代伊離開OpenAI創立了Anthropic公司,繼續致力於人工智慧的安全研究,推動構建更具可信度和安全性的AI模型。

在阿莫代伊之後,還有短暫任職2個月的安全主管,亞歷山大·馬德里(Aleksander Madry)。

他在職期間主要聚焦對新模型的能力進行評估,並開展內部紅隊測試,以識別和緩解潛在的安全風險。

雖然他的任期較短,但他在紅隊測試和威脅預測上的重要推進,為OpenAI的安全實踐提供了新的視角和方法論。

在2023年7月後,馬德里轉而專注於“AI推理”方面的工作,離開了安全主管的職位。

在他之後的第三位安全主管,則是楊·萊克(Jan Leike),在2023年7月至2024年5月擔任這一職務,和Ilya一起領導“超級對齊”專案,目標是在四年內解決超智慧AI的對齊問題。

在此期間,楊·萊克推動了使用小型模型監督和評估大型模型的研究,開創了對超人類能力模型進行實證對齊的新方法。

這種方法對於理解和應對高階人工智慧模型的行為具有深遠影響。

然而,由於與公司在安全和產品優先順序上的分歧,楊·萊克於2024年5月宣佈離職。

儘管如此,他在對齊研究方面的貢獻,為後續人工智慧的可控性研究奠定了理論和實踐基礎。

而翁荔則是於2024年7月擔任OpenAI安全主管。

關於翁荔

翁荔是OpenAI華人科學家、ChatGPT的貢獻者之一,本科畢業於北大,在印第安納大學伯明頓分校攻讀博士。

畢業之後的翁荔先是短暫的在Facebook實習了一段時間,第一份工作則是就職於Dropbox,擔任軟體工程師。

她於2018年加入OpenAI,在GPT-4專案中主要參與預訓練、強化學習和對齊、模型安全等方面的工作。

在OpenAI去年底成立的安全顧問團隊中,翁荔領導安全系統團隊(Safety Systems),解決減少現有模型如ChatGPT濫用等問題。

翁荔在Google Scholar的引用量也達到了13000+次。

此前她提出的提出LLM外在幻覺(extrinsic hallucination)的博文也是非常火爆。

翁荔重點關注外在幻覺,討論了三個問題:產生幻覺的原因是什麼?幻覺檢測,抵抗幻覺的方法。

關於研究的細節,可以點選這裡檢視:萬字blog詳解抵抗辦法、產幻原因和檢測方式。

至於翁荔離職後的去向,量子位也會保持持續的關注。

參考連結:[1]https://x.com/lilianweng/status/1855031273690984623[2]https://www.linkedin.com/in/lilianweng/

熱門資訊
  • 馬斯克欲阻止OpenAI成為營利性企業,特朗普時代的AI如何監管? | 2024-12-02 07:29:59
  • 中科大俞書宏院士團隊AM:具有動態電磁波吸收和熱防護功能的彈性碳氣凝膠 | 2024-12-02 07:30:00
  • 餘承東為首批智界新S7車主交車,一年內三次上市,起售價再降2萬元 | 2024-12-02 07:30:01
  • 面向低軌星座組網,採用牽制釋放技術,首飛成功的長十二火箭“不一樣” | 2024-12-02 07:30:06
  • 時速1000公里的“超級高鐵”還能用5G?中國有了方案 | 2024-12-02 07:52:05
  • 三季度國內平板出貨量排名:蘋果減8.6% 華為漲5.3% | 2024-12-02 07:52:21
  • 美國“黑五”消費表現平平,但網購創了新紀錄 | 2024-12-02 07:53:04
  • OpenWrt One 官方首款路由器開售,美規/歐規 595 元 | 2024-12-02 08:44:50
  • 金士頓 × 雙城之戰 Ⅱ 聯名記憶體 / 快閃記憶體盤釋出,45.9 元起 | 2024-12-02 09:00:30
  • 英特爾 12 月 3 日公佈“顯示卡大訊息”,預計釋出銳炫 B 獨立顯示卡 | 2024-12-02 09:00:32
  • 微星官網上線 MPG 322URX QD-OLED 顯示器,配滿速 DP 2.1 介面 | 2024-12-02 09:20:48
  • 中國平板線上市場最新排名:蘋果大幅衰退 華為猛漲將反超 | 2024-12-02 09:25:17
  • 創新雲朵氣囊!Baseus倍思全新Bowie MC1耳夾耳機正式推出 | 2024-12-02 09:35:36
  • 榮耀300 Ultra核心引數曝光:80W無線快充 僅8.2mm厚 | 2024-12-02 09:35:38
  • 壓力過大,會出大事!《細胞》:壓力造成的記憶“崩潰”,或與一類精神疾病有關 | 2024-12-02 09:44:57
  • 科學家往動物園扔了一個鍵盤,6只猴子用它寫了一本書 | 2024-12-02 09:48:09
  • 10月中國智慧投影線上銷量為42.8萬臺 終結持續下滑 | 2024-12-02 09:58:29
  • 銘瑄加入英特爾 AIC 陣營,預告擁有額外金手指“電競之心”顯示卡 | 2024-12-02 10:02:02
  • 華為緊逼蘋果,榮耀緊貼小米,Q3國內平板報告出爐 | 2024-12-02 10:06:20
  • 騰達 A18 Pro 無線訊號擴充套件器釋出,首發到手價 99 元 | 2024-12-02 10:15:50
  • PC鮮辣報:英特爾新顯示卡本週發 2025全球筆電出貨持增 | 2024-12-02 10:23:49
  • 港媒:更多發展中國家選擇北斗系統 | 2024-12-02 10:24:40
  • 天津工業大學,最新Nature大子刊! | 2024-12-02 10:24:44
  • 45位兩院院士出席!國家重大科研儀器成果在深釋出 | 2024-12-02 10:24:45
  • 小米米家無線洗地機4C開售:首發就接近半價 疊加國補到手879元 | 2024-12-02 10:30:46
  • RTX 4090詭異原型卡首曝:四插槽三風扇 居然能點亮! | 2024-12-02 10:30:48
  • 華擎英特爾銳炫 B570 顯示卡檔案曝光,確認 18Xe 核心、10GB 視訊記憶體 | 2024-12-02 10:36:41
  • AMD首款B850主機板圖片曝光 2025年CES展正式釋出 | 2024-12-02 11:10:06
  • 今年通用NAND價格已下跌超50%!三星、鎧俠都計劃減產穩價 | 2024-12-02 11:16:32
  • 加密貨幣每瘋狂一次,人類就離AGI更遠一點? | 2024-12-02 11:21:53
最近發布
突發!TVB知名女星毫無預警宣佈與未婚夫分手,結束長達八年情 面對被黑,蘭姐強勢迴歸。小菲狀態好轉,發宣告。更多內幕揭曉! 中國男籃決戰日本隊,首發五人曝光,廣東隊大贏家,徐傑第一後衛 孫穎莎奪女單冠軍!採訪謙遜立足拼,劉國樑給中國選手頒獎笑開花 分析 馬威交易取消後的影響:湖人還有什麼選擇?只能等休賽期? 火箭vs猛龍前瞻:範弗裡特有望復出戰舊主,火箭欲終結六連敗 梅西轟動宏都拉斯!當地媒體:這是世紀體育盛事! 登記開啟!金中、29中、13中等校動了! 開年暴擊!南京又一家機構跑路了? TechInsights:AI PC未能提振筆記本市場 2024年僅增長5% 睡覺時突然腿抽筋,就是缺鈣?錯!還有這4個原因,別輕易忽視了 泡泡瑪特又贏麻了!此前被調侃是“境內最大的博彩公司” 再也不用扎手指!5億糖尿病患者有福了 傳《尼爾:機械紀元》續作、新《古墓麗影》今年公佈 有工作經驗的畫素畫師如何寫簡歷? 離譜!Xun被搶3條龍,JDG仍然獲勝!Peyz力挽狂瀾,WBG痛失好局 將耗死在國際空間站?59歲美滯留女宇航員求救:喪失重要身體機能 華為FreeClip耳機玫瑰金開售 開放式聆聽設計 CBA俱樂部杯-山西淘汰北控晉級4強 原帥18分 小紅書上移民的中產:曾經北京七套房, 羨慕海外一張床, 如今卻...... 不可抗力停課2天以上退一半保教費,佛山幼兒園收費新規釋出 紅棉襯醉美,2020番順醉美青餅評測 華為FreeClip耳夾耳機玫瑰金配色開售:1299元 64歲寧波老闆,跨界無數次,給員工發8億,即將擁有第三家IPO? 卡友資訊股東持股情況變動 廣州“城市合夥人”:城市與人才的雙向奔赴 有人說孫穎莎粉絲是飯圈文化的時候 卻有些人用真金白銀愛孫穎莎! 男生剪“短髮”髮型乾淨利落,試試這3款,剪完帥氣提升顏值! 7個臀部訓練最佳動作,打造迷人的蜜桃臀! 偉大的4-2!林詩棟奪冠:新科世界第1誕生、超越王楚欽,狂攬3冠 新疆完美了!新小外強於皮特森+黑根斯,承認補強大外良性競爭! 林詩棟奪男單冠軍!採訪大談不容易太謙遜,單獨拍照露出笑容! 國乒最新戰報!林詩棟第2局11-8,衝3冠王,梁靖崑救2局點仍輸球 替補奇兵!快船大將5記3分助隊贏球 哈登好幫手 爆冷!北控男籃吊打奪冠大熱門球隊,外援決定比賽的走向 官宣離任,胡明軒宣佈重要決定,廣東宏遠遺憾,杜鋒祝福 又一個賈德松!崔康熙看人很準,魯媒:卡約又要錯過中國聯賽了 劉國樑憔悴!黑眼圈很重,擋住蒯曼被提醒,孫穎莎王楚欽被裁判整 林詩棟逆轉梁靖崑奪冠,成就三冠王,綜合實力更加突出 CBA最新外援註冊資訊,遼籃4人,新疆補充新援,廣東男籃放棄萊斯 大滿貫收官獎金排名:林詩棟三冠60萬第1,孫穎莎第2王曼昱10萬第9 臺灣律師分析大S遺產劃分,S媽要錢得看汪小菲臉色,打臉光頭安排 臺媒曝大S家人鬆手,讓出撫養權給汪小菲,希望馬筱梅善待孩子 二線白酒暴雷,狼真的來了! 搭上比亞迪,自動駕駛獨角獸,利潤大增170%! 炸裂!外資吹響“加倉中國”集結號背後:科技格局重塑與資產重估 這波夢幻西遊副本積分兌換真是血虧,四賜福的山賊值得買嗎? 《星戰亡命之徒》高階美工又回到CDPR 開發《巫師4》 《哪吒2》登陸北美,首映禮現好萊塢!有觀眾哭花眼妝:特效超預期,買票靠搶 曝張蘭被封年損失近4億,麻六記絕地自救太壯觀,員工曬張蘭近況

©2024 時時頭條 版權所有

隱私政策 | 服務條款 | 聯繫我們