時時頭條
  • 娛樂
  • 體育
  • 財經
  • 科技
  • 旅遊
  • 軍事
  • 育兒
  • 時尚
  • 遊戲
  • 歷史
  1. 首頁
  2. 科技

DeepSeek火爆海外開源社群,衍生模型超670個

2025-01-30 20:36:58

智東西作者 徐豫編輯 漠影

智東西1月29日報道,國產AI之光DeepSeek-R1正快速平替OpenAI、Meta、Google的模型,成為應用開發者的新選擇。

該模型在知名AI開源社群Hugging Face上的下載量已超70萬次,日增40%。

▲DeepSeek-R1躋身Hugging Face最受喜愛的模型前十名(圖源:Clem Delangue X主頁)

不過,DeepSeek強勁的增長勢頭,也引起了美方的高度關注。

今日凌晨CNBC報道稱,美國海軍基於“潛在安全和道德問題”,已要求內部人員禁止使用DeepSeek模型。

據玉淵譚天訊息,昨天,美國多名官員回應DeepSeek對美國的影響,稱其“蒸餾”技術是“偷竊”,正對其影響開展國家安全調查。

同日,DeepSeek官網的服務狀態頁面顯示:“近期DeepSeek線上服務受到大規模惡意攻擊,註冊可能繁忙,請稍等重試。已註冊使用者可以正常登入,感謝理解和支援。”玉淵譚天向安全專家諮詢並獨家瞭解道,DeepSeek這次受到的網路攻擊,IP地址都在美國。

截至發稿,在Chatbot Arena大模型榜單中,DeepSeek-R1基準測試排名已升至全類別大模型第二,超過OpenAI的o1和o1-mini模型,僅次於Anthropic的Claude3.5 Sonnet,熱度持續攀升。

一、DeepSeek衍生模型數量日增30%,下載量超320萬

Hugging Face首席科學官Thomas Wolf今天接受彭博社採訪時,透露了DeepSeek-R1開源模型上線一週後增勢強勁,並且該公司有計劃在DeepSeek-R1的基礎上,自研開源專案Open-R1。

Hugging Face社群內的開發者們正在公開復現DeepSeek-R1。主頁的135萬個模型中,檢索“DeepSeek”相關的模型有將近2700個。

Hugging Face聯合創始人兼CEO Clem Delangue 1月28日發帖稱,DeepSeek-R1的衍生模型至少有500種。

Thomas Wolf今天給出了最新資料,用DeepSeek-R1搭建的模型至少有670個,累計下載量超320萬次,日增約30%;而DeepSeek-R1的下載量超過70萬次,日增40%。

據Clem Delangue透露,DeepSeek-R1已進入該社群史上最受喜愛的模型前十名之列。

截至1月29日,Hugging Face社群點贊數排行前十的AI模型依次是:

1、黑森林實驗室的FLUX.1-dev

2、CompVis的stable-diffusion-v1-4

3、Stability AI的stable-diffusion-x1-base-1.0

4、Meta的Llama-3-8B

5、BigScience的bloom

6、Stability AI的stable-diffusion-3-medium

7、DeepSeek的DeepSeek-R1

8、Mistral AI的Mixtral-8x7B-Instruct-v0.1

9、Meta的Llama-2-7B

10、Meta的Llama-2-7B-chat-hf

二、Hugging Face開搞Open R1,要研究透DeepSeek

跟上眾多開發者的潮流,Hugging Face也打算基於DeepSeek-R1復刻一套自己的新模型,即Open-R1專案。

據Hugging Face官網1月28日介紹,Open-R1專案將重建DeepSeek-R1的資料和訓練管道,並在這個過程中驗證其效果、突破其上限,從而增強推理的透明度,以及積累可複製的經驗。

不同開發商的復刻方法不盡相同。針對DeepSeek-R1遺留的特定推理資料收集方法、未公開模型訓練程式碼、訓練時的計算和資料縮放定律等問題,Open-R1計劃透過以下步驟補齊這些空白板塊:

首先,從DeepSeek-R1中提取高質量推理資料集,來複制R1-Distill模型。

然後,複製DeepSeek用於建立R1-Zero的純RL管道,這個過程將涉及為數學、推理和程式碼任務,整理新的大規模資料集。

最後,可以透過多階段訓練,實現從基礎模型到SFT(監督微調),再到RL(強化學習)的模型進階。

▲Open-R1復刻DeepSeek-R1的計劃示意圖(圖源:Hugging Face官網)

按照Thomas Wolf的預期,其團隊將在接下來的幾個月內弄清楚這些細節問題,並應用於Open-R1專案。

三、谷歌前CEO:全球AI的轉折點已經到來

這場有關DeepSeek的硝煙,不僅僅籠罩了OpenAI、Meta、Google等一眾主流模型開發商,使其著手研究如何降低模型的開發成本;也進一步蔓延至中美兩國的AI博弈大局。

不到兩週前,美國商務部工業和安全域性(BIS)才頒佈了晶片出口限制最新規定。其中,BIS共拉黑了11家與先進AI技術有關的中國實體。

在The Verge昨晚的報道中,OpenAI前政策研究員Miles Brundage稱,像DeepSeek-R1這種推理模型通常需要使用大量GPU,會受到美國晶片出口管制的干擾。

在Miles Brundage看來,DeepSeek-R1使用了兩個關鍵的最佳化技巧,一是更高效的預訓練,二是思維鏈推理強化學習,這在一定程度上使其能以更少的GPU數量、更便宜的GPU,推動DeepSeek-R1實現了更強大的效能。因此,Miles Brundage稱,美國對GPU實施有效的出口管制,比以往任何時候都更為重要。

不過,OpenAI首席研究官Mark Chen則傾向於外界誇大了DeepSeek-R1的成本優勢。他一方面認可了DeepSeek獨立開發出了OpenAI o1級別的推理模型,但另一方面認為兩者在開發成本上的差距並沒有那麼大,仍然對OpenAI的技術路線持樂觀態度。因此,從某種意義上說,DeepSeek還是有被先進GPU卡脖子的風險。

另外,有不少觀點認為DeepSeek-R1的出現將惠及部分美國科技巨頭。

《華爾街日報》1月27日報道稱,DeepSeek-R1的技術突破意味著,不少美國科技巨頭可能不必花費太多時間、精力和算力,來訓練他們的AI模型。

而且這些模型都是開源的,開發人員可以檢查和修改其程式碼,並用它來構建自己的應用程式。這可以幫助更多小企業花費比閉源模式低得多的成本,用上AI,並且開源可以促進更多合作和實驗。

摩根士丹利分析師Brian Nowak稱,蘋果也將因DeepSeek等大模型的任何進展中受益匪淺,原因是蘋果“擁有現存最有價值的消費技術分發平臺”。

谷歌前CEO Eric Schmidt昨天告訴《華盛頓郵報》,他認為美國需要加大開源AI研發力度,開發出更多開源模型,鼓勵先進AI實驗室共享訓練方法,以及投資星際之門等AI基礎設施,以應對DeepSeek的迅速發展。

Eric Schmidt還一改去年“美國領先”的說辭,在《華盛頓郵報》專欄文章中稱,DeepSeek的崛起標誌著全球AI“轉折點”的到來,證明了中國可以用更少的資源與大型科技公司競爭。

結語:國產模型出圈新路線,Meta、Hugging Face等爭相模仿

目前,有的團隊和機構正在研究、復刻DeepSeek-R1,有的嘗試用該模型重塑自家模型,例如Meta、Hugging Face、UC伯克利、港科大等。

同時,2025年開年,DeepSeek-R1將推理模型競賽推向新拐點,有望憑藉低算力、高價效比的技術路線,開拓國產模型的全球市場。

春節期間DeepSeek掀起的這場AI風暴,仍在中美乃至全球科技、政金界產生持續影響,並不斷髮酵。這已經成為改變AI科技產業趨勢的風向標事件,智東西將持續跟進相關進展和報道,敬請關注。

熱門資訊
  • OPPO闢謠:不會取消超大杯產品 是燈塔產品心肝寶貝 | 2025-02-07 09:38:37
  • 蘋果或已量產M5晶片:正在封裝 最早2025年底面世 | 2025-02-07 09:38:43
  • 蘋果 macOS 15.3 Sequoia 改善和SuperDuper第三方備份工具相容性 | 2025-02-07 09:38:46
  • 蘋果 2025 款 Apple TV 預估 9/10 月釋出:A17 Pro 晶片 | 2025-02-07 09:38:50
  • Linux圖形驅動程式碼提示英特爾正在準備新款Battlemage GPU | 2025-02-07 09:38:52
  • 蘋果為M4 Mac系列提供部件和自維修手冊 | 2025-02-07 09:38:54
  • 蘋果M5開始量產 新一代產品將主打AI效能 | 2025-02-07 09:38:56
  • AI需求爆棚!AMD MI350資料中心GPU將提前釋出 | 2025-02-07 09:41:22
  • 年輕人不愛看電視了?在廣州商場走訪一圈後,我發現了真相 | 2025-02-07 09:41:24
  • 雷蛇釋出幻影戰狼V3白色版遊戲手柄:配閃電級滑鼠扳機 | 2025-02-07 09:41:26
  • "請稍後再試",DeepSeek算力不夠了? | 2025-02-07 09:42:12
  • 神舟二十號乘組或有驚喜!神舟十九號3名航天員,最快4月返回地球 | 2025-02-07 09:42:21
  • 突破性癌症療法進入臨床試驗階段 在放射治療期間保護健康組織 | 2025-02-07 09:42:23
  • 臺積電勁敵?日本晶片廠商Rapidus將在4月1日試產2nm | 2025-02-07 09:42:25
  • 蘇姿豐確認 AMD RX 9070 系列顯示卡將於 3 月初上市 | 2025-02-07 09:42:38
  • PNY 推出三系列 USB Type-C 快閃記憶體盤,至高 10Gbps 規格 | 2025-02-07 09:42:40
  • 天鋇GT37迷你主機首發5299元:銳龍AI 9 HX 370旗艦芯 | 2025-02-07 09:42:44
  • 木紋飾面點綴電源倉,鑫谷推出全景海景房機箱甄木 1 | 2025-02-07 09:42:46
  • 微星MEG VISION X AI幻影RTX 5080主機開售!機身自帶13寸觸控屏:到手29499元 | 2025-02-07 09:42:48
  • 提供更多功率選擇,鑫谷預告 KE-850P 白金牌數字電源 | 2025-02-07 09:42:50
  • 客戶需求強勁,AMD 加速推出Instinct MI350 系列資料中心 GPU | 2025-02-07 09:42:52
  • 日本電視徹底衰敗!松下打算放棄電視機業務! | 2025-02-07 09:46:11
  • Nomad推出Apple Watch資料線 雙USB-C介面 | 2025-02-07 09:46:14
  • 韶音新一代舒適圈OpenFit 2開放式耳機體驗 | 2025-02-07 09:46:15
  • 不只是舒適新“聲”級:深度評測韶音OpenFit 2 開放式耳機 | 2025-02-07 09:46:19
  • 延長電池壽命,谷歌為 Pixel Watch 智慧手錶醞釀自適應充電 | 2025-02-07 09:46:21
  • addlink 推出 P21 移動固態硬碟:USB-C 20Gbps,至高 4TB 容量 | 2025-02-07 09:46:24
  • 英睿達 E100 固態硬碟採用慧榮 SM2268XT2 主控,混用 QLC 和 TLC | 2025-02-07 09:46:25
  • 世間將再無松下電視!日本松下官宣解散家電子公司並放棄電視機業務 | 2025-02-07 09:46:27
  • DeepSeek引爆本地部署熱潮 PC換機潮可期? | 2025-02-07 09:46:58
最近發布
突發!TVB知名女星毫無預警宣佈與未婚夫分手,結束長達八年情 面對被黑,蘭姐強勢迴歸。小菲狀態好轉,發宣告。更多內幕揭曉! 中國男籃決戰日本隊,首發五人曝光,廣東隊大贏家,徐傑第一後衛 孫穎莎奪女單冠軍!採訪謙遜立足拼,劉國樑給中國選手頒獎笑開花 分析 馬威交易取消後的影響:湖人還有什麼選擇?只能等休賽期? 火箭vs猛龍前瞻:範弗裡特有望復出戰舊主,火箭欲終結六連敗 梅西轟動宏都拉斯!當地媒體:這是世紀體育盛事! 登記開啟!金中、29中、13中等校動了! 開年暴擊!南京又一家機構跑路了? TechInsights:AI PC未能提振筆記本市場 2024年僅增長5% 睡覺時突然腿抽筋,就是缺鈣?錯!還有這4個原因,別輕易忽視了 泡泡瑪特又贏麻了!此前被調侃是“境內最大的博彩公司” 再也不用扎手指!5億糖尿病患者有福了 傳《尼爾:機械紀元》續作、新《古墓麗影》今年公佈 有工作經驗的畫素畫師如何寫簡歷? 離譜!Xun被搶3條龍,JDG仍然獲勝!Peyz力挽狂瀾,WBG痛失好局 將耗死在國際空間站?59歲美滯留女宇航員求救:喪失重要身體機能 華為FreeClip耳機玫瑰金開售 開放式聆聽設計 CBA俱樂部杯-山西淘汰北控晉級4強 原帥18分 小紅書上移民的中產:曾經北京七套房, 羨慕海外一張床, 如今卻...... 不可抗力停課2天以上退一半保教費,佛山幼兒園收費新規釋出 紅棉襯醉美,2020番順醉美青餅評測 華為FreeClip耳夾耳機玫瑰金配色開售:1299元 64歲寧波老闆,跨界無數次,給員工發8億,即將擁有第三家IPO? 卡友資訊股東持股情況變動 廣州“城市合夥人”:城市與人才的雙向奔赴 有人說孫穎莎粉絲是飯圈文化的時候 卻有些人用真金白銀愛孫穎莎! 男生剪“短髮”髮型乾淨利落,試試這3款,剪完帥氣提升顏值! 7個臀部訓練最佳動作,打造迷人的蜜桃臀! 偉大的4-2!林詩棟奪冠:新科世界第1誕生、超越王楚欽,狂攬3冠 新疆完美了!新小外強於皮特森+黑根斯,承認補強大外良性競爭! 林詩棟奪男單冠軍!採訪大談不容易太謙遜,單獨拍照露出笑容! 國乒最新戰報!林詩棟第2局11-8,衝3冠王,梁靖崑救2局點仍輸球 替補奇兵!快船大將5記3分助隊贏球 哈登好幫手 爆冷!北控男籃吊打奪冠大熱門球隊,外援決定比賽的走向 官宣離任,胡明軒宣佈重要決定,廣東宏遠遺憾,杜鋒祝福 又一個賈德松!崔康熙看人很準,魯媒:卡約又要錯過中國聯賽了 劉國樑憔悴!黑眼圈很重,擋住蒯曼被提醒,孫穎莎王楚欽被裁判整 林詩棟逆轉梁靖崑奪冠,成就三冠王,綜合實力更加突出 CBA最新外援註冊資訊,遼籃4人,新疆補充新援,廣東男籃放棄萊斯 大滿貫收官獎金排名:林詩棟三冠60萬第1,孫穎莎第2王曼昱10萬第9 臺灣律師分析大S遺產劃分,S媽要錢得看汪小菲臉色,打臉光頭安排 臺媒曝大S家人鬆手,讓出撫養權給汪小菲,希望馬筱梅善待孩子 二線白酒暴雷,狼真的來了! 搭上比亞迪,自動駕駛獨角獸,利潤大增170%! 炸裂!外資吹響“加倉中國”集結號背後:科技格局重塑與資產重估 這波夢幻西遊副本積分兌換真是血虧,四賜福的山賊值得買嗎? 《星戰亡命之徒》高階美工又回到CDPR 開發《巫師4》 《哪吒2》登陸北美,首映禮現好萊塢!有觀眾哭花眼妝:特效超預期,買票靠搶 曝張蘭被封年損失近4億,麻六記絕地自救太壯觀,員工曬張蘭近況

©2024 時時頭條 版權所有

隱私政策 | 服務條款 | 聯繫我們