時時頭條
  • 娛樂
  • 體育
  • 財經
  • 科技
  • 旅遊
  • 軍事
  • 育兒
  • 時尚
  • 遊戲
  • 歷史
  1. 首頁
  2. 財經

DeepSeek為何出自量化基金公司?

2025-01-31 16:55:03

春節假期,潑天流量降到了DeepSeek的頭上。

大概一週多之前,DeepSeek還算不上太有名氣,在大模型圈之外,外界對它可能多是一頭霧水。然而短短几天,其就一躍成為業界頂流,並闖進了公眾視野。

因接連推出的兩款大模型產品,DeepSeek在華爾街掀起風暴,美股科技股一度重挫。週二,單日蒸發近6000億美元市值,博通和美光科技等晶片產業鏈股票也紛紛大跌。雖然週三英偉達反彈漲近9%,但DeepSeek帶來的心理衝擊並沒消散。

“DeepSeek大模型在效能上比肩ChatGpt,可能意味著國產大模型實現突破,這對美股科技股造成了衝擊。”前海開源基金首席經濟學家楊德龍告訴時代週報記者。在他看來,科技股是美股牛市的主要推動力,但投資者擔心其估值產生巨大泡沫。若一些新技術突破或新模型不需要消耗那麼多的GPU,可能會引發像英偉達等公司的大幅下跌,從而導致美股科技股泡沫破裂。

作為一家成立不到兩年的大模型公司,無論在融資、技術進展還是輿論層面,DeepSeek一向都動靜不大。而它背後的公司幻方量化(一家頭部量化私募),在此之前也僅是在私募圈出名。出人意料的是,一傢俬募和一家大模型初創公司,這樣的少見組合誕生了“DeepSeek神話”——無疑令人倍感好奇。

這一切是怎麼做到的?

潛行多年

如果從成立時間上看,DeepSeek並無特別之處。自2022年底ChatGPT釋出之後,全球科技圈震動,隨之一系列國產大模型創業專案面世。DeepSeek搭乘的也是這股潮流,2023年4月,幻方量化高調宣佈進軍大模型,三個月之後,DeepSeek作為獨立公司成立。

但脫胎於幻方量化的DeepSeek,其實技術積累要更早。

幻方量化成立於2015年,創始人是梁文鋒。在該公司官網上,赫然寫著的是:使用AI投資的對沖基金。按照幻方量化的披露,在公司成立之前七八年時間,創始團隊就在探索將技術應用於投資交易。當時量化投資在國內尚未流行,團隊成員在這方面的經驗同樣寥寥,出於朦朧的市場感知和技術理想,梁文鋒團隊仍決定走上這條路。

在這一時期,幻方量化創始團隊從零開始嘗試全自動交易,採用機器學習等技術。2010年是一個轉折點,當年股指期貨和融資融券相繼推出,A股投資更活躍和多樣化。一時間,量化投資在國內私募基金業逐漸增加,報道稱梁文鋒團隊也藉此收益頗豐。

△圖源:圖蟲

2015年,幻方量化正式成立,藉助AI和數學進行量化投資。2016年,幻方量化第一個由深度學習演算法模型生成的股票倉位上線實盤交易,使用GPU進行計算。而在此之前,演算法主要依靠線性模型和傳統機器學習演算法,模型計算主要依賴於CPU。

自此之後,幻方的量化策略全面AI化。到2017年底,幾乎所有量化策略均已採用AI模型計算。隨後不久,該公司明確宣佈AI為主要發展方向。

所謂量化投資,指的是藉助統計學和數學方法,利用計算機程式對大量資料進行分析,尋求獲得超額收益的投資策略。在持倉風格上,量化投資傾向高度分散和多樣化配置,以降低單一資產波動的風險。在決策上,不同於傳統的依靠基金經理主觀判斷,量化公司是基於資料和模型進行交易。

全面AI化也帶來某些問題,比如複雜的模型計算需求使得單機訓練遭遇算力瓶頸,訓練需求和有限的計算資源產生矛盾,幻方量化需要解決大規模算力的受限難題。在這個背景下,幻方量化在2019年成立了一家AI基礎研究公司,並推出自研的“螢火一號”AI叢集,搭載500塊顯示卡。同一年,幻方量化規模擴張,躋身百億私募。2021年,幻方又斥資10億元加碼建設“螢火二號”,為AI研究提供算力支援。

從事後來看,幻方量化在構建AI算力過程中的“囤卡”動作,為它贏得了市場機會。作為國內早期的英偉達晶片大買家之一,在ChatGPT爆發前夜,幻方量化手中的英偉達顯示卡數量就越攢越多。據幻方量化稱,在2022年時,其用於科研支援的閒時算力高達1533萬GPU時,這意味著每天用於科研而非交易的算力便達4.2萬GPU時。這個水平,大大超越了後來的很多大模型公司。

DeepSeek,就是在這樣的加持下問世。

也交過學費

幻方量化上演了一個“一朝成名天下知”的精彩故事,在它的敘事版本里,無論做金融交易還是進軍大模型,都是比較純粹的技術向追求。

一位接近幻方量化的投資人士告訴時代週報記者,他一直很關注這家公司,並且和團隊成員有過交流。雖然沒有直接接觸過創始人本人,但能感覺出來,相對於商業盈利,這個團隊的技術理想色彩是更為濃厚的。

幻方量化希望透過AI量化交易,對金融資產進行定價和投資。金融交易足夠複雜,又是從起家就介入的領域,對於旨在實現通用人工智慧(AGI)的幻方量化而言,這是一個非常合適的切入場景。

早在2020年,點拾投資創始人朱昂曾訪談過幻方量化CEO陸政哲。彼時陸政哲稱,幻方量化將自己定義為一家完全依靠AI來做投資的對沖基金。其模型資料來源有三個,分別是行情資料、覆蓋全市場的基本面資料以及經過結構化處理的另類資料。用這三類資料來訓練機器模型,據此構建投資組合,再用精細化的程式化交易完成交易。

這套打法確實效果顯著,在2017年-2020年間,整個量化行業高速增長,幻方量化的管理規模也水漲船高。不過,量化交易並非完美,幻方量化在這上面也吃過苦頭。

2021年12月,由於業績回撤達歷史最大值,幻方量化就業績不及格發文致歉。幻方量化稱,其人工反覆檢視了AI的投資決策,認為AI選出來的股票從長期價值來說基本上沒問題,但在買賣時點上確實做的不夠好。尤其市場風格劇烈切換時,AI傾向於冒險博取更多收益,這進一步加大了回撤。

量化資管行業擴張太快,被認為是另一個原因。幻方量化認為,行業規模猛增,導致策略同質化嚴重,加大了整體操作的難度。因此,當時幻方量化著手控制總的規模,同時表態要加大對策略研究的投入,以重新獲得市場優勢。而在監管層面,2024年7月份融券業務相關政策發生重大調整,轉融券業務暫停,並且融券保證金比例上調。此外,程式化交易被進一步強化監管。量化行業似乎告別一段野蠻發展期。

△圖源:圖蟲

目前,梁文鋒旗下有兩家百億私募,除了寧波幻方量化(股票策略),另外一家是浙江九章資產(多資產策略)。就業績而言,據私募排排網資料,過去兩年量化公司的風頭仍然強勢,如2023年百億私募排行榜中,前十名中量化公司佔據六席,在104家上榜私募中,九章資產和幻方量化的業績分列32和33位。到2024年,量化私募的整體收益仍高於主觀私募,除東方港灣(主觀投資)牢牢把持行業首位之外,前三十名中量化或主觀+量化的機構佔據多數。不過,幻方量化的業績同樣算不上突出,僅排在第19位。

在私募排排網有業績展示的12只產品中,幻方量化旗下產品2024年的收益均值為12.18%,收益中位數為13.02%。

“還需冷靜看待”

某種程度上,DeepSeek應該是幻方量化的深度轉型之作。成立之初,該公司就表示將專注在大模型上,從語言大模型到視覺大模型,再到多模態大模型,堪稱步步為營。

過去一年多,從默默無聞到火爆出圈,DeepSeek經歷了一條清晰的產品迭代之路。

在2024年5月之前,DeepSeek相繼推出了DeepSeek Coder(免費且開源的首個模型)、DeepSeek LLM(第一個大語言模型),其中DeepSeek LLM包含670億引數,在一個包含2萬億token(語言模型中用來表示單詞或短語的符號)的資料集上進行訓練。在中文表現上,該模型據稱超越了當時的GPT-3.5。

這兩款模型都沒有引起波瀾,直到隨後釋出的DeepSeek-V2,才讓DeepSeek在圈中出名。DeepSeek-V2是混合專家(MoE)語言模型,包含總引數達到2360億,每個token啟用210億個引數。在一些行業測試中,DeepSeek-V2有著不錯的表現。

有意思的是,當時國內業界對這款模型似乎欠缺技術層面的關注。DeepSeek-V2之所以被注意到,是由於它在大模型行業掀起一場價格大戰——DeepSeek在5月出宣佈,DeepSeek-V2降價至每百萬Tokens輸入價格為1元、輸出價格為2元,開發者還能獲得500萬Tokens的免費額度。

這個價格水平,大約相當於GPT-4 Turbo的七十分之一。

隨即網際網路大廠紛紛跟進,甚至不乏有廠家將價格降得比DeepSeek-V2還低。就在國內玩家為價格戰打的火熱時,有矽谷從業者發現,DeepSeek-V2採用的多頭潛在注意力機制,有效提升了大模型的效能。

這或許是矽谷較早地正視這家中國初創公司。

據一位行業相關人士解釋,多頭潛在注意力機制是DeepSeek-V2提出的一種注意力架構,該架構可以顯著降低推理過程中的KV快取。所謂KV快取,指的是在大模型的推理過程中,用於儲存先前計算結果的一種技術。

到2024年底,DeepSeek繼續迭代,推出了DeepSeek-V3模型。DeepSeek終於迎來它的GPT-3時刻。

今年1月20日,DeepSeek-R1釋出,在數學、程式碼、自然語言推理等任務上,宣稱效能對標OpenAI o1正式版。而它的蒸餾(將大模型的知識遷移到小模型中)小模型,也超越了OpenAI o1-mini。此外,在開源和閉源路線仍有爭議的眼下,DeepSeek宣佈R1開源,允許使用者進行“模型蒸餾”,以促進技術共享。

DeepSeek-R1是一枚重磅炸彈,在效能上為全球業界矚目之外,更重要的是——它的成本相比競品大大降低。一週之後,DeepSeek趁熱打鐵,又推出開源多模態模型,被認為在文生圖方面超越OpenAI的DALL-E3。至此,外界對DeepSeek的討論關注,達到高潮。

與先進大模型保持相近的效能,並在訓練成本、執行成本和服務定價上全面大幅下降,這是DeepSeek震撼科技圈的原因。在這樣的現象級產品出現之前,過去兩年多時間,由於AI業界對高效能顯示卡的追逐,英偉達被一路推上王座。無論在資本市場還是產業鏈,這個邏輯似乎已經確立,沒料到DeepSeek橫空出世,硬生生攪了局。

不過,這場衝擊波能持續多久,還是個未知數。DeepSeek的勢頭固然很猛,但是否彌合了國產大模型與國際先進水平之前的技術代差,正在引發熱議。另外,DeepSeek透過演算法最佳化提升效率,是否就意味著對算力需求的明顯減弱,下結論也太早。

喧鬧之外,降溫觀察逐漸成為一種聲音。“針對最近幾天事情的發展,個人覺得還是冷靜看待,肯定其取得的成就,但也要避免情緒化。”上述投資人士如此說道。

本文源自:時代週報

熱門資訊
  • 行情不對勁!散戶做好準備,午後,A股會有更大級別行情嗎 | 2024-11-29 16:46:16
  • 洗盤!消化浮籌?下週,A股會迎來新一輪行情了 | 2024-11-29 16:46:20
  • A股放量上漲:創指漲2.5%,滬深兩市成交1.7萬億元,券商、半導體攜手走強 | 2024-11-29 16:47:14
  • 今天,真不是我拉的! | 2024-11-29 16:47:20
  • 天下車智|裁員、降薪、被告,誰能拯救失意的哪吒汽車? | 2024-11-29 16:47:59
  • 中央決定:副省長王浩履新 | 2024-11-29 16:48:00
  • 正元智慧(300645)11月29日主力資金淨流入475.18萬元 | 2024-11-29 16:48:06
  • 電投產融收盤上漲1.16%,滾動市盈率28.62倍 | 2024-11-29 16:50:55
  • 莎莎國際(00178.HK)11月29日收盤上漲11.94%,成交1611.91萬港元 | 2024-11-29 16:50:56
  • 夢金園成功上市:黃金珠寶賽道的“三好”企業,長期潛力值得關注 | 2024-11-29 16:52:08
  • 中證軍工龍頭指數上漲1.3%,前十大權重包含海格通訊等 | 2024-11-29 16:52:11
  • 港股異動 | 思派健康(00314)漲超5% 近日與健醫科技達成戰略合作 此前推動分紅獎勵計劃 | 2024-11-29 16:52:59
  • 萬達電影:11月28日融資買入3916.68萬元,融資融券餘額7.72億元 | 2024-11-29 16:53:00
  • 旭升集團9.99%漲停,總市值135.6億元 | 2024-11-29 16:53:02
  • 渤海租賃:11月28日融資淨買入7218.58萬元,當日排名第34 | 2024-11-29 16:53:19
  • 中大力德10.0%漲停,總市值51.55億元 | 2024-11-29 16:53:21
  • 中證港股通內地金融指數上漲0.5%,前十大權重包含中國人壽等 | 2024-11-29 16:53:23
  • 中微半導跌2.03%,成交額5288.24萬元,主力資金淨流出623.38萬元 | 2024-11-29 16:53:25
  • 大東方11月29日創一年新高,盤中最高觸及7.99元 | 2024-11-29 16:53:27
  • 深物業A收盤下跌3.11%,滾動市盈率24.37倍 | 2024-11-29 16:53:28
  • 檳傑科達(01665.HK)11月29日收盤上漲3.23%,成交681.7萬港元 | 2024-11-29 16:56:06
  • 吉林化纖收盤上漲0.81%,滾動市盈率230.52倍 | 2024-11-29 16:56:07
  • 中證醫藥100指數上漲1.65%,前十大權重包含海思科等 | 2024-11-29 17:01:22
  • 中美貿易戰打出默契,直接搞垮3個工業強國,誰會是最後贏家? | 2024-11-29 17:17:19
  • 專家建議將農民養老金提升至一個月500元 | 2024-11-29 17:28:32
  • 專家建議將農民養老金提升至每月500元 | 2024-11-29 17:36:20
  • 摩根資產管理:未來10至15年中國股票的預期年化回報率為6.6% | 2024-11-29 17:45:37
  • 十連板了!!南京化纖如何“烏雞變鳳凰”? | 2024-11-29 17:45:40
  • A股三大指數集體上漲,大金融消費全線爆發,內資淨買入超138億! | 2024-11-29 17:45:42
  • 巳巳如意,生生不息!2025年春晚主題釋出 | 2024-11-29 17:46:18
最近發布
突發!TVB知名女星毫無預警宣佈與未婚夫分手,結束長達八年情 面對被黑,蘭姐強勢迴歸。小菲狀態好轉,發宣告。更多內幕揭曉! 中國男籃決戰日本隊,首發五人曝光,廣東隊大贏家,徐傑第一後衛 孫穎莎奪女單冠軍!採訪謙遜立足拼,劉國樑給中國選手頒獎笑開花 分析 馬威交易取消後的影響:湖人還有什麼選擇?只能等休賽期? 火箭vs猛龍前瞻:範弗裡特有望復出戰舊主,火箭欲終結六連敗 梅西轟動宏都拉斯!當地媒體:這是世紀體育盛事! 登記開啟!金中、29中、13中等校動了! 開年暴擊!南京又一家機構跑路了? TechInsights:AI PC未能提振筆記本市場 2024年僅增長5% 睡覺時突然腿抽筋,就是缺鈣?錯!還有這4個原因,別輕易忽視了 泡泡瑪特又贏麻了!此前被調侃是“境內最大的博彩公司” 再也不用扎手指!5億糖尿病患者有福了 傳《尼爾:機械紀元》續作、新《古墓麗影》今年公佈 有工作經驗的畫素畫師如何寫簡歷? 離譜!Xun被搶3條龍,JDG仍然獲勝!Peyz力挽狂瀾,WBG痛失好局 將耗死在國際空間站?59歲美滯留女宇航員求救:喪失重要身體機能 華為FreeClip耳機玫瑰金開售 開放式聆聽設計 CBA俱樂部杯-山西淘汰北控晉級4強 原帥18分 小紅書上移民的中產:曾經北京七套房, 羨慕海外一張床, 如今卻...... 不可抗力停課2天以上退一半保教費,佛山幼兒園收費新規釋出 紅棉襯醉美,2020番順醉美青餅評測 華為FreeClip耳夾耳機玫瑰金配色開售:1299元 64歲寧波老闆,跨界無數次,給員工發8億,即將擁有第三家IPO? 卡友資訊股東持股情況變動 廣州“城市合夥人”:城市與人才的雙向奔赴 有人說孫穎莎粉絲是飯圈文化的時候 卻有些人用真金白銀愛孫穎莎! 男生剪“短髮”髮型乾淨利落,試試這3款,剪完帥氣提升顏值! 7個臀部訓練最佳動作,打造迷人的蜜桃臀! 偉大的4-2!林詩棟奪冠:新科世界第1誕生、超越王楚欽,狂攬3冠 新疆完美了!新小外強於皮特森+黑根斯,承認補強大外良性競爭! 林詩棟奪男單冠軍!採訪大談不容易太謙遜,單獨拍照露出笑容! 國乒最新戰報!林詩棟第2局11-8,衝3冠王,梁靖崑救2局點仍輸球 替補奇兵!快船大將5記3分助隊贏球 哈登好幫手 爆冷!北控男籃吊打奪冠大熱門球隊,外援決定比賽的走向 官宣離任,胡明軒宣佈重要決定,廣東宏遠遺憾,杜鋒祝福 又一個賈德松!崔康熙看人很準,魯媒:卡約又要錯過中國聯賽了 劉國樑憔悴!黑眼圈很重,擋住蒯曼被提醒,孫穎莎王楚欽被裁判整 林詩棟逆轉梁靖崑奪冠,成就三冠王,綜合實力更加突出 CBA最新外援註冊資訊,遼籃4人,新疆補充新援,廣東男籃放棄萊斯 大滿貫收官獎金排名:林詩棟三冠60萬第1,孫穎莎第2王曼昱10萬第9 臺灣律師分析大S遺產劃分,S媽要錢得看汪小菲臉色,打臉光頭安排 臺媒曝大S家人鬆手,讓出撫養權給汪小菲,希望馬筱梅善待孩子 二線白酒暴雷,狼真的來了! 搭上比亞迪,自動駕駛獨角獸,利潤大增170%! 炸裂!外資吹響“加倉中國”集結號背後:科技格局重塑與資產重估 這波夢幻西遊副本積分兌換真是血虧,四賜福的山賊值得買嗎? 《星戰亡命之徒》高階美工又回到CDPR 開發《巫師4》 《哪吒2》登陸北美,首映禮現好萊塢!有觀眾哭花眼妝:特效超預期,買票靠搶 曝張蘭被封年損失近4億,麻六記絕地自救太壯觀,員工曬張蘭近況

©2024 時時頭條 版權所有

隱私政策 | 服務條款 | 聯繫我們