時時頭條
  • 娛樂
  • 體育
  • 財經
  • 科技
  • 旅遊
  • 軍事
  • 育兒
  • 時尚
  • 遊戲
  • 歷史
  1. 首頁
  2. 科技

12%計算量就能媲美原模型,Adobe、羅切斯特大學等提YOPO剪枝技術

2024-11-29 07:38:25

AIxiv專欄是機器之心釋出學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或者聯絡報道。投稿郵箱:[email protected];[email protected]

本篇論文的核心作者包括羅切斯特大學的博士研究生張澤良,指導教師徐辰良副教授,以及來自Adobe的研究員趙文天,萬錕和李宇哲。

儘管近期 Qwen2-VL 和 InternVL-2.0 的出現將開源多模態大模型的 SOTA 提升到了新高度,但巨大的計算開銷限制了其在很多場景下的應用。近日,Adobe 研發團隊聯合羅切斯特大學系統性得研究了主流多模態大模型在引數和計算模式層面的冗餘,並提出了名為 YOPO(You Only Prune Once)的一系列剪枝方案。實驗結果表明 LLaVA-1.5 只需保留 12% 的計算量即可獲得與原始模型同等的效能,並且實驗團隊還驗證了這些計算冗餘在 Qwen2-VL 和 InternVL-2.0 同樣普遍存在。這為高效處理密集視覺 token 提供了新路徑。

目前程式碼、模型和專案主頁均已放出。

論文:Treat Visual Tokens as Text? But Your MLLM Only Needs Fewer Efforts to See論文連結:https://arxiv.org/abs/2410.06169開原始碼 & 模型:https://github.com/ZhangAIPI/YOPO_MLLM_Pruning/tree/main?tab=readme-ov-file

背景介紹

近期多項研究表明,隨著模型規模和輸入影象解析度的增加,多模態大模型的能力也隨之提升。然而,使用更大的模型或引入更多視覺 tokens 會帶來顯著的計算負擔。大部分多模態大模型視覺 token 數量在幾百到幾千不等,通常遠大於文字 token 的數量。這種巨大的不平衡帶來了一個關鍵挑戰:模型的計算成本隨著總輸入 token 的數量的平方而增加,從而限制了多模態大模型的可擴充套件性。儘管近期一些工作提出了對視覺 token 做削減的解決方案,如 FastV,SparseVLM, Pyramid-drop 等,但這類方法不可避免得在判斷削減哪些視覺 token 時引入了額外的計算量。為此研究團隊提出了在不引入額外計算量的前提下對模型引數和計算模式進行更高效剪枝,並在多個 benchmark 上實現了 SOTA。

方法

在應用了此剪枝方案後,模型的計算複雜度由和視覺 token 數量的二次方成正比降為了和其數量成正比。

2 非活躍注意力頭剪枝:研究團隊以 LLaVA-1.5 作為研究物件,隨機選取了 100 個視覺問答樣本,可視化了視覺 token 的不同注意力頭的權重,實驗發現大約有一半數量的注意力頭都沒有被啟用。由此可見這部分注意力頭的相關計算同樣存在大量冗餘並可以被剪枝。

3 選擇性層丟棄:研究團隊透過視覺化 LLaVA-1.5 不同層的視覺 token 跨模態注意力權重發現,大權重集中在前 20 層,在第 20 層到 40 層之間權重接近於 0。

這項結果表明靠後的 20 層的視覺計算存在大量冗餘。這一觀察啟發了研究團隊在靠後的層中直接跳過所有與視覺相關的計算,從而減少計算開銷。具體來說,對於層 l>L−N,視覺注意力和跨模態注意力計算都被省略,使得注意力計算可以簡化如下:

4 在 FFN 中進行稀疏視覺投影:透過剪枝大部分視覺注意力計算,模型的視覺表示變得高度稀疏。為了有效利用這種稀疏性,研究團隊提出在每個 transformer 模組內的 FFN 隱藏層中隨機丟棄 p% 的神經元。

實驗結果

研究團隊在眾多常見基準上評估了他們提出的方法在剪枝 LLaVA-1.5-7B 和 LLaVA-1.5-13B 模型中的效果。由表中得知,在相同的計算預算(即相同的 FLOPs)下,團隊提出的剪枝方法在四個樣本較多的基準測試上一致性得取得了最佳結果,分別在 GQA、VQAv2、POPE 和 MMB 上比第二優方法平均高出 3.7%、1.1%、2.2% 和 0.45%。

為了展示此種方法在剪枝視覺計算冗餘方面的可擴充套件性,團隊在兩個最大的基準測試 VQAv2 和 GQA 上,以不同的剪枝粒度,將他們提出的策略與 token 剪枝代表性工作 PyramidDrop 和 FastV 進行比較。可以觀察到,隨著視覺計算的 FLOPs 減少,剪枝模型的效能也隨之下降。具體來說,對於使用 FastV 剪枝的模型,將 FLOPs 從 75% 減少到 19% 導致在兩個基準測試上的平均效能從 71.35% 降至 66.63%。相比之下,團隊提出的方法並未直接剪枝 token,而是針對引數和計算模式層面的冗餘計算進行剪枝,從而僅導致 0.5% 的效能下降。

為了進一步印證文中觀察到的大量視覺計算冗餘是普遍存在的,團隊將該方法應用於其他模型包括 Qwen2-VL-7B 和 InternVL-2.0 4B/8B/26B。團隊在 GQA 和 POPE 基準上評估了效能,並調整剪枝粒度以在保持原始模型效能的同時儘量減少 FLOPs。如圖所示,即使在未微調的情況下,以適當比例剪枝這些模型的視覺計算也不會影響其效能。此外,更大的模型能夠適應更高的剪枝比例,這從不同模型規模下對 InternVL-2.0 的剪枝結果中得到了驗證。

為什麼不直接同時剪枝視覺和文字的引數?研究團隊專注於減少視覺 token 計算中的冗餘,從而降低其開銷,同時保留文字 token 的計算。為了探討文字 token 是否也存在類似的冗餘,團隊進行了一個實驗,分別對僅視覺 token 和視覺與文字 token 同時剪枝 20 個注意力頭。在未進行微調的情況下,僅剪枝視覺 token 在 VQAv2、GQA、SQA 和 TextVQA 上的平均效能為 67.1%,而同時剪枝視覺和文字 token 的效能則大幅下降至 4.3%。這表明在當前多模態大模型中,視覺計算中的冗餘顯著高於文字計算中的冗餘。

對 token 剪枝和計算模式剪枝的效率分析。研究團隊對不同輸入視覺 token 數量下各方法的效率進行了比較。結果表明,與基於 token 剪枝的方法相比,從計算模式層面解決視覺計算冗餘問題在處理較長視覺序列時具有更大的效率優勢。這種方法有效緩解了處理大量視覺 token 所帶來的計算開銷上升問題,展現了其在處理視覺序列方面的可擴充套件性。

總結

研究團隊針對剪枝多模態大模型以實現高效計算的挑戰進行了研究。與文字不同,視覺資訊具有高度稀疏性和冗餘性。以往的研究主要集中在減少視覺 token 數量;而本篇工作則分析了引數和計算模式中的冗餘性。團隊提出的策略包括:鄰域感知的視覺注意力、非活躍視覺注意力頭的剪枝、FFN 中的稀疏視覺投影以及選擇性層丟棄。這些方法將 LLaVA-1.5 的計算開銷減少了 88%,同時大幅保留了其效能。針對 Qwen2-VL-7B 和 InternVL-2.0 4B/8B/26B 的額外實驗進一步證實,視覺計算冗餘在多模態大模型中普遍存在。

熱門資訊
  • 加拿大 CAE 與商飛簽訂 C919 和 C909 全動飛行模擬機採購協議 | 2024-11-13 12:05:36
  • 英特爾 Arrow Lake 核顯 Arc 130T 曝光:OpenCL比Arc 140V快 24% | 2024-11-13 12:07:36
  • 索尼等品牌節節敗退 中國品牌電視席捲日本!已佔據過半份額 | 2024-11-13 12:07:38
  • 孫正義首次透露!曾三次嘗試買下英偉達 | 2024-11-13 12:13:50
  • 意獲中國1克嫦娥五號月壤!法俄1.5克,嫦娥六號與阿波羅的差異大 | 2024-11-13 12:24:19
  • 中國科學家用量子搜尋暗物質獲重要進展 | 2024-11-13 12:40:17
  • 臺積電產能被瘋搶:3nm將達到100%、5nm更是101%! | 2024-11-13 12:42:44
  • 取消開機廣告、整頓亂收費效果顯著:電視滿意度首次躍升至85分 | 2024-11-13 12:44:11
  • 頂配10999元!全球首款AMD Zen5掌機實測:遊戲效能提升最多22% | 2024-11-13 12:49:47
  • 外媒:因審批繁瑣,美國無人駕駛載人飛行器正輸給中國 | 2024-11-13 12:52:05
  • 11月13日外媒科學網站摘要:MIT在開發哪些未來農業技術 | 2024-11-13 12:52:07
  • NASA噴氣推進實驗室再裁員 今年已裁掉八分之一員工 | 2024-11-13 12:52:08
  • 李彥宏說大模型幻覺基本消除了,實測文心一言到底怎麼樣? | 2024-11-13 12:52:13
  • 速率比5G提升10倍以上!6G發展大會即將來襲,一文看懂產業鏈! | 2024-11-13 12:57:44
  • 訊息稱小米隱秘佈局 AI 眼鏡:和歌爾合作,預計明年 Q2 釋出 | 2024-11-13 12:59:25
  • 中國商飛簽下130架飛機訂單 國航意向成為C929首家使用者 | 2024-11-13 13:03:06
  • 半導體裝置——自主可控最強主線 | 2024-11-13 13:24:16
  • 有鴻蒙更好用!雙十一華為智慧門鎖 Pro讓你省心更安全 | 2024-11-13 13:31:19
  • 波音:近 2 個月的罷工結束,全面恢復生產仍需數週 | 2024-11-13 13:41:36
  • 雙槽DDR5記憶體超頻T0選手,微星MEG Z890 UNIFY-X暗影主機板評測 | 2024-11-13 13:59:27
  • MONTECH 推出 MKey Pro 三模 TKL 機械鍵盤:佳達隆 G Pro 3.0 軸 | 2024-11-13 14:29:03
  • 英偉達釋出NVIDIA app正式版 帶來統一GPU設定軟體 | 2024-11-13 14:39:10
  • 英偉達首款消費級 APU 曝光,遊戲效能媲美筆記本版 RTX 4070 | 2024-11-13 14:48:05
  • 酷凜海外推出 BOREAS 120 風扇:鋁製框架,0.6mm 葉框間隙 | 2024-11-13 14:48:08
  • 馬斯克:"政府效率部"將公佈所有行動 設"最蠢支出"榜 | 2024-11-13 15:12:29
  • 方程豹 豹8上市,4款款型,售價37.98萬元起 | 2024-11-13 15:12:40
  • 小米230天下線10萬輛車!雷軍學馬斯克睡工廠,重新整理車圈量產速度 | 2024-11-13 15:17:11
  • AMD 確認全球範圍內裁員 4%,約 1000 人受影響 | 2024-11-13 15:30:50
  • 項立剛:出國的人都死得早,他領導就是如此! | 2024-11-13 15:35:06
  • 多則訊息點燃固態電池板塊,低空飛行器正嘗試使用 | 2024-11-13 15:42:03
最近發布
突發!TVB知名女星毫無預警宣佈與未婚夫分手,結束長達八年情 面對被黑,蘭姐強勢迴歸。小菲狀態好轉,發宣告。更多內幕揭曉! 中國男籃決戰日本隊,首發五人曝光,廣東隊大贏家,徐傑第一後衛 孫穎莎奪女單冠軍!採訪謙遜立足拼,劉國樑給中國選手頒獎笑開花 分析 馬威交易取消後的影響:湖人還有什麼選擇?只能等休賽期? 火箭vs猛龍前瞻:範弗裡特有望復出戰舊主,火箭欲終結六連敗 梅西轟動宏都拉斯!當地媒體:這是世紀體育盛事! 登記開啟!金中、29中、13中等校動了! 開年暴擊!南京又一家機構跑路了? TechInsights:AI PC未能提振筆記本市場 2024年僅增長5% 睡覺時突然腿抽筋,就是缺鈣?錯!還有這4個原因,別輕易忽視了 泡泡瑪特又贏麻了!此前被調侃是“境內最大的博彩公司” 再也不用扎手指!5億糖尿病患者有福了 傳《尼爾:機械紀元》續作、新《古墓麗影》今年公佈 有工作經驗的畫素畫師如何寫簡歷? 離譜!Xun被搶3條龍,JDG仍然獲勝!Peyz力挽狂瀾,WBG痛失好局 將耗死在國際空間站?59歲美滯留女宇航員求救:喪失重要身體機能 華為FreeClip耳機玫瑰金開售 開放式聆聽設計 CBA俱樂部杯-山西淘汰北控晉級4強 原帥18分 小紅書上移民的中產:曾經北京七套房, 羨慕海外一張床, 如今卻...... 不可抗力停課2天以上退一半保教費,佛山幼兒園收費新規釋出 紅棉襯醉美,2020番順醉美青餅評測 華為FreeClip耳夾耳機玫瑰金配色開售:1299元 64歲寧波老闆,跨界無數次,給員工發8億,即將擁有第三家IPO? 卡友資訊股東持股情況變動 廣州“城市合夥人”:城市與人才的雙向奔赴 有人說孫穎莎粉絲是飯圈文化的時候 卻有些人用真金白銀愛孫穎莎! 男生剪“短髮”髮型乾淨利落,試試這3款,剪完帥氣提升顏值! 7個臀部訓練最佳動作,打造迷人的蜜桃臀! 偉大的4-2!林詩棟奪冠:新科世界第1誕生、超越王楚欽,狂攬3冠 新疆完美了!新小外強於皮特森+黑根斯,承認補強大外良性競爭! 林詩棟奪男單冠軍!採訪大談不容易太謙遜,單獨拍照露出笑容! 國乒最新戰報!林詩棟第2局11-8,衝3冠王,梁靖崑救2局點仍輸球 替補奇兵!快船大將5記3分助隊贏球 哈登好幫手 爆冷!北控男籃吊打奪冠大熱門球隊,外援決定比賽的走向 官宣離任,胡明軒宣佈重要決定,廣東宏遠遺憾,杜鋒祝福 又一個賈德松!崔康熙看人很準,魯媒:卡約又要錯過中國聯賽了 劉國樑憔悴!黑眼圈很重,擋住蒯曼被提醒,孫穎莎王楚欽被裁判整 林詩棟逆轉梁靖崑奪冠,成就三冠王,綜合實力更加突出 CBA最新外援註冊資訊,遼籃4人,新疆補充新援,廣東男籃放棄萊斯 大滿貫收官獎金排名:林詩棟三冠60萬第1,孫穎莎第2王曼昱10萬第9 臺灣律師分析大S遺產劃分,S媽要錢得看汪小菲臉色,打臉光頭安排 臺媒曝大S家人鬆手,讓出撫養權給汪小菲,希望馬筱梅善待孩子 二線白酒暴雷,狼真的來了! 搭上比亞迪,自動駕駛獨角獸,利潤大增170%! 炸裂!外資吹響“加倉中國”集結號背後:科技格局重塑與資產重估 這波夢幻西遊副本積分兌換真是血虧,四賜福的山賊值得買嗎? 《星戰亡命之徒》高階美工又回到CDPR 開發《巫師4》 《哪吒2》登陸北美,首映禮現好萊塢!有觀眾哭花眼妝:特效超預期,買票靠搶 曝張蘭被封年損失近4億,麻六記絕地自救太壯觀,員工曬張蘭近況

©2024 時時頭條 版權所有

隱私政策 | 服務條款 | 聯繫我們