時時頭條
  • 娛樂
  • 體育
  • 財經
  • 科技
  • 旅遊
  • 軍事
  • 育兒
  • 時尚
  • 遊戲
  • 歷史
  1. 首頁
  2. 科技

一鍵生成萬字專利!中科院釋出多智慧體框架AutoPatent,含1933個「草稿-專利」資料對

2024-12-21 02:45:26

新智元報道

編輯:LRST

【新智元導讀】AutoPatent框架能夠自動化生成高質量的專利文件,大幅提高專利撰寫效率,有望簡化專利申請流程,降低成本,促進創新保護。

在科技日新月異的今天,專利作為保護創新成果的重要法律工具,其撰寫過程卻往往繁瑣且耗時,傳統的專利撰寫工作通常由熟悉專利法律和技術領域的專利代理人完成,這一過程耗時費力,且效率較低。因此,開發一種能夠自動化生成高質量專利文件的方法,對於提高專利撰寫的效率和準確性具有重要意義。

最近,來自中科院深圳先進院和大連理工大學的研究團隊聯合開發了一個名為AutoPatent的自動化的多智慧體專利生成框架,能夠在十分鐘左右的時間依據發明人的專利技術底稿生成一篇完整的專利文件。

論文地址:https://arxiv.org/abs/2412.09796

程式碼連結:https://github.com/QiYao-Wang/AutoPatent

研究背景

一份完整的專利申請檔案通常包含標題、摘要、技術背景、詳細描述和權利要求等內容,其平均長度在17,000 Tokens以上。以往的專利申請流程通常為發明人依據發明的具體可實施內容撰寫專利技術底稿委託專利代理人起草專利申請檔案。

專利起草是一個複雜的知識密集型任務,需要專利代理人對專利法熟悉並且具備該發明所屬技術領域的知識,從而能夠完成對發明人技術底稿的審查和規範化重寫。

目前這一過程仍然完全由人工手動完成,具有較高的人力成本和時間成本,從技術交底書到正式向專利局提交的時間通常在一個月以上,無法有效保護迭代更新較快的技術領域的相關發明。

專利起草任務Draft2Patent

以往的專利撰寫任務通常關注專利檔案內部文字的相互轉化,例如專利的摘要與權利要求之間的相互轉化等。

研究人員透過模擬真實場景中的專利撰寫工作,引入了一項新穎的專利起草任務Draft2Patent,將發明人技術底稿轉化為完整的專利檔案,提升專利代理人的專利撰寫效率。

該任務主要有兩個主要困難:

底稿和完整專利的平均長度分別為4,000 Tokens和17,000 Tokens。

一份高質量專利需要具有專利性(非顯而易見性、有用性、新穎性以及符合專利法律規範),同時需要滿足專業技術領域和法律的相關規範。

研究人員構建了Draft2Patent任務對應的基準資料集D2P,其中包含1,933條底稿專利文字對和其他元資料,並將其劃分為包含1,500條資料的訓練集,133條資料的驗證集和300條資料的測試集。

隨著大語言模型的發展,基於大語言模型的智慧體展現了在知識密集型領域的意圖理解、規劃、記憶、重複思考及任務執行的強大能力。

針對Draft2Patent任務,研究人員提出了一個新穎的多智慧體自動化專利起草框架AutoPatent,其中使用寫作、規劃及審查三大類八個智慧體在短元件生成、專利寫作規劃樹構建(PGTree)、參考-審查增強生成(RRAG)三步驟的驅動下完成完整專利的撰寫。

該篇文章的主要貢獻有:

自動化生成,提升專利撰寫效率

透過自動化生成專利文件,文章提出的AutoPatent框架顯著提高了專利撰寫的效率,能夠在十分鐘左右的時間內生成一篇完整的專利文件,減輕了專利代理人和發明者的工作負擔,使他們能夠更專注於創新和專利內容的最佳化。

多智慧體協作,提升專利質量

AutoPatent框架透過多智慧體協作,其中規劃智慧體構建PGTree(Patent Writing Guideline Tree,專利寫作指南樹),專利詳細描述寫作智慧體與審查智慧體基於RRAG(Reference-Review-Augmented Generation,參考審查增強生成)協作撰寫佔據專利文字80%以上的詳細描述部分,確保生成的專利文件符合法律和技術標準。這提高了專利的合規性和保護範圍,增加了專利被授權的可能性。

由此及彼,推動智慧財產權服務創新

文章提出的Draft2Patent任務和AutoPatent框架為智慧財產權服務領域帶來了新的思路和方法。這有助於推動智慧財產權服務的創新和發展,提高整個行業的服務水平和競爭力。

資料集

研究團隊構建了D2P基準資料集,包含1,933個草稿-專利對和其他專利元資料。

由於專利局僅公開授權專利,而發明人和專利代理人不會公開其發明的底稿。

為此,團隊透過與專業的專利代理人溝通,構建了涵蓋發明所有相關資訊的五個問題 ,對於單個專利P,將GPT-4o-mini模擬為發明人,透過詢問五個問題得到對應的回答 ,並將其與問題組合為底稿。

為了保證底稿的有效性,研究人員構建了對應問題的審查標準,透過將GPT-4o模擬為專利審查員來評估每個答案是否能夠準確描述該發明,並且透過人工篩選後,獲得了1,933條高質量的專利底稿資料。

D2P資料集中不僅包含底稿專利文字對,還包含底稿與其他專利元資料文字對,如底稿標題文字對等用於智慧體的微調,同時還構建了底稿-PGTree文字對資料,用於微調規劃智慧體。

對於單個專利P,研究人員將GPT-4o-mini模擬為人工智慧助手總結專利P的詳細描述中每一部分的內容,並將其組織構建為預設的雙層多路專利寫作規劃樹的資料結構。

統計資料集中各部分的文字長度後,可以看到標題、摘要、權利要求、總結及技術背景等內容的長度小於2000 Tokens,而專利的詳細描述部分長度超過了14,000 Tokens,佔據完整專利的80%以上,生成高質量專利詳細描述是本基準的一大挑戰。

自動化專利撰寫框架AutoPatent

研究人員提出了一個新穎的多智慧體自動化專利起草框架AutoPatent,其中包含三大類八個智慧體在三大步驟的驅動下完成完整專利的撰寫。

智慧體

在AutoPatent框架中,定義了八個智慧體,並將其分為三類:寫作智慧體、規劃智慧體及審查智慧體。

寫作智慧體:由於專利的各個部份之間存在著一定的格式及風格差異,如專利的摘要一般較短而權利要求通常為具有編號的結構化文字。將六個寫作智慧體分為兩大類,即短文字寫作者和詳細描述寫作者。

規劃智慧體:由於專利的詳細描述的平均長度超過14,000 Tokens,為大語言模型一次性生成詳細描述帶來了困難。透過引入雙層多路的專利寫作規劃樹PGTree,指導詳細描述寫作者在RRAG過程中分步生成完整的詳細描述。

審查智慧體:透過模擬真實場景中的專利撰寫步驟,定義了審查智慧體。其需要依據事先設定的評價規範完成兩類任務,即發明人提交新底稿後的質量審查和與詳細描述寫作者協作評估詳細描述的質量並提供反饋達到最佳化的效果。

工作流程

提供了相應的邏輯框圖和虛擬碼。透過模擬真實場景中的專利撰寫過程將AutoPatent框架的整體工作流程分為三步。

短元件生成:在Step I中,利用不同的短文字寫作者將專利底稿並行轉化為對應的短文字。之後將這些短文字與專利底稿共同組成參考(Reference, R)。

專利寫作規劃樹構建:在Step II中,利用規劃智慧體構建該底稿對應的PGTree。PGTree是一個雙層多路樹,將詳細描述的生成任務拆解為雙層級的大綱式多步生成任務。第一層節點提供該部分的整體概述,第二層節點向詳細描述寫作者提供每個子部分的具體指令。

參考-審查增強生成:在Step III中,詳細描述寫作者首先根據PGTree中二層節點的具體寫作指令從參考R中檢索對該部分寫作有用的資訊,提升內容的一致性和可靠性。詳細描述寫作者之後根據二層節點的具體寫作指令和檢索到的內容生成子部分的內容,審查智慧體將主動介入依據審查標準判斷生成的子部分的質量,並透過與詳細描述寫作者的多輪互動完成子部分的內容最佳化,直至透過審查。

實驗結果

研究人員採用了n-gram基於的BLEU指標和ROUGE-1、ROUGE-2、ROUGE-L指標作為客觀指標,同時提出了一種新的逆重複率(IRR)指標來衡量專利文件中句子的重複程度,從而去除由於重複句子過多對基於n-gram的指標的過度獎勵。

其中真實專利的IRR在t=0.2時為91.33,t=0.4時為98.57,真實專利的文字重複率較低。

其中基於Jaccard相似度和設定的閾值超引數判斷專利文字內部句子的重複,函式f(si, sj)定義為:

同時,實驗邀請了三位熟悉專利法和專利撰寫的人類專家對生成的專利文件進行質量評價。評價標準包括準確性、全面性、邏輯性、清晰度、連貫性和一致性等六個維度。

將AutoPatent框架與零樣本提示生成方法和監督微調生成方法進行了對比,以評估AutoPatent框架的效能。

實驗結果顯示,AutoPatent框架在多個維度上均優於基線方法,其中AutoPatent框架使用Qwen2.5-7B作為基座模型時的效能超過了引數量更大和能力更強的模型,生成的專利文件在長度、內容質量、重複率等方面均表現出色。

與此同時,三位人類專家均認為基於AutoPatent框架生成的專利文字質量好於其他方法。

AutoPatent的出現在未來可能對智慧財產權行業產生深遠影響:

專利生成流程重塑:傳統的專利申請流程繁瑣,涉及多次人工稽核和修改。AutoPatent透過自動化生成和審查流程,將原本需要數週甚至數月的時間縮短至幾小時或幾天,極大地提高了效率。

降低專利書寫難度,促進創新:AutoPatent的出現降低專利撰寫難度,當專利撰寫變得更為便捷和經濟時,更多的創新想法將有機會轉化為專利,從而激發整個社會的創新活力。

智慧財產權服務行業變革:隨著AutoPatent等自動化工具的應用,智慧財產權服務機構將不得不探索新的服務內容和模式,如專利資料分析、專利價值評估等增值服務。

參考資料:

https://arxiv.org/abs/2412.09796

熱門資訊
  • LG 預告首款家用管家機器人:整合 GPT-4o,注重和使用者情感互動 | 2024-12-03 14:54:21
  • 三星在韓國推出 AI 訂閱俱樂部服務,使用者可租賃智慧家電 | 2024-12-03 15:05:23
  • 外媒評英特爾CEO突然退休:找到合適替代人選絕非易事 | 2024-12-03 15:22:57
  • 訊息稱SpaceX考慮認購內部股份 估值高達3500億美元 | 2024-12-03 15:23:04
  • NVIDIA下代GPU已提早半年開始準備!用上3nm、芯片面積兩倍大 | 2024-12-03 15:24:26
  • 榮耀筆記本X14/X16 Plus 2025釋出 首發價4899元起 | 2024-12-03 15:24:27
  • 我國首個商業航天發射場,海南商發明年可實現月月有發射 | 2024-12-03 15:33:01
  • 爾英發布品牌首款 AMD 主機板瑤光 Alkiad B650 ITX D5 | 2024-12-03 15:41:57
  • OPPO Pad 3 Pro 平板開啟 ColorOS 15 內測招募 | 2024-12-03 15:41:59
  • 三星 AR 眼鏡原型被曝明年 1 月展示:50 克輕量設計、AI 加持 | 2024-12-03 15:42:00
  • 中信證券:長征十二號首發成功 商業航天產業已進入發展“快車道” | 2024-12-03 15:44:09
  • 851個零件復刻全球最貴光刻機!ASML推出High NA EUV樂高套裝:售價1650元 | 2024-12-03 15:45:24
  • REALFORCE 燃風推出靜電容小鍵盤 RT1 Ten,軸體擊鍵壽命超億次 | 2024-12-03 15:58:27
  • 中國首型4米級運載火箭長征十二號首飛成功,是我國目前運力最強兩級單芯級火箭 | 2024-12-03 16:08:55
  • 三星專利探索錶帶設計:易於佩戴,提升智慧手錶感測器監測準確性 | 2024-12-03 16:20:00
  • 獵鷹9號發射節奏是太空梭30倍 成本只有百分之一 | 2024-12-03 16:22:17
  • 新研發的導航系統可在GPS失效時利用古老技術繼續工作 | 2024-12-03 16:24:19
  • 改寫百年認知!神經元的基本形態,我們一直弄錯了? | 2024-12-03 16:24:22
  • 何愷明MIT開門弟子名單:奧賽雙料金牌得主、清華姚班學霸在列 | 2024-12-03 16:24:23
  • 1500萬元!浙工大一化工專案獲國家自然科學基金重大專案立項 | 2024-12-03 16:24:25
  • 海韻曝光RX 8800 XT功耗220W 傳已開始量產效能看齊4080 | 2024-12-03 16:29:07
  • 9999元 聯想ThinkPad T14s AI銳龍版上市:首發銳龍AI 7 PRO 360 | 2024-12-03 16:37:42
  • 哈佛研究:缺氧能延壽50%,中國科學家反對!還需另一關鍵輔助 | 2024-12-03 16:47:12
  • 我國新一代載人運載火箭、重型火箭研製工作有序推進 | 2024-12-03 16:47:16
  • 黑鯊鳳鳴頭戴式遊戲耳機“霜銀白”配色發售,229 元 | 2024-12-03 16:51:22
  • 小米推出米家迷你洗衣機洗烘 1kg,預售價 1999 元 | 2024-12-03 17:01:51
  • 榮耀平板 V9 外觀曝光:三款配色真機圖公佈,後蓋圓環亮眼 | 2024-12-03 17:12:57
  • 國產大飛機 C919 商業首航重慶,執飛東航“滬渝快線” | 2024-12-03 18:21:04
  • 小米推出米家熱泵烘乾機 10kg 超薄全嵌款,3599 元 | 2024-12-03 18:38:31
  • 聯想新品採用匯頂方案組合:含 YOGA Pad Pro 指紋、配件晶片等 | 2024-12-03 18:38:33
最近發布
突發!TVB知名女星毫無預警宣佈與未婚夫分手,結束長達八年情 面對被黑,蘭姐強勢迴歸。小菲狀態好轉,發宣告。更多內幕揭曉! 中國男籃決戰日本隊,首發五人曝光,廣東隊大贏家,徐傑第一後衛 孫穎莎奪女單冠軍!採訪謙遜立足拼,劉國樑給中國選手頒獎笑開花 分析 馬威交易取消後的影響:湖人還有什麼選擇?只能等休賽期? 火箭vs猛龍前瞻:範弗裡特有望復出戰舊主,火箭欲終結六連敗 梅西轟動宏都拉斯!當地媒體:這是世紀體育盛事! 登記開啟!金中、29中、13中等校動了! 開年暴擊!南京又一家機構跑路了? TechInsights:AI PC未能提振筆記本市場 2024年僅增長5% 睡覺時突然腿抽筋,就是缺鈣?錯!還有這4個原因,別輕易忽視了 泡泡瑪特又贏麻了!此前被調侃是“境內最大的博彩公司” 再也不用扎手指!5億糖尿病患者有福了 傳《尼爾:機械紀元》續作、新《古墓麗影》今年公佈 有工作經驗的畫素畫師如何寫簡歷? 離譜!Xun被搶3條龍,JDG仍然獲勝!Peyz力挽狂瀾,WBG痛失好局 將耗死在國際空間站?59歲美滯留女宇航員求救:喪失重要身體機能 華為FreeClip耳機玫瑰金開售 開放式聆聽設計 CBA俱樂部杯-山西淘汰北控晉級4強 原帥18分 小紅書上移民的中產:曾經北京七套房, 羨慕海外一張床, 如今卻...... 不可抗力停課2天以上退一半保教費,佛山幼兒園收費新規釋出 紅棉襯醉美,2020番順醉美青餅評測 華為FreeClip耳夾耳機玫瑰金配色開售:1299元 64歲寧波老闆,跨界無數次,給員工發8億,即將擁有第三家IPO? 卡友資訊股東持股情況變動 廣州“城市合夥人”:城市與人才的雙向奔赴 有人說孫穎莎粉絲是飯圈文化的時候 卻有些人用真金白銀愛孫穎莎! 男生剪“短髮”髮型乾淨利落,試試這3款,剪完帥氣提升顏值! 7個臀部訓練最佳動作,打造迷人的蜜桃臀! 偉大的4-2!林詩棟奪冠:新科世界第1誕生、超越王楚欽,狂攬3冠 新疆完美了!新小外強於皮特森+黑根斯,承認補強大外良性競爭! 林詩棟奪男單冠軍!採訪大談不容易太謙遜,單獨拍照露出笑容! 國乒最新戰報!林詩棟第2局11-8,衝3冠王,梁靖崑救2局點仍輸球 替補奇兵!快船大將5記3分助隊贏球 哈登好幫手 爆冷!北控男籃吊打奪冠大熱門球隊,外援決定比賽的走向 官宣離任,胡明軒宣佈重要決定,廣東宏遠遺憾,杜鋒祝福 又一個賈德松!崔康熙看人很準,魯媒:卡約又要錯過中國聯賽了 劉國樑憔悴!黑眼圈很重,擋住蒯曼被提醒,孫穎莎王楚欽被裁判整 林詩棟逆轉梁靖崑奪冠,成就三冠王,綜合實力更加突出 CBA最新外援註冊資訊,遼籃4人,新疆補充新援,廣東男籃放棄萊斯 大滿貫收官獎金排名:林詩棟三冠60萬第1,孫穎莎第2王曼昱10萬第9 臺灣律師分析大S遺產劃分,S媽要錢得看汪小菲臉色,打臉光頭安排 臺媒曝大S家人鬆手,讓出撫養權給汪小菲,希望馬筱梅善待孩子 二線白酒暴雷,狼真的來了! 搭上比亞迪,自動駕駛獨角獸,利潤大增170%! 炸裂!外資吹響“加倉中國”集結號背後:科技格局重塑與資產重估 這波夢幻西遊副本積分兌換真是血虧,四賜福的山賊值得買嗎? 《星戰亡命之徒》高階美工又回到CDPR 開發《巫師4》 《哪吒2》登陸北美,首映禮現好萊塢!有觀眾哭花眼妝:特效超預期,買票靠搶 曝張蘭被封年損失近4億,麻六記絕地自救太壯觀,員工曬張蘭近況

©2024 時時頭條 版權所有

隱私政策 | 服務條款 | 聯繫我們