時時頭條
  • 娛樂
  • 體育
  • 財經
  • 科技
  • 旅遊
  • 軍事
  • 育兒
  • 時尚
  • 遊戲
  • 歷史
  1. 首頁
  2. 科技

AI又一突破!“眼神打字”更快更省力,研究登上Nature子刊

2024-11-25 09:52:55

因漸凍症(ALS)等病症而無法言語或打字的人群不容忽視,他們在日常溝通交流中面臨著巨大障礙,急需有效的輔助手段來打破溝通壁壘。

儘管輔助性/替代性溝通(AAC)裝置及眼動打字技術雖能提供一定支援,但頻繁的按鍵操作極易導致眼疲勞和時間成本,嚴重阻礙了運動障礙患者進行自然流暢的對話以及充分表達自我,進而影響生活質量。

為解決這一問題,來自谷歌的研究團隊及其合作者開發了一個由大語言模型(LLM)驅動的使用者介面(UI)——SpeakFaster。

據介紹,SpeakFaster 利用經過微調的 LLM 和會話語境,能以極高的準確率將高度縮略的英文文字(僅為單詞首字母,必要時還會新增字母和單詞)擴充套件為所需的完整短語,幫助 ALS 患者眼動打字按鍵次數減少了 57%,文字輸入速度比 baseline 提高了 29-60%。

影片|SpeakFaster UI 的截圖顯示。該介面允許使用者輸入縮寫文字,並使用對話上下文以完整句子形式建議答覆。

相關研究論文以“Using large language models to accelerate communication for eye gaze typing users with ALS” 為題,已發表在 Nature 子刊 Nature Communications 上。

這些結果表明,透過大幅提高文字輸入速度並減少身體壓力,SpeakFaster 可以幫助嚴重運動障礙患者更準確、更高效地交流,使他們能夠更充分地參與對話,從而提高獨立性、社會參與度、自我表達能力和生活質量。

讓漸凍症患者更好地溝通

SpeakFaster 提供了一種基於人工智慧(AI)的方法,將 LLM 與專為縮寫文字輸入而設計的 UI 結合。

具體而言,研究團隊首先對 SpeakFaster 的 UI 進行了設計,從而確保其允許輕鬆輸入和最佳化縮寫,保證使用者始終能夠傳達他們想要的資訊,即使初始預測不是他們想要的。

他們此前證明,經過微調的 LaMDA(64B引數)可以將單詞首字母形式的縮寫(例如“ishpitb”)擴充套件為完整短語(例如“I saw him play in the bed”),在提供對話上下文(即另一位說話者的輪次)時,準確率高達 77%。無法找到精確匹配的情況往往發生在更長、更復雜的短語上。

圖|SpeakFaster UI 中縮寫文字輸入的主要互動途徑:僅首字母路徑。

雖然很有希望,但實際的解決方案需要確保使用者在初始縮寫擴充套件(AE)失敗的情況下能夠隨後輸入任何任意的短語,即使用者在 UI 中永遠不會遇到“死衚衕”。因此,他們開發了一個 UI 和兩個底層微調的 LLM,作為完整、實用的解決方案。

其中,KeywordAE 能夠擴充套件混合首字母和完整或部分拼寫單詞的縮寫。KeywordAE 模型還能夠擴充套件僅由首字母組成的縮寫,因此提供了此前他們工作功能的超集。

圖|KeywordAE UI 途徑。

FillMask 則能夠在周圍單詞的上下文中提供以給定首字母開頭的備選單詞。兩個模型均使用從四個公共英語對話資料集中合成的大約 180 萬個獨特的三元組 {上下文、縮寫、完整短語} 進行微調。

圖|FillMask UI 路徑。

為了形成通往微調 LLM 的通道,他們還設計了一個具有三個路徑的 UI,即 Initials-only AE、KeywordAE 和 FillMask,以支援完整的縮寫文字輸入體驗。

Initials-only AE 是 SpeakFaster UI 中所有短語輸入工作流程的共同起點。在三個路徑中,它涉及的按鍵和眼動點選次數最少,僅首字母路徑就足以滿足簡短和可預測的短語。當用戶輸入縮寫時,UI 在每個按鍵後自動觸發對 KeywordAE LLM 的呼叫,包括使用者鍵入的縮寫以及所有之前的對話輪次作為 LLM 的輸入。每個呼叫返回基於對話上下文和縮寫的 top-5 最有可能的選項,這些選項在 UI 中呈現給使用者瀏覽和選擇。

如果透過僅首字母路徑沒有找到預期短語,那麼 SpeakFaster UI 提供了兩種替代 UI 路徑來幫助使用者找到預期短語。

第一種替代 UI 路徑是 KeywordAE,允許使用者拼寫多個單詞。每次按鍵後都會自動觸發對 KeywordAE 的呼叫,而每次呼叫後,UI 將呈現 KeywordAE LLM 返回的最新 top-5 短語擴充套件。

第二種替代 UI 路徑是 FillMask,這是從找不到精確預期短語的失敗中恢復的另一種方法。與 KeywordAE 不同,FillMask 僅適用於擴充套件中的非常少(通常是單個單詞)單詞不正確的情況。

KeywordAE 和 FillMask 是兩種替代互動模式,用於從透過僅首字母路徑無法獲得預期短語中恢復。在當前研究中,SpeakFaster UI 允許使用者在使用 KeywordAE 模式後使用 FillMask 模式,這對於在難以預測的短語中找到正確的單詞很有用。

圖|由 KeywordAE 和 FillMask 輔助的短語輸入模擬策略。

這樣一來,當使用 SpeakFaster 時,使用者首先輸入他們想要的短語中單詞的首字母。然後,經過微調的 LLM 會預測整個短語,並根據這些首字母和對話上下文顯示最可能的短語。如果所需短語不在選項中,使用者可以透過拼出關鍵詞或選擇替代詞來最佳化預測。這種方法大大減少了所需的按鍵次數,從而加快了溝通速度。

之後,為評估 SpeakFaster UI 介面節省使用者操作動作的大致上限,研究團隊開展了模擬實驗。他們使用 Turk Dialogues 語料庫,模擬了三種不同的使用者互動策略:

策略 1:使用首字母縮寫進行 AE,如果失敗則使用 KeywordAE 進行迭代拼寫,直到找到匹配的短語。

策略 2:與 Strategy 1 相同,但每當最佳匹配短語候選詞中只剩下一個錯誤單詞時,就使用 FillMask 進行替換。

策略 2A:Strategy 2 的變體,更積極地使用 FillMask,即在最佳選項中剩下兩個或更少的錯誤單詞時立即使用。

與 Gboard 的預測 baseline 相比,SpeakFaster 在三種策略下都實現了顯著的按鍵節省。在 Strategy 2 下,使用 KeywordAE v2 模型,SpeakFaster 實現了 0.657 的按鍵節省率(KSR),比 Gboard 的 KSR(0.482) 高出 36%。這表明,利用 LLM 的上下文感知能力和 FillMask 的詞替換功能,可以在很大程度上提高文字輸入效率。

模擬結果還表明,SpeakFaster 在提供 5 個最佳短語選項的情況下表現最佳,並且對話上下文對於 LLM 的預測能力至關重要。

圖|模擬實驗結果表明,SpeakFaster UI 可大幅節省按鍵。

除了模擬實驗外,研究團隊還進行了使用者研究,從而測試 SpeakFaster 的有效性。

研究團隊測量了動作節省(與要輸入的完整字符集相比節省的按鍵次數)、實用性(每分鐘的打字速度)和 SpeakFaster UI 的可學習性(人們需要多少練習才能習慣使用該系統)這三個指標以評估 SpeakFaster 介面。

在運動節省指標方面,與傳統 baseline 相比,SpeakFaster 為 ALS 眼動使用者和非 AAC 參與者提供了大量按鍵動作節省。對於非 AAC 使用者,SpeakFaster 在指令碼場景中可實現 56% 的按鍵節省,在非指令碼場景中可實現 45% 的按鍵節省。對於 ALS 眼動使用者,SpeakFaster 還在指令碼階段顯著節省了按鍵。

圖|左圖:非 AAC 使用者的KSR。右圖:ALS 眼動使用者的 KSR。橙色和紫色條顯示使用 SpeakFaster 系統時的 KSR,藍色和綠色條顯示使用 baseline 智慧鍵盤時的 KSR。

在實用性指標方面,對於非 AAC 使用者來說,整體文字輸入速度與傳統打字速度相當。然而,在針對一位 ALS 眼動使用者的實驗室研究顯示,SpeakFaster 使指令碼階段的打字速度提高了 61.3%,非指令碼階段的打字速度提高了 46.4%。

圖|左圖:對於非 AAC 使用者,指令碼階段和非指令碼階段的整體文字輸入速度沒有出現顯著變化。右圖:對於 ALS 眼動使用者,SpeakFaster 顯著提高了指令碼階段和非指令碼階段的速度。

除了節省動作和提升打字速度外,學習曲線和所引入的認知負荷也是評估打字系統和UI的關鍵指標。雖然與非 AAC 使用者相比,ALS 眼動使用者在使用 SpeakFaster 時最初的學習曲線略慢,但只需 15 個練習對話,ALS 眼動使用者就能達到舒適的打字速度。

圖|透過為非 AAC 使用者提供 6 個練習對話和為 ALS 眼動使用者提供 15 個練習對話,參與者能夠學習 SpeakFaster 系統達到每分鐘 20-30 個單詞的舒適打字速度(顯示在 y 軸上)。

雖然各項實驗表明 SpeakFaster 幫助嚴重運動障礙患者實習高效交流方面具有獨特優勢,但目前該研究還存在有模型語言單一、短語長度受限、服務成本高昂以及研究樣本量較少等侷限。

AI 正在改善殘障人士生活

SpeakFaster 並非首個致力於改善殘障人士生活的 AI 專案。

2019 年,BrightSign 推出了一款基於 AI 的智慧手套。該手套內建預定義手語庫,能將手勢轉化為語音,結合機器學習演算法,可讓讓聽力或語言障礙者雙向交流、獨立與他人直接溝通,行動受限者如中風患者或聽力喪失老人也可使用。

2021 年,加州大學舊金山分校 Chang Lab 團隊首次用腦機介面幫助一位癱瘓超過 15 年的失語男子 BRAVO1 恢復了“說話”能力。該研究透過在被試者大腦內植入電極的深度神經讀取技術幫助被試者實現腦與裝置的資訊交換,從而恢復其與世界溝通的能力。()

2024 年,OpenAI 推出了 Voice Engine 模型的小規模預覽成果。該模型使用文字輸入和單個 15 秒音訊樣本來生成與原始說話者非常相似的自然語音,已經幫助一名因血管性腦腫瘤而失去流利語言能力的年輕患者恢復聲音。

2024 年,北卡羅來納州立大學與北卡羅來納大學教堂山分校的蘇浩教授團隊提出了一種在計算機模擬環境中透過強化學習來讓機器人學習控制策略的新方法,有望極大地提高老年人,行動障礙人士和殘疾人的生活質量。

相信在不久的將來,AI 將進一步改善殘障人士的生活。

對此,你怎麼看?歡迎在評論區留言。

作者:阮文韻

如需轉載或投稿,請直接在公眾號內留言

熱門資訊
  • 微軟釋出英特爾CPU版Surface Pro 11/Laptop 7、USB 4 擴充套件塢 | 2025-01-30 23:30:56
  • 2999元 宏碁推出新款27寸顯示器:2K QD-OLED屏 | 2025-01-30 23:30:59
  • 九州風神CH260機箱首發399元起:前面板支援畫素顆粒拼裝 | 2025-01-31 00:04:05
  • Nature子刊:浙江大學蘇文靜/謝偉團隊揭示質膜相關ARAF凝聚體促進RAS相關癌症耐藥性 | 2025-01-31 00:07:21
  • 經典的紅黑配色!耕升RTX 5080追風OC顯示卡圖賞 | 2025-01-31 00:38:27
  • 幾何秩序美!索泰RTX 5080 16GB SOLID OC顯示卡圖賞 | 2025-01-31 01:11:51
  • 微軟釋出新一代Surface USB4擴充套件塢 以更少的成本帶來豐富的介面 | 2025-01-31 03:13:36
  • 微軟釋出基於Intel處理器的Surface Pro 11和Surface Laptop 7 | 2025-01-31 03:18:44
  • 剛剛!DeepSeek,突驚美軍! | 2025-01-31 03:41:18
  • 突破只待時日!最具潛力的下一代電池,程序不斷提速 | 2025-01-31 03:43:58
  • 揭牌!中國科學院煙臺海岸帶研究所煙臺市海洋生態環境核安全保障重點實驗室啟動 | 2025-01-31 03:44:00
  • 羅技推出隱形辦公空間監控裝置 Logitech Spot | 2025-01-31 03:55:47
  • 美國被困宇航員想回家!特朗普:已指示採取行動,但一切存在變數 | 2025-01-31 04:01:07
  • 中國科學家用兩隻雄性小鼠“創造”下一代,已存活至成年 | 2025-01-31 04:01:09
  • NASA噴氣推進實驗室(JPL)2025年任務彙總 | 2025-01-31 04:11:48
  • 長江儲存已出貨DDR5-6000套件中的16奈米G4 DDR5 DRAM | 2025-01-31 04:11:50
  • 喜訊!上海交通大學海南研究院海鈴團隊首次在南海觀測到大氣繆子訊號!2024年共完成兩次海試 | 2025-01-31 04:55:56
  • 多國設限,如此圍堵中國,豬都能笑醒! | 2025-01-31 05:06:00
  • 15篇!中國學者2024年Nature Immunology論文發表彙總 | 2025-01-31 05:11:37
  • 突傳噩耗!諾貝爾化學獎得主逝世,享年94歲! | 2025-01-31 05:12:32
  • 打電話也要“以舊換新”了?——5G新通話瞭解下 | 2025-01-31 05:14:25
  • 滯留太空的美宇航員進行太空行走,預計持續約6.5小時 | 2025-01-31 06:16:59
  • 長江儲存開始出貨294層第五代NAND快閃記憶體 | 2025-01-31 06:44:06
  • 運營商財經網康釗:美國連閹割版英偉達晶片都不想賣給中國? | 2025-01-31 06:44:07
  • 北京大學姜輝團隊ACS Nano:生物可降解塑膠聚乳酸可侵入精子,誘導生殖毒性 | 2025-01-31 06:44:11
  • 口述|新年展望二:醫生、科學家最關注的科學突破 | 2025-01-31 07:14:24
  • 山西農業大學副教授以第一作者身份在JCR一區Top期刊(IF5y=6.2)上發表研究成果 | 2025-01-31 07:34:36
  • 罕見,這篇頂刊Matter,所有作者,均用中文署名! | 2025-01-31 08:04:11
  • 科學家開發單穩態結構軟體機器魚,以每秒6.8倍體長速度高速遊動 | 2025-01-31 08:31:46
  • 重大突破!北京林業大學在《Cell》旗下著名期刊發表研究成果 | 2025-01-31 08:31:47
最近發布
突發!TVB知名女星毫無預警宣佈與未婚夫分手,結束長達八年情 面對被黑,蘭姐強勢迴歸。小菲狀態好轉,發宣告。更多內幕揭曉! 中國男籃決戰日本隊,首發五人曝光,廣東隊大贏家,徐傑第一後衛 孫穎莎奪女單冠軍!採訪謙遜立足拼,劉國樑給中國選手頒獎笑開花 分析 馬威交易取消後的影響:湖人還有什麼選擇?只能等休賽期? 火箭vs猛龍前瞻:範弗裡特有望復出戰舊主,火箭欲終結六連敗 梅西轟動宏都拉斯!當地媒體:這是世紀體育盛事! 登記開啟!金中、29中、13中等校動了! 開年暴擊!南京又一家機構跑路了? TechInsights:AI PC未能提振筆記本市場 2024年僅增長5% 睡覺時突然腿抽筋,就是缺鈣?錯!還有這4個原因,別輕易忽視了 泡泡瑪特又贏麻了!此前被調侃是“境內最大的博彩公司” 再也不用扎手指!5億糖尿病患者有福了 傳《尼爾:機械紀元》續作、新《古墓麗影》今年公佈 有工作經驗的畫素畫師如何寫簡歷? 離譜!Xun被搶3條龍,JDG仍然獲勝!Peyz力挽狂瀾,WBG痛失好局 將耗死在國際空間站?59歲美滯留女宇航員求救:喪失重要身體機能 華為FreeClip耳機玫瑰金開售 開放式聆聽設計 CBA俱樂部杯-山西淘汰北控晉級4強 原帥18分 小紅書上移民的中產:曾經北京七套房, 羨慕海外一張床, 如今卻...... 不可抗力停課2天以上退一半保教費,佛山幼兒園收費新規釋出 紅棉襯醉美,2020番順醉美青餅評測 華為FreeClip耳夾耳機玫瑰金配色開售:1299元 64歲寧波老闆,跨界無數次,給員工發8億,即將擁有第三家IPO? 卡友資訊股東持股情況變動 廣州“城市合夥人”:城市與人才的雙向奔赴 有人說孫穎莎粉絲是飯圈文化的時候 卻有些人用真金白銀愛孫穎莎! 男生剪“短髮”髮型乾淨利落,試試這3款,剪完帥氣提升顏值! 7個臀部訓練最佳動作,打造迷人的蜜桃臀! 偉大的4-2!林詩棟奪冠:新科世界第1誕生、超越王楚欽,狂攬3冠 新疆完美了!新小外強於皮特森+黑根斯,承認補強大外良性競爭! 林詩棟奪男單冠軍!採訪大談不容易太謙遜,單獨拍照露出笑容! 國乒最新戰報!林詩棟第2局11-8,衝3冠王,梁靖崑救2局點仍輸球 替補奇兵!快船大將5記3分助隊贏球 哈登好幫手 爆冷!北控男籃吊打奪冠大熱門球隊,外援決定比賽的走向 官宣離任,胡明軒宣佈重要決定,廣東宏遠遺憾,杜鋒祝福 又一個賈德松!崔康熙看人很準,魯媒:卡約又要錯過中國聯賽了 劉國樑憔悴!黑眼圈很重,擋住蒯曼被提醒,孫穎莎王楚欽被裁判整 林詩棟逆轉梁靖崑奪冠,成就三冠王,綜合實力更加突出 CBA最新外援註冊資訊,遼籃4人,新疆補充新援,廣東男籃放棄萊斯 大滿貫收官獎金排名:林詩棟三冠60萬第1,孫穎莎第2王曼昱10萬第9 臺灣律師分析大S遺產劃分,S媽要錢得看汪小菲臉色,打臉光頭安排 臺媒曝大S家人鬆手,讓出撫養權給汪小菲,希望馬筱梅善待孩子 二線白酒暴雷,狼真的來了! 搭上比亞迪,自動駕駛獨角獸,利潤大增170%! 炸裂!外資吹響“加倉中國”集結號背後:科技格局重塑與資產重估 這波夢幻西遊副本積分兌換真是血虧,四賜福的山賊值得買嗎? 《星戰亡命之徒》高階美工又回到CDPR 開發《巫師4》 《哪吒2》登陸北美,首映禮現好萊塢!有觀眾哭花眼妝:特效超預期,買票靠搶 曝張蘭被封年損失近4億,麻六記絕地自救太壯觀,員工曬張蘭近況

©2024 時時頭條 版權所有

隱私政策 | 服務條款 | 聯繫我們