
這張由加州大學舊金山分校和加州大學伯克利分校的研究人員提供的照片顯示了 2023 年在加州的言語神經假體研究參與者Ann。(Noah Berger/加州大學舊金山分校、加州大學伯克利分校通過美聯社)
科學家研製出了一種裝置,可以實時將言語思考轉化為口頭語言。儘管這仍處於實驗階段,但他們希望腦機接口有朝一日能夠幫助那些無法說話的人發出聲音。
據美聯社報道,一項新研究描述了在一名 47 歲四肢癱瘓的加拿大薩斯喀徹溫女子Ann身上測試該設備的情況。
2005 年,Ann剛滿 30 歲,中風導緻她癱瘓,無法說話。當時,她是裏賈納路德學院的數學和體育老師,她在中風後 18 年內無法說話。作為臨床試驗的一部分,醫生在手術中將該設備植入她的大腦。
它“將她說話的意圖轉化為流暢的句子”,這項研究的共同作者戈帕拉·阿努曼奇帕利 (Gopala Anumanchipalli) 說,這項研究發表在周一的《自然神經科學》雜誌上。
其他用於語音的腦機接口 (BCI) 通常在句子的思考和計算機的言語表達之間有輕微的延遲。研究人員表示,這種延遲可能會擾亂對話的自然流暢,從而可能導緻溝通不暢和沮喪。
堪薩斯大學語言與應用神經科學實驗室的喬納森·布魯姆伯格 (Jonathan Brumberg) 表示,這是“我們領域的一個相當大的進步”,但他並未參與這項研究。
加州的一個團隊使用電極記錄了這名女性在大腦中默念句子時的大腦活動。科學家們使用合成器,根據她受傷前的聲音製作了合成器,創造出了她會說的語音。他們訓練了一個人工智能模型,將神經活動轉化為聲音單位。
加州大學伯克利分校的阿努曼奇帕利說,它的工作原理與現有的用於實時轉錄會議或電話的系統類似。
植入物本身位於大腦的語言中心,因此它可以監聽,並將這些信號翻譯成組成句子的語音片段。這是一種“流式傳輸方法”,阿努曼奇帕利說,每 80 毫秒的語音片段(大約半個音節)都會被發送到錄音機中。
“它不會等待句子結束,”阿努曼奇帕利說。“它會即時處理句子。”
布魯姆伯格表示,快速解碼語音有可能跟上自然語音的快節奏。他補充說,使用語音樣本“將是語音自然度的一個重大進步”。
儘管這項研究的部分資金來自美國國立衛生研究院,但阿努曼奇帕利表示,這項研究並未受到最近美國國立衛生研究院研究經費削減的影響。他表示,這項技術還需要進行更多研究才能廣泛應用,但隻要“持續投入”,十年內患者就有可能受益於這項技術。