跳至內容

語音產生裝置

本頁使用了標題或全文手工轉換
維基百科,自由的百科全書
斯蒂芬·霍金,物理學家和SGD用戶

語音生成裝置(英語:Speech-generating devices縮寫SGDs),也被稱為聲音輸出通訊輔助裝置 ,是一種電子輔助和替代通訊 (AAC)系統。為有語言障礙的人補充、代替言語或書寫,使他們能夠口頭傳達他們的需求。 [1] 對於那些有語言溝通障礙的人來說,SGDs是很重要的。因為這個系統讓每個人在溝通互動上成為積極的參與者。語音生成裝置對於肌萎縮性側索硬化症(ALS)的患者特別有幫助,但最近已被用於協助預測性語音不足的兒童。 [2]

SGDs有多個輸入和顯示方法,給予不同類型的語言障礙者使用。有些SGDs提供許多的符號頁面來因應大量的言語訊息,因此隨着系統定位這些符號頁面時,一次僅能看到部分的符號。語音產生裝置可以產生透過錄製自然語音或語音合成的聲音,這種聲音或許帶有較少的情感訊息,但可以讓用戶表達豐富的語言訊息。 [3]

許多因素會引響系統內容、組織和SGD系統的詞彙更新,例如在用戶的需求,以及該裝置使用的情境。 [4] 透過技術的進步,改善現有的詞彙量和輸出語速是目前活躍的研究領域。用戶對詞彙的使用應當是有高度重要性,是經常適用,具有一定範圍的含義,並且是在功能務實。 [5]

存取裝置上訪問訊息有很多種方法:直接、間接地,或者使用專門的存取裝置,雖然特定的存取方式會依用戶的能力決定[1] 雖然速率增強策略可以增加輸出的用戶的速率,導致通訊的效率提高,語音生成系統輸出通常比語音慢得多。 [6]

第一個已知的SGD原型是在70年代中期,在硬件軟件開發進展迅速。這意味着SGD功能,現在可以整合到智能電話等裝置。SGDs的用戶包括著名的史蒂芬·霍金羅傑·埃伯特、 托尼Proudfoot、和皮特Frates(ALS的冰桶挑戰的創始人)。

語音產生系統可以是純粹為AAC開發的專用裝置,或者非專用裝置,如電腦運行的其他軟件,來使系統作為AAC裝置的電腦裝置。 [7] [8]

語音產生裝置的歷史

[編輯]
患者操作的選擇機制(POSM或POSSUM),在20世紀60年代初研發

SGDs早在電子通訊輔助根。第一個這樣的援助是命名於1960年在英國註冊由馬嶺原型病人操作的選擇技術(POSSUM)一小口和粉撲打字機控制器[9] [10] POSSUM通過一組發光的顯示器上的符號進行掃描 。 [9] 在1970年,荷蘭代爾夫特理工大學的研究人員創建的亮點操作打字機(LOT),它利用端點的小幅度移動在字元的矩陣,每個配備了光電電池來指向一個小光點。儘管在商業上不成功,LOT仍深受其用戶好評。 [11]

在70年代和80年代初,許多公司開始出現了成為後來SGDs的突出廠家。托比丘吉爾因腦炎而失去說話能力後, [12]於1973年創立托比丘吉爾有限公司, 在美國,Dynavox(當時稱為有情系統技術)的發起是出於卡內基-梅隆大學的學生專案,始於1982年,以幫助一名年輕腦癱女子腦性麻痺溝通的。 [13] 在20世紀80年代初期,技術改進導致語音溝通系統大大增加數目,產品多樣性,和可商購的通訊裝置效能,並縮小尺寸和降低價格。替代性的存取,如目標掃描(也稱為眼睛指向)校準用戶眼睛的移動直接引導SGD產生想表達的話語。用戶選則這種順序性地替代性存取掃描,已在通訊裝置中得以取得。 [10] [14] 語音輸出的可包括數碼的和合成的語音。 [10]

硬件軟件的開發進展迅速且繼續進行,其中包括由歐洲共同體資助的項目。第一個商用動態畫面的語音生成裝置是在20世紀90年代開發的。軟件程式被開發,使得以點腦為基礎的通訊面板得以研發 。 [10] [14] 正當提高存取性和系統能力時,高科技裝置繼續變得更小,更輕。 [14];通訊裝置可利用眼動追蹤系統,執行如同電腦做的文字處理網絡功能,並可作為獨立接入其他裝置,如電視,廣播和電話的環境控制裝置 。 [15]

著名的ACC用戶包括斯蒂芬·霍金羅傑艾伯特 [16] 托尼Proudfoot,和皮特Frates。由於ALS所引起的病發性殘疾,以及經過緊急性的氣管手術,霍金無法說話。氣管切開術 。從那獨特的語音合成裝置發出的聲音已經和他密不可分。 [17] 在過去的20年左右有語言缺陷的年輕的孩子使用SGD有所增加,如自閉症,唐氏綜合症,以及手術後的預期性腦部損傷。

在21世紀初開始,專家看到不僅SGDs在成人身上有好處,兒童也是。神經語言學家發現SGDs在幫助在腦部手術後歷經暫時性語言缺陷的ALS兒童時,同樣有效。特別是,數碼化的SGDs已被用作用於在恢復過程中的兒科患者。

存取方法

[編輯]

有許多方法可以存取話語訊息:直接,間接地,或專業化的存取裝置。直接存取方涉及與系統的物理接觸,透過使用鍵盤或觸控板。關於使用系統,從SGDs間接和通過個別裝置存取的用戶必須透過操縱感、游標、視覺指示器、光學指標、紅外線指示器或開關來使用掃描器 。 [1]

個別使用的方法將依賴於用戶的技巧和能力有所不同。直接選擇可用身體,指針,滑鼠 , 操縱桿 ,或眼動, [18]而開關控制掃描通常用於間接選擇。 [8] [19] 不同於直接選擇(例如,在鍵盤上打字,觸摸屏),當電子裝置的掃描指標(或光標)是所需的選項時,目標掃描的用戶只能在進行選擇。 那些無法使讓眼睛校準游標的用戶,用眼睛注視來指向和調整,選擇所需要的單詞和短語。掃描的速度和的圖案模式,以及選擇系統項目的方法,都是依用戶個別的生理條件、視覺或認知能力而設計。 [20]

資訊建設

[編輯]
Dasher的速度提升計劃的螢幕截圖

增進式和替代式溝通一般比語音慢很多, [6]用戶通常每分鐘生產8-10字。 [21] 速率增強策略可以增加輸出的用戶的速率,大約每分鐘增加12-15個詞語, [21]因此提高溝通的效率。

在任何SGD中可能有大量的聲音表現形式有利於促進效率和有效的溝通,包括問候,表達慾望,和詢問問題。 [22] 隨着用戶操縱各種網頁,SGDs有許多符號頁面來因應大量的聲音表達,因此一次只有部分的符號可在螢幕上看見。 [23] 語音產生裝置通常顯示一組使用選項: 一則使用動態變化的螢幕,或固定顯示的螢幕。 [24]

提高SGD溝通速率有兩個主要的方式:編碼和預測[6]

編碼讓用戶產生一個或兩個啟用他們的SGD的字,句子或短語。 [6] 標誌性的編碼策略,如結合的圖示(圖片符號)精簡語意產生的單詞或短語。 [25] 在數字,字母,數字,字母和編碼(也稱為縮寫擴展),單詞和句子被編碼為字母和數字序列。例如,鍵入「HH」或「G1」(用於問候1)可以得到「你好,你怎麼樣?「。 [25]

預測是一個速率的增強策略,通過預測的單詞或短語,試圖減少用的擊鍵次數。然後,用戶無需編寫整個單詞,就可以選擇正確的預測用詞。文字預測軟件會根據語言的使用頻率、與其他文字的關聯性、過去的使用或文法切合度來決定選字。 [6] [25] [26] 然而,用戶已表示靜態的鍵盤佈局比具有預測性的設計在每分鐘可以產生多個字(用掃描介面),這表明在使用掃描介面時,事先預示認知字詞的排列法已否定了預測性的介面。 [27]

一些像是聽覺科學的「聲音互動裝置」,結合編碼和預測到同一個系統中。例如,鍵入「HMF」可以是「你能不能幫我找到____」,然後預測功能可以幫助用戶完成句子,比如「你能不能幫我找到「我的眼鏡」?或者你能幫我找到「我的車鑰匙」?

另一種提升溝通效率是Dasher , [28]它使用語言模型和算術編碼來呈現螢幕上目標字母。這些字詞都是根據過去的使用歷史給予選擇。 [29] [30]

文字產生的速率大部分依賴系統裏的概念層次:TALK系統,以每分鐘60字的展示輸出,讓用戶選擇大量的句子。 [31]

固定和動態顯示​​裝置

[編輯]

固定顯示裝置

[編輯]
具有固定顯示器的語音產生裝置

固定顯示裝置是指那些在特定模板中符號和數據項都是固定的;一些來源稱為「靜態」顯示。 [32] 這樣的顯示裝置具有比一些其他裝置更簡單的學習曲線。

固定顯示複製了傳統低技術ACC的典型格局(低技術被定義為那些不需要電池,電或電子裝置),如通訊板。他們有共同的缺點;例如,它們常限制符號和訊息的數量。 [24] 要注意的是,隨着二十一世紀製造技術的進步,固定顯示SGDs已不再被廣泛使用。

動態顯示裝置

[編輯]

動態顯示裝置通常也是觸摸面板裝置。平板、TextSpeak Design, [33] Tobii技術與Word+。 [34]的裝置是最普遍使用的動態顯示裝置。當按下按鍵時,裝置通常會產生電子生產的視覺符號,改變一連串的顯示選擇。用戶可以利用頁面連結來選取單字或訊息所在的頁面,更改符號。動態顯示裝置的首頁可能會顯示與許多不同上下文或對話的主題符號。按任何一個符號能打開一個與該主題相關的螢幕頁面。 [24] 例如,看排球比賽的時候,用戶可以按「運動」符號打開與有關體育的訊息的頁面,然後按記分牌的符號,說出「比分是多少?」

動態顯示的語音發生裝置,能夠輸出兩個合成和數碼化語音的

動態顯示裝置的優點包括大量的詞彙可用性,並能透過句構看到句子[22]動態顯示裝置的進一步優點是,能提供對多樣的溝公平到,包括手機 , 短訊和電子郵件。 [35]林雪平大學的研究顯示,電子郵件寫作練習讓使用SGD的兒童開發新的社交技能,增加他們的社會參的能力。 [36]

輸出

[編輯]

SGD的輸出可以是數碼化的或合成的:數碼化語音是直接錄製字詞或語音;然而合成的語音是用文字語音錄製軟件錄製,帶有較少的情感訊息,但用戶能藉由打入新詞說出豐富的訊息。 [37] [38] 如今,每個用戶都使用了結合錄製的語音和文字語音技術的語音生成裝置。 [38] 然而,一些裝置僅能以一種類型的語音輸出。

數碼化語音

[編輯]
簡單開關操作:語音產生裝置

單詞,短語或整個訊息可以被數碼化,並儲存到用戶的播放裝置。 [1] 這個過程稱為語音儲存。 [39] 錄製化語音的優點包括: (1)給予聽話者自然的韻律和語音自然度。[3]例如,有相同的年齡和性別的AAC用戶的人可以被選來錄製聲音)。 [3](2)它提供了額外的聲音,這些聲音也是很重要的,像是笑聲或吹哨聲。此外,當語音失常患者失去說能力,數碼化SGDs為患者和家人提供一定程度的常態服務。

只使用錄音語音輸出的主要缺點是,用戶不能產創新的語音;它們僅限於使用預先錄製在裝置中的訊息。 [3] [40] 根據裝置的不同,錄音長度有可能會被限制。 [3] [40]

合成語音

[編輯]

SGDs運用合成語音和語言的語音規則的應用來把用戶的訊息翻譯成語音輸出。( 語音合成 )。 [1] [38] 用戶可以自由地創建新的詞和資訊,並且被那些已被預先記錄在他人裝置語音所限制。 [38]

智能電話和電腦已經透過應用程式的更新,增加合成語音的使用率。這應用程式讓用戶在清單中選擇已被當作話語說過的片語和訊息。相關應用程式,如Speak it!或是為iPhone提供的便宜的協助性表達裝置,讓用戶無需造訪醫生或學習使用專業機械。

合成SGDs可以使多樣的訊息產生變得個人化或相互整合:可以透過單一的字母、字詞、片陳述式子、圖片來產生。[1] [40] 透過合成語音,訊息除儲存能力便沒有限制,對於記憶空間的需求也沒這麼大。 [3]

合成語音引擎提供許多語言使用, [38] [40]引擎的參數,可以被用戶所操控。如說話速率、音調範圍、性別、重音分佈、停頓和發音異常。 [40]

編製程序

[編輯]
鍵盤文字到語音產生裝置

選擇字集和詞彙

[編輯]

SGD的選擇字集是集合了所有的訊息、符號和編碼。方便用戶的一種裝置。[38] 內容、組織和選擇字集的更新都是興新的研究領域。同時也受許多因素引響,包括用戶的能力,興趣和年齡。 [4] AAC系統的選擇字集可包括用戶尚未知道的詞語,這些字詞被歸類在「後續學習」 [4] 許多因素會引響系統內容、組織和SGD系統的詞彙更新,例如在用戶的需求,以及該裝置使用的情境。[4]

最初的內容選擇

[編輯]

研究人員Beukelman和Mirenda列出了一些對初始內容選擇可能的來源(如家庭成員,朋友,教師和護理人員)。廣大的資源需求,是因為需要,個人沒有經歷過任何特定情境會產生的所有語音表達。[4] 例如,家長和治療師可能不會想到邀加入俚語,如「 是嗎 。」 [41]

以前技術已經典型說話者會說的話語和ACC用戶在語音裝置上所產出的話語內容。如此的研發過程對於產生核心的話語集或語音表達是很好地的,但當特定的字詞需要用在特定情形時,就沒甚麼效率。(例如,用戶對騎馬有興趣,直接關連到騎馬相關的字詞。「邊緣詞彙」是指詞彙對個人的興趣或需要是特定、獨特的。開發邊緣詞彙的裝置典型的技術是: 進行與多個「話語人」採訪:兄弟姐妹,父母,老師,同事和其他相關人員[4]

其他研究人員,如Charlie Musselwhite同和聖路易斯表明初期的詞彙項目應該是用戶很感興趣的,經常使用,且有一系列的語意漢語用功能。 [5] 這些標準已被廣泛用於在AAC中,作為SGD的生態學性質檢驗。 [4]

自動化內容維護

[編輯]

Beukelman和Mirenda強調詞彙的選擇也包括正在進行的詞彙維護; [4]然而,維護AAC的困難是,用戶或他們的照顧者必須手動編制任何新的話語(例如新的朋友或個人的故事的名字),而且沒有自動添加內容的解決方案。 [21] 若干研究方法試圖克服這一困難, [42]相關議題從「推斷輸入」,如基於載入與用戶的朋友和家人的日誌談話產生的內容, [43]到互聯網採集到的數據、語言材料,如WebCrawler網絡。 [44] 而且,通過利用LIFELOG為基礎來更改的方法,裝置的內容可基於用戶發生在他們一天中的事件而改變。 [42] [45] 通過得到更多用戶的使用數據,更高質素的訊息可冒險從他人用戶的資料中生成。 [42] 例如,通過利用全球定位系統,裝置的內容可以基於地理位置而改變。 [46] [47]

倫理問題

[編輯]

最近開發的許多SGDs系統包括表現測量和分析工具 ,以幫忙監視由用戶使用的內容。這引起了人們對私隱的關注,有的認為,用戶使用的裝置應有讓用戶決定是否要在這樣的監控下使用。 [48] [49] 類似的考量是關於自動內容生成裝置提議, [45]私隱的議題日益成為SGD設計的考量因素。 [41] [50] 隨着AAC裝置被設計成為所有地區用戶所使用,有個攸關法律、社會和科技的議題,關注於個人資料和家庭的分配問題,這些問題在ACC的使用資料中都能被找到。個人資訊管理系統例如,SGDs必須設計出來,如此才能支援用戶有權刪除自動加入系統的對話或內容。 [51]

挑戰

[編輯]

動態生成語音裝置通常是由專業人士增進式的對話所完成的。專家必須迎合患者的需求,因為患者通常選擇他們想要什麼樣的詞/詞組。例如,使用患者根據自己的年齡,殘疾,興趣等。因此,內容的組織是非常耗時的。此外,SGDs很少是由醫療保險公司支付。因此,資金和人員的資源分配極有限。波士頓兒童醫院的約翰·科斯特洛博士極力在他的醫院或誇國醫院招集和募款,維持這些計劃的執行和良好的工作人員素質。

生產者

[編輯]

即便有幾個公司生產的軟件給與SGD運作的空間,SGDs的生產者相對少數,另外還有一些自製系統。專門裝置的生產商包括聽覺科學 ,Dynavox邁耶-約翰遜 ,LC科技 , Lingraphica頁面存檔備份,存於互聯網檔案館) ,Prentke Romich公司 , 薩爾蒂公司 , Talk To Me技術頁面存檔備份,存於互聯網檔案館) , 火星文設計 , [33] Tobii科技和Words+。 [34] 其他公司生產的軟件,像iPhone,iPad任天堂DS裝置也有SGDs系統。 [52]

參考文獻

[編輯]
  1. ^ 1.0 1.1 1.2 1.3 1.4 1.5 安泰公司(2010)
  2. ^ Blischak等人(2003)
  3. ^ 3.0 3.1 3.2 3.3 3.4 3.5 Glennen&Decoste第88-90
  4. ^ 4.0 4.1 4.2 4.3 4.4 4.5 4.6 4.7 Beukelman&Mirenda,第2章
  5. ^ 5.0 5.1 Charlie Musselwhite同路易-
  6. ^ 6.0 6.1 6.2 6.3 6.4 華盛頓大學
  7. ^ Glennen,第62-63頁。
  8. ^ 8.0 8.1 JANS和克拉克(1998),頁37-38。 參照錯誤:帶有name屬性「jansclark1998」的<ref>標籤用不同內容定義了多次
  9. ^ 9.0 9.1 Vanderheide(2002)
  10. ^ 10.0 10.1 10.2 10.3 Zangari(1994)
  11. ^ [15] ^ Stassen的等人 ,第127頁
  12. ^ 托比丘吉爾(簡介)
  13. ^ Dynavox(公司歷史)
  14. ^ 14.0 14.1 14.2 烏爾卡德(2004)。
  15. ^ Robitaille,第151-153。
  16. ^ 芝加哥太陽時報(2009年)
  17. ^ 斯蒂芬·霍金和ALS
  18. ^ Mathy(2000)
  19. ^ Glennen&Decoste 62-63頁
  20. ^ Beukelman&Mirenda,第97-101
  21. ^ 21.0 21.1 21.2 希金波坦等人(2007)
  22. ^ 22.0 22.1 Beukelman&Mirenda
  23. ^ 霍克斯坦等人(2004)
  24. ^ 24.0 24.1 24.2 Beukelman&Mirenda頁。 84-85
  25. ^ 25.0 25.1 25.2 文卡塔吉裏(1995年)
  26. ^ 強化的交流,成立
  27. ^ Johansen等人(2003)
  28. ^ Ward等人(2000)
  29. ^ 洛克等人(2010)
  30. ^ 麥基(2003),第119頁
  31. ^ 托德曼(2000)
  32. ^ 霍克斯坦等人(2003)
  33. ^ 33.0 33.1 www.textspeak.com
  34. ^ 34.0 34.1 www.infinitec.org
  35. ^ Dynavox在www.speechbubble.org.uk
  36. ^ Sundqvist&Rönnberg(2010)
  37. ^ 施洛瑟,Blischak&Koul(2003年)
  38. ^ 38.0 38.1 38.2 38.3 38.4 38.5 Beukelman&Mirenda頁。 105-106 參照錯誤:帶有name屬性「beu」的<ref>標籤用不同內容定義了多次
  39. ^ Beukelman&Mirenda,第105。
  40. ^ 40.0 40.1 40.2 40.3 40.4 拉多姆斯基等人(2007)
  41. ^ 41.0 41.1 @article {wickenden2011whose, 標題= {是誰的聲音?:問題和殘疾人青少年使用輔助和替代通訊(AAC)生活的民族志研究}, 筆者= {Wickenden,M}, 雜誌= {殘疾研究季刊}, 音量 數量: 學年 }
  42. ^ 42.0 42.1 42.2 Reddington主及Tintarev(2011)
  43. ^ 阿什拉夫等。(2002)
  44. ^ Luo等人(2007)
  45. ^ 45.0 45.1 Black等(2010)
  46. ^ Dominowska等
  47. ^ 帕特爾與拉達克里希南
  48. ^ Beukelman&Mirenda,第三十
  49. ^ 黑石等。(2002)
  50. ^ Rackensperger等。(2005)
  51. ^ Reddington主與科爾斯-坎普(2011)
  52. ^ www.cbsphily.com

傳記

[編輯]