跳至內容

媒介語

維基百科,自由的百科全書

所謂媒介語,是指為了機器翻譯的需要,人工所創造出來的一種提供在不同語言之間交流用的算法。

媒介語示意圖

對媒介語的要求,是國際交流頻繁的情況下,機器翻譯向多語種發展的一種需求。例如,沒有媒介語,那麼在四種語言之間互譯就需要12種算法。而使用媒介語則4種語言互譯只需要8種算法。這樣對於機器翻譯來說簡單了許多。

充當媒介語的語言

[編輯]

有些語言學家主張使用一種自然語言作為媒介語,但是每種語言都有許多各自特殊的規則和例外,很難將他讓機器容易認讀。又有主張使用人工語言,但是人工語言過多的效仿自然語言,因此作為媒介語也不適合。

媒介語也有詞彙語法,這些語法規則是以自然語言為基礎的,但是只能包括最常用的規則和詞彙。媒介語的每個詞表示一個單一而且精確的意義,句子則是表示確定意義的詞的綜合。

另一方面,計算語言學的專家一般認為,建立一個語意資料庫反而是一個更可行的辦法。因為無論任何一種語言,都至少有一個詞語帶有歧義。而若要建立一個數學上整全的翻譯系統,唯一的方法是對每一個詞語建立一個獨有的定義,這樣,轉換才能變得順暢。因此,相對於設立一個媒介語,更好的辦法應該是建立一個語意資料庫。

這一種理論,在語言學界引來反對的意見,特別是語文教育工作者。根據現代的語文教育理論,沒有兩種語言是完全對等的。因此,假若語意資料庫可以完全解決翻譯的問題,那這個資料庫一定會超級龐大,用以記載每一個字詞在語法和語意上的不同意義。若這個資料庫所記錄的將會是世界上所有的語言,那恐怕現時沒有甚麼方法可以有效記載這種種資料。