计算语言学

维基百科,自由的百科全书
跳转至: 导航搜索
語言學
理論語言學
應用語言學
其他

計算語言學computational linguistics)是一門跨學科的研究領域,試圖找出自然語言的規律,建立運算模型,最終讓電腦能夠像人類般分析,理解和處理自然語言。

過去,計算語言學的研究一般由專門負責利用電腦處理自然語言的電腦學家進行。由於近年的研究顯示人類語言是超乎想像的複雜,現在的計算語言學研究多由來自不同學科的專家共同進行。一般來說,研究隊伍的成員有電腦學家、語言學家、語言專家(熟悉有關研究項目所要處理的語言的人),以至研究人工智能認知心理學數學邏輯學等的專家。

起源[编辑]

計算語言學始於一九五零年代的美國,是人工智能研究的開端。當時,美國希望能夠利用運算又快又準確的電腦,將大量外語材料瞬間翻譯成英語;研究重點特別放在翻譯俄文寫成的科學技術刊物上,以窺探蘇聯的科技發展。[1]

應用[编辑]

語音合成、語音識別[编辑]

主要包括以下几个方面:语音编码(speech coding)、语音识别(speech recognition)、语种识别(language identification)、说话人识别(speaker recognition)或说话人确认(speaker verification)、语义理解(semantics understanding)、语音合成(speech synthesis)等。

在人机交互过程中,经常用到语音识别技术和语音合成技术。

信息检索[编辑]

信息抽取[编辑]

问答系统[编辑]

机器翻译[编辑]

机器翻译的主要方法包括规则机器翻译实例机器翻译统计机器翻译

參考資料[编辑]

  1. ^ John Hutchins. Retrospect and prospect in computer-based translation. 1999-09-17 [2008-07-04] (英文). 

参見[编辑]

相關鏈結[编辑]