自然语言理解
自然语言理解是研究如何让电脑理解自然语言的一门技术,是自然语言处理技术中最困难的一项。一般来说,是将自然语言转换成一种形式化的表示结构。
研究问题
[编辑]- What?:何谓理解?
- How?:电脑如何能理解人类语言。
- When?:电脑了解到何种程度才算理解。
- Where?:自然语言如何转换成电脑可理解的结构,如何储存。
- Why?:电脑真的能理解吗?为何能、为何不能。
范畴与脉络
[编辑]自然语言理解这个概括的术语,适用于多样的电脑应用,从小型、相对简单之事,例如发给机器人的简短命令,到高度复杂的任务,例如完全读懂报纸新闻或理解一段诗。许多真实世界的运用介于两个极端之间,例如文本分类用于自动分析电邮,并且将其转发至公司适合的部门,并不需要深切理解文本[1],但是比起结构固定的资料库之查询,要处理的词汇以及句法更广更多样。
自然语言理解系统设定的目标深度与广度,决定其复杂度(连带隐含的挑战)与处理的应用类型。系统的广度以其词汇及文法的多寡来衡量;系统的深度以其相对于母语人士的理解程度来衡量。“近似英语”指令的翻译程式属于最窄浅的一种,但处理的应用也少。狭窄但深入的系统探究并模拟理解的机制[2],但应用范围仍然有限。超越简单关键字对比的文件内容理解系统,例如判断新闻稿是否适合某读者,属于比较宽广的系统,也算复杂[3],但是仍然有些浅薄。既广且深的系统,现今的尖端技术仍无法达成。
元件与系统结构
[编辑]无论什么手法,多数自然语言理解系统包含一些共同的元件。系统需要其语言的词汇表、语法分析器以及 语法的规则,从而分解语句成为内在的表述。建立具有适当本体的、多量的词汇表,是件大工程,例如WordNet的词汇表耗费多年人力[4]。
系统也需要“语义理论”去引导理解。语言理解系统的解析能力有赖于使用的语义理论。互竞的语义理论,作为电脑自动语义解析的基础,各有其特定的平衡取舍[5]。理论从“素朴语义学”或 “随机语义分析”到利用“语用学”从上下文得出意涵[6][7][8]。
自然语言理解的高级应用也会在其框架内纳入逻辑推理,其过程是将得出的意涵对应到一阶逻辑的一组论断,然后用演绎推理得到结论。
自然语言理解的文本脉络处理可能遭遇难关,各种各样的例子与反例,造成了脉络形式模拟的多重途径,各有特定的强弱之处[9][10]。
应用
[编辑]- 人机交谈:电脑如何能与人交谈?
- 机器翻译:电脑如何将一篇英文文章翻译成中文?
- 自动摘要:电脑如何对文章进行摘要?
研究者
[编辑]- 英语观点的研究人员
- R.C.Schank : Script, Conceptual Dependency Theory.
- Fillmore : 格语法(Case Grammar).
参考文献
[编辑]- ^ An approach to hierarchical email categorization by Peinfeng Li et al. in Natural language processing and information systems edited by Zoubida Kedad, Nadira Lammari 2007 ISBN 3-540-73350-7
- ^ Building Working Models of Full Natural-Language Understanding in Limited Pragmatic Domains by James Mason 2010 [1] (页面存档备份,存于互联网档案馆)
- ^ Mining the Web: discovering knowledge from hypertext data by Soumen Chakrabarti 2002 ISBN 1-55860-754-4 page 289
- ^ G. A. Miller, R. Beckwith, C. D. Fellbaum, D. Gross, K. Miller. 1990. WordNet: An online lexical database. Int. J. Lexicograph. 3, 4, pp. 235-244.
- ^ Using computers in linguistics: a practical guide by John Lawler, Helen Aristar Dry 198 ISBN 0-415-16792-2 page 209
- ^ Naive semantics for natural language understanding by Kathleen Dahlgren 1988 ISBN 0-89838-287-4
- ^ Stochastically-based semantic analysis by Wolfgang Minker, Alex Waibel, Joseph Mariani 1999 ISBN 0-7923-8571-3
- ^ Pragmatics and natural language understanding by Georgia M. Green 1996 ISBN 0-8058-2166-X
- ^ Understanding language understanding by Ashwin Ram, Kenneth Moorman 1999 ISBN 0-262-18192-4 page 111
- ^ Formal aspects of context by Pierre Bonzon et al 2000 ISBN 0-7923-6350-7
- ^ 存档副本. [2005-07-13]. (原始内容存档于2017-03-24).
- ^ [2]
- ^ [3]
- 陈锺诚, "自然语言处理", http://ccckmit.wikidot.com/nlp (页面存档备份,存于互联网档案馆)