词语搭配

维基百科,自由的百科全书
跳转至: 导航搜索

语料库语言学词语搭配(Collocation)是指按顺序排列的单字或者术语同时出现的次数比偶然的多。在片语学phraseology)中词语搭配是惯用片语(phraseme)的子类别。一个措辞上的词语搭配的例子,如Michael Halliday[1]提出的语言表达式strong tea

词语搭配这个词的定义在语言学界中是最受争论的之一[2]

词语搭配在机器翻译等任务中能有所应用。

用于搭配提取的公式[3][编辑]

此外,在[4]中罗列了84个可用于此任务的公式。

参考文献[编辑]

  1. ^ Halliday, M.A.K., 'Lexis as a Linguistic Level', Journal of Linguistics 2(1) 1966: 57-67
  2. ^ Evert, S. Corpus Linguistics. An International Handbook. 2008. 
  3. ^ Manning, C. D. Foundations of statistical natural language processing. MIT Press. 1999. 
  4. ^ Pecina, P.. An Extensive Empirical Study of Collocation Extraction Methods, 43. 2005: pp. 13.