统计语言学

维基百科,自由的百科全书

这是本页的一个历史版本,由Eagerbot留言 | 贡献2015年12月11日 (五) 04:06 (Link style 模板標示日期及時間, replaced: {{Link style}} → {{Link style|time={{subst:#time:Y-n-j}}T{{subst:#time:h:m:s}}+00:00}} 由 自动维基浏览器协助)编辑。这可能和当前版本存在着巨大的差异。

统计语言学数理语言学的一个分支,是运用统计学的方法研究各种语言现象的学科。

歷史

18世纪时,开始用统计学来解释语言的消失与保存。1880年代,青年语法学派中的一些学者也使用过统计方法来研究语言。自发明计算机以后,统计语言学得到了迅速发展。

研究方向

统计语言学主要研究:

  • 语言单位的出现频率
  • 作家的用词频率、词长分布和句长分布,以确定作家的写作风格
  • 计算语言存在的绝对年代以及亲属语言从共同原始语分化出来的年代

參見