图灵估计

维基百科,自由的百科全书
跳转到: 导航, 搜索

圖靈估計(Good-Turing Estimates/Discounting)用來平滑不常出現的N連文法(n-gram)。對於出現r次的n-gram來說,經過圖靈估計後,新的出現次數r^*為:

r^{*}=(r+1)\frac{n_{r+1}}{n_r}

其中n_r代表n-gram在訓練集中出現r次的個數。一般而言,圖靈估計很少單獨使用,而是做為其他平滑化技術的前端處理,例如Katz平滑

个人工具
名字空间
操作
导航
帮助
工具
其他语言