跳转到内容

文本辨识

维基百科,自由的百科全书

文本辨识(Text Recognition)指的是训练机器如何去了解一个文本的内容,以及一个非结构的文本中抽取结构性有用的资讯,来了解这个文本的意涵。[1]


文本辨识主要的技术包括下面几种:关键句抽取(Key Phase Extraction)、摘要抽取(Abstract Extraction)、意图抽取(Intention Extraction)、命名实体抽取(Named Entity Extraction)、主题抽取(Topic Extraction)、情绪抽取(Emotional Extraction)、以及问答集系统(Q&A)等,文本辨识的技术与所谓的文字探勘非常类似。

参考资料[编辑]

  1. ^ 林东清. 资讯管理:e化企业的核心竞争能力 七版. 台北市: 智胜文化. 2018年8月: 第157页. ISBN 9789864570478(中文).

外部链接[编辑]