文本辨识

文本辨识（Text Recognition）指的是训练机器如何去了解一个文本的内容，以及一个非结构的文本中抽取结构性有用的资讯，来了解这个文本的意涵。^[1]

文本辨识主要的技术包括下面几种：关键句抽取（Key Phase Extraction）、摘要抽取（Abstract Extraction）、意图抽取（Intention Extraction）、命名实体抽取（Named Entity Extraction）、主题抽取（Topic Extraction）、情绪抽取（Emotional Extraction）、以及问答集系统(Q&A)等，文本辨识的技术与所谓的文字探勘非常类似。