命名實體識別

維基百科,自由的百科全書

命名實體識別(英語:Named Entity Recognition,簡稱NER),又稱作專名識別命名實體,是指識別文本中具有特定意義的實體,主要包括人名、地名、機構名、專有名詞等,以及時間、數量、貨幣、比例數值等文字。指的是可以用專有名詞(名稱)標識的事物,一個命名實體一般代表唯一一個具體事物個體,包括人名、地名等。

NER屬於從非結構化文本中分類和定位命名實體感情的子任務,其過程是從是非結構化文本表達式中產生專有名詞標註信息的命名實體表達式,目前NER有兩個顯著的問題,即識別和分類。例如,「奧巴馬是美國總統」的「奧巴馬」和「美國」都代表一個具體事物,因此都是命名實體。而「總統」不代表一個具體事物,因此不是命名實體。

參考資料[編輯]