跳转到内容

全文检索

维基百科，自由的百科全书

本条目存在以下问题，请协助改善本条目或在讨论页针对议题发表看法。

此条目可参照英语维基百科相应条目来扩充。 (2019年5月15日)
若您熟悉来源语言和主题，请协助参考外语维基百科扩充条目。请勿直接提交机械翻译，也不要翻译不可靠、低品质内容。依版权协议，译文需在编辑摘要注明来源，或于讨论页顶部标记{{Translated page}}标签。

此条目的语调或风格或许不合百科全书。 (2019年5月15日)
请根据指南协助改善这篇条目，并在讨论页讨论问题所在，加以改善。

此条目应避免有陈列杂项、琐碎资料的部分。 (2019年5月15日)
请协助将有关资料重新编排成连贯性的文章，安置于适当章节或条目内。

此条目没有列出任何参考或来源。 (2019年5月15日)
维基百科所有的内容都应该可供查证。请协助补充可靠来源以改善这篇条目。无法查证的内容可能会因为异议提出而被移除。

从文本或资料库中，不限定资料栏位，自由地萃取出讯息的技术。

执行全文检索任务的程式，一般称作搜寻引擎，它将使用者随意输入的文字，试图从资料库中，找到符合的内容。

全文索引的相关议题[编辑]

语根处理 (stemming)
符素解析器 (token parser) 1-gram, 2-gram , n-gram
断词/分词 word segmentation
倒排索引 inverted index

演算法、搜寻策略之模型[编辑]

布林式 boolean
统计模型 Probabilistic model
向量空间模型 vector base model
隐性语义模型 Latent semantic model

评量之准则[编辑]

查全率(recall rate)，查准率(precision)

开放原始码之全文检索系统[编辑]

和中文有关的议题[编辑]

断词
语法解析
古籍议题
多语言混合

优化[编辑]

剔除字(Stopwords)
词性标注
规范文件(authority file)
知识体系，本体论(ontology)
超连结分析(page rank)技术

历史及未来之趋势[编辑]

自由语句搜寻

参考[编辑]

检索自“https://zh.wikipedia.org/w/index.php?title=全文檢索&oldid=54423734”

分类：

隐藏分类：