看下面这个表格里的文档内容: 然后再把 接下来说下什么是倒排索引 其实你像很多搜索引擎技术(比如:Solr、Elasticsearch、Lucene)索引用的都是倒排索引,那倒排索引到底是什么意思? 倒排索引会根据你的文档内容把一些关键字做一些分词,相当于用关键字定位到你的文档内容,这是什么意思? 举个例子,还是以这个文档讲一下,这5条文档里面全文检索首先会分析一下,把一些关键字进行整合起来,如下列表所示: 这时候分析 那么 小 在 1 2 3 4 5 里面都有存放,这个 再来说 大家在这里记住一点,最终这个词库的话会把文档内容中一些常用的名词通过一个单词表记录一下它的出现频率,这些单词哪些文档出现次数比较多的,它都会记录下来。 那么这些我们就可以把他叫做词库,比如说最近出现了什么新闻,热词,那么这些热词的话可以自己去联网,去读哪些热词的,或者手动添加进去也是可以的,添加到词库里面去的 比如说我是用户搜索这个 这就叫倒排索引,他比任何索引理解起来都要简单,说白了他对应的文档内容关键字做了一些收集,把一些关键字在哪些文档出现的评率比较多的会收集起来,就是这样的流程。 |
原文地址:https://blog.csdn.net/kaiwen_100/article/details/131695245
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:https://www.msipo.com/article-807.html 如若内容造成侵权/违法违规/事实不符,请联系MSIPO邮箱:3448751423@qq.com进行投诉反馈,一经查实,立即删除!
Copyright © 2023, msipo.com