ElasticSearch一个高扩展的分布式全文搜索引擎基于Lucene作为核心实现所有索引搜索功能

使用场景

(1)搜索领域:如维基百科、谷歌全文检索等。
(2)网站具体内容访问统计文章点赞留言评论等。
(3)用户行为分析记录员工行为数据消费趋势、员工群体进行定制推广等。
(4)数据分析访问日志数据分析等。

基本概念

Elasticsearch面向文档,类比传统数据库例如MySQL:
MySQL -> Databases -> Tables -> Rows -> Columns
Elasticsearch -> Indices -> Types -> Documents -> Fields
Elasticsearch集群可以包含多个索引indices,每一个索引可以包含多个类型type,每一个类型包含多个文档documents然后每个文档包含多个字段fields

索引
在ES中,索引一个大型的相同属性文档集合。ES把索引划分多个分片每个分片集群不同服务器之间迁移
文档
文档是索引和搜索数据的最小数单位一个文档同时包含字段对应的值,每个文档由多个字段构成,具有层次性,可以文档中包含文档。
类型
类型是文档的容器,类型中对于字段定义叫做映射mapping),所有类型下的文档被储存在同一个索引下,但是类型的映射(mapping)会告诉Elasticsearch不同的文档如何被索引。
映射
类似于静态语言中的数据类型一个number类型的mapping字段只能存储number类型的数据。

倒排索引

正向索引是以文档对象唯一id作为索引,以文档内容作为记录结构。而倒排索引指的是将文档内容中的单词作为索引,将包含该词的文档id作为记录结构
在这里插入图片描述
例如如下三句话:
(1)博客好用
(2)博客系统开发的不错
(3)博客网站开发很难
进行分词如下所示
在这里插入图片描述
如果要搜寻带系统二字的文章,相较于查找所有的数据而言,只需要标签这一栏,就可以获取文章id了。

原文地址:https://blog.csdn.net/weixin_42592415/article/details/134759744

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任

如若转载,请注明出处:http://www.7code.cn/show_43836.html

如若内容造成侵权/违法违规/事实不符,请联系代码007邮箱suwngjj01@126.com进行投诉反馈,一经查实,立即删除

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注