ES全文检索[ES系列] - 第508篇

#match 分词后or的效果GET /es_db/_search{  "query": {    "match": {        "address": "广州白云山公园"    }  }}
# 分词后 and的效果GET /es_db/_search{  "query": {    "match": {        "address": {          "query": "广州白云山公园",          "operator": "and"        }      }  }}

在match中的应用：当operator参数设置为or时，minnum_should_match参数用来控制匹配的分词的最少数量。

# 最少匹配广州，公园两个词GET /es_db/_search{  "query": {    "match": {      "address": {        "query": "广州公园",        "minimum_should_match": 2      }    }  }}

对于match查询，其底层逻辑的概述：

n 分词：首先，输入的查询文本会被分词器进行分词。分词器会将文本拆分成一个个词项（terms），如单词、短语或特定字符。分词器通常根据特定的语言规则和配置进行操作。

n 倒排索引：ES使用倒排索引来加速搜索过程。倒排索引是一种数据结构，它将词项映射到包含这些词项的文档。每个词项都有一个对应的倒排列表，其中包含了包含该词项的所有文档的引用。

n 匹配计算：一旦查询被分词，ES将根据查询的类型和参数计算文档与查询的匹配度。对于match查询，ES将比较查询的词项与倒排索引中的词项，并计算文档的相关性得分。相关性得分衡量了文档与查询的匹配程度。

n 结果返回：根据相关性得分，ES将返回最匹配的文档作为搜索结果。搜索结果通常按照相关性得分进行排序，以便最相关的文档排在前面。

1.2 multi_match query 多字段查询

可以根据字段类型，决定是否使用分词查询，得分最高的在前面

GET /es_db/_search{  "query": {    "multi_match": {      "query": "长沙张龙",      "fields": [        "address",        "name"      ]    }  }}

注意：字段类型分词,将查询条件分词之后进行查询，如果该字段不分词就会将查询条件作为整体进行查询。

1.3 match_phrase query短语查询

短语搜索(match phrase)会对搜索文本进行文本分析，然后到索引中寻找搜索的每个分词并要求分词相邻，你可以通过调整slop参数设置分词出现的最大间隔距离。match_phrase 会将检索关键词分词。

GET /es_db/_search{  "query": {    "match_phrase": {      "address": "广州白云山"    }  }}GET /es_db/_search{  "query": {    "match_phrase": {      "address": "广州白云"    }  }}

思考：为什么查询广州白云山有数据，广州白云没有数据？

分析原因：

先查看广州白云山公园分词结果，可以知道广州和白云不是相邻的词条，中间会隔一个白云山，而match_phrase匹配的是相邻的词条，所以查询广州白云山有结果，但查询广州白云没有结果。

POST _analyze{  "analyzer":"ik_max_word",  "text":"广州白云山"}

如何解决词条间隔的问题？可以借助slop参数，slop参数告诉match_phrase查询词条能够相隔多远时仍然将文档视为匹配。

#广州云山分词后相隔为2，可以匹配到结果GET /es_db/_search{  "query": {    "match_phrase": {      "address": {        "query": "广州云山",        "slop": 2      }    }  }}

1.4 query_string query

允许我们在单个查询字符串中指定AND | OR | NOT条件，同时也和 multi_match query 一样，支持多字段搜索。和match类似，但是match需要指定字段名，query_string是在所有字段中搜索，范围更广泛。

注意: 查询字段分词就将查询条件分词查询，查询字段不分词将查询条件不分词查询

GET /es_db/_search{  "query": {    "query_string": {      "query": "赵六 AND 橘子洲"    }  }}

- 指定单个字段查询：

GET /es_db/_search{  "query": {    "query_string": {      "default_field": "address",      "query": "白云山 OR 橘子洲"    }  }}

- 指定多个字段查询：

GET /es_db/_search{  "query": {    "query_string": {      "fields": ["name","address"],      "query": "张三 OR (广州 AND 王五)"    }  }}

1.5 simple_query_string

类似Query String，但是会忽略错误的语法,同时只支持部分查询语法，不支持AND OR NOT，会当作字符串处理。支持部分逻辑：

l + 替代AND

l | 替代OR

l - 替代NOT

GET /es_db/_search{  "query": {    "simple_query_string": {      "fields": ["name","address"],      "query": "广州公园",      "default_operator": "AND"    }  }}
GET /es_db/_search{  "query": {    "simple_query_string": {      "fields": ["name","address"],      "query": "广州 + 公园"    }  }}

1.6 bool query布尔查询

布尔查询可以按照布尔逻辑条件组织多条查询语句，只有符合整个布尔条件的文档才会被搜索出来。

在布尔条件中，可以包含两种不同的上下文。

（1）搜索上下文(query context)：使用搜索上下文时，Elasticsearch需要计算每个文档与搜索条件的相关度得分，这个得分的计算需使用一套复杂的计算公式，有一定的性能开销，带文本分析的全文检索的查询语句很适合放在搜索上下文中。

（2）过滤上下文(filter context)：使用过滤上下文时，Elasticsearch只需要判断搜索条件跟文档数据是否匹配，例如使用Term query判断一个值是否跟搜索内容一致，使用Range query判断某数据是否位于某个区间等。过滤上下文的查询不需要进行相关度得分计算，还可以使用缓存加快响应速度，很多术语级查询语句都适合放在过滤上下文中。

布尔查询一共支持4种组合类型:

类型

说明

must

可包含多个查询条件，每个条件均满足的文档才能被搜索到，每次查询需要计算相关度得分，属于搜索上下文

should

可包含多个查询条件，不存在must和fiter条件时，至少要满足多个查询条件中的一个，文档才能被搜索到，否则需满足的条件数量不受限制,匹配到的查询越多相关度越高，也属于搜索上下文

filter

可包含多个过滤条件，每个条件均满足的文档才能被搜索到，每个过滤条件不计算相关度得分，结果在一定条件下会被缓存，属于过滤上下文

must_not

可包含多个过滤条件，每个条件均不满足的文档才能被搜索到，每个过滤条件不计算相关度得分，结果在一定条件下会被缓存，属于过滤上下文

PUT /books{  "settings": {    "number_of_replicas": 1,    "number_of_shards": 1  },  "mappings": {    "properties": {      "id": {        "type": "long"      },      "title": {        "type": "text",        "analyzer": "ik_max_word"      },      "language": {        "type": "keyword"      },      "author": {        "type": "keyword"      },      "price": {        "type": "double"      },      "publish_time": {        "type": "date",        "format": "yyy-MM-dd"      },      "description": {        "type": "text",        "analyzer": "ik_max_word"      }    }  }}
POST /_bulk{"index":{"_index":"books","_id":"1"}}{"id":"1", "title":"Java编程思想", "language":"java", "author":"Bruce Eckel", "price":70.20, "publish_time":"2007-10-01", "description":"Java学习必读经典，殿堂级著作！赢得了全球程序员的广泛赞誉。"}{"index":{"_index":"books","_id":"2"}}{"id":"2","title":"Java程序性能优化","language":"java","author":"葛一鸣","price":46.5,"publish_time":"2012-08-01","description":"让你的Java程序更快、更稳定。深入剖析软件设计层面、代码层面、JVM虚拟机层面的优化方法"}{"index":{"_index":"books","_id":"3"}}{"id":"3","title":"Python科学计算","language":"python","author":"张若愚","price":81.4,"publish_time":"2016-05-01","description":"零基础学python，光盘中作者独家整合开发winPython运行环境，涵盖了Python各个扩展库"}{"index":{"_index":"books","_id":"4"}}{"id":"4", "title":"Python基础教程", "language":"python", "author":"Helant", "price":54.50, "publish_time":"2014-03-01", "description":"经典的Python入门教程，层次鲜明，结构严谨，内容翔实"}{"index":{"_index":"books","_id":"5"}}{"id":"5","title":"JavaScript高级程序设计","language":"javascript","author":"Nicholas C. Zakas","price":66.4,"publish_time":"2012-10-01","description":"JavaScript技术经典名著"}

GET /books/_search{  "query": {    "bool": {      "must": [        {          "match": {            "title": "java编程"          }        },{          "match": {            "description": "性能优化"          }        }      ]    }  }}
GET /books/_search{  "query": {    "bool": {      "should": [        {          "match": {            "title": "java编程"          }        },{          "match": {            "description": "性能优化"          }        }      ],      "minimum_should_match": 1    }  }}GET /books/_search{  "query": {    "bool": {      "filter": [        {          "term": {            "language": "java"          }        },        {          "range": {            "publish_time": {              "gte": "2010-08-01"            }          }        }      ]    }  }}

1.7 highlight高亮

highlight 关键字: 可以让符合条件的文档中的关键词高亮。

highlight相关属性：

· pre_tags 前缀标签

· post_tags 后缀标签

· tags_schema 设置为styled可以使用内置高亮样式

· require_field_match 多字段高亮需要设置为false

示例数据：

PUT /products{  "settings" : {    "index" : {      "analysis.analyzer.default.type": "ik_max_word"    }  }}
PUT /products/_doc/1{  "proId" : "2",  "name" : "牛仔男外套",  "desc" : "牛仔外套男装春季衣服男春装夹克修身休闲男生潮牌工装潮流头号青年春秋棒球服男 7705浅蓝常规 XL",  "timestamp" : 1576313264451,  "createTime" : "2019-12-13 12:56:56"}
PUT /products/_doc/2{  "proId" : "6",  "name" : "HLA海澜之家牛仔裤男",  "desc" : "HLA海澜之家牛仔裤男2019时尚有型舒适HKNAD3E109A 牛仔蓝(A9)175/82A(32)",  "timestamp" : 1576314265571,  "createTime" : "2019-12-18 15:56:56"}测试：GET /products/_search{  "query": {    "term": {      "name": {        "value": "牛仔"      }    }  },  "highlight": {    "fields": {      "*":{}    }  }}

1.7.1 自定义高亮html标签

可以在highlight中使用pre_tags和post_tags

GET /products/_search{  "query": {    "multi_match": {      "fields": ["name","desc"],      "query": "牛仔"    }  },  "highlight": {    "post_tags": ["</span>"],    "pre_tags": ["<span style='color:red'>"],    "fields": {      "*":{}    }  }}

1.7.2多字段高亮

GET /products/_search{  "query": {    "term": {      "name": {        "value": "牛仔"      }    }  },  "highlight": {    "pre_tags": ["<font color='red'>"],    "post_tags": ["<font/>"],    "require_field_match": "false",    "fields": {      "name": {},      "desc": {}    }  }}

http://mp.weixin.qq.com/s?__biz=MzA4ODIyMzEwMg==&mid=2447538502&idx=1&sn=56ecc4363d9541520769df6723d20a34

SpringBoot

Suno AI制作音乐,Viggle AI - 照片跳舞,AI音乐,Noisee AI制作MV。Spring Boot技术。博客已有400+，文章特色：一个知识点一个系列、让技术变得简单、文章轻松幽默，悟纤和师傅趣谈更是轻松有趣。

最新文章

Suno V4 API 接入 – 最新的Suno模型，音质很炸裂

Suno V4上线啦，来听听V3和V4的区别，效果太炸裂了 —— V4 IS HERE

Suno V4版本震撼来袭，音质与歌词双提升

Spring Boot实用小技巧10 - 第532篇

AI视频生视频，一次支持20秒的视频，效果挺震撼 - 模仿爆款抖音账号制作爆款视频[AI视界]

Spring Boot实用小技巧9 - 第531篇

Viggle API开放，接入到自己的产品中，让照片跳起舞来

双十一狂欢11天，买越多，送越多，多次购买可叠加使用

Spring Boot实用小技巧8 - 第530篇

Spring Boot实用小技巧7

又一款AI对口型神器，让照片开口说话唱歌，1分钟教会（附保姆级教程）

Spring Boot实用小技巧6 - 第528篇

Spring Boot实用小技巧5 - 第527篇

Suno新上线Covers翻唱新 - 实现音频风格任意转换

万物皆能舞，AI让你秒变“舞”林高手 – Viggle AI“舞”所不能

Spring Boot实用小技巧4 - 第526篇

Suno AI API接入 - 将AI音乐接入到自己的产品中，支持120并发任务

Spring Boot实用小技巧3 - 第525篇

Spring Boot实用小技巧2 - 第524篇

Spring Boot实用小技巧 - - 第523篇

情人节 - 什么礼物最能打动女生的心？

SpringBoot基本原理，轻松应对面试官 - 第522篇

SpringBoot多例模式，在同一个类中注入两次是否是同一个对象 – 一不小心就会写出一个重大BUG！！ - 521篇

SpringBoot开发的AI导航站技术架构剖析 —— 技术如何选型 - 第520篇

SpringBoot 中多例模式的神秘世界：用法区别以及应用场景，最后的灵魂拷问会吗？- 第519篇

SpringBoot异常处理机制之自定义404、500错误提示页面 - 518篇

Spring的SmartLifecycle可以没用过，但没听过就不好了！ - 第517篇

Noisee AI中文站网页版 AI 音乐生成视频全新登场，快来抢先体验——国内第一个登场的中文站来袭 - 516篇

idea springboot woff/woff2/eot/ttf/svg等小图标不显示的问题 - 第515篇

一文讲清楚SpringBoot项目打包jar后运行报错template might not exist - 第514篇

Transaction rolled back because it has been marked as - 第512篇

Spring Boot整合ElasticSearch实战 - 第511篇

抖音主播/电商人员有福了，利用Suno创作产品宣传，让产品动起来-小米Su7 - 第510篇

ES 深度分页问题及针对不同需求下的解决方案[ES系列] - 第509篇

ES全文检索[ES系列] - 第508篇

如何让AI生成自己喜欢的歌曲-AI音乐创作的正确方式 - 第507篇

日赚800，利用淘宝/闲鱼进行AI音乐售卖实操 - 第506篇

AI音乐，8大变现方式——Suno：音乐版的ChatGPT - 第505篇

ES高级查询语法DSL实战 - 第504篇

ElasticSearch文档批量操作[ES系列] - 第503篇

ElasticSearch文档操作[ES系列] - 第502篇

国内最全的Spring Boot系列之七

ElasticSearch重建/创建/删除索引操作 - 第501篇

ElasticSearch扫盲概念篇[ES系列] - 第500篇

Elasticsearch安装分词插件[ES系列] - 第499篇

Elasticsearch可视化平台Kibana [ES系列] - 第498篇

ElasticSearch详细搭建以及常见错误high disk watermark [ES系列] - 第497篇

ElasticSearch应用场景以及技术选型[ES系列] - 第496篇

全文检索[ES系列] - 第495篇

15篇MyBatis-Plus系列集合篇「值得收藏学习」

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉