Elasticsearch安装分词插件[ES系列] - 第499篇

应该说，standard 分词器是大多数西方语言分词的一个合理的起点。事实上，它构成了大多数特定语言分析器的基础，如 english 、french 和 spanish 分析器。它也支持亚洲语言，只是有些缺陷（=.=To Be Honest , 你输入任何中文，都会被拆成一个一个的文字来分词，简直不要太糟糕），你可以考虑通过 ICU 插件的方式使用 icu_analyzer 进行中文分词更合理。

二、ICU 分析器插件

Elasticsearch的 ICU 分析器插件使用国际化组件 Unicode (ICU) 函数库提供丰富的处理 Unicode 工具。这些包含对处理亚洲语言特别有用的 icu_分词器，还有大量对除英语外其他语言进行正确匹配和排序所必须的分词过滤器。

ICU 插件是处理英语之外语言的必需工具，非常推荐你安装并使用它，不幸的是，因为是基于额外的 ICU 函数库，不同版本的ICU插件可能并不兼容之前的版本，当更新插件的时候，你需要重新索引你的数据（=。=根据你的ES版本替换后面的版本号，是6.8.1，则用6.8.1，你用7.3.0就用7.3.0，类推）。

2.1在线安装analysis-icu分词插件

安装命令如下：

#查看已安装插件bin/elasticsearch-plugin list#安装插件bin/elasticsearch-plugin install analysis-icu#删除插件bin/elasticsearch-plugin remove analysis-icu

特别说明：这里要求是bin/这样的写法，不然插件无法安装到目录plugins下。

其它说明：安装和删除完插件后，需要重启ES服务才能生效。

使用kibana测试分词效果：

POST _analyze{"analyzer":"icu_analyzer","text":"中华人民共和国"}

看右边的分词效果还不错。

2.2离线安装ik中文分词插件

本地下载elasticsearch-analysis-ik-x.x.x.zip插件，解压，

然后手动上传到elasticsearch的plugins目录，然后重启ES实例就可以了。

ik中文分词插件：

https://github.com/medcl/elasticsearch-analysis-ik

https://github.com/xiaoxinda/elasticsearch-analysis-ik/releases

#ES的默认分词设置是standard，会单字拆分POST _analyze{    "analyzer":"standard",    "text":"中华人民共和国"}
#ik_smart:会做最粗粒度的拆POST _analyze{    "analyzer": "ik_smart",    "text": "中华人民共和国"}
#ik_max_word:会将文本做最细粒度的拆分POST _analyze{    "analyzer":"ik_max_word",    "text":"中华人民共和国"}

字段说明：

（1）token：分词

（2）start_offset：分词起始位置

（3）end_offset：分词结束位置

（4）type：

（5）position：记录单词在文档中的分词位置（多个），用于做词语搜索（Phrase Query）

特别说明：对于字段start_offset和end_offset主要用于高亮显示。

• 阿里巴巴前高级研发工程师

• 三家千万级互联网企业技术顾问

• MBTI/盖洛普技术专家

• 厦门某高校外聘教师

• 51CTO特约合作讲师

• 网易云课堂签约讲师

•《深入理解设计模式》作者

http://mp.weixin.qq.com/s?__biz=MzA4ODIyMzEwMg==&mid=2447538356&idx=1&sn=45af1297590e724b95db6136d575e81f

SpringBoot

Suno AI制作音乐,Viggle AI - 照片跳舞,AI音乐,Noisee AI制作MV。Spring Boot技术。博客已有400+，文章特色：一个知识点一个系列、让技术变得简单、文章轻松幽默，悟纤和师傅趣谈更是轻松有趣。

最新文章

Suno V4 API 接入 – 最新的Suno模型，音质很炸裂

Suno V4上线啦，来听听V3和V4的区别，效果太炸裂了 —— V4 IS HERE

Suno V4版本震撼来袭，音质与歌词双提升

Spring Boot实用小技巧10 - 第532篇

AI视频生视频，一次支持20秒的视频，效果挺震撼 - 模仿爆款抖音账号制作爆款视频[AI视界]

Spring Boot实用小技巧9 - 第531篇

Viggle API开放，接入到自己的产品中，让照片跳起舞来

双十一狂欢11天，买越多，送越多，多次购买可叠加使用

Spring Boot实用小技巧8 - 第530篇

Spring Boot实用小技巧7

又一款AI对口型神器，让照片开口说话唱歌，1分钟教会（附保姆级教程）

Spring Boot实用小技巧6 - 第528篇

Spring Boot实用小技巧5 - 第527篇

Suno新上线Covers翻唱新 - 实现音频风格任意转换

万物皆能舞，AI让你秒变“舞”林高手 – Viggle AI“舞”所不能

Spring Boot实用小技巧4 - 第526篇

Suno AI API接入 - 将AI音乐接入到自己的产品中，支持120并发任务

Spring Boot实用小技巧3 - 第525篇

Spring Boot实用小技巧2 - 第524篇

Spring Boot实用小技巧 - - 第523篇

情人节 - 什么礼物最能打动女生的心？

SpringBoot基本原理，轻松应对面试官 - 第522篇

SpringBoot多例模式，在同一个类中注入两次是否是同一个对象 – 一不小心就会写出一个重大BUG！！ - 521篇

SpringBoot开发的AI导航站技术架构剖析 —— 技术如何选型 - 第520篇

SpringBoot 中多例模式的神秘世界：用法区别以及应用场景，最后的灵魂拷问会吗？- 第519篇

SpringBoot异常处理机制之自定义404、500错误提示页面 - 518篇

Spring的SmartLifecycle可以没用过，但没听过就不好了！ - 第517篇

Noisee AI中文站网页版 AI 音乐生成视频全新登场，快来抢先体验——国内第一个登场的中文站来袭 - 516篇

idea springboot woff/woff2/eot/ttf/svg等小图标不显示的问题 - 第515篇

一文讲清楚SpringBoot项目打包jar后运行报错template might not exist - 第514篇

Transaction rolled back because it has been marked as - 第512篇

Spring Boot整合ElasticSearch实战 - 第511篇

抖音主播/电商人员有福了，利用Suno创作产品宣传，让产品动起来-小米Su7 - 第510篇

ES 深度分页问题及针对不同需求下的解决方案[ES系列] - 第509篇

ES全文检索[ES系列] - 第508篇

如何让AI生成自己喜欢的歌曲-AI音乐创作的正确方式 - 第507篇

日赚800，利用淘宝/闲鱼进行AI音乐售卖实操 - 第506篇

AI音乐，8大变现方式——Suno：音乐版的ChatGPT - 第505篇

ES高级查询语法DSL实战 - 第504篇

ElasticSearch文档批量操作[ES系列] - 第503篇

ElasticSearch文档操作[ES系列] - 第502篇

国内最全的Spring Boot系列之七

ElasticSearch重建/创建/删除索引操作 - 第501篇

ElasticSearch扫盲概念篇[ES系列] - 第500篇

Elasticsearch安装分词插件[ES系列] - 第499篇

Elasticsearch可视化平台Kibana [ES系列] - 第498篇

ElasticSearch详细搭建以及常见错误high disk watermark [ES系列] - 第497篇

ElasticSearch应用场景以及技术选型[ES系列] - 第496篇

全文检索[ES系列] - 第495篇

15篇MyBatis-Plus系列集合篇「值得收藏学习」

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉