Elasticsearch中文分词之热更新词典

1.所有ES节点都操作

  • 配置中文分词器
cd /usr/share/Elasticsearch
./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.6.0/elasticsearch-analysis-ik-6.6.0.zip
  • 重启所有ES节点
systemctl restart elasticsearch

 

2.安装nginx

[root@db01 /etc/yum.repos.d]#vim nginx.repo

[nginx-stable]
name=nginx stable repo
baseurl=http://nginx.org/packages/centos/$releasever/$basearch/
gpgcheck=1
enabled=1
gpgkey=https://nginx.org/keys/nginx_signing.key

[root@db01 /etc/yum.repos.d]#yum install -y nginx
  • -防止更新词典写中文乱码或者输入中文无效解决方案
vim /etc/nginx/conf.d/default.conf(修改字符集)
systemctl restart nginx

 

Elasticsearch中文分词之热更新词典

 

  • -更新词典
[root@db01 /usr/share/nginx/html]#vim dic.txt

中国
美国
韩国
  • -浏览器访问刚更新或创建的词典

Elasticsearch中文分词之热更新词典

 

3.配置分词器配置文件,增加远程地址(所有节点都需要修改配置)

[root@db01 /usr/share/nginx/html]#cd /etc/elasticsearch/analysis-ik/
vim IKAnalyzer.cfg.xml

 

Elasticsearch中文分词之热更新词典

 

4.重启所有的ES节点

systemctl restart elasticsearch.service

 

5.重新更新数据让分词生效

Elasticsearch中文分词之热更新词典

 

6.增加新的词典数据

  • -编辑dic.txt文件
[root@db01 /usr/share/nginx/html]#vim dic.txt 
中国
美国
韩国
交易
帅气
走位
  • -然后重启elasticsearch
systemctl restart elasticsearch
  • -从启动日志可以看到重新加载的数据

Elasticsearch中文分词之热更新词典

  • 验证新增词典是否正常分词

Elasticsearch中文分词之热更新词典

赞赏

微信赞赏支付宝赞赏

ELK

Elasticsearch6.6部署

2019-12-4 12:57:01

ELK

Filebeat收集nginx的json格式日志

2019-12-5 13:31:19

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
有新消息 消息中心
搜索