在线精品99_中国九九盗摄偷拍偷看_91免费版在线观看_91.app_91高清视频在线_99热最新网站

elasticsearch中文分词集成怎么实现

153次阅读
没有评论

共计 1864 个字符,预计需要花费 5 分钟才能阅读完成。

本篇内容介绍了“elasticsearch 中文分词集成怎么实现”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让丸趣 TV 小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

对于索引可能最关系的就是分词了 一般对于 es 来说默认的 smartcn   但效果不是很好  

一个是 ik 的,一个是 mmseg 的,下面分别介绍下两者的用法,其实都差不多的,先安装插件,命令行:

安装 ik 插件

plugin -install medcl/elasticsearch-analysis-ik/1.1.0

下载 ik 相关配置词典文件到 config 目录

unzip ik.zip

rm ik.zip

分词配置

ik 分词配置,在 elasticsearch.yml 文件中加上

index:
 analysis: 
 analyzer: 
 ik:
 alias: [ik_analyzer]
 type: org.elasticsearch.index.analysis.IkAnalyzerProvider

index.analysis.analyzer.ik.type : “ik”

安装 mmseg 插件:

bin/plugin -install medcl/elasticsearch-analysis-mmseg/1.1.0

下载相关配置词典文件到 config 目录

cd config

wget http://github.com/downloads/medcl/elasticsearch-analysis-mmseg/mmseg.zip –no-check-certificate

unzip mmseg.zip

rm mmseg.zip

mmseg 分词配置,也是在在 elasticsearch.yml 文件中

index:
 analysis:
 analyzer:
 mmseg:
 alias: [news_analyzer, mmseg_analyzer]
 type: org.elasticsearch.index.analysis.MMsegAnalyzerProvider

index.analysis.analyzer.default.type :  mmseg

mmseg 分词还有些更加个性化的参数设置如下

index:
 analysis:
 tokenizer:
 mmseg_maxword:
 type: mmseg
 seg_type:  max_word 
 mmseg_complex:
 type: mmseg
 seg_type:  complex 
 mmseg_simple:
 type: mmseg
 seg_type:  simple

这样配置完后插件安装完成,启动 es 就会加载插件。

定义 mapping

在添加索引的 mapping 时就可以这样定义分词器

{
  page :{
  properties :{
  title :{
  type : string ,
  indexAnalyzer : ik ,
  searchAnalyzer : ik 
 },
  content :{
  type : string ,
  indexAnalyzer : ik ,
  searchAnalyzer : ik 
 }
 }
 }
}

indexAnalyzer 为索引时使用的分词器,searchAnalyzer 为搜索时使用的分词器。

java mapping 代码如下:

XContentBuilder content = XContentFactory.jsonBuilder().startObject()
 .startObject(page)
 .startObject(properties) 
 .startObject(title)
 .field(type ,  string) 
 .field(indexAnalyzer ,  ik)
 .field(searchAnalyzer ,  ik)
 .endObject() 
 .startObject(code)
 .field(type ,  string) 
 .field(indexAnalyzer ,  ik)
 .field(searchAnalyzer ,  ik)
 .endObject() 
 .endObject()
 .endObject()
 .endObject()

测试分词可用调用下面 api,注意 indexname 为索引名,随便指定一个索引就行了

“elasticsearch 中文分词集成怎么实现”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注丸趣 TV 网站,丸趣 TV 小编将为大家输出更多高质量的实用文章!

正文完
 
丸趣
版权声明:本站原创文章,由 丸趣 2023-08-16发表,共计1864字。
转载说明:除特殊说明外本站除技术相关以外文章皆由网络搜集发布,转载请注明出处。
评论(没有评论)
主站蜘蛛池模板: 91天堂素人精品系列网站 | 亚洲成人自拍 | 亚洲精品tv久久久久久久久 | 18成人免费观看软件大全 | 欧美精彩视频在线观看 | 亚洲成a人无码亚洲成www牛牛 | 亚洲综合站 | 日韩视频福利 | 怡红院免费va男人的天堂 | 亚洲一区二区三区精品视频 | 在线无限观看次数破解版 | 国产亚洲成av片在线观看 | 国内自拍偷拍视频 | 久久草在线 | 美女啪啪网站又黄又免费 | 国产精品综合一区二区三区 | 欧美成人免费一级人片 | 成人在线免费电影 | 无码国产精品一区二区免费式直播 | 一本一本久久a久久精品综合 | 毛片手机在线看 | 国产一区亚洲二区 | 一级α一级α片免费观看网站 | 免费国产不卡午夜福在线观看 | 中文精品无码中文字幕无码专区 | 99精品免费观看 | 中文乱码人妻系列一区二区 | 曰曰碰天天碰国产 | 亚洲成成品网站源码中国有限公司 | 国产亚洲精品热视频在线观看 | 又黄又爽又色的免费网站 | 青青草原网站在线观看 | 日本一级特大片 | 色欲天天天天天综合网 | 无码h片在线观看网站 | 色偷偷狠狠色综合网 | 911亚洲精品国内自产 | 免费观看日本污污ww网站 | 精品人妻一区二区三区四区在线 | 精品九九人人做人人爱 | 天天干天天操天天拍 |