在线精品99_中国九九盗摄偷拍偷看_91免费版在线观看_91.app_91高清视频在线_99热最新网站

elasticsearch中文分词集成怎么实现

175次阅读
没有评论

共计 1864 个字符,预计需要花费 5 分钟才能阅读完成。

本篇内容介绍了“elasticsearch 中文分词集成怎么实现”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让丸趣 TV 小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

对于索引可能最关系的就是分词了 一般对于 es 来说默认的 smartcn   但效果不是很好  

一个是 ik 的,一个是 mmseg 的,下面分别介绍下两者的用法,其实都差不多的,先安装插件,命令行:

安装 ik 插件

plugin -install medcl/elasticsearch-analysis-ik/1.1.0

下载 ik 相关配置词典文件到 config 目录

unzip ik.zip

rm ik.zip

分词配置

ik 分词配置,在 elasticsearch.yml 文件中加上

index:
 analysis: 
 analyzer: 
 ik:
 alias: [ik_analyzer]
 type: org.elasticsearch.index.analysis.IkAnalyzerProvider

index.analysis.analyzer.ik.type : “ik”

安装 mmseg 插件:

bin/plugin -install medcl/elasticsearch-analysis-mmseg/1.1.0

下载相关配置词典文件到 config 目录

cd config

wget http://github.com/downloads/medcl/elasticsearch-analysis-mmseg/mmseg.zip –no-check-certificate

unzip mmseg.zip

rm mmseg.zip

mmseg 分词配置,也是在在 elasticsearch.yml 文件中

index:
 analysis:
 analyzer:
 mmseg:
 alias: [news_analyzer, mmseg_analyzer]
 type: org.elasticsearch.index.analysis.MMsegAnalyzerProvider

index.analysis.analyzer.default.type :  mmseg

mmseg 分词还有些更加个性化的参数设置如下

index:
 analysis:
 tokenizer:
 mmseg_maxword:
 type: mmseg
 seg_type:  max_word 
 mmseg_complex:
 type: mmseg
 seg_type:  complex 
 mmseg_simple:
 type: mmseg
 seg_type:  simple

这样配置完后插件安装完成,启动 es 就会加载插件。

定义 mapping

在添加索引的 mapping 时就可以这样定义分词器

{
  page :{
  properties :{
  title :{
  type : string ,
  indexAnalyzer : ik ,
  searchAnalyzer : ik 
 },
  content :{
  type : string ,
  indexAnalyzer : ik ,
  searchAnalyzer : ik 
 }
 }
 }
}

indexAnalyzer 为索引时使用的分词器,searchAnalyzer 为搜索时使用的分词器。

java mapping 代码如下:

XContentBuilder content = XContentFactory.jsonBuilder().startObject()
 .startObject(page)
 .startObject(properties) 
 .startObject(title)
 .field(type ,  string) 
 .field(indexAnalyzer ,  ik)
 .field(searchAnalyzer ,  ik)
 .endObject() 
 .startObject(code)
 .field(type ,  string) 
 .field(indexAnalyzer ,  ik)
 .field(searchAnalyzer ,  ik)
 .endObject() 
 .endObject()
 .endObject()
 .endObject()

测试分词可用调用下面 api,注意 indexname 为索引名,随便指定一个索引就行了

“elasticsearch 中文分词集成怎么实现”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注丸趣 TV 网站,丸趣 TV 小编将为大家输出更多高质量的实用文章!

正文完
 
丸趣
版权声明:本站原创文章,由 丸趣 2023-08-16发表,共计1864字。
转载说明:除特殊说明外本站除技术相关以外文章皆由网络搜集发布,转载请注明出处。
评论(没有评论)
主站蜘蛛池模板: 亚洲美女视频在线 | 男人和女人一级 黄 色大片 | 91九色视频无限观看免费 | 免费人成视频在线观看视频 | 欧美精品国产综合久久 | 一级黄色片在线看 | 国产乱人伦精品免费 | 亚洲欧美日韩成人网 | 欧美牲交a欧美牲交aⅴ免费真 | 国产三级av在线播放 | 久久精品国产亚洲av麻豆不卡 | 欧美日韩中文在线视频 | 国产av一区二区三区最新精品 | 天天射影院 | 97人妻人人做人碰人人爽 | 香蕉精品高清在线观看视频 | 精品丰满人妻无套内射 | 国内精品视频 在线播放 | 亚洲精品国产精品制服丝袜 | 久久久久亚洲av成人片一区 | 精品少妇人妻av无码久久 | 久久99久久99精品免观看女同 | 精品福利一区 | 久久久精品3d动漫一区二区三区 | 久久精品隔壁老王影院 | 亚洲欧美一区二区三区九九九 | 青青自拍视频 | 伊在人亚洲香蕉精品区 | 亚洲精品无码aⅴ中文字幕蜜桃 | 精品欧美日韩一区二区三区 | 久久久久女人精品毛片 | 韩国精品一区视频在线播放 | 毛片免费播放 | 国产乱子经典视频在线观看 | 新逃学威龙在线观看 | 野花国产精品入口 | 日韩一区二区三区射精-百度 | 亚洲爆乳www无码专区 | 成人免费网址在线 | 精品在线第一页 | 午夜影院免费在线观看 |