es mapping 以及数据类型总结。
1.核心数据类型
字符型:
Text被用来索引长文本,再建立索引前会将这项文本进行分词,转化为词的组合,建立索引。允许检索但不能用来排序和聚合
Keyword:不需要进行分词,可用来检索过滤、排序和聚合
数字类型
byte/short/integer/long/double/float/data/binary
3.Mappiing 支持的属性
"type":text: 一般文本使用(可被分词进行模糊查找)/keyword
"analyzer":"ik_max_word" 指定分词器
"normalizer":"normalizer_name" 字段标准化规则
"boost":1.5 字段权重
"coerce":true 清理脏数据
"copy_to":"field_name" 自定义ALL字段
"doc_values":true 加快排序、聚合操作
"dynamic":true 新字段动态添加
"enable:true 是否会被索引
"fileddata":false 针对Text字段加快排序和聚合(doc_values对Text无效)
"eager_global_ordinals":true 是否开启全局预加载, 只支持text/keyword
"format":"yyyy-MM-dd HH:mm:ss||yyyy-MM-dd||epoch_mills"格式化
"ignore_above":100 指定子u但索引和存储的最大长度
"ignore_malformed":false 插入文档时是否忽略类型
"index_option":"docs" docs索引文档号、freqs文档号+词频、positions、offsets
"index":true 该字段是否会被索引和查询
"fields":{"raw":{"type":"keyword"}} 可以对一个字段提供多种索引模式
"norms":true 用户标准化文档以便查询时计算相关性
"null_value":"NULL" 可以让值为NULL的字段显示的可索引、可搜索
"position_increment_gap":0 词组合查询时可跨词查询
"properties":{} 嵌套属性
"search_analyzer":"ik_max_word" 查询分词器
"similary":"BM25" 用于指定文档评分;BM25/classic/boolean
"store":true _soure会保存一份原始文档
"term_vector":"no" 默认不存储向量信息
3.复杂数据类型
字符数组["onew","two"]/整形数组[1,2]/数组型数组[1,[2,3]]/对象数组[{"name":"mang"}]
4.地理位置类型
地理坐标类型Geo-pint datatype/地理形状类型Geo-shape datatype
5.特定类型
IPV4类型、completion类型、Token Count、mapper-nurmur3/附加类型