Contents
  1. 1. reindex

reindex

顾名思义是重建index的意思,因为一些原因,之前的index参数、mapping等设置需要优化、不合理时就需要reindex。典型的原因是设置shard数量,当index增长或者业务量增长需要扩容集群,重新设置shard可以进一步优化性能。
reindex基本操作比较简单:

1
2
3
4
5
6
7
8
9
10
POST _reindex?wait_for_completion=false&slices=auto&refresh
{
"source": {
"index": "tk_books",
"size": 100
},
"dest": {
"index": "ttkk_tk_books"
}
}

wait_for_completion: false不等待任务完成
slices: 并行操作,相当于切片,设置auto是按shard数切分,也可以指定一个数
size: 批量操作,每批数据,每批数据5-15MB开始,逐步调整size大小可以改善性能

一些优化技巧:
1.把dest index的冗余设置0
2.把dest index的refresh_interval设置-1
这样可以加快写入速度,完成后再改成正常。

重新设置shard,需要先建dest index,设置好number_of_shard。

Contents
  1. 1. reindex