提问者:小点点

「轮胎批量api」完成索引数据耗时比一条河还多


以前我使用jdbc river将所有数据从mysql索引到elasticsearch。现在我已经转向轮胎批量api,因为它让我在将数据索引到elasticsearch之前可以自由操作数据。但是使用轮胎批量api的索引过程比使用jdbc river3M记录需要大量时间(4倍)。有没有办法使索引过程更快更高效?


共1个答案

匿名用户

IMHO,关键是JDBC河是在Elasticsearch内部启动的。所以JDBC请求后,数据在内存中,直接发送到ES。

使用外部进程,您可以多跳一次网络。

也就是说,低4倍可能太多了。