以前我使用jdbc river将所有数据从mysql索引到elasticsearch。现在我已经转向轮胎批量api,因为它让我在将数据索引到elasticsearch之前可以自由操作数据。但是使用轮胎批量api的索引过程比使用jdbc river3M记录需要大量时间(4倍)。有没有办法使索引过程更快更高效?
IMHO,关键是JDBC河是在Elasticsearch内部启动的。所以JDBC请求后,数据在内存中,直接发送到ES。
使用外部进程,您可以多跳一次网络。
也就是说,低4倍可能太多了。