提问者:小点点

Neo4j查询结合来自Elasticsearch的数据用于基于时间的图


Neo4j和Cypher大师,

我正在使用Neo4j、Elasticsearch和Spring Data Neo4j。我有相互关联的实体节点。在关系上有一个计数字段,它是两个实体之间的关系总数。我使用以下Cypher来返回一个实体的前50个关系:

MATCH (e1:Entity)-[r1:RELATED_TO]-(e2:Entity)
WHERE e1.uuid = '<ENTITY_ID>'
RETURN e1,r1,e2
ORDER BY r1.count DESC
LIMIT 50

现在我想做的是通过带回上周(上个月等)的前50个关系来可视化实体的基于时间的图表。我不在Neo4j中存储时间序列数据,只存储关系的总数。时间序列数据存储在Elasticsearch索引中,格式如下。

日期、entityOr关系ID、start Id、endId、类型

每次更新关系时,都会在索引中插入一行,其中包含日期时间、关系ID和entityId。

可以使用以下Elasticsearch查询搜索和聚合关系计数:

GET localhost:9200/trends/_search

{
    "size": 0,
    "query": {
        "bool": {
            "must": [
                {
                    "term": {
                        "type": "RELATIONSHIP"
                    }
                },
                {
                    "range": {
                        "date": {
                            "gte": "2020-04-01T00:00:00.000+00:00",
                            "lt": "2020-04-28T00:00:00.000+00:00"
                        }
                    }
                },
                {
                    "bool": {
                        "should": [
                            { "term": { "startId": "<ENTITY_ID>"} },
                            { "term": { "endId": "<ENTITY_ID>" } }
                        ]
                    }
                }
            ]
        }
    },
    "aggs": {
        "my_rels": {
            "terms": {
                "field": "entityOrRelationshipId",
                "size": 50
            }
        }
    }
} 

这会产生以下结果,其中包含特定日期范围内每个关系ID的计数(doc_count):

{
    "took": 5,
    "timed_out": false,
    "_shards": {
        "total": 5,
        "successful": 5,
        "skipped": 0,
        "failed": 0
    },
    "hits": {
        "total": 2273,
        "max_score": 0.0,
        "hits": []
    },
    "aggregations": {
        "my_rels": {
            "doc_count_error_upper_bound": 0,
            "sum_other_doc_count": 145,
            "buckets": [
                {
                    "key": "2fa94be4-828b-4a20-b5f8-4965d5516149",
                    "doc_count": 303
                },
                {
                    "key": "74fb5f46-a6e8-41a8-bd11-cb374324b285",
                    "doc_count": 197
                },
                {
                    "key": "dc57fdcf-ea88-4808-9310-4e09d368e743",
                    "doc_count": 178
                },
                {
                    "key": "c4fbda1f-717e-4422-bc10-66ca6a6f39d7",
                    "doc_count": 79
                },
                etc.

            ]
        }
    }
}

使用Neo4J APOC库,如何将Elasticsearch计数结果组合到我的Cypher查询中,而无需将计数值存储在Neo4J中?

任何帮助将不胜感激。


共1个答案

匿名用户

假设:

>

  • RELATED_TO关系有一个uuid属性作为关系id,并且
  • Entityid和“桶”列表作为参数entityId传递给查询,这应该可以工作:

    UNWIND $buckets AS b
    MATCH (e1:Entity)-[r1:RELATED_TO]-(e2)
    WHERE e1.uuid = $entityId AND r1.uuid = b.key
    RETURN e1, r1, e2, b.doc_count AS count
    ORDER BY count DESC
    

    不需要LIMIT子句,因为结果行数将由存储桶列表的大小决定。