如何在elasticsearch中获得同义词匹配的自动建议

提问者：小点点

如何在elasticsearch中获得同义词匹配的自动建议

我正在使用下面的代码，当我键入“cu”时，它不会给出自动建议作为curd

但它确实与酸奶匹配文档，这是正确的。我如何获得同义词的自动完成和相同的文档匹配？

PUT products
{
  "settings": {
    "index": {
      "analysis": {
        "analyzer": {
          "synonym_analyzer": {
            "tokenizer": "standard",
            "filter": [
            "lowercase",
              "synonym_graph"
            ]
          }
        },
        "filter": {
          "synonym_graph": {
            "type": "synonym_graph",
            "synonyms": [
               "yogurt, curd, dahi"
            ]
          }
        }
      }
    }
  }
}

PUT products/_mapping
{
  "properties": {
    "description": {
      "type": "text",
      "analyzer": "synonym_analyzer"
    }
  }
}

POST products/_doc
{
  "description": "yogurt"
}

GET products/_search
{
  "query": {
    "match": {
      "description": "cu"
    }
  }
}

共1个答案

匿名用户

当您在synonym_graph过滤器中提供同义词列表时，这仅仅意味着ES将互换处理任何同义词。但是当通过标准分析器分析它们时，只会生成完整的单词标记：

POST products/_analyze?filter_path=tokens.token
{
  "text": "yogurt",
  "field": "description"
}

产量：

{
  "tokens" : [
    {
      "token" : "curd"
    },
    {
      "token" : "dahi"
    },
    {
      "token" : "yogurt"
    }
  ]
}

因此，常规的match_query不会在这里剪切它，因为标准分析器没有为它提供足够的可匹配子串（n-gram）上下文。

同时，您可以将match替换为match_phrase_prefix这正是您想要的-匹配有序的字符序列，同时考虑同义词：

GET products/_search
{
  "query": {
    "match_phrase_prefix": {
      "description": "cu"
    }
  }
}

但是，正如查询名称所暗示的那样，这只适用于前缀。如果你喜欢一个自动补全，它建议术语，而不管子字符串匹配发生在哪里，看看我的另一个答案，我在那里谈论了利用n-gram。

如何在elasticsearch中获得同义词匹配的自动建议

共1个答案

相关问题

热门标签

如何在elasticsearch中获得同义词匹配的自动建议

共1个答案

相关问题

热门标签

微信关注