我们用th.microsoft分析器创建一个字段调用“product_name”,它打破了令牌中的泰语单词。
但是,当我们将search api调用为queryType=简单、search chMode=all VS queryType=简单、search chMode=any时,我们会得到相同的结果。
似乎search chMode=all没有应用每个标记都需要在结果中匹配的逻辑。
有什么建议吗?
你提到了我以前的一篇文章,其中某些语言的标记化,如中文、日文和韩文,会产生出乎意料的高召回率。
我与微软一起开始了一个支持案例,他们验证了错误行为。根本原因是搜索服务本身的问题。我有4个不同的搜索服务,它们的行为不同。在我的案例中,4个环境中有3个重现了错误行为。如果我创建了一个新的搜索服务,它将按预期工作。旧的搜索服务重现了错误行为。
很容易认为在Azure中创建的所有搜索服务都会完全相同。事实并非如此。它们在幕后会有细微的差异和版本,即使这不是以版本号的形式向您公开的。
建议:
PS:你最初的问题如果包括你做什么、你得到什么结果以及你期望什么的具体例子会更好。