我们使用评分配置文件来驱动相关性和调整分数,即提升属性的相关性isActive是1 x 50使用评分配置文件中的功能,同时通过传递在索引上搜索特定字段
然而Search. Score似乎受到文档大小的高度挤压,较小的大小高分可能是由于TF-IDF……
这违背了使用评分配置文件的目的,但是在我们的例子中,我们不希望分数因文档大小而受到影响,因为我们正在传递search chFields。
搜索字段不通过的情况下,我们希望分数按大小调整,即在所有可搜索字段中自由形式搜索。
示例搜索查询-
代理临时工
我想知道新功能模式预览功能是否对您有帮助?使用它,您可以从搜索查询中逐个字段地获取更多信息,例如uniqueTokenMatches和term频率。使用它,您可以根据客户端的需要调整顺序。
此外,你是正确的,默认是一个TF-IDF像得分,但是,你可能也有兴趣尝试BM25,虽然不能解决你所要求的,但可以更有效地帮助你得到你正在寻找的分数。
目前,我采用了Liam建议的方法来调整算法BM25的参数,并在索引创建json中添加了b作为0.0,以便在TF-IDF计算文档分数时不使用文档大小。
"similarity": {
"@odata.type": "#Microsoft.Azure.Search.BM25Similarity",
"b" : 0.0,
"k1" : 1.3
}
然而,同时在索引上识别了另一个字段,该字段与索引上的记录的大小具有相关性,即大小越大,该字段的值越高,并且在评分配置文件中使用该字段,用于在评分中应该考虑文档大小的情况。