1.Query Rules 的定义与作用
Query Rules 是 Elasticsearch 提供的一种功能,允许用户根据预定义的规则动态调整搜索结果。它通过匹配查询的元数据(如用户输入、地理位置、用户兴趣等),对搜索结果进行定制化调整,例如固定某些文档到结果顶部或排除某些文档。
2.Query Rules 的核心组成部分
(1)规则类型(Rule Type)
• `pinned`:将指定文档固定到搜索结果的顶部。例如,在电商场景中,可以将热门商品固定到搜索结果顶部,提高其曝光率。
• `exclude`:从搜索结果中排除指定文档。例如,可以排除过时的新闻或不再销售的商品。
(2)匹配条件(Criteria)
匹配条件用于定义规则触发的条件,支持多种匹配类型,如:
• `exact`:精确匹配,要求完全一致。
• `fuzzy`:模糊匹配,允许一定程度的误差。
• `contains`:包含匹配,检查字段中是否包含指定内容。
(3)动作(Actions)
动作是指当规则匹配时要执行的操作,例如:
• 固定特定的文档`_id`。
• 排除某些文档。
3.在搜索请求中应用 Query Rules 的案例
案例 1:推广特定内容
假设我们需要在用户搜索“智能手机”时,将某些热门商品固定到搜索结果顶部。
定义规则集:
```json
PUT _query_rules/promotion-ruleset
{
"rules": [
{
"rule_id": "promote-specific-products",
"type": "pinned",
"criteria": [
{
"type": "exact",
"metadata": "query_string",
"values": ["智能手机"]
}
],
"actions": {
"ids": ["product-123", "product-456"]
}
}
]
}
```
• `rule_id`:规则的唯一标识。
• `type`:规则类型为`pinned`,表示将指定文档固定到顶部。
• `criteria`:当用户搜索“智能手机”时触发规则。
• `actions`:将文档`product-123`和`product-456`固定到搜索结果顶部。
应用规则的搜索请求:
```json
GET my-index/_search
{
"retriever": {
"rule": {
"retriever": {
"standard": {
"query": {
"query_string": {
"query": "智能手机"
}
}
}
},
"match_criteria": {
"query_string": "智能手机"
},
"ruleset_ids": ["promotion-ruleset"]
}
}
}
```
• `ruleset_ids`:指定应用的规则集为`promotion-ruleset`。
这个查询请求是一个 Elasticsearch 的搜索请求,它结合了 Query Rules 功能,用于在搜索时动态应用预定义的规则集(如固定某些文档到搜索结果顶部)。以下是对这个请求的详细解释:
---
1.请求路径
`GET my-index/_search`
• `my-index`:这是目标索引的名称,表示查询将在这个索引中执行。
• `_search`:这是 Elasticsearch 的搜索接口,用于执行查询操作
---
2.请求体的结构
请求体中使用了`retriever`和嵌套的`rule`部分,这是 Query Rules 功能的核心结构。
(1)`retriever`部分
`retriever`是一个检索器,用于定义查询的基本逻辑。它在这里的作用是将标准查询(`standard`)与规则(`rule`)结合起来。
(2)`rule`部分
`rule`是 Query Rules 的核心,用于定义如何应用规则集。
---
3.具体字段解释
(1)`retriever.standard.query`
这部分定义了标准的查询逻辑,即用户实际输入的搜索条件:
```json
"retriever": {
"standard": {
"query": {
"query_string": {
"query": "智能手机"
}
}
}
}
```
• `query_string`:这是一个查询类型,表示使用字符串查询。
• `query: "智能手机"`:这是用户输入的搜索关键词,表示查询包含“智能手机”的文档。
---
(2)`match_criteria`
`match_criteria`定义了规则触发的条件:
```json
"match_criteria": {
"query_string": "智能手机"
}
```
• `query_string`:表示匹配条件基于查询字符串。
• `"智能手机"`:这是触发规则的关键词。当用户搜索“智能手机”时,规则会被触发。
注意:`match_criteria`中的关键词需要与规则集中定义的触发条件一致,否则规则不会生效。
---
(3)`ruleset_ids`
`ruleset_ids`指定了要应用的规则集:
```json
"ruleset_ids": ["promotion-ruleset"]
```
• `promotion-ruleset`:这是规则集的名称,表示应用之前定义的`promotion-ruleset`规则集。
在前面的案例中,`promotion-ruleset`规则集定义了将某些文档(如`product-123`和`product-456`)固定到搜索结果顶部的规则。
---
4.整体逻辑
这个查询请求的作用是:
1. 用户搜索关键词“智能手机”。
2. Elasticsearch 会根据标准查询逻辑检索包含“智能手机”的文档。
3. 同时,Query Rules 会检查规则集`promotion-ruleset`。
4. 如果规则集中的触发条件(`match_criteria`)匹配用户输入(“智能手机”),则执行规则集中的动作(如将某些文档固定到顶部)。
5. 最终返回的搜索结果会结合规则集的动作,例如将`product-123`和`product-456`固定到搜索结果顶部。
---
5.示例结果
假设索引中有以下文档:
```json
[
{"_id": "product-123", "title": "热门智能手机 A"},
{"_id": "product-456", "title": "热门智能手机 B"},
{"_id": "product-789", "title": "普通智能手机 C"}
]
```
执行上述查询后,搜索结果可能如下:
1. 热门智能手机 A(`product-123`,被规则固定到顶部)
2. 热门智能手机 B(`product-456`,被规则固定到顶部)
3. 普通智能手机 C(`product-789`,正常检索结果)
---
总结
这个查询请求通过结合标准查询和 Query Rules 功能,实现了在用户搜索时动态调整搜索结果的顺序。它将某些文档固定到顶部,从而满足业务需求(如推广热门商品)。
案例 2:排除不相关内容
假设我们需要在用户搜索“新闻”时,排除某些过时的新闻内容。
定义规则集:
```json
PUT _query_rules/exclude-ruleset
{
"rules": [
{
"rule_id": "exclude-old-news",
"type": "exclude",
"criteria": [
{
"type": "exact",
"metadata": "query_string",
"values": ["旧闻"]
}
],
"actions": {
"ids": ["news-789"]
}
}
]
}
```
• `type`:规则类型为`exclude`,表示从搜索结果中排除指定文档。
• `criteria`:当用户搜索“旧闻”时触发规则。
• `actions`:排除文档`news-789`。
应用规则的搜索请求:
```json
GET my-index/_search
{
"retriever": {
"rule": {
"retriever": {
"standard": {
"query": {
"query_string": {
"query": "新闻"
}
}
}
},
"match_criteria": {
"query_string": "新闻"
},
"ruleset_ids": ["exclude-ruleset"]
}
}
}
```
• `ruleset_ids`:指定应用的规则集为`exclude-ruleset`。
4.Query Rules 的性能优化
(1)简化规则逻辑
尽量减少规则的数量和复杂性,避免过多的模糊匹配或复杂的条件组合。过多的规则会增加查询的计算开销,降低性能。
(2)合理设置 JVM 参数
通过调整 Elasticsearch 的 JVM 参数(如堆内存大小)来优化整体性能。例如,合理设置堆内存大小可以避免频繁的垃圾回收(GC),从而提高系统性能。
(3)启用查询缓存
对于频繁使用的查询,启用查询缓存可以减少重复查询的开销,提升查询性能。
5.Query Rules 的监控与评估
(1)查询规则测试器 API
使用 Query Rules 测试器 API 验证规则是否按预期工作。
```json
POST _query_rules/my-ruleset/_test
{
"match_criteria": {
"match": "exclude"
}
}
```
(2)查询执行计划分析
通过启用查询执行计划分析(`profile`参数),可以分析查询的性能瓶颈。
```json
{
"query": {
"match": {
"field": "value"
}
},
"profile": true
}
```
通过以上案例和参数详解,可以更好地在 Elasticsearch 中使用 Query Rules 功能来动态调整搜索结果,同时结合性能优化和监控手段,确保系统的高效运行。