Elasticsearch索引聚合查询—Pipline聚合

碧茂大数据 2022-05-07

275

更多精彩，请点击上方蓝字关注我们！

1 ElasticSearch设计管道机制

让上一步的聚合结果成为下一个聚合的输入，这就是管道
第一个维度：管道聚合有很多不同类型，每种类型都与其他聚合计算不同的信息，但是可以将这些类型分为两类：

父级：父级聚合的输出提供了一组管道聚合，它可以计算新的存储桶或新的聚合以添加到现有存储桶中。
兄弟：同级聚合的输出提供的管道聚合，并且能够计算与该同级聚合处于同一级别的新聚合

第二个维度：根据功能设计的意图

比如前置聚合可能是Bucket聚合，后置的可能是基于Metric聚合，那么它就可以成为一类管道
进而引出了：xxx bucket

Bucket聚合 -> Metric聚合
bucket聚合的结果，成为下一步metric聚合的输入

Average bucket
Min bucket
Max bucket
Sum bucket
Stats bucket
Extended stats bucket

2 Average bucket 聚合

字段类型：

它将跳过桶并使用下一个可用值继续计算
buckets_path：指定聚合的名称，支持多级嵌套聚合
gap_policy 当管道聚合遇到不存在的值，有点类似于term等聚合的(missing)时所采取的策略，可选择值为：skip、insert_zeros
skip：此选项将丢失的数据视为bucket不存在
format 用于格式化聚合桶的输出(key)

POST _search
{
  "size": 0,
  "aggs": {
    "sales_per_month": {
      "date_histogram": {
        "field": "date",
        "calendar_interval": "month"
      },
      "aggs": {
        "sales": {
          "sum": {
            "field": "price"
          }
        }
      }
    },
    "avg_monthly_sales": {
// tag::avg-bucket-agg-syntax[] 
      "avg_bucket": {
        "buckets_path": 
"sales_per_month>sales",
        "gap_policy": "skip",
        "format": "#,##0.00;(#,##0.00)"
      }
// end::avg-bucket-agg-syntax[] 
    }
  }
}

3 Stats bucket 聚合

POST sales/_search
  {
    "size": 0,
    "aggs": {
      "sales_per_month": {
        "date_histogram": {
          "field": "date",
          "calendar_interval": "month"
        },
        "aggs": {
          "sales": {
            "sum": {
              "field": "price"
            }
          }
        }
      },
      "stats_monthly_sales": {
        "stats_bucket": {
          "buckets_path": 
  "sales_per_month>sales" 
        }
      }
    }
  }
  {
    "took": 11,
    "timed_out": false,
    "_shards": ...,
    "hits": ...,
    "aggregations": {
      "sales_per_month": {
        "buckets": [
          {
            "key_as_string": "2015/01/01 00:00:00",
            "key": 1420070400000,
            "doc_count": 3,
            "sales": {
              "value": 550.0
            }
          },
        {
          "key_as_string": "2015/02/01 00:00:00",
          "key": 1422748800000,
          "doc_count": 2,
          "sales": {
            "value": 60.0
          }
        },
        {
          "key_as_string": "2015/03/01 00:00:00",
          "key": 1425168000000,
          "doc_count": 2,
          "sales": {
            "value": 375.0
          } 
        } 
      ]
    },
    "stats_monthly_sales": {
      "count": 3,
      "min": 60.0,
      "max": 550.0,
      "avg": 328.3333333333333,
      "sum": 985.0
    } 
  } 
}

关注公众号：领取精彩视频课程&海量免费语音课程

elasticsearch

文章转载自碧茂大数据，如果涉嫌侵权，请发送邮件至：contact@modb.pro进行举报，并提供相关证据，一经查实，墨天轮将立刻删除相关内容。

Elasticsearch索引聚合查询—Pipline聚合

1 ElasticSearch设计管道机制

2 Average bucket 聚合

3 Stats bucket 聚合

关注公众号：领取精彩视频课程&海量免费语音课程

评论