Oracle高级分组小结

原创只是甲 2020-06-18

1869

一.group by 语句
二.rollup语句
三.cube语句
四.group_id()
五.grouping
六.grouping_id
七.grouping set

备注:测试数据库版本为Oracle 11g R2

这个blog我们来聊聊常见的Oracle的高级分组函数

测试数据:

DROP TABLE testa;
 
 
CREATE  TABLE testa (area   VARCHAR2 (20), month VARCHAR2   (20),
amount NUMBER);


insert into testa values ('上海', '1月', 199); 
insert into testa values ('上海', '2月', 199); 
insert into testa values ('上海', '3月', 155); 
insert into testa values ('上海', '3月', 155); 
insert into testa values ('上海', '4月', 125); 
insert into testa values ('广州', '1月', 75); 
insert into testa values ('广州', '2月', 67); 
insert into testa values ('北京', '1月', 235);
insert into testa values ('北京', '2月', 330); 
Commit;

一.group by 语句

求每个区域，每个月的销售额

SELECT  area, month, SUM (amount) FROM testa
GROUP BY   area, month ORDER BY   area, month;

SQL> SELECT  area, month, SUM (amount) FROM testa
  2  GROUP BY   area, month ORDER BY   area, month;
AREA                 MONTH                SUM(AMOUNT)
-------------------- -------------------- -----------
北京                 1月                          235
北京                 2月                          330
广州                 1月                           75
广州                 2月                           67
上海                 1月                          199
上海                 2月                          199
上海                 3月                          310
上海                 4月                          125
8 rows selected

二.rollup语句

rollup语法
–可跟一个到多个表达式
–记表达式数量为n，会生成n+1组分类汇总的统计结果
–rollup(a)=(a) union all (_ALL)
–rollup(a,b)=(a,b) union all (a) union all (_ALL)
–rollup(a,b,c)=(a,b,c) union all (a,b) union all (a) union all (_ALL)

求每个区域每个月份汇总以及地区的汇总及总汇总

SELECT   NVL (area, '地区合计') area, NVL (month, '月合计') month, SUM (amount)
FROM   testa
GROUP BY      ROLLUP (area, month);

SQL> SELECT   NVL (area, '地区合计') area, NVL (month, '月合计') month, SUM (amount)
  2  FROM   testa
  3  GROUP BY      ROLLUP (area, month);
AREA                 MONTH                SUM(AMOUNT)
-------------------- -------------------- -----------
北京                 1月                          235
北京                 2月                          330
北京                 月合计                       565
广州                 1月                           75
广州                 2月                           67
广州                 月合计                       142
上海                 1月                          199
上海                 2月                          199
上海                 3月                          310
上海                 4月                          125
上海                 月合计                       833
地区合计             月合计                      1540
12 rows selected

三.cube语句

cube语法
–可跟一个到多个表达式
–记表达式数量为n，会生成power(2,n)组分类汇总的统计结果
–cube(a)=(a) union all (_ALL),
–cube(a,b)=(a,b) union all (a) union all (b) union all (_ALL)
–cube(a,b,c)=(a,b,c) union all (a,b) union all (a,c) union all (b,c) union all (a) union all (b)
union all © union all (_ALL)

求每个区域每个月份汇总以及地区的汇总及每个月份的汇总及总汇总
将rollup修改为cube后，多了每个月销售额的汇总数据

SELECT   NVL (area, '地区合计') area, NVL (month, '月合计') month, SUM (amount)
FROM   testa
GROUP BY cube(area, month);

SQL> SELECT   NVL (area, '地区合计') area, NVL (month, '月合计') month, SUM (amount)
  2  FROM   testa
  3  GROUP BY cube(area, month);
AREA                 MONTH                SUM(AMOUNT)
-------------------- -------------------- -----------
地区合计             月合计                      1540
地区合计             1月                          509
地区合计             2月                          596
地区合计             3月                          310
地区合计             4月                          125
北京                 月合计                       565
北京                 1月                          235
北京                 2月                          330
广州                 月合计                       142
广州                 1月                           75
广州                 2月                           67
上海                 月合计                       833
上海                 1月                          199
上海                 2月                          199
上海                 3月                          310
上海                 4月                          125
16 rows selected

四.group_id()

group_id()语法
– 区分相同分组标准的分组统计结果，有n组，返回的数字从0到n-1
– 正常情况下比较是少有重复的分组
– 但是对于一些特定的场景，会存在重复

--正常分组
SELECT  area, month, SUM (amount) s_amount,group_id() groupid FROM testa
GROUP BY  (area, month)
order by area,month;

--分组后再来rollup
SELECT  area, month, SUM (amount) s_amount,group_id() groupid FROM testa
GROUP BY  (area, month),rollup(area,month)
order by area,month;

SQL> --正常分组
     --group_id()全部是0，表示没有重复的分组
SQL> SELECT  area, month, SUM (amount) s_amount,group_id() groupid FROM testa
  2  GROUP BY  (area, month)
  3  order by area,month;
AREA                 MONTH                  S_AMOUNT    GROUPID
-------------------- -------------------- ---------- ----------
北京                 1月                         235          0
北京                 2月                         330          0
广州                 1月                          75          0
广州                 2月                          67          0
上海                 1月                         199          0
上海                 2月                         199          0
上海                 3月                         310          0
上海                 4月                         125          0
8 rows selected
SQL> --分组后再来rollup
     --group_id()对于重复的分组进行了标记
     --最多有3个重复的组,所以标记为0,1,2
SQL> SELECT  area, month, SUM (amount) s_amount,group_id() groupid FROM testa
  2  GROUP BY  (area, month),rollup(area,month)
  3  order by area,month;
AREA                 MONTH                  S_AMOUNT    GROUPID
-------------------- -------------------- ---------- ----------
北京                 1月                         235          1
北京                 1月                         235          2
北京                 1月                         235          0
北京                 2月                         330          2
北京                 2月                         330          0
北京                 2月                         330          1
广州                 1月                          75          1
广州                 1月                          75          2
广州                 1月                          75          0
广州                 2月                          67          1
广州                 2月                          67          2
广州                 2月                          67          0
上海                 1月                         199          0
上海                 1月                         199          1
上海                 1月                         199          2
上海                 2月                         199          0
上海                 2月                         199          2
上海                 2月                         199          1
上海                 3月                         310          1
上海                 3月                         310          0
上海                 3月                         310          2
上海                 4月                         125          0
上海                 4月                         125          1
上海                 4月                         125          2
24 rows selected

五.grouping

grouping 语法
grouping(expr)
– 若是expr的汇总，则返回1，否则返回0
判断是否是area列的分组

SELECT   NVL (area, '地区合计') area, NVL (month, '月合计') month, SUM (amount) s_amount,grouping(area) grping
FROM   testa
GROUP BY cube(area, month);

SQL> SELECT   NVL (area, '地区合计') area, NVL (month, '月合计') month, SUM (amount) s_amount,grouping(area) grping
  2  FROM   testa
  3  GROUP BY cube(area, month);
AREA                 MONTH                  S_AMOUNT     GRPING
-------------------- -------------------- ---------- ----------
地区合计             月合计                     1540          1
地区合计             1月                         509          1
地区合计             2月                         596          1
地区合计             3月                         310          1
地区合计             4月                         125          1
北京                 月合计                      565          0
北京                 1月                         235          0
北京                 2月                         330          0
广州                 月合计                      142          0
广州                 1月                          75          0
广州                 2月                          67          0
上海                 月合计                      833          0
上海                 1月                         199          0
上海                 2月                         199          0
上海                 3月                         310          0
上海                 4月                         125          0
16 rows selected

六.grouping_id

grouping_id语法:
grouping_id(expr1,expr2,expr3,…)
– 为n个expr构成的分组标准产生的分组统计结果生成区分ID
– 可将每个表达式想象成一个二进制数位，将这些二进制数位之和转为十进制
– 若本行是某expr的汇总，那么该expr对应的二进制数是1，否则为0
– 可以，grouping 是grouping_id的简化版本

cube总共合计是0~power(2,n)-1,如果配合上grouping_id的话，值的范围相同
grouping_id(a,b)的话，所有的合计为3，b的合计为2，a的合计为1，a，b的合计取值为0

SELECT   NVL (area, '地区合计') area, NVL (month, '月合计') month, SUM (amount) s_amount,grouping_id(area,month) grping
FROM   testa
GROUP BY cube(area, month);

SQL> SELECT   NVL (area, '地区合计') area, NVL (month, '月合计') month, SUM (amount) s_amount,grouping_id(area,month) grping
  2  FROM   testa
  3  GROUP BY cube(area, month);
AREA                 MONTH                  S_AMOUNT     GRPING
-------------------- -------------------- ---------- ----------
地区合计             月合计                     1540          3
地区合计             1月                         509          2
地区合计             2月                         596          2
地区合计             3月                         310          2
地区合计             4月                         125          2
北京                 月合计                      565          1
北京                 1月                         235          0
北京                 2月                         330          0
广州                 月合计                      142          1
广州                 1月                          75          0
广州                 2月                          67          0
上海                 月合计                      833          1
上海                 1月                         199          0
上海                 2月                         199          0
上海                 3月                         310          0
上海                 4月                         125          0
16 rows selected

--grouping可以很好的解决cube的时候是按照什么进行分组的
SELECT CASE GROUPING (area) || GROUPING (month) WHEN '00' THEN '按地区与月份'
WHEN '10' THEN '按月份' WHEN '01' THEN '按地区' WHEN '11' THEN '总合计'
END
AS GROUPING,
CASE GROUPING_ID (area, month) WHEN 0 THEN '按地区与月份' WHEN 2 THEN '按月份'
WHEN 1 THEN '按地区' WHEN 3 THEN '总合计'
END
AS GROUPING_ID,
area, month,
SUM (amount) FROM testa
GROUP  BY CUBE (area, month);

SQL> SELECT CASE GROUPING (area) || GROUPING (month) WHEN '00' THEN '按地区与月份'
  2  WHEN '10' THEN '按月份' WHEN '01' THEN '按地区' WHEN '11' THEN '总合计'
  3  END
  4  AS GROUPING,
  5  CASE GROUPING_ID (area, month) WHEN 0 THEN '按地区与月份' WHEN 2 THEN '按月份'
  6  WHEN 1 THEN '按地区' WHEN 3 THEN '总合计'
  7  END
  8  AS GROUPING_ID,
  9  area, month,
 10  SUM (amount) FROM testa
 11  GROUP  BY CUBE (area, month);
GROUPING     GROUPING_ID  AREA                 MONTH                SUM(AMOUNT)
------------ ------------ -------------------- -------------------- -----------
总合计       总合计                                                        1540
按月份       按月份                            1月                          509
按月份       按月份                            2月                          596
按月份       按月份                            3月                          310
按月份       按月份                            4月                          125
按地区       按地区       北京                                              565
按地区与月份 按地区与月份 北京                 1月                          235
按地区与月份 按地区与月份 北京                 2月                          330
按地区       按地区       广州                                              142
按地区与月份 按地区与月份 广州                 1月                           75
按地区与月份 按地区与月份 广州                 2月                           67
按地区       按地区       上海                                              833
按地区与月份 按地区与月份 上海                 1月                          199
按地区与月份 按地区与月份 上海                 2月                          199
按地区与月份 按地区与月份 上海                 3月                          310
按地区与月份 按地区与月份 上海                 4月                          125
16 rows selected

七.grouping set

有时候分组需求无需rollup和cube那么多
例如我只想要 A的分组和B的分组、A的分组和BC的分组
这个时候我只能 group by A union all group by B、 group by A union all group by B,C

这个时候grouping set的出现就可以很好的解决这个问题
GROUP BY GROUPING SETS (A,B) 等价与 GROUP BY A UNION ALL GROUP BY B
GROUP BY GROUPING SETS (A,B,C) 等价与 GROUP BY A UNION ALL GROUP BY B UNION ALL GROUP BY C
GROUP BY GROUPING SETS ((A,B,C)) 等价与 GROUP BY A,B,C
GROUP BY GROUPING SETS (A,(B,C)) 等价与 GROUP BY A UNION ALL GROUP BY B,C

SELECT   NVL (area, '地区合计') area, NVL (month, '月合计') month, SUM (amount) s_amount,grouping_id(area,month) grping
FROM   testa
GROUP BY grouping sets(area, month);

SQL> SELECT   NVL (area, '地区合计') area, NVL (month, '月合计') month, SUM (amount) s_amount,grouping_id(area,month) grping
  2  FROM   testa
  3  GROUP BY grouping sets(area, month);
AREA                 MONTH                  S_AMOUNT     GRPING
-------------------- -------------------- ---------- ----------
北京                 月合计                      565          1
广州                 月合计                      142          1
上海                 月合计                      833          1
地区合计             2月                         596          2
地区合计             4月                         125          2
地区合计             1月                         509          2
地区合计             3月                         310          2
7 rows selected

这里还有一个grouping set、rollup、group_id()联合使用的例子
求每个区域的汇总、每个月份的汇总以及所有的汇总

--通过rollup来构造总合计
SELECT NVL (area, '地区合计') area,
NVL (month, '月合计') month,
SUM (amount)
FROM testa
GROUP BY grouping sets( ROLLUP (area), ROLLUP( month))
;

--去掉其中一个rollup及可以去掉一个重复的总合计
SELECT NVL (area, '地区合计') area,
NVL (month, '月合计') month,
SUM (amount)
FROM testa
GROUP BY grouping sets( ROLLUP (area), month)
;

--当然我们也可以用上面学的group_id()进行去重
SELECT NVL (area, '地区合计') area,
NVL (month, '月合计') month,
SUM (amount)
FROM testa
GROUP BY grouping sets( ROLLUP (area), ROLLUP( month))
having group_id() = 0
;

SQL> --通过rollup来构造总合计
SQL> SELECT NVL (area, '地区合计') area,
  2  NVL (month, '月合计') month,
  3  SUM (amount)
  4  FROM testa
  5  GROUP BY grouping sets( ROLLUP (area), ROLLUP( month))
  6  ;
AREA                 MONTH                SUM(AMOUNT)
-------------------- -------------------- -----------
北京                 月合计                       565
广州                 月合计                       142
上海                 月合计                       833
地区合计             2月                          596
地区合计             4月                          125
地区合计             1月                          509
地区合计             3月                          310
地区合计             月合计                      1540
地区合计             月合计                      1540
9 rows selected
SQL> --去掉其中一个rollup及可以去掉一个重复的总合计
SQL> SELECT NVL (area, '地区合计') area,
  2  NVL (month, '月合计') month,
  3  SUM (amount)
  4  FROM testa
  5  GROUP BY grouping sets( ROLLUP (area), month)
  6  ;
AREA                 MONTH                SUM(AMOUNT)
-------------------- -------------------- -----------
北京                 月合计                       565
广州                 月合计                       142
上海                 月合计                       833
地区合计             月合计                      1540
地区合计             2月                          596
地区合计             4月                          125
地区合计             1月                          509
地区合计             3月                          310
8 rows selected
SQL> --当然我们也可以用上面学的group_id()进行去重
SQL> SELECT NVL (area, '地区合计') area,
  2  NVL (month, '月合计') month,
  3  SUM (amount)
  4  FROM testa
  5  GROUP BY grouping sets( ROLLUP (area), ROLLUP( month))
  6  having group_id() = 0
  7  ;
AREA                 MONTH                SUM(AMOUNT)
-------------------- -------------------- -----------
北京                 月合计                       565
广州                 月合计                       142
上海                 月合计                       833
地区合计             2月                          596
地区合计             4月                          125
地区合计             1月                          509
地区合计             3月                          310
地区合计             月合计                      1540
8 rows selected

「喜欢这篇文章，您的关注和赞赏是给作者最好的鼓励」

关注作者

文章被以下合辑收录

Oracle开发（共11篇）

Oracle SQL PLSQL开发