暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

SQL常用窗口函数——ROW_NUMBER()、RANK()、DENSE_RANK()简介及使用

楼的日常跋涉 2021-07-02
7777
以下是常用窗口函数的介绍。

1. ROW_NUMBER()

row_number会为查询出来的每一行记录生成一个序号,依次顺序排序且不会重复,注意使用row_number函数时必须要用over子句选择对某一列进行排序才能生成序号。

-- row_number() 顺序排序

select 

Cust_Id,

Login_Dt,

row_number() over (partition by Cust_Id order by Login_Dt asc) as row_number

from cust_login_inf;

 


2. RANK()

rank函数用于返回结果集的分区内每行的排名,行的排名是相关行之前的排名数加一rankrow_number函数不同的是,rank函数考虑到over子句中排序字段值相同的情况,over子句中排序字段值相同的序号是一样的,后面字段值不相同的序号将跳过相同的排名号排下一个,也就是相关行之前的排名数加一,可以理解为根据当前的记录数生成序号,后面的记录依此类推。

-- rank() 跳跃排序,如果有两个第二级别时,接下来是第四级别

select 

Cust_Id,

Login_Dt,

rank() over (partition by Cust_Id order by Login_Dt asc) as rank

from cust_login_inf;

 


3. DENSE_RANK()

dense_rank函数的功能与rank函数类似,dense_rank函数在生成序号时是连续的,而rank函数生成的序号有可能不连续。dense_rank函数出现相同排名时,将不跳过相同排名号,rank值紧接上一次的rank值。在各个分组内,rank()是跳跃排序,有两个第一名时接下来就是第三名,dense_rank()是连续排序,有两个第一名时仍然跟着第二名。

-- dense_rank() 跳跃排序,如果有两个第二级别时,接下来是第三级别

select 

Cust_Id,

Login_Dt,

dense_rank() over (partition by Cust_Id order by Login_Dt asc) as dense_rank

from cust_login_inf;

 

关于Partition by

Parttion by关键字是数据库分析性函数的一部分,用于给结果集进行分区。它和聚合函数Group by不同的地方在于它只是将原始数据进行名次排列,能够返回一个分组中的多条记录(记录数不变),而Group by是对原始数据进行聚合统计,一般只有一条反映统计值的结果(每组返回一条)。

TIPS

使用rank over()的时候,空值是最大的,如果排序字段为null, 可能造成null字段排在最前面,影响排序结果。

可以这样:rank() over(partition by student order by score desc nulls last)

总结:

在使用排名函数的时候需要注意以下三点:

1、排名函数必须有 OVER 子句。

2、排名函数必须有包含 ORDER BY 的 OVER 子句。

3、分组内从1开始排序。

4rank中空值是最大的,要用 nulls last进行调整


一、近七天中连续三天都登陆的

1.1 查询出近7天的登陆用户,并对用户登陆日期进行排名;

1.2 计算用户登陆日期和排名之间的差值;

-- rank(date_sub() 的使用

select 

Cust_Id,

Login_Dt,

Rank,

date_sub(Login_Dt,Rank) as Dt_Dif  --1.2

 from 

 (

select 

Cust_Id,

Login_Dt,

rank() over (partition by Cust_Id order by Login_Dt asc) as Rank  --1.1

from cust_login_inf

where Login_Dt >=date_sub('2021-02-24',6) and Login_Dt<='2021-02-24'

 )t1

;

2.1 对同用户及差值进行分组,统计差值个数;

2.2 取出差值个数大于等于3的数据;

2.3 对数据去重;

-- count(group by 的使用

select

Cust_Id

from 

(

Select

Cust_Id

from 

(

select 

Cust_Id,

date_sub(Login_Dt,Rank) as Dt_Dif  --1.2

from 

(

select 

Cust_Id,

Login_Dt,

rank() over (partition by Cust_Id order by Login_Dt asc) as Rank  --1.1

from cust_login_inf

where Login_Dt >=date_sub('2021-02-24',6) and Login_Dt<='2021-02-24'

)t1

)t2

group by Cust_Id,Dt_Dif  --2.1

having count(*)>=3  --2.2

)t3

group by Cust_Id   --2.3

;

  


二、部门平均薪水

1剔除每个部门最高、最低薪水的雇员数据

-- rank(group by 的使用

select 

Employee_Id,

    Dept_Id,

    Salary

from 

(

Select

Employee_Id,

Dept_Id,

Salary,

rank() over (partition by Dept_Id order by Salary asc) as Asc_Rank,

rank() over (partition by Dept_Id order by Salary desc) as Desc_Rank

from SALARY_TABLE

)t1

where Asc_Rank > 1 and Desc_Rank > 1

;

 

2求每个部门雇员的平均薪水,保留整数

-- avg(cast() 的使用

select

Dept_Id,

cast(avg(Salary) as int) as Avg_Salary

from 

(

select 

Employee_Id,

Dept_Id,

Salary

from 

(

select

Employee_Id,

Dept_Id,

Salary,

rank() over (partition by Dept_Id order by Salary asc) as Asc_Rank,

rank() over (partition by Dept_Id order by Salary desc) as Desc_Rank

from SALARY_TABLE

)t1

where Asc_Rank > 1 and Desc_Rank > 1

)t2

group by Dept_Id

;

 

 

参考:

https://www.cnblogs.com/hzjl/p/10518558.html


文章转载自楼的日常跋涉,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论