Hive 窗口函数保姆级教程
园陌 五分钟学大数据 2023-04- 1918:01 发表于北京
收录于合集
14 个
#Hive
五分钟学大数据
大数据领域原创技术号,专注于大数据研究,包括
Hadoop、Flink、Spark、Kafka、Hiv… 81 篇原创内容
公众号
在 SQL 中有一类函数叫做聚合函数,例如 sum()、avg()、max() 等等,这类函
数可
以将多行数据按照规则聚集为一行, 一般来讲聚集后的行数是要少于聚集前的行数
的。但是有时我们想要既显示聚集前的数据,又要显示聚集后的数据,这时我们便
引入了窗口函数。窗口函数又叫 OLAP 函数 1 分析函数,窗口函数兼具分组和排序
功
能。
本文分为两部分:
第一部分是 Hive 窗口函数详解,剖析各种窗口函数(几乎涵盖 Hive 所有的窗口
函 数 ) ;
第二部分是窗口函数实际应用,这部分总共有五个例子,都是工作常用、面试必问
的非常经典的例子。
Hive 窗 口 函 数
窗口函数最重要的关键字是 partition by
和 order by
具体语法如下: XXX over(partition by xxx order by xxx)
特别注意:over()
里面的 partition by
和 order by 都不是必选的 ,over() 里面可
以只有 partition by, 也可以只有 order by,也可以两个都没有,大家需根据需求
评论