暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

SQL用了两年多,我最常用的2个小技巧

数据森麟 2021-07-07
651


公众号后台回复“图书“,了解更多号主新书内容

     作者:luanhz

     来源:小数志


导读

SQL是所有数据从业者必须打牢的基本功之一,扎实的SQL查询和适当的调优技巧是检验SQL能力的两大重要准则。个人曾经专门花费过好多时间用于提升SQL能力,期间也刷了大量的SQL题目,在这期间也不断摸索总结了一些小技巧,今天本文就来分享其中的两个,也差不多是日常使用中最为高频的两个了。


5分钟学会的两个小技巧


为了配合演示这两个小技巧,本文所使用示例数据如下,其实这也是前几天推文中所使用的数据:

示例学生成绩表


01 SQL的数据类型隐式转换
很多编程语言都限定了数据类型,例如在Python中字符串"0"和数值0是不相等的,布尔型True和数值1也是不相等,但在SQL中则不然,其内置了数据类型隐式转换功能,所以执行查询 select "0"=0 会返回1的,这既说明字符串"0"和数值0是相等的,也说明SQL中的布尔值会自动转换为1或0。


利用这一小技巧,在实现很多统计指标时就可以有很多小技巧。例如计算学生成绩表中每名学生的成绩的优秀率,即成绩在90分以上的科目与本人总科目的占比。为实现这一查询,常规的操作是分别统计每名学生成绩在90分以上的科目数量和总科目,然后进行相除得到占比。


实际上,在给出前述小例子的基础上,这一需求可以如下实现:


其中,在每名学生的分组中,条件判断score>=90返回一组0或1的结果,对这组0/1取值进行求均值操作,即等价于求成绩>=90的科目占比。


02 巧妙运用if函数和null

SQL内置了众多函数,但对于一名程序员而言if函数应该尤为常见和常用;另一方面,null值也是SQL中一个神奇的存在,它有两大特性:一是任何值与null的任何计算都会得到null值;二是在任何聚合函数中,null值都不参与计算(例如,count计数就是查找null以外的结果数量)。配合使用if函数和null值,有时也可实现很好的效果。


例如,仍然针对以上学生成绩表,需要分别统计每名学生成绩在80分以上成绩的平均值,也就是如果成绩>=80则参与最后均值计算,否则不参与。配合if函数和null的特性,可以如下优雅的实现:


实际上,上述查询语句中,首先通过if函数衍生一个临时字段if(score>=80, score, null)其取值为:成绩≥80时取成绩值,否则置为null,即相当于仅保留了成绩在80分以上的记录;而后嵌套一层avg函数即直接实现了计算80分以上平均值的效果。

当然,对于这一需求也可以先用where条件过滤出成绩在80分以上的记录后再聚合统计。

◆ ◆ ◆  ◆ 

麟哥新书已经在当当上架了,我写了本书:《拿下Offer-数据分析师求职面试指南》,目前当当正在举行活动,大家可以用相当于原价5折的预购价格购买,还是非常划算的:





数据森麟公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里交流关于数据分析&数据挖掘的相关内容,还没有加入的小伙伴可以扫描下方管理员二维码,进群前一定要关注公众号奥,关注后让管理员帮忙拉进群,期待大家的加入。


管理员二维码:

猜你喜欢

 !原来爬取B站弹幕这么简单

 厉害了!麟哥新书登顶京东销量排行榜!

 笑死人不偿命的知乎沙雕问题排行榜

 用Python扒出B站那些“惊为天人”的阿婆主!

 你相信逛B站也能学编程吗

文章转载自数据森麟,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论