暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

Python数据分析系列之二:相关性运算

实证会计入门一点通 2022-08-01
2468

  /  

IDE(Integrated Development Environment)是提供程序开发环境的专业应用程序,一般包括代码编辑器、编译器、调试器和图形用户界面(GUI)等工具。诸如Visual Studio(VS)、PyCharm、Xcode、Spyder和Jupyter Notebook都是业界常用的IDE。

本期推文基于Jupyter Notebook以及Spyder,介绍数据分析中相关性运算的Python实现。



首先,单击电脑左下角开始图标,搜索Anaconda3(64-bit)文件夹,在其下拉菜单中单击Jupyter Notebook(anaconda3),待弹出一个黑框后按Enter键从而打开Jupyter Notebook工作界面,参见图1。

图1  搜索Jupyter Notebook



单击Jupyter Notebook工作界面右上角New按钮,在下拉列表中选择Python3(ipykernel)选项以新建一个Python文件,参见图2。

图2  Jupyter Notebook启动工作界面



在弹出的代码框中输入第一段代码from string import ascii_letters,按Ctrl+Enter快捷组合键或单击按钮运行上述代码,通过单击左上角的“+”按钮可以新增代码框,直至完成相关性运算整个程序文件的编写,参见图3。

图3  创建Python文件



单击File项下的Download as选项将上述Jupyter Notebook另存为describe.py程序文件,其中的相关系数与热力图分别参见图4与图5。

图4  运用Python函数corr()计算的Pearson相关系数


图5  热力图:基于Python随机函数生成的表格型数据



单击电脑开始界面的Spyder(anaconda3),打开Spyder集成开发环境;按Ctrl+O快捷组合键打开我们新建的describe.py文件;顺次按Run current cell等工具按钮执行相应的命令行,计算Pearson相关系数,绘制热力效果图(参见图6和图7),以体验Spyder相较于Jupyter Notebook的另类“风味”!

图6  Spyder:基于describe.py文件


图7  Spyder风格的热力效果图



鉴于相关系数和热力图为常见数据分析方法,这里未予介绍;关于Python程序文件各行命令的注释,也请读者诸君自行百度研习。




编辑:Sunny

审核:杨露

往期回顾:

Python数据分析系列之一:Anaconda的安装

祁祁连山迷万重,分类别裁识流变——真实盈余管理桑基图的Stata实现

慧中大道

叠彩流光齐春晖,琳琅满目秀葳蕤——蓁蓁图表系列之峰峦图

圆通果实弘以智,淡妆浓抹总相宜——蓁蓁图表系列之华夫饼图

【鼎园会计】专题合集

实证会计入门一点通


扫描二维码关注我们

鼎园会计微信群


本群主旨:

交流Stata与Python,

分析结构化数据,

探讨非结构化文本会计,

共同书写鼎园会计人生。


文章转载自实证会计入门一点通,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论