/
IDE(Integrated Development Environment)是提供程序开发环境的专业应用程序,一般包括代码编辑器、编译器、调试器和图形用户界面(GUI)等工具。诸如Visual Studio(VS)、PyCharm、Xcode、Spyder和Jupyter Notebook都是业界常用的IDE。
本期推文基于Jupyter Notebook以及Spyder,介绍数据分析中相关性运算的Python实现。

首先,单击电脑左下角开始图标,搜索Anaconda3(64-bit)文件夹,在其下拉菜单中单击Jupyter Notebook(anaconda3),待弹出一个黑框后按Enter键从而打开Jupyter Notebook工作界面,参见图1。

图1 搜索Jupyter Notebook
单击Jupyter Notebook工作界面右上角New按钮,在下拉列表中选择Python3(ipykernel)选项以新建一个Python文件,参见图2。

图2 Jupyter Notebook启动工作界面
在弹出的代码框中输入第一段代码from string import ascii_letters,按Ctrl+Enter快捷组合键或单击按钮运行上述代码,通过单击左上角的“+”按钮可以新增代码框,直至完成相关性运算整个程序文件的编写,参见图3。


图3 创建Python文件
单击File项下的Download as选项将上述Jupyter Notebook另存为describe.py程序文件,其中的相关系数与热力图分别参见图4与图5。

图4 运用Python函数corr()计算的Pearson相关系数

图5 热力图:基于Python随机函数生成的表格型数据
单击电脑开始界面的Spyder(anaconda3),打开Spyder集成开发环境;按Ctrl+O快捷组合键打开我们新建的describe.py文件;顺次按Run current cell等工具按钮执行相应的命令行,计算Pearson相关系数,绘制热力效果图(参见图6和图7),以体验Spyder相较于Jupyter Notebook的另类“风味”!

图6 Spyder:基于describe.py文件

图7 Spyder风格的热力效果图
鉴于相关系数和热力图为常见数据分析方法,这里未予介绍;关于Python程序文件各行命令的注释,也请读者诸君自行百度研习。

编辑:Sunny
审核:杨露

往期回顾:
祁祁连山迷万重,分类别裁识流变——真实盈余管理桑基图的Stata实现

实证会计入门一点通
扫描二维码关注我们

鼎园会计微信群
本群主旨:
交流Stata与Python,
分析结构化数据,
探讨非结构化文本会计,
共同书写鼎园会计人生。





