暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

Python数据分析系列之三:描述性统计

实证会计入门一点通 2022-08-05
2084


一、创建数据集

打开Stata17,调入盈余管理数据集,保留上市公司股票代码(stkcd)、年份(year)、赫芬达尔指数(HHI_oi)、环保投资(lnEPI)和真实盈余管理(REM)等5个变量,并将处理后的数据导出为Excel文件,相应操作命令如下。



二、转换文件格式

将Stata导出的epi.xlsx另存为epi.csv格式数据集。



三、基于Jupyter Notebook

编写描述性统计程序



第1步,打开Jupyter Notebook,参见图1。

图1  打开带有目录功能的Jupyter Notebook


第2步,单击右上角New按钮创建Python文件,参见图2。

图2  创建Python无标题新文件


第3步,将代码框格式选择为Markdown,然后输入不同级别的标题,按Ctrl+Enter快捷组合键执行;按左上角的“+”按钮新增代码框,输入Python命令(或注释),如此依序完成描述性统计一系列命令的编写、编译与调试,参见图3和图4。

图3  编写Python代码块


图4  编写Python代码块(续图3)



第4步,最后是重命名(File选项Rename)并保存Jupyter Notebook(Download As选项Python文件.py),比如Myhhides.py,参见图5。

图5  Jupyter Notebook文件命名与默认路径保存:Myhhides.p


Jupyter Notebook的目录功能不是自带的,需要我们通过Anaconda Prompt安装jupyter_contrib_nbextensions模块并进行用户配置,读者诸君可自行百度搜索帮助文件,创建个人电脑目录环境,以便更加高效管理多层次复杂Python程序文件。

上述模块安装命令如下:

pip install jupyter_contrib_nbextensions


用户配置需输入的文本内容如下:

Jupyter contrib nbextension install --user   




编辑:Sunny

审核:杨 露

往期回顾:

Python数据分析系列之二:相关性运算

Python数据分析系列之一:Anaconda的安装

祁祁连山迷万重,分类别裁识流变——真实盈余管理桑基图的Stata实现

叠彩流光齐春晖,琳琅满目秀葳蕤——蓁蓁图表系列之峰峦图

圆通果实弘以智,淡妆浓抹总相宜——蓁蓁图表系列之华夫饼图

【鼎园会计】专题合集

实证会计一点通

扫描公众号关注我们

鼎园会计

/微信群/

本群主旨:

交流Stata与Python,

分析结构化数据,

探讨非结构化文本会计,

共同书写鼎园会计人生。


文章转载自实证会计入门一点通,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论