由于描述性分析的内容较多,所以还是决定分两次来更新,这样逻辑也会更为清晰。本次更新的内容为描述分布及正态性分析,下次更新均数计算以及频率计算
我们还是以官方教程提供的数据和代码为参考,同时加上简单随机抽样代码以及NHANES中复杂多阶段概率抽样代码,便于大家比较
01 DATASET链接地址
https://wwwn.cdc.gov/nchs/data/tutorials/analysis_data.sas7bdat
02 SAS代码
PROC UNIVARIATE normal data=ANALYSIS_DATA; /*常见简单随机抽样数据Univariate过程*/
where ridageyr >= 20;
VAR lbxtc;
title "Distribution of cholesterol: NHANES 1999-2002";
run;
PROC UNIVARIATE normal data=ANALYSIS_DATA; /*Nhanes中官方推荐的Univariate过程*/
where ridageyr >= 20;
VAR lbxtc;
freq wtmec4yr;
title "Distribution of cholesterol: NHANES 1999-2002";
run;
03 结果展示

↑
简单随机抽样数据Univariate过程结果

↑
NHANES官方推荐的Univariate过程
04 一点总结
有朋友应该已经发现区别了,代码里面多了freq这一句,之后输出的结果均数、中位数并不完全相同。但正态性检验的结果还是基本一致(非正态,不过正态性检验对于正态性要求比较高,稍微偏离正态P值就会<0.05)
微信涨粉确实慢,觉得内容还不错的朋友可以点个赞或者在看,万分感谢~
文章转载自月明学习小铺,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




