看过前几期推送之后相信大家对于NHANES数据库都有一定的了解,但具体到文献中的Table 1要怎么运用这些知识呢,我们这期就详细聊一聊。
话不多说,简单介绍一下今天的内容:T test、方差分析、卡方检验以及最后的例子讲解。
因为本次用到的数据集均为同一个,获取链接统一放在下面:
https://wwwn.cdc.gov/nchs/data/tutorials/analysis_data.sas7bdat
01 NHANES中 T test 实现
咱们还是老规矩,放上SAS代码(model语句后有中文注释)、结果图片以及结果解释。
PROC SURVEYREG data=analysis_data nomcar;STRATA sdmvstra;CLUSTER sdmvpsu;CLASS riagendr;WEIGHT wtmec4yr;MODEL bpxsar = riagendr/solution clparm vadjust=none;/*nomcar表示非完全随机删失,与Taylor series variance estimation(Nhanes官网推荐,可用varmethod=taylor指定)配套使用;class语句表示在不同性别之间比较差异,与一般线性模型中一致;有class语句时,如果想得到estimate,SE,以及95% CI的话需要在model语句中加入solution clparm;vadjust=none表示不用自由度校正方差估计,SAS默认vadjust=df,在本程序中两个选项结果差距不大*/run;

↑
T test结果展示
结果显示,T test 结果P值为0.0033,Model中F value的P值与下面t value的P值相同。
02 NHANES中方差分析的实现
PROC SURVEYREG data=analysis_data nomcar ;STRATA sdmvstra;CLUSTER sdmvpsu;CLASS ridreth1;WEIGHT wtmec4yr;MODEL bpxsar = ridreth1/solution clparm vadjust=none anova;/*MODEL语句中加入anova选项,CLASS语句中变量由性别换为种族*/run;

↑
方差分析结果展示
结果显示,方差分析总体差异的P值为<0.0001。
03 NHANES中卡方分析的实现
proc surveyfreq data=analysis_data;strata sdmvstra;cluster sdmvpsu;weight wtmec4yr;table riagendr*ridreth1/col rownostd nowt wchisq wllchisq chisq chisq1;/*不同性别之间种族构成比是否有差异,按照官网推荐采用Rao-Scott Chi-Square的结果*/run;

↑
卡方分析结果展示
按照官网推荐采用Rao-Scott Chi-Square的结果,P值为0.0010。
04 NHANES数据已发表文章Table 1
最后我们还是用上期推送已经提到过那篇文章(使用标准误的那篇,如果想使用标准差的话,可以参考非复杂抽样分析的程序,我在这就不赘述了)的Table 1作为例子对前面所讲的知识加以运用,截图如下。
↑
图片中分组为三组,用到的分析方法有方差分析和卡方分析
按照测得的拟除虫菊酯类杀虫剂水平分成三分位。
1.表格中第一行是age(连续性变量),用surveymeans得到mean及SE,然后用surveyreg进行方差分析即可得到相应的P值;
2.表格中第二行是sex(二分类变量),用surveyfreq得到percent及SE,然后同样用surveyfreq加上相应的chisq选项即可得到相应的P值;
3.其他行同理。
05 一点碎碎念
从我在公众号上推送第一篇文章到今天,已有32天。公众号注册其实已有近2年,可以说这是我一直想做的事情,只是不知道分享什么,才一直拖到了现在。
其实,我最开始更新NHANES教程是在简书。记得我当时还生病了,心里郁闷又没什么事干就想着好歹是把自己学的东西整理出来,没人看也无所谓,毕竟也是输出。
真正用NHANES数据去做实际的数据分析是在那之后了,确实要感谢当时给我答疑解惑的师兄师姐和老师,要不然也就不会有如今新更新的这些教程。
公众号上的NHANES系列教程其实也就是这么来的。NHANES教程是我公众号的基础,但其实也不可能是公众号的全部,所以我一直希望能在NHANES教程中加入更多的东西,不管是基础的统计学知识还是不一样的思考问题的角度,也是希望能把内容的价值最大化。
公众号后面真正运营的是个人,人是有温度和情感的,那公众号也应该有。
一周一更已是颇为不易,上次标准差和标准误的推送满打满算就用了差不多两天的时间,觉得还可以的朋友记得点赞在看哦。
最后,还是要感谢一下帮忙转载的师兄以及关注的朋友,当然还有之前问我标准差和标准误问题的朋友(上一期竟然忘了感谢)。
感谢你能看到这里,毕竟看我絮叨了这么多。五一假期愉快,下周见(不出意外的话,会是一期权重内容的新版本)~
06 参考内容
https://wwwn.cdc.gov/nchs/nhanes/tutorials/samplecode.asp
Yang Q, Zhang Z, Gregg EW, Flanders WD, Merritt R, Hu FB. Added sugar intake and cardiovascular diseases mortality among US adults. JAMA Intern Med. 2014;174(4):516-524.




