暂无图片
暂无图片
4
暂无图片
暂无图片
暂无图片

NHANES数据库系列教程(五)--几分钟明白Table1

月明学习小铺 2021-07-21
7250


看过前几期推送之后相信大家对于NHANES数据库都有一定的了解,但具体到文献中的Table 1要怎么运用这些知识呢,我们这期就详细聊一聊。


话不多说,简单介绍一下今天的内容:T test、方差分析、卡方检验以及最后的例子讲解


因为本次用到的数据集均为同一个,获取链接统一放在下面:


https://wwwn.cdc.gov/nchs/data/tutorials/analysis_data.sas7bdat



01 NHANES中 T test 实现


咱们还是老规矩,放上SAS代码(model语句后有中文注释)、结果图片以及结果解释。


    PROC SURVEYREG data=analysis_data nomcar; 
    STRATA sdmvstra;
    CLUSTER sdmvpsu;
    CLASS riagendr;
    WEIGHT wtmec4yr;
    MODEL bpxsar = riagendr/solution clparm vadjust=none;
    /*nomcar表示非完全随机删失,与Taylor series variance estimation(Nhanes官网推荐,可用varmethod=taylor指定)配套使用;
    class语句表示在不同性别之间比较差异,与一般线性模型中一致;
    有class语句时,如果想得到estimate,SE,以及95% CI的话需要在model语句中加入solution clparm;
    vadjust=none表示不用自由度校正方差估计,SAS默认vadjust=df,在本程序中两个选项结果差距不大*/
    run;


    T test结果展示


    结果显示,T test 结果P值为0.0033,Model中F value的P值与下面t value的P值相同。



    02 NHANES中方差分析的实现


      PROC SURVEYREG data=analysis_data nomcar ; 
      STRATA sdmvstra;
      CLUSTER sdmvpsu;
      CLASS ridreth1;
      WEIGHT wtmec4yr;
      MODEL bpxsar = ridreth1/solution clparm vadjust=none anova;
      /*MODEL语句中加入anova选项,CLASS语句中变量由性别换为种族*/
      run;


      方差分析结果展示


      结果显示,方差分析总体差异的P值为<0.0001。



      03 NHANES中卡方分析的实现


        proc surveyfreq data=analysis_data;
        strata sdmvstra;
        cluster sdmvpsu;
        weight wtmec4yr;
        table riagendr*ridreth1/col row
        nostd nowt wchisq wllchisq chisq chisq1;
        /*不同性别之间种族构成比是否有差异,按照官网推荐采用Rao-Scott Chi-Square的结果*/
        run;


        卡方分析结果展示


        按照官网推荐采用Rao-Scott Chi-Square的结果,P值为0.0010。



        04 NHANES数据已发表文章Table 1


        最后我们还是用上期推送已经提到过那篇文章(使用标准误的那篇,如果想使用标准差的话,可以参考非复杂抽样分析的程序,我在这就不赘述了)的Table 1作为例子对前面所讲的知识加以运用,截图如下。


        图片中分组为三组,用到的分析方法有方差分析和卡方分析


        按照测得的拟除虫菊酯类杀虫剂水平分成三分位。


        1.表格中第一行是age(连续性变量),用surveymeans得到mean及SE,然后用surveyreg进行方差分析即可得到相应的P值;

        2.表格中第二行是sex(二分类变量),用surveyfreq得到percent及SE,然后同样用surveyfreq加上相应的chisq选项即可得到相应的P值;

        3.其他行同理。



        05 一点碎碎念


        从我在公众号上推送第一篇文章到今天,已有32天。公众号注册其实已有近2年,可以说这是我一直想做的事情,只是不知道分享什么,才一直拖到了现在。


        其实,我最开始更新NHANES教程是在简书。记得我当时还生病了,心里郁闷又没什么事干就想着好歹是把自己学的东西整理出来,没人看也无所谓,毕竟也是输出。


        真正用NHANES数据去做实际的数据分析是在那之后了,确实要感谢当时给我答疑解惑的师兄师姐和老师,要不然也就不会有如今新更新的这些教程。


        公众号上的NHANES系列教程其实也就是这么来的。NHANES教程是我公众号的基础,但其实也不可能是公众号的全部,所以我一直希望能在NHANES教程中加入更多的东西,不管是基础的统计学知识还是不一样的思考问题的角度,也是希望能把内容的价值最大化。


        公众号后面真正运营的是个人,人是有温度和情感的,那公众号也应该有。


        一周一更已是颇为不易,上次标准差和标准误的推送满打满算就用了差不多两天的时间,觉得还可以的朋友记得点赞在看哦。


        最后,还是要感谢一下帮忙转载的师兄以及关注的朋友,当然还有之前问我标准差和标准误问题的朋友(上一期竟然忘了感谢)。


        感谢你能看到这里,毕竟看我絮叨了这么多。五一假期愉快,下周见(不出意外的话,会是一期权重内容的新版本)~



        06 参考内容


        https://wwwn.cdc.gov/nchs/nhanes/tutorials/samplecode.asp

        Yang Q, Zhang Z, Gregg EW, Flanders WD, Merritt R, Hu FB. Added sugar intake and cardiovascular diseases mortality among US adults. JAMA Intern Med. 2014;174(4):516-524.





        文章转载自月明学习小铺,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

        评论