暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

你需要的NHANES权重解答,两个象限 and 一个场景

月明学习小铺 2021-07-21
3795




之前有朋友问我NHANES中权重的问题。除了多周期如何合并权重之外,还有朋友提到该选取哪部分权重。


那我们不妨换个角度审视权重,结合实际例子扒一扒权重的使用。



01 两个象限


第二期教程主要从权重选择以及多周期合并两方面介绍了权重,其实我们判断权重是否正确也正是从这两方面来看的。正推过来可以用于理解,反推回去可以用于核查。


既然是两方面的内容,结合我们常见的平面直角坐标系,就能得到一个更为明了的图示。以权重类型作为X轴,以合并周期数作为Y轴。


权重直角坐标系图示


我们以图中的橙色以及绿色点为例,看一下坐标轴上的点对应的内容。


橙色点代表1999-2002年MEC(Mobile Examination Center)权重(变量名称一般是以WTMEC开头),那绿色点代表的就是2001-2006年24小时膳食回顾权重(24-hour recall,这里又需要细分一下,如果使用的是第一天的recall,变量名称一般为WTDRD1;如果是第二天的recall,变量名称一般为WTDRD2)。


需补充的是,和我们平常看直角坐标系一样,我仍然建议朋友们先看X轴,再看Y轴。确定权重类型是保证权重正确的首要条件。接下来的一个场景,我们也会把讲解的重点放在权重类型选择上。



02 一个场景


如果是使用一部分人群数据进行分析,怎么考虑权重?(感谢问这个问题的朋友)


首先看X轴,确定到底应该用哪一种类型的权重。要回答这个问题,就要明确只用到一部分人群的原因


1.最常见的情况,只有部分人群符合我们的纳入标准(如年龄≥20岁)。而我们关注变量是针对全部样本人群进行收集的(比如血压),那需要用到的就是MEC权重或者In-home interview权重。以2003-2004年为例,MEC权重对应的变量名称为WTMEC2YR。


2.在符合纳入标准的情况下,如果是因为我们所关注变量只有这部分人测了,比如2003-2004年的空腹血糖,检测人群只针对12岁及以上的空腹人群(实际检测人数相当于本周期所有人数的1/3)。此时需要使用相应的空腹子人群权重(WTSAF2YR)。


3.在符合纳入标准的情况下,如果是因为我们所关注变量由FFQ或者24h小时膳食回顾收集,需要使用单独的膳食权重,同时考虑膳食回顾状态是否可信。以2003-2004年为例,对应的权重变量名称分别为WTS_FFQ;WTDRD1,WTDRD2。


仍需补充的是,一些在In-home interview中收集的变量(如体力活动),如果与在MEC中收集的变量进行合并,仍需使用MEC权重。


最后看Y轴,将不同周期合并,即可得到相应的权重变量。


还有一点没有说明的是,domain语句(使用部分人群时官方推荐用法和删除不符合要求的人群结果有无区别呢先挖个坑,下周加更填


03 一点总结


以上内容主要从两个象限、一个场景对NHANES 1999年之后的权重进行阐述。不一定全面,但应该基本够用。


在使用权重的过程中,强烈建议大家多查询官方对于权重的介绍说明,确保尽可能正确,做到一半再返工实在是不值得。


其实不用权重或者用错了权重,统计软件也会出来统计结果。但正如我上课时统计老师所说,做数据分析最关键的是人,你需要判断应该用哪些变量和方法,统计软件是不会判断的。


最后说说为什么要重新写权重相关文章,一方面是很多人问到,另一方面是确实要把这个问题讲清楚。学东西毕竟不是越快越好,适当放慢速度,回头看看,也未尝不是一件好事。



04 小门槛


我们这次设置一个小小的门槛。不过大家可以放心,这样的小门槛不会太多,我也不会在教程的关键位置设置门槛。


我花一些时间整理好了NHANES权重计算公式以及NHANES数据分析的常用网址,感兴趣的朋友可以将转发朋友圈或微信群的截图发送到后台(之前有转发过的朋友也算哦),我看到后会把资料链接单独发送。


烤面包加芝士味道不错哦。还有明天是母亲节,不要忘了送上祝福。


祝好,晚安~



05 参考内容


https://wwwn.cdc.gov/nchs/nhanes/tutorials/module3.aspx




文章转载自月明学习小铺,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论