关于之前说的内容调整,我想了一下。目前我准备在文末加上内容框架图片,方便大家理解。有其他建议的朋友欢迎后台留言。
上期推文我们已经探讨了年龄、吸烟、饮酒等变量的分组情况。本期推文我们关注经济状况、体力活动、疾病判断、既往疾病史,重点放在疾病判断和既往疾病史部分。
01 经济状况
虽然NHANES中与经济状况相关的变量有三个,但是最常用以及官方最推荐的是家庭收入贫困比(the ratio of family income to poverty)。
官网推荐的标准也有三个。但既往文献中采用的标准也不是都和官网一致。官网和相应文献的标准我截图出来供大家参考。

↑
从左到右分别是官网、文章来源JAMA Internal Medicine、文章来源BMJ
02 体力活动
体力活动按照类型(type)和领域(domain)可以分为不同的种类。
按照类型可分为以下几类:有氧活动、肌肉强化活动、骨骼强化活动、平衡活动、多组合活动(两种或两种以上上述四类活动)。
按照领域可分为以下几类:闲暇时间、工作、教育、居家和/或交通。
NHANES有关体力活动的问卷主要是从domain出发进行设计的(按照领域分类也更符合日常生活的活动场景)
值得注意的是,1999-2004与2005-2018相比,不管是问题(1999-2004年为次数和每次时间,2005-2018年为每周天数和平均一天时间)还是最后官方放出来的数据集(1999-2004年有PAQ和PAQIAF,2005-2018年只有PAQ)都有一定差异,需要使用该变量的朋友可以在使用前比较一下。

↑
1999-2004与2005-2018活动时间计算方式对比
还需要提到的是2020年WHO指南,已经删除对于运动时间要大于10min的要求。不过1999-2018年的问卷都还是参照原来的指南保留这一要求。这里只是提一嘴,大家知道就好。
03 疾病判断
不同文献对于以下三种常见疾病的判断标准不同,不过都是基于问卷自报,或问卷自报和实验室指标的组合。
糖尿病。官方有单独放出糖尿病患病情况的数据集,在问卷数据这一板块。自报糖尿病、是否用降糖药、是否用胰岛素等在数据集中均有涉及。
与糖尿病相关的常见实验室指标(如空腹血糖、OGTT、HbA1c)在NHANES中均有检测。值得注意的是,OGTT是在2005-2006及之后的周期才有。
我在这引用两篇文献中的糖尿病标准供大家参考:
Diabetes was defined as a self-reported history of diabetes, use of oral hypoglycemic agents or insulin, or fasting plasma glucose greater than or equal to 126 mg/dL. (来自Mayo Clin Proc的一篇文章,详见后文参考内容)
self reported baseline history of diabetes, hypertension, cardiovascular disease, chronic obstructive pulmonary disease, and cancer.(来自BMJ的一篇文章)
补充一下,我在查看2005-2006糖尿病原始问卷和数据集时,发现自报用过降糖药或胰岛素的人群中有小部分自报是糖尿病前期而不是糖尿病。
高血压、高血脂。官方关于高血压和高血脂患病情况的数据集是放在一起的,也是在问卷数据这一板块。自报高血压、是否使用降压药、自报高血脂、是否使用降脂药等在数据集中也均有涉及。
血压作为体测中的常见指标,在NHNAES也有测量。细心观察的朋友,应该会发现1999-2002中关于血压有一个比较特殊的算法(与普通的平均值不同,详见下图),变量名为BPXSAR, BPXDAR。

↑
1999-2002中血压特殊算法
与高血脂相关的血脂指标(总胆固醇、甘油三酯等)在NHANES中也有检测,不过不同周期可能略有区别。大家合并的时候可以多比对一下就好。
具体文献中用到的标准我就不放出来了,大家结合实际情况采用一种就好。
04 既往疾病史
心脑血管疾病(CVDs)。CVDs包括的内容其实很多,我们以维基百科的定义为例。以下是相应的文字引用。
VD includes coronary artery diseases (CAD) such as angina and myocardial infarction (commonly known as a heart attack).
Other CVDs include stroke, heart failure, hypertensive heart disease, rheumatic heart disease, cardiomyopathy, abnormal heart rhythms, congenital heart disease, valvular heart disease, carditis, aortic aneurysms, peripheral artery disease, thromboembolic disease, and venous thrombosis.
NHANES关于CVD的问题自然不会像定义中那样面面俱到,里面主要涉及心力衰竭、冠心病、心绞痛、心脏病发作、中风。实际进行判断的时候用or进行连接即可。
大家看NHANE官方的codebook时,可能会发现相应变量的缺失很多。这是由于问卷设计导致的,cvd以及下面提到的cancer相关问题只对≥20岁人群进行了询问。
按照比较常规的纳入标准(≥20岁,非怀孕),会发现其实缺失也不算多。我按照上述标准粗略算了一下,1999-2014中cvd缺失为218。
癌症(cancer)。NHANES问卷关于cancer有单独设计一个问题(Ever told you had cancer or malignancy),大家结合该问题对应变量的取值进行判断即可。我也按照上述标准算了一下,1999-2014中cancer缺失为51。
05 一点总结
本期内容比较多,我在这也附上相应的内容框架图片。

↑
内容框架图片
即便对NHNAES数据库比之前更为了解,我还是不能保证我告诉朋友们的都是对的。所以我在这强烈建议大家多查看NHANES官网,官网也是我写推送最重要的参考来源。
总感觉送达转换率不很理想,不知道和微信之前更改推送规则有无关系,感兴趣的朋友记得星标公众号哦。对了,记得点赞转发在看哦。
都说互联网是有记忆的,时至今日又有多少人还会去关心十堰的那次爆炸。前几日每日去搜都没有消息,心里也挺落寞。同在十堰,终还是难以平静,惟愿一切安好。
祝好,周末愉快。
06 参考内容
https://wwwn.cdc.gov/nchs/data/nhanes/analyticguidelines/99-10-analytic-guidelines.pdf
Bao W, Liu B, Simonsen DW, Lehmler HJ. Association Between Exposure to Pyrethroid Insecticides and Risk of All-Cause and Cause-Specific Mortality in the General US Adult Population. JAMA Intern Med. 2020;180(3):367-374.
Chen C, Ye Y, Zhang Y, Pan XF, Pan A. Weight change across adulthood in relation to all cause and cause specific mortality: prospective cohort study. BMJ. 2019;367:l5584.
Piercy KL, Troiano RP, Ballard RM, et al. The Physical Activity Guidelines for Americans. JAMA. 2018;320(19):2020-2028.
https://www.who.int/publications/i/item/9789240015128
Al-Kindi SG, Sarode A, Zullo M, et al. Serum Bicarbonate Concentration and Cause-Specific Mortality: The National Health and Nutrition Examination Survey 1999-2010. Mayo Clin Proc. 2020;95(1):113-123.
https://en.wikipedia.org/wiki/Cardiovascular_disease




