这也告诉我们了,NHANES数据库分析和挖掘中,权重的应用是非常重要的,用于解决因复杂抽样而带来的有偏问题。 针对NHANES2015-2016这个周期,我用R语言来演示下无加权和有加权处理后,种族占比的情况。 R语言代码片段 ### 1 准备工作环境 ### library(pacman) p_load('nhanesA','survey','tidyverse','arsenal')...
这也告诉我们了,NHANES数据库分析和挖掘中,权重的应用是非常重要的,用于解决因复杂抽样而带来的有偏问题。 针对NHANES2015-2016这个周期,我用R语言来演示下无加权和有加权处理后,种族占比的情况。 R语言代码片段 ### 1 准备工作环境 ### library(pacman) p_load('nhanesA','survey','tidyverse','arsenal')...
然后参与问卷调查的人被告知做进一步实验室数据检查和身体测量数据,但是只有一部分人参与,因此产生了另外一个权重wtmec2yr。他们中的一些人进行一些小众化的测试用于调查疾病的调查,如一部分人参与饮食调查所以在文件中“dr1iff”中有个权重WTDR2D - Dietary two-day sample weight。 问题2:要不要选择权重? NHANES官...
1. Nhanes研究设计 NHanes采用的是复杂多阶段的概率抽样(a complex, multistage, probability sampling design),并且对某些亚组进行oversampling(不知道中文怎么翻译好,保证有足够的亚组人群纳入研究)。其实这也是之后数据分析较为独特的原因。 四阶段抽样:分别是县(counties)、城市街区(segments)、住户(households)、个人...
在NHANES中,一次24小时的饮食回忆与两次24小时的饮食回忆有很大不同。因此,选择一次还是两次24小时的饮食回忆是非常令人困惑的。使用正确的样本权重来解释复杂的调查设计(包括过度抽样)、调查无回答和后分层是非常重要的。必须使用样本权重来计算代表美国平民非机构化人口或任何感兴趣子人口的估计值。作者使用了饮食第...
NHANES中的权重 在NHANES中创建权重,以解决复杂的调查设计(包括超采样),调查无答复和分层后调整,以匹配人口普查局的总人口数。以NHANES加权样本时,它代表了美国平民非制度化居民人口。样本权重分配给每个样本人员。它是由该样本人代表的人口总数的度量。如何在连续NHANES中创建权重 样本权重分为三个步骤:计算基本...
因此,在使用NHANES数据进行研究时,正确选择和应用权重是必不可少的一步。 4 权重包括哪些 1. 权重包括三大类 2. 权重变量所在的位置 wtint2yr和wtmec2yr权重:demo数据中可以找到; 特殊权重:针对特定子集人群,如空腹检查、饮食和化合物检查,需查看具体的数据文档文件。
仅纳入了1999-2004年的in-home interview类型数据,权重计算为: 1999-2002年(2个周期)的权重为2/3*wtint4yr 2003-2004年(1个周期)的权重为1/3*wtint2yr通过这些步骤,你可以更准确地分析NHANES数据,确保你的研究结果更具代表性。0 0 发表评论 发表 作者...
最后看Y轴,将不同周期合并,即可得到相应的权重变量。 还有一点没有说明的是,用domain语句(使用部分人群时官方推荐用法)和删除不符合要求的人群结果有无区别呢? 03 一点总结 以上内容主要从两个象限、一个场景对NHANES 1999年之后的权重进行阐述。不一定全面,但应该基本够用。 在使用权重的过程中,强烈建议大家多查询...
📊 对于2017年-2020年3月大流行前文件与之前NHANES周期之间的亚组趋势比较(例如,按年龄、性别、种族和西班牙裔血统等),我们需要谨慎解释。🔍 调查权重的合并,是按时间长度的比例来分配的。举个例子,如果你想把2015-2016年和2017年3月到2020年的数据合并在一起,你会得到一个代表5.2年周期的数据文件。那么,...