他们中的一些人进行一些小众化的测试用于调查疾病的调查,如一部分人参与饮食调查所以在文件中“dr1iff”中有个权重WTDR2D - Dietary two-day sample weight。 问题2:要不要选择权重? NHANES官网是要求在研究的时候进行加权分析数据。因为加权更为真实地反映出整体的情况。当然你也会看到一些已经发表的文章没有考虑...
因此,对于在做NHANES课题的统计分析时,建议大家优先考虑加权后一系列统计分析,除非你选择的变量没有存在过度抽样问题或者你想做有无加权分析的结果对比分析,可以采用无加权分析。为了更加严谨、科学,建议优先考虑做好加权处理后一系列统计分析。 这也告诉我们了,NHANES数据库分析和挖掘中,权重的应用是非常重要的,用于解决...
📊 对于2017年-2020年3月大流行前文件与之前NHANES周期之间的亚组趋势比较(例如,按年龄、性别、种族和西班牙裔血统等),我们需要谨慎解释。🔍 调查权重的合并,是按时间长度的比例来分配的。举个例子,如果你想把2015-2016年和2017年3月到2020年的数据合并在一起,你会得到一个代表5.2年周期的数据文件。那么,调查...
在NHANES的数据集中,研究者可以找到多种权重,分别对应不同的调查模块及样本设计。例如,访谈权重和MEC权重是最常用的两种,每种权重对解读数据结果都不可或缺。不过,需要记住的是,使用的权重必须包含研究所需的所有变量的最小子群体的权重。 在使用多周期NHANES数据合并时,权重的处理更为复杂。以1999-2008和2009-2018...
问题1:NHANES 的权重是如何产生的? 该调查的抽样方式是分层抽样。每两年进行一次调查。在美国选取几个州,然后再在选取州的下面的一些县级别,然后在县级别中的选取一些市级别的地方,然后在选取市级别下的城镇级别选取家庭为作为调查单位。 首先进行问卷调查,美国总人口数/参加调查问卷的人数=wtint2yr ...
但是由于新冠疫情的影响,后续把数据2017-2020年3月份分作为3.2年为一个周期权重只给了wtmecprp。如果需要列入2017-2020年的数据,可以考虑特殊处理。总结 喵学姐认为,NHANES 数据库最好加权分析,选用涉及变量中最小子集的权重,特殊年份特殊处理。(若理解有误,请及时纠正)
第一个,为什么要理解和应用NHANES的权重? 无权重分析,会出现过度抽样导致的偏倚问题。 而通过有权重分析,则能够更加真实地反映美国人口的实际情况分布。 如下图所示: NHANES2015-2016这个周期,在无加权分析和有加权分析下种族的占比情况,与美国实际人口数下种族占比情况对比,容易发现: ...
第一个,为什么要理解和应用NHANES的权重? 无权重分析,会出现过度抽样导致的偏倚问题。 而通过有权重分析,则能够更加真实地反映美国人口的实际情况分布。 如下图所示: NHANES2015-2016这个周期,在无加权分析和有加权分析下种族的占比情况,与美国实际人口数下种族占比情况对比,容易发现: ...
问题1:NHANES 的权重是如何产生的? 该调查的抽样方式是分层抽样。每两年进行一次调查。在美国选取几个州,然后再在选取州的下面的一些县级别,然后在县级别中的选取一些市级别的地方,然后在选取市级别下的城镇级别选取家庭为作为调查单位。 首先进行问卷调查,美国总人口数/参加调查问卷的人数=wtint2yr ...