DLNM作者Antonio Gasparrini在论文“Distributed lag non-linear models”(onlinelibrary.wiley.com)中,介绍了准泊松模型应当使用QAIC或QBIC来比较模型。计算公式如下: 以QAIC为例,公式中为最大似然值的对数值,为过度分散参数,为模型参数个数。因此,只需要这些值就可以手动计算QAIC了。不幸的是,glm()函数也不会计算准...
如果模型里包含了自变量的当期值和滞后项,则模型就是分布式滞后模型(distributed lag linear model,DLM)。简单的分布式滞后模型,就是把变量的滞后项直接放入模型中作为自变量,而不约束各滞后项系数的关系,这种可称为“无约束的分布式滞后模型”;更复杂的分布式滞后模型会对滞后项的系数加以约束,如假设变量的效应在滞后维...
我们提出了一个解决方案,进一步放宽对关系的假设,并将这种方法扩展到分布式滞后非线性模型(DLNM),这是一个模型家族,可以以灵活的方式描述沿预测器空间和其发生的滞后维度同时变化的效应。通过这种方式,DLNM类也为现有的较简单的方法提供了一个统一的框架。 DLNMs以前只在流行病学方面进行过简单的描述:本文的目的是严...
DLNM模型得核心优势在于它能够在不同的时间尺度上捕捉非线性效应。具体而言DLNM模型通过滞后分布来考虑不同时间点对结果的不同影响,而非简单的线性关系。它能够识别出那些对目标变量产生非线性影响的时间段,尤其是在滞后效应较为复杂的情况下。这种灵活性以及精确度致使DLNM在复杂数据建模中具有了更大的应用潜力。 假设...
分布滞后非线性模型(DLNM)表示一个建模框架,可以灵活地描述在时间序列数据中显示潜在非线性和滞后影响的关联。该方法论基于交叉基的定义,交叉基是由两组基础函数的组合表示的二维函数空间,它们分别指定了预测变量和滞后变量的关系。本文在R软件实现DLNM,然后帮助解释结果,并着重于图形表示。本文提供指定和解释DLNM的概念...
示例数据通常采用时间序列数据,以反映变量在不同时间点的变化。本篇示例数据来自dlnm工具包的chicagoNMMAPS数据集,只选取温度小于等于20[公式]的数据,将大于20[公式]的值设为缺失值,以简化线性假设。分布式滞后线性模型表示为公式,其中变量的滞后项由矩阵表示,通过自定义函数mylag()方便地获取。cross...
本文说明了R语言中实现分布滞后线性和非线性模型(DLM和DLNM)的建模。首先,本文描述了除时间序列数据之外的DLM / DLNM的一般化方法,在Gasparrini [2014]中有更详细的描述 ( 点击文末“阅读原文”获取完整代码数据 ) 。 前言 本文中包含的结果并不代表科学发现,而仅出于说明目的进行报告。
⼆、DLNM的模型理解 1. 分布滞后 我们先来看Almon提出的分布滞后模型,研究响应变量Y与⾃变量X的时间效应,Y由X的 过去值加权和表⽰。等式中的表⽰权重,可以理解为的系数,⽤最⼩⼆乘法来估计,⼀般来讲我们会对权重进⾏⼀些假设,⽐如呈指数递减、服从帕斯卡分布等,但需要结合数据和模型的...
门槛回归: "thr"参数用于创建门槛型基矩阵,适用于自变量影响有特定阈值的情况。还有"integer"用于离散变量的单值分类和"lin"用于线性模型的基矩阵。通过dlnm工具包的chicagoNMMAPS数据集,我们可以实例化这些模型并绘制相对风险曲线,以直观理解不同模型如何描述暴露与响应的关系。让我们用样条曲线回归再次研究...
R语言中的分布滞后非线性模型(DLNM)与发病率,死亡率和空气污染示例 数据 数据集包含1987-2000年期间每日死亡率(CVD、呼吸道),天气(温度,相对湿度)和污染数据(PM10和臭氧)。数据是由健康影响研究所赞助的《国家发病率,死亡率和空气污染研究》(NMMAPS)的一部分[Samet et al.,2000a,b]。