我们采用Neyman-Rubin的潜在结果框架(Rubin,1974;Splawa-Neyman等,1990),并假设存在一个分布\mathcal{P},从中得到N个实现的独立随机变量作为训练数据:(Y_i(0), Y_i(1), X_i , W_i) ∼ \mathcal{P},其中X_i \in \mathbb{R}^d是一个d维协变量或特征向量,W_i \in \{0,1\}是否在实验组
即T-Learner 直接基于两组样本分别估计 \mu_{1}(x) 和\mu_{0}(x) 来间接实现 \tau(x) 的估计。 b)然后我们再来思考下 T-Learner 的优缺点。 该算法的优点是:1. 原理简单且十分容易理解。2. 在训练两个响应模型时,可以灵活地使用已有的机器学习方法。3. 对干预和非干预样本分别建模,充分考虑了干预因...
Meta-Learning方法是指基于Meta-Learner进行Uplift预估,其中Meta-Learner可以是任意的既有预测算法,如LR、SVM、RF、GBDT等。根据Meta-Learner的组合不同,通常分为:S-Learner、T-Learner、X-Learner、R-Learner。 优点:利用了既有预测算法的预测能力,方便易实现 缺点:不直接建模uplift,效果打折扣 2.2.1 S-Learner S...
原理:X-Learner结合了S-Learner和T-Learner的优点,通过训练一个模型来同时估计处理效应和结果模型。 公式推导:X-Learner利用一个统一的模型来同时预测处理效应和结果,然后通过加权平均来计算因果效应。 意义:X-Learner在处理复杂的因果关系时非常灵活,能够同时考虑处理效应和结果模型。 代码演示:通过Python代码实现X-Lear...
使用X-learner预测出客户在未来被营销干预与不被营销干预情况下的提升概率,两者相比较,即可按照图1.1划分出客户被营销后的反应四象限。2.4.A/B测试方案设计与执行 为了研究应用推广后的Uplift模型相较于传统机器学习模型的效果:一方面应对比两个模型的预测客户营销后的效果差距,另一方面应对比客户被营销和不被...
使用X-learner预测出客户在未来被营销干预与不被营销干预情况下的提升概率,两者相比较,即可按照图1.1划分出客户被营销后的反应四象限。 2.4.A/B测试方案设计与执行 为了研究应用推广后的Uplift模型相较于传统机器学习模型的效果:一方面应对比两个模型的预测客户营销后的效果差距,另一方面应对比客户被营销和不被营销的...
X-learner是一种较为新的方法,通过使用两步估计和用倾向性得分纠偏,可以在数据量较少的情况下做出较好的估计(更多细节参考Künzel et al. 2019)。 基于DML和DRL的估计框架:这两种框架我们结合微软公司的Econml工具来介绍: https://www.microsoft.com/en-us/research/project/econml/ ...
2.X与Y互为因果,有时也称反向因果关系。 3.选择偏差,选择偏差包括两种形式,即样本选择偏差 (sample selection bias) 和自选择偏差 (self-selection bias);样本选择偏差是指因样本选择的非随机性导致结论存在偏差,本质上也是一种遗漏变量问题 (Heckman,1979)。
因果推断中的估计方法是核心之一,主要包括以下几种代表性方法:MetaLearner方法:基于机器学习估计条件期望E[Y|X,T],从而实现对平均处理效应识别公式的利用。TLearner方法:分别针对处理组和对照组构建模型,实现简单灵活。数据利用率低,效果受限于模型选择与数据不均衡问题。SLearner方法:通过一个模型处理...
T-Learner 分别基于实验组和对照组数据建立 model,并分别预测干预下及未干预下的结果,将结果相减得到因果效应的估计。X-Learner 主要解决样本不平衡问题,在干预下实验组和对照组样本数不均等时,借鉴 T-Learner 思想并进行交叉预测,并根据倾向值得分 g(x) 将结果重新加权得到最终因果效应。R-Learner、Double Robust...