G方法
流病
定义
目前发展了3种控制时依混杂的统计方法:参数g-formula、逆概率加权(inverse probability of weighting,IPW)和G估计,统称为G方法(generalized methods,G-methods)。不同于传统方法,G方法不会通过将混杂因素固定在某个值或某个水平而实现控制混杂的目的,因此可有效避免过度校正偏倚和对撞机偏倚,从而得到无偏因果效应估计值。
比较
G方法的优缺点[1]
| 方法 | 优点 | 缺点 |
| 参数g-formula | 可估计联合暴露;效率和稳定性高 | 计算复杂、程序复杂;易受模型误设的影响;只能在零假设被认为不成立的前提下使用 |
| IPW结合MSMs | 易于理解,容易实现 | 不满足正性假设时不能用该方法;估计不稳定;不能处理交互 |
| G估计 | 不满足正性假设时可以使用;可以处理交互 | 计算复杂、程序复杂;方法较难、解释不易 |
实现
参数g-formula计算较复杂,因为涉及了蒙特卡洛模拟和bootstrap,可用 Stata软件中的“gformula”命令[3][5]或R软件中的 “gformula”软件包[4]实现;
IPW可在大多数统计软件中轻松实现,可参考R软件包“ipw”;
G估计计算较 复杂,可通过Stata软件中的“stgest”命令[2]、SAS软件 中的“SURV”宏程序或R软件中的“DTRreg”软件包实现。