众所周知,新药的临床试验中,随机化为其重要的原则之一,它是评价药物疗效的根本前提。 随机化过程中,人们关注的是“随机”么?显然是,但不仅仅是,随机更重要的意义在于——基线均衡?它使得影响药物干预的各个影响因素尽可能的均衡,为了这个目的,有区组随机。 如果因素很多,很难在有限的时间得到足够的样本量呢?动态随机化么?可能吧。 但是如何评价这种随机已经可以达到使各组均衡?作报表看看基线差异么?可能是这样的吧,我没去过大药厂,具体不清楚了。 但是有一个问题我非常清楚,这种检验Baseline的方法,从医学的角度是不尽情理的。 为什么这么讲,我举个例子吧!
例子一: 临床上,我所在的研究所搞脂肪肝研究, 影响非酒精性脂肪肝的因素,从病因讲,肥胖,2型糖尿病,高脂血症...,因此临床会考虑BMI、血脂、血糖、甚至血压...,再把临床试验常规考虑的性别年龄考虑进来,够多了吧,然而这远远不够。比如说肥胖,通常要区分是否是向心性肥胖,因为研究显示“并发脑梗死、高血压、冠心病、糖尿病、高脂血症等各种并发症的危险性约是全身匀称性肥胖者的2-3倍”,对于脂肪肝来说,研究证实“向心性肥胖也是脂肪肝的一个高危因素”,因此,不但要考虑是否肥胖,还要考虑肥胖的类型。通常向心性肥胖的更容易得脂肪肝,预后也较差,同样BMI=25的人,脂肪越是往腰腹部堆积,脂肪肝程度越重,因此不仅要把腰围考虑进来,还要考虑腰臀比,甚至腰围和BMI的交互关联。 同理,血脂和血糖也是临床上密切关联的一对,而且这两对之间也可能不孤立,也就是说,影响脂肪肝预后的因素太复杂了,因素以及因素的交互太多,而且脂代谢问题只是其中一个环节,还有其他更重要的环节——我们研究所正在搞相关研究,并取得一定的成果。 这个时候,倒是可以动态随机使得两组间BMI和腰围都无统计学意义,但是,很有可能发生的是:安慰剂组BMI指数的离散度(SD)较小,而相应的腰围的SD较大,也就是说安慰剂里有属于向心性肥胖(BMI和腰围无法单独判断是否是中性性肥胖,必须结合两者看)的患者要多于新药治疗组,即使这种“多于”可能没有统计学意义,但是,问题的确无法通过数学问题来评价,因此,可以说,通过区组随机和动态随机过程,组间的Baseline是否已经均衡是很难用数学表达式和数字报表来反映的。
例子二: 因为我临床去过消化科,我再举一个消化系统疾病的例子,这就是克罗恩病(Crohn's),流行病学研究发现,"该病男女间无显著差别,任何年龄均可发病,但是20-30岁和60-70岁是两个高峰发病年龄。"(<实用内科学>•第12版•第18篇消化系统疾病•第19章克罗恩病•Page:1899) 我不妨模拟一组数据,较极端分布大致如下图:
同样的,在系统性红斑狼疮中也有这一特点,总体的男女发病比例大概为1:9,但是有报道称处于育龄期的男女比例达到了1:30,而青春期前和绝经期后只是略高于男性。那么在育龄期的妇女SLE高发,显然和此时的激素分泌水平有关。由于这种发病年龄分布实在是太“特殊”(人们只会关注随机分组的年龄差异没有统计学意义,关注看得见的,但必然会忽视看不见的,也就是隐藏在临床疾病中的特别问题,医学家和统计学家都不法分别来解答的)了,无论是动态随机还是一般的随机,我相信可以达到很好的均衡,但是并不是100%,只能保证80%、90%成功率,也就是说随机5次或10次试验可能要失败一次。然而我需要的是100%的事情,而且不仅仅是年龄一个指标,而是全部基线指标都随机化到近乎100%的均衡,且保证基线与基线之间可能存在着的我们目前还无法预测和解释的关联,也就是一种稳健的随机化。 因此设想一种更极端的形式: 不妨将脂肪肝的影响因素众多的特点和克罗恩病的年龄分布特点结合,模拟一个数据集,同时再随机设置3个我们没有预期到的可能的交互作用,如总胆固醇和年龄的比值(事实上可能并没有意义,也可能有意义,但没有人确切知道)等影响因素。但我姑且认为他是有意义的,看神经网络能否控制这么多的影响因素,随机化发生在神经网络训练结束后。 整个数据集包括有393个观测,10个影响因素作为基线下水平(3个不可预知指标,代表的是有可能存在的交互影响,但神经网络训练前,并不将其引入)。从393个观测中随机抽取15%的观测,作为安慰剂组,再随机抽取15%,作为新药组,然后比较各个因素,得到1列P值。如此操作10次,每一次操作代表一次试验的基线指标的t检验。将整个随机化10次后,也就是做了10次试验,发现没有一次模拟是失败的,也就是没有一次出现任意指标基线差异有统计学意义。 因此,结论:如果一个临床试验,有10个基线控制因素,要随机化分两组,至少我的前10次模式试验没有失败,100%成功,而且是在极其复杂的影响因素下,10个控制因素。 有人会说,你小子是不是太绝对了!其实,这何止是绝对,简直就是绝对。甚至于在极小样本中(n=9)。 神经网络做随机化的应用 1、极其复杂的基线指标的随机,这主要体现在数量上和交互影响上。如上边的举例。 2、极其小的样本含量的随机,却保证基线指标均衡。 我们发现当从393个样本中,抽取每组只有9个样本的小样本时(模拟3次),基线指标和隐含关联也基本是相对“均衡的”。
|
改名|钢镚|会员|联系我们|公卫人
( 沪ICP备06060850号-3|沪公网安备31010402334125号 )
GMT+8, 2025-9-18 13:54 , Processed in 0.036847 second(s), 8 queries , Gzip On, Redis On.
Powered by Discuz! X3.5
© 2001-2025 Discuz! Team.