小胖说统计搬至Epiman论坛

xiaopang1980 · 发表于 2009-2-26 11:55:18

本帖最后由 xiaopang1980 于 2009-2-26 11:59 编辑

小胖学统计之十：随机化

和前面所提到的盲法一样，随机化也是在临床试验中避免偏倚的重要设计技巧。啥是随机化呢，很简单，通俗地说，受试者到底分在那个组，必须是随机的，服从概率论的原理，不受研究者和受试者主观意愿的影响。随机化可以消除由于治疗分配带来的偏倚，可以使治疗组和对照组具有较好的可比性，更为重要的是随机化是合理的统计检验的基础，也就是说只有在随机化的试验中应用统计检验才是合理的。
随机化有哪些方法呢？通常有以下几种随机化方法：简单随机化、区组随机化、分层随机化和动态随机化。下边小胖将对这几种方法一一做简单介绍。
1．简单随机化：我们可以简单地理解为扔硬币，来了一个受试者，扔一次硬币，正面进一组，反面进另一组，简单易行，但大家可以想到，比如你扔了10次可能正好有5正5反，也可能有4正6反，等等，当然你扔的次数越多，正反出现的概率就会越接近。这就出现了一个问题，我们临床试验一般例数有限，有时就会出现各组例数相差较大的情况。曾经有人做过计算，你扔100次，正好50正50反的概率只有8％。
2．区组随机化：就是按照区组进行随机化，从而保证某一相等区间内各组病人完全相等。举个简单的例子吧，两个处理组A组和B组，我们设计4个病人为一个区组，比如一共A组和B组每组要入选100例病人共200例吧，那一共有50个区组，4个病人为一组，在这一组中保证有两个A和两个B，这样随机1－4号里两个A两个B，5－8号两个A两个B，这样依次类推。。。这样我们就可以较好地做到两组的病人基本相等。为什么呢，很简单，如果我们能完成200例入组的话，可能会出现下边几种情况：
（1）入组例数正好是4的倍数，比如说200例，204例等，这时入组例数正好是整倍的区间数（50，51个区间），由于每个区间都是两个A两个B，那么最后每组的病人数肯定是相等的（100，102例）
（2）入组例数除以4的余数是1，比如说201例，那么有一个组会多出1例来
（3）入组例数除以4的余数是2，比如说202例，这时会有两种情况，一种是多出来的2例都是一个组的，那么有一个组会多出2例来，另一种是那多出来的2例各分在两个组，那么最后两组的例数还是相等的
（4）入组例数除以4的余数是3，比如说203例，那么多出来的3例肯定有2例分在一个组，另1例分在另一个组，最后有一个组会多出1例来。
如上所述，最不理想的情况，最多一个组比另一个组会多出2例来，这样我们就可以做到两组病例数的基本相同。
区组随机化一个重要的问题就是区组大小的问题，上边这个例子我们取的区组大小就是4，那么怎么确定区组大小呢？

随机化方法是让医生无法预测下一个病人划分到哪个组，因此我们在确定区组大小时也要谨记这个原则。如果两个组别而你的区组大小为2，那第一个病人是A组，那第二个病人肯定就是B组了，那这种随机性就相当差了。很好理解，区组越小，我们就越容易猜到下一个病人是哪个组的，因而我们应避免前边提及的只有两位病人的区组。但区组大小也不能太大，否则会可能产生由于中断一个区组而使两组例数有较大的差异。怎么理解呢，举个例子，两个组别，如果你的区间长度为16，比如说你最后入选了168例病人吧，这时一共有10个完整的区组，另外最后还有一个区组被中断了，只有8例病人，这时这多余的8例病人的分配就有如下可能：
情况1  A：0    B: 8 两组相差8例
情况2  A：1    B: 7 两组相差6例
情况3  A：2    B: 6 两组相差4例
情况4  A：3    B: 5 两组相差2例
情况5  A：4    B: 4 两组相差0例
情况6  A：5    B: 3 两组相差2例
情况7  A：6    B: 2 两组相差4例
情况8  A：7    B: 1 两组相差6例
情况9  A：8    B: 0 两组相差8例

如上所述，这时就会出现两组例数相差较多的情况，最大可能相差8例。正如小胖在上篇博文中举的例子，如果区间长度为4的话，最大可能相差则为2例。
因此，区间长度的选择不宜太小，也不宜太大。通常情况下，如果只有两个组别，区间长度一般可取4－10，就小胖的以前的做法，一般我会取4或6。最后小胖罗唆一句，区间长度必须是组别个数的倍数哦，不然你咋分配病人呢，呵呵。

3．分层随机化：啥意思？就是每个重要因素或重要因素组合为一单独层（也就是单独的随机表格），而在每一单独层内，各组病人例数保持均衡，从而最后达到这个重要因素在各个治疗组分布均衡的结果。举个简单的例子，两个治疗组试验组（drug X）和对照组（drug Y），按照基因型B或C分层，可能会产生以下两个随机表格：

第一个表格：

基因型    分组
B          drug X
B          drug Y
B          drug Y
B          drug X

……

第二个表格：

基因型分组
C       drug Y
C       drug X
C       drug Y
C       drug X
……

在入组病人时，先看以下这个病人是什么基因型的，如果是基因B型的，则根据第一个表格的随机顺序入组；如果是基因C型的，则根据第二个表格的随机顺序入组，最后我们能基本保证试验组和对照组的基因B型和C型的病人大致相等。这就是最简单的分层随机化的过程。
其实大家应该很熟悉分层随机化，我们现在进行的临床试验大部分都是多中心临床试验，而我们在随机的过程中一般都会采取分中心随机化。这时的分中心随机化其实就是以研究中心为层的分层随机化。在中心随机化中，每个中心都有自己单独的一个随机表格，病人随机时，各个中心入选的病人按照各个中心的随机表格的顺序进行入组，最后保证的也是试验组和对照组在各个中心的病人数大致相等，也可以理解为，每个中心试验组和对照组的病人数大致相等。

上文中简单说了分层随机化的一些基本内容，那么为什么我们要进行分层随机化呢，很简单的道理，我们在作临床试验时总希望某些对疗效结果有较大影响的因素在各个治疗组内尽可能分布均衡。举个例子吧，在乙肝临床试验中，大家都知道基因型对最后的应答有很大的影响，通常情况下，基因C型的比基因B型的更难治，即疗效差；如果试验组基因C型（难治的）的过多则试验组的总体应答情况就会被拉下来，试验组与对照组疗效的差异就会比实际的变小；试验组基因C型（难治的）的过少则试验组的总体疗效就会被提上去了，试验组与对照组疗效的差异就会比实际的变大；总之，试验组和对照组基因型分布差异很大，就会影响到对疗效的评价。因此，我们需要把基因型作为分层因素进行分层随机化，使基因型在两组分布保持均衡。
当然小胖还需要说明的一点是，虽然我们不按照某些重要因素进行分层随机化，在统计分析中，可以使用一些多元统计方法（如多元回归、多元logistic回归、COX分析等）对这些重要的预后因素进行调整和分析，但这势必也降低了统计效率。还有一点，如果我们临床试验的样本量足够大，根据概率论的原理，重要因素在各个治疗组应该不会相差很大。但话说回来，我们临床试验的样本量一般也不会太大。综合以上几点，对重要因素进行分层随机化有时还是十分有必要的。
小胖还要说明的一点是，现在我们做的多中心临床试验，由于研究中心是影响研究的一个十分重要的因素（比如各中心临床试验条件、评估者、评估方法、评估结果等都不尽一样），一般都会进行中心随机化。

分层随机化中如何选择分层因素呢？这个更多地根据不同的疾病而定，选择那些对疗效有重要影响的因素。这些更多地取决于临床实践，而非统计学。小胖在这里要说的是，多个分层因素的选择。有的临床试验选择的分层因素不止一个，最常见的是你首先把研究中心当一个分层因素，然后在此之外又选择了别的分层因素，如年龄、疾病亚型啊等等，这时就会出现分层因素组合的情况。下边是分层因素组合的一个简单例子：
两组：A组和B组
分层因素：研究中心（10个中心）、疾病亚型（两个亚型I型和II型）
这时我们一共有10×2=20层，即需20个随机安排表：

随机表格1：

研究中心基因型    分组
01          I       A
01          I       B
01          I       A
01          I       B
……

随机表格2：

研究中心基因型    分组
01          II       A
01          II       A
01          II       B
01          II       B
……

随机表格3：

研究中心基因型    分组
02          I       B
02          I       B
02          I       A
02          I       A
……

随机表格4：

研究中心基因型    分组
02          II       A
02          II       B
02          II       B
02          II       A
……

…………………..

随机表格19：

研究中心基因型    分组
10          I       B
10          I       A
10          I       A
10          I       B
……

随机表格20：

研究中心基因型    分组
10          II       A
10          II       B
10          II       A
10          II       B
……

当然，小胖要强调的一点是，分层的因素不能过多，因为因素一多则组合数就多，层数也就多，层数一多，就会使有些层次的人数不足。例如多中心临床试验中心为分层因素（10个中心），另外还有2个分层因素，每个因素各分成2层，则共有10×2×2＝40层，一共需要安排40个随机表格。如果一共入选200例病人的话，每层平均5个人，甚至有的层人数会很少，难以实施统计处理。因此分层因素不宜过多，要进行精选。通常来说两个以上的分层因素就会使分层难以实施。

xiaopang1980 · 发表于 2009-2-26 11:59:50

4．动态随机化（dynamic randomization）：是指在临床试验过程中，病人随机入组的概率根据一定的条件而变化，能有效地保证各组间病例数和重要预后因素保持基本均衡。
那为什么要引入动态随机化呢？如前所述，我们可以采取分层随机化来保证一些重要的预后因素在各组分布基本均衡，但我们也要考虑到分层随机中的分层因素不能很多，如果分层因素很多，便会出现有的层的例数很少甚至没有的情况，而动态随机化就很好地解决这些问题。
在一些样本量不是很大，但又必须考虑预后因素对疗效影响的临床试验中，动态随机化显得尤为必要。
我们先从最简单的动态随机化方法来了解一下动态随机化的思路：
一个袋子里有黑色和白色两个球，你摸到黑球就入A组，摸到白球就入B组，开始时你摸到黑球和白球的概率为0.5/0.5。假设你第一次摸了个黑球，入A组，然后你要把黑球放回袋子里，同时在往袋子里加一个白球，这时袋子里有1黑2白，你第二次摸到黑球和白球的概率就变成0.33/0.67，如果你第二次还是摸到黑球，那你要再加一个白球，这时袋子里有1黑3白，此时你第三次摸到黑球和白球的概率就变成0.25/0.75，依次类推，每次随机摸一个球，根据球的颜色确定入组，然后将该球放回袋子里并加入1个另一颜色的球，继续摸球。。。。
这样通过概率的不断调整，最后达到两组间病例数大致相等。
以上就是最简单的动态随机化，可以实现各组例数大致相等，至于如何实现重要预后因素在两组间分布均衡，则需要更为复杂的方法，现在最常见的方法是最小化法。

最小化法主要解决的就是预后因素在组间分布均衡的问题，我们从下边这个例子来看一下最小化法的基本思路：

在一项临床试验中，年龄和性别是重要的预后因素，我们希望各治疗组在这两个方面保持均衡。已入组10例病人情况如下：

               A组       B组

年龄

<30             2          1
30~50       1          1
>50             2          3

性别

男             3          2
女                2          3

现在来了第11例病人，他是35岁的男性病人，那他要入哪一组呢？
1．在A组中，和他年龄水平（30~50）相同的病例为1例；和他性别水平（男）相同的病例为3例；两者相加1＋3等于4
2．在B组中，和他年龄水平（30~50）相同的病例为1例；和他性别水平（男）相同的病例为2例；两者相加1＋2等于3
3． 3<4, 那么这例病人就入B组，以使两组在年龄和性别方面的差别减少

以上就是最小化的最基本思路，简单一句话概括，就是根据前边入组的病人的情况，来确定病人的入组，原则上使组间预后因素的差别变小。
说到这里，可能大家觉得很复杂，其实我们需要了解的就是最小化法的简单思路，知道是怎么回事。
到底这例病人该入那个组，就要求助于计算机了，咋说呢，现在啥都可以通过computer来解决，呵呵。
现在基本通常的做法就是，当合格病人要入组时，收集其预后因素的基本信息，然后传真到随机中心，随机中心按照传真上的信息输入计算机，计算机程序就会计算出分到哪一组，然后再传真通知研究者。

我们在随机化入组中，常碰到的情况是1：1随机，即各组要求病人入组的比例是相等的。当然在一些临床试验中，也会碰到一些随机比率不是1：1的情况。本文中小胖将就这种情况加以简单介绍。
首先，我们比较一下1：1随机和非1：1随机。1：1随机在统计上是最有效率的随机比率，在总样本量一定的情况下，其统计把握度是最大的；而非1：1随机，如果要达到和1：1随机相同的把握度，则需要更大的样本量。我们从下边这个例子看一下吧：
假设一临床试验，主要疗效指标为应答率，假设试验组和对照组的应答率分别为33.3%和20％；显著性水平为双侧0.05，把握度为90％；
（1）如果设计为试验组和对照组随机比率为1：1，则总样本量为460 （230例每组）
（2）如果设计为试验组和对照组随机比率为3：1，则总样本量为600 （450/150）
从上面的例子可以看出，3:1随机的总样本量要大于1:1随机，随机比率越大时，需要的总样本量越大。当随机比率大于3：1时，样本量会变得很大，因此一般不会采用。
这时大家会问一个问题了，既然非1：1随机需要更多的样本量，那为什么还要采用呢？
其实我们在以下情况下，会常用到非1：1随机：
（1）治疗组间存在着比较大的成本差异，即一个组治疗的相关费用大大高于另一个组。这时我们就希望更多的病人入到便宜的那组中，这时我们就可以采用非1：1随机化了；
（2）对某些比较严重的疾病，一组疗效较好甚至可以救命，而另一组比如说安慰剂或者常规医疗对疾病没有大的疗效，这时我们需要把较少的病人入到安慰剂组，因此也有必要采用非1：1随机化了。
总之，究竟要不要采用非1：1随机，要根据实际情况综合考虑，这里又涉及到小胖自认为的临床试验的三个核心即科学、伦理和成本；这三个东西始终贯穿着临床试验的各个阶段。

epiman · 发表于 2009-2-26 13:23:00

:)多谢小胖分享

EpiMan也有博客的，每位会员都有属于自己的博客，除了写日志外，还可以和好友玩游戏

小胖说统计博客 http://www.epiman.cn/2113

bluelotus · 发表于 2009-3-1 20:59:33

跟贴学习之~~

xtf001 · 发表于 2009-3-3 15:15:17

来学习一下了,一定不错

xiaopang1980 · 发表于 2009-3-6 13:49:52

小胖学统计之十一：研究设计

在我们开展的临床试验中，最常见的有三种研究设计类型即平行设计(parallel group design)、交叉设计（cross-over design）和析因设计（factorial design）。
1．平行设计：这也是我们绝大部分临床试验的设计类型。即将病人随机分配到两个或多个治疗组中的一组，每组分别给予不同的治疗。当然我们最常遇到的两组临床试验，一组试验药物，一组对照药物或安慰剂，就是最典型的平行设计。平行设计是最常见也是最简单最传统的设计，可以直接比较两组间的差异，也比较容易进行统计分析。
2．交叉设计：按照预先设计好的顺序，病人在各个时期依次接受各种治疗，以比较各治疗间的差异。这是自身比较和组间比较综合应用的伟大发明哦。下边是一个最简单的2X2交叉设计的例子：

                                 A药物 ---- 洗脱期  ---- B药物

受试者随机化

                                 B药物 ----  洗脱期  ---- A药物

交叉设计最大的好处是由于做到自身比较，因此需要较少的样本量。而它存在的问题也是显而易见的，其中最大的问题就是延滞效应（carryover effect），啥意思呢，就是一个病人现服了A药物后经过一段洗脱期后再服用B药物，就存在一种情况，即这个病人服用A药物的效果可能在后期服用B药时还有残余，从而难以真正判断药物的疗效，特别是B药的疗效。因此，交叉设计应尽量避免延滞效应，一方面洗脱期必须足够长，以使药物的作用完全消退，更重要的一方面是你在应用交叉设计时必须要充分了解疾病的特征，要求疾病是慢性病，且病情相对稳定。总之一句话，要精心进行研究，在试验前就要确定是否满足交叉设计的要求。在这里，小胖还要说明的一点是，交叉设计对病人的失访要求比较严格，当有病人失访时，分析和解释会变得很复杂，因此，交叉设计一般仅限于预期失访较少的试验。
当然小胖最后强调的一点是，交叉设计特别是2x2交叉设计也有它天生适应的土壤，那就是生物等效性试验，这也是我们交叉设计最常用的情况

上边小胖介绍了平行设计和交叉设计，下边将继续介绍一下析因设计。
首先小胖给大家讲一个故事，20世纪中叶，心血管疾病和肿瘤已成为疾病死亡的主要原因。大量观察研究显示，β-胡萝卜素可能会降低肿瘤的发生率；而另一方面，很多医生通过观察猜想阿司匹林可能会预防心脏病的发生。为此60年代和70年代开展了很多临床试验，但结果却不尽相同。1980年由主要研究者Charles H. Hennekens领导开始进行了历史上最著名的临床试验之一Physicians' Health Study，此试验选择了医生作为受试者，原因在于医生比普通人群能更准确地报告他们的医疗史和健康状况，同时也更有可能确定研究药物的可能的副作用。而此试验的主要目的在于评价阿司匹林能否预防心肌梗塞和其他心血管事件，同时还想知道β-胡萝卜素能否预防肿瘤的发生。在这项试验中，使用了当时还是创新的临床研究设计，也就是所谓的2x2析因设计。受试者将被分配到下列四组中：（1）阿司匹林加β-胡萝卜素；（2）阿司匹林加β-胡萝卜素安慰剂（3）阿司匹林安慰剂加β-胡萝卜素（2）阿司匹林安慰剂加β-胡萝卜素安慰剂。共有22071名受试者随机入组。最后试验结果表明，阿司匹林可以使心肌梗塞的风险降低44％（P<0.00001）；而补充β-胡萝卜素12年未带来益处也未带来害处。
以上这个故事，就是历史上最著名的一个析因设计即通过治疗的不同组合，对两个或多个治疗同时进行评价的例子，从以上这个例子我们简单地可以看出析因设计有以下优点：
（1）可以在一个试验中，同时检验两种假设
（2）成本大大降低
（3）受试者可接受性提高，即只有1/4的机会分到完全安慰剂组中
这里小胖提出一个问题，为什么要使用析因设计？
小胖简单总结为两点，一是出于成本的考虑；二是出于探索药物之间交互作用的考虑。
首先我们看一下第一点成本。大家都知道开展一项临床试验是十分昂贵的。一项临床试验的主要花费包括：
1．治疗费用，也就是研究药物对照药物的费用
2．受试者筛选、随机入组和随访费用
3．临床试验的设计以及前期准备
4．统计分析和报告
析因设计的出现，即我们可以在一个试验中同时研究两种或两种以上药物的疗效，比起我们开展两个或两个试验分别研究两种或两种以上药物的疗效，在临床试验费用方面，特别是在一些非治疗费用方面会大大节省。这种情况下采用析因设计，我们通常假设药物之间是独立的，不会相互影响，即无论有B还是没B，A的效应本身都是一样的。显然，对于那些治疗性试验，这种假设很少是合理的，因为各种治疗都是针对同一种疾病的，难免会产生一些相互的影响。因此，用析因设计来达到在一个试验中同时研究两种或两种以上药物的疗效来代替开展两个或两个试验分别研究两种或两种以上药物的疗效的目的，这种情况大部分出现于一些预防性试验中，比如前文中提到的Physicians' Health Study，以及后来的Physicians' Health Study II，还有WHI研究。在这些试验中，每个药物经常分开进行分析和报告。实际上，有时一种药物治疗可能已经结束并进行分析报告了，而另一种药物治疗还在继续。例如，在Physicians' Health Study中，阿司匹林早早就显示出了降低心肌梗塞风险而终止治疗了，而β-胡萝卜素却仍在继续。在这种情况下，应用析因设计，其药物治疗评价的比较应该是：

以A药和B药，2x2析因设计为例
（1） A药  （2）B药  （3）A+B (4) PLACEBO

A药的评价比较：接受A药治疗的对比未接受A药治疗的即（1）＋（3）vs （2）＋（4）
B药的评价比较：接受B药治疗的对比未接受B药治疗的即（2）＋（3）vs （1）＋（4）

而样本量的计算也是基于上述两个比较，分别计算出上述两个比较所需的样本量，然后选择较大的那一个样本量即为这个试验所需的样本量。而在具体的统计分析中，通常我们也不会对多重性进行调整。
最后小胖要强调的一点是，上边这些统计方面的考虑是基于药物之间无交互作用这一假设的。至于交互作用的问题，我们将在下一篇博文中加以介绍，也就是析因设计应用的另一方面即出于探索药物之间交互作用的考虑。

如前文所述，析因设计另一大应用是出于探索药物之间交互作用的考虑。如果您对药物之间的交互作用感兴趣或想比较所有可能的药物治疗组合的疗效，那么析因设计将是你的最合适的选择。在这里小胖需要说明的一点是，如果你只对所有治疗组合中的某几个组合感兴趣，比如现在有三个药物，8种药物治疗组合，你只是想比较其中的三四个治疗组合，那么你还是选择一个只包含你所感兴趣的治疗组合的试验，这时析因设计不是你最好的选择。
其实，上述情况下的析因设计应用最广泛的便是我们经常碰到的联合治疗的临床试验，比如我们常见到的在心血管临床试验，特别是高血脂临床试验中，通常会使用联合治疗。联合治疗作为一种治疗方法有时是十分必需的。比如说我们常碰到以下几种情况（以两种药物联合治疗为例）：
（1）两种药物有不同的互补的疗效机制
（2）一种药物由于毒性反应只能限定在某个剂量以下，而这时可以联合另一种药物达到更高的疗效，而毒性也不会过大；比如说在高血脂治疗中，他汀类药物的剂量一般超过80mg后，其毒性就会很大，因此可以联合其他药物使用比如ezetimibe，出现ezetimibe＋他汀类10mg/20m/40mg，同样可以达到80mg他汀类的疗效甚至更高，毒性也相应地减少了

另外一点，如果你主要关心的是药物之间的交互作用，那么在样本量方面会大大增加，才能检验出这种交互作用。因此，我们结合前文所述，如果你计算样本量时是基于药物主效应，那么这时的样本量在估计交互作用时，其检验效能会大大降低。
现在关于析因设计，特别是对于交互作用，还有很多争议，小胖就不在此赘述了，小胖只是希望通过以上这些简单的介绍能让大家初步了解析因设计是什么样子的就可以了。

xiaopang1980 · 发表于 2009-3-6 13:51:52

小胖学统计之十二：多中心临床试验

何谓多中心临床试验？很简单，就是由一个研究中心的主要研究者总负责，然后多个研究中心的研究者合作，按照同一个研究方案在不同的研究中心同时进行的临床试验。现在大家所接触到的临床试验几乎都是多中心临床试验，为啥？最重要的便是多个中心同时入组，可以在较短的时间内入选到所需的病例数，这也是大家普遍的出发点，其实小胖觉得另一个重要的方面，便是多个中心入选的病例无论在病种病情分布等方面范围比较广，特别是对于我们这个幅员辽阔的大中国来说，和实际人群总体能保持较好的一致性，试验结果和结论也更具代表性。这就涉及到统计上所谓的研究结果的推广与应用。这一点我们可以举一个简单的例子，大家都知道乙肝在中国主要有两个基因型即B型和C型，而B型主要分布于南方，C型主要分布于北方；而在治疗难易程度方面，C型比B型难治，因此进行乙肝临床试验时，需要进行多中心试验，而中心的选择也应兼顾南方北方，如果我们只在南方的某个中心进行试验，则可能会使得入选病人大多为B型（易治）的，而最终对治疗疗效的评价也很可能会高估，试验的结论也无法推广到整个乙肝人群。
在这里小胖需要说的一点是，我们现在开展的国内多中心临床试验基本上都是在国内的各个研究中心进行。其实，更典型的多中心临床试验应该是那些global试验，这些试验的研究中心分布在不同的国家，入选病例也分布在不同的种族，所有这些都使最后的研究结论具有很好的代表性，也为研究结果的推广与应用提供了良好的依据，使得新药的应用更具广义性。
最后还不得不提的一点是，多中心临床试验的开展，使得更多的研究者能有机会参与到临床试验过程中，他们可以集思广益、精心合作来共同保证试验的高质量。但在这一点上，也是一把双刃剑，如果各中心研究者能够相互配合，博采众长，那么可以大大提高临床试验的质量，而由于研究者之间不统一，各自为政引成临床试验很大问题也不乏其例。

小胖将以问和答的形式，对多中心试验中的一些常见问题，作一简单介绍？

问题1：多中心临床试验中对每个中心的病人有最低数量的要求吗？

回答：首先ICH E9中指出“应避免各中心样本数量相差悬殊以及个别中心的样本数太少”。当然我们应尽可能做到各中心病例数相当，但也会出现个别中心病例数较少的情况，此时比较普遍的意见也是不希望设置每个中心入组的最低病人数，因为如果一旦限定，则会使得那些入组比较慢的中心完成试验的时间大大延长。在实际的统计分析过程中，如果出现病例数很少的中心，可能会造成一些统计分析方面的问题，这时我们可以把几个中心进行合并（pooling）起来进行统计分析。这里需要提的一点是，在进行中心合并时，很多情况下要根据中心病人的人口学特征，人口学特征相似的合并在一起，而不是随随便便想当然合并。

问题2：在统计分析中怎样进行中心的合并（pooling）？

回答：统计分析中的中心合并已被统计界所广泛接受。在具体操作方面，最理想的情况是把你怎么进行中心合并明确写在你的研究方案里。但这一点很难做到，因为有时在研究方案撰写时我们无法准确预期中心入选病人的情况，这种情况下，我们最实际的方法是把你所采取的中心合并的策略写在你的统计分析计划书（SAP）里，而且必须在数据锁定或揭盲前最终确定下来。这种计划的思路，小胖已在前边的博文中提到很多次，小胖一直认为统计分析最大的原则就是计划，就是你在采取一些统计分析方法前，必须事先在研究方案或统计分析计划书中明确说明。
至于中心合并的策略，大家需要谨记的一点就是，我们的目的是不要让一个或两个中心影响到整个的治疗效果。因此，我们在进行中心合并时，要遵循相似性特别是在人口学特征方面的原则，比如在跨国多中心临床试验中，欧洲国家的中心可以合在一起。简单地把那些病人较少的两个或多个中心合在一起的方法是不恰当的。

问题3：治疗－中心交互作用（treatment-by-center interaction）是怎么产生的？

回答：我们在开展多中心临床试验时，各个研究中心在病人的人口学特征、医疗条件、医疗史等方面差别较大，这种研究中心之间的差别可能会导致各中心研究结果的不同，这时就会产生我们所谓的治疗－中心交互作用。当然治疗－中心交互作用还来源于各中心执行研究方案的不同以及不同的疗效评价标准等，最常见的例子比如对应答的评价标准，还有实验室标准不同。

问题4：治疗－中心交互作用（treatment-by-center interaction）对研究结果的影响？

回答：通常把治疗－中心交互作用（treatment-by-center interaction）分为两种：定量（quantitative）和定性（qualitative）。定量治疗－中心交互作用是指各中心的研究结果的方向是一致的，比如都是A药的疗效大于B药，这时只是各中心在数值上相差较大，这时其实就是个数量上不同的问题，按哲学上来说这时候是个量变，在这种情况下，有的统计学家就认为通过中心之间合并数据（pooling data），这种交互作用不会严重影响到统计分析结果。定性治疗－中心交互作用则是指各中心的研究结果的方向是不一致的，比如有的中心A药的疗效大于B药，有的中心A药的疗效小于B药，这时可就是原则性比较严重的问题，这时其实就是本质不同的问题，按哲学上来说这时候是个质变，此时这种交互作用会严重影响到统计分析结果。如果你还是对所有中心治疗效果只做一个总体统计分析就可能会得到错误的结果，而且也是不够的。在这种情况下，最好的办法就是对治疗-中心交互作用进行具体的描述，并说明具体那个中心对交互作用的影响，这是一个复杂的过程。小胖还要说明的一点就是，在这种情况下，很多统计师是不会再谈论什么治疗差异了，关键是这时不是一句话两句话就能说清的。

问题5：多中心临床试验中怎么考虑中心的影响？

通常情况下，多中心临床试验的统计分析都应把中心纳入到统计模型中，特别是按中心进行随机化时。当然在某些研究中，每个中心只有少数几个病人时，此时中心对主要及次要变量的影响不会太大，在这种情况下，模型中包含中心是不合适的，否则可能会影响到比较的精确度，而且如果我们预期到每个中心只有有限的病人时，也没有必要按中心进行随机化。

问题6：怎么样处理治疗－中心交互作用？

如果把交互作用不必要地纳入到模型中，会降低主效应检验的效能。正如ICH E9中所述，对多中心试验中的治疗组差异进行统计检验时，应该把中心效应纳入到统计分析模型中，而治疗－中心交互作用则不应纳入模型中。其实在具体的统计分析中，我们现在通常的做法如下：

建立一个由治疗、中心以及治疗－中心交互作用在内的统计模型，

首先我们先计算交互作用的p值，

（1）如果p>0.1，那么则说明治疗和中心间无交互作用，这时把治疗－中心交互作用从模型中剔除，然后再进行模型的统计分析；
（2）如果p<0.1，那么则说明治疗和中心间存在着交互作用，这时就无法进一步评估治疗效应了。接下来就要根据不同的情况，对不同中心的结果进行描述和讨论了，这便是一个比较麻烦的过程了。。。

epiman · 发表于 2009-3-6 14:13:39

小胖学统计之十二：多中心临床试验
7 e) D% V' ^. c, C5 s( M) G* j6 Q( z6 y. X. N
何谓多中心临床试验？很简单，就是由一个研究中心的主要研究者总负责，然后多个研究中心的研究者合作，按照同一个研究方案在不同的研究中心同时进行的临床试验。现在大家所接触 ...
# p. W! \8 o& }. Y2 sxiaopang1980 发表于 2009-3-6 13:51
; K# | j. X( U$ k, P& Y- d

登录/注册后可看大图

已经在首页底部加了banner推荐
小胖也可以在自己的博客上连载，或专门成立一个兴趣小组。
小胖说统计博客 http://www.epiman.cn/2113

山医郝 · 发表于 2009-3-9 22:56:33

哇，很专业的一股气味扑面而来啊，拜读了，很有用的东西

xiaopang1980 · 发表于 2009-3-11 21:57:51

好的啊，谢谢epiman，回去我总结一下，过两天在epiman博客上连载

账号		自动登录	找回密码
密码			立即注册

[公告] 小胖说统计搬至Epiman论坛