医疗器械临床试验样本量如何计算

放大字体  缩小字体 发布日期:2019-12-12  来源:来自互联网  作者:来自互联网  浏览次数:123
导读

残酷的现实是,如果三个信息没有同时搞对,那样本量估算的合理性也就无从谈起了。 聪明的小A想到了解决办法:虽然我没看过累计复发率,但是这些患者术后1个月随访资料都有啊,也有术后1个月的功能评分。 解析:这是…

无论是做什么样的医疗器械临床研究,在设计阶段的样本量估算都是必不可少的过程。对于前瞻性研究,样本量估算的结果直接决定了研究的可行性,是帮助我们探讨“这个研究能不能做完”、“我们用这个指标评价结局合不合适”的关键手段。当然合理的样本量估算也是伦理的重要要求之一。对于回顾性研究,虽然资料都有了但是有时重新整理资料也需要耗费不少精力,合理的样本量估算结果能够帮我们优化工作量,用尽量少的精力得到想要的研究结果。

但问题来了,在我们写标书、写文章的时候,我们的样本量却经常不被专家们认可。此时您的内心也许是这样的“不懂统计真要命”

统计学专家一定在莫名其妙的打着喷嚏,因为他们真的是躺枪啊。在各种标书评审和审稿中,小编看到的样本量计算错误,还真不是单纯的统计学问题。

换句话说,样本量估算方法选对了,公式选对了,但是结果真不一定对。

让我们再来看看样本量估算所需知道的关键信息有哪些类别:

信息1、研究核心结论分析时所用的统计方法;

信息2、参与核心结论分析的具体指标(变量)有哪些;

信息3、对将会收集到的核心指标分布特征的预期。

不难看出来,所谓的“公式没问题”其实确保的只是信息1的准确性。然而残酷的现实是,如果三个信息没有同时搞对,那样本量估算的合理性也就无从谈起了。

如果您还是一头雾水,可以继续看看下面的解释。

一、选择正确的指标(对应上面信息2)

1.1所选指标应该是研究的核心指标,与首要研究假说相对性。

举个例子,医生小A提出了一个改进术式,认为术式改进后能够改善患者的1年复发率。因此小A设计了一个RCT,把主要疗效评价指标定为“术后1年内累计复发率”

问题来了:小A既不知道新术式1年内的累计复发率到底能降到多少,也没有相关的文献。

聪明的小A想到了解决办法:虽然我没看过累计复发率,但是这些患者术后1个月随访资料都有啊,也有术后1个月的功能评分。我简单看看两组患者术后1个月功能评分是多少,以评分作为指标估算一下样本量不就行了么?而且也是我们自己的病人,人群代表性也好。

解析:这是在各种标书中经常看到的,主要研究假说的参数找不到,换个次要指标的预计结果(可能来自预实验,也可能来自文献)估算样本量。更有甚者用于估算样本量的指标都没纳入结局评价指标中。这么做最大的问题是,我们凑出来的样本量能够满足验证首要研究假说的需求么?显然是不行的。毕竟估算样本量的时候我们都没有纳入首要假说所需的指标。

解决办法:

a.没有数据凑数据。用上面的例子来说,还有几个不同的可选策略。

比较简单的办法是,找找过去对同一疾病术式的改进,看看大概能在原来的基础上提升多少。比如一次改进能降低到原来复发率的60%,我们认为我们的改进也能降低80%。如果改进前复发率30%,那么改进后可能为30%×60%=18%。

如果没有针对同一疾病相关的术式研究,可以以找相似疾病(同器官、同系统、同机制)的数据。

也可以通过专家咨询,对采用过这一新术式的专家进行访谈,定性的提出该方法可能的复发率是多少。

b.选择临床意义相近的其他指标结果。就是干脆把核心指标换掉,对应的也改变首要研究假说。前提是所选的新指标,其临床意义也是可接受的。

无法得到1年复发率的参数,但是相同疾病不同术式间1年功能得分比较是有的。临床上,功能与复发与否是同等重要的指标,且新术式在功能上的收益理论上也和上述文献相似。这时候,如果功能有提升,当然能证明新方法临床可用,因此改掉原始假说似乎也是合理的。

1.2注意区分不同指标间的细微差别,避免不同指标的混淆。

当我们从文献中找数据的时候,经常会忽略指标的细节,这很可能会导致我们代入公式的参数是来自“神似但不同”的其他指标。

问题来了:还拿小A的例子说吧,他关注的是患者术后的复发率,所以检索文献的时候就把疾病、手术和复发率作为了关键词。

聪明的小A找到一篇文献:“针对某改进术式应用后患者的随访,发现该术式患者远期复发率介于25%-30%之间”,然后华丽的计算出了样本量。

解析:小A在关注疾病、手术和复发率的时候,潜意识认为只要是“复发率”就跟他是相同的指标。但真的是这样么?其实不然,在不同的研究中,根据研究者的随访能力和人力物力,选择终点指标时观察时间并不相同。然而任何事件的累计发生风险都随着时间的延长而增高,比如术后1年的累计复发率,通常会高于术后3个月。而如果小A找到的指标是术后3年的远期复发率,并以此估算样本量。显然他就会高估新术式的复发水平,而导致样本量的高估(如果用1年来当成3年复发率用,当然就会低估)。

解决办法:

a.老老实实找个1年复发率的数据。

b.基于传统术式1年复发率和3年复发率之间的差异,用已知的新术式3年复发率粗略的倒推出1年复发率可能是多少。

·比如,传统术式1年复发率为40%,3年复发率为60%。也就是1年没复发的人,继续随访2年仍有20%复发。如果新术式3年复发率为40%,1年复发率不知道,我们其实可以假设1年复发率为X,X+X×20%=40%,从而推断出1年复发率为33.3%。当然我们如果直接用率差倒推也是可以的(40%-20%=20%)。到底用哪个结果,就要看理论上的合理性,以及研究对把握度的需求了。

二、合理估计指标的预期大小和变异(对应上面信息3)

指标找准了,剩下的就是给出预期的指标大小和变异了。不过最让大家困惑的肯定是:“老子研究还没做呢,鬼知道最后会是多大啊!”别急,有这种焦虑可以理解,毕竟研究结果有很大的不确定性,更何况很多探索性研究本身结果就有不确定性。但是,既然研究有不确定性,我们总不能蒙着头胡做一气吧。毕竟很可能上来就开干,结果收集了大几百个病人再一看,发现就算做到1万人也得不到预想的结果,这时候才发现根本就不应该开始就太迟了。所以样本量估算的一大作用还在于,帮助我们评估一下,我们到底有没有实力回答自己提出来的研究假说。因此,绞尽脑汁算个样本量还是很重要的。根据优先程度,我们觉得可以分成下面几个数据来源:文献数据>没数凑数>拍脑袋。让我们逐一看一看。

2.1来自可靠文献的数据

如我们上面说的,尽量找到相似的文献,如果参数刚好对应的上,那么我们只需要把文献报道的结果引用过来就好了。不过引用数据的时候,也会遇到问题。

问题:如果有多个文献都有数据,但结果又不尽相同怎么办。

机智的小A提出了“可靠”的策略:先用meta啊,要不就用RCT的结果,总之先看证据等级高的呗。

解析:如果一个美国开展的RCT,和中国开展的队列研究,我们采信谁的结果?如果是一个1995年完成的RCT,和2010年的队列,我们采信谁的结果?如果是一个针对高危患者的RCT,和一个针对与小A一样的一般人群的队列,我们采信谁的结果?相信您自己心理已经明白了,证据等级并不是最优先考虑特征。

解决办法:

a.尽量选择设计要素相近的结果。

首先考察文献的PICO,也就是对象、干预/暴露因素、对照、结局评价指标(包含时点),优先选择和我们相似研究的结果。尤其是P、I和O的相似度至关重要。

b.优先使用以国内患者为对象的研究结果。

毕竟国内外在疾病诊断、干预方法和技术水平、患者随访、遗传特征上都存在较大差异。因此同样是SCI文章,来自国内的数据即便证据等级较弱时,可能效应也更接近我们将来的实际情况。

c.优先使用近年发表的研究结果。

毕竟无论是诊断还是疾病治疗的常规,都随着年份在不断变化。尤其是随着各种新技术、其他相关疾病治疗措施的改善,患者在对我们关注的治疗措施的反应以及预后上都可能与过去存在较大差异。因此越接近当下的文献结果,自然效应也会和我们更相似。

2.2没数凑数——通过文献间接推测参数范围

在无法获得直接数据的时候,通过多篇文献包含的信息,综合推断我们研究中指标可能出现的结果。上面我们已经举过例子了(1)-1.1-a)。

就拿上面(1)-1.1-a)的例子来说,我们想知道新术式、传统术式术后1年复发率:

文献1、传统术式研究很多,可以直接得到1年复发率;

文献2、但新术式只有1篇不设对照的研究,报告了3年复发率;

文献3、此时我们通过另1片研究,知道传统术式1年复发率和3年复发率之间的差异。

此时估计样本量时,我们对照组(传统术式)来自一篇文献,干预组(新术式组)的数据通过2篇文献间接推断出来。总共样本量的估算可能会用到3篇文献,才能把数据凑出来。

2.3凑不出来拍脑袋

有的时候,如果创新性太强,我们凑也凑不出来怎么办?此时,为了尽量降低研究的风险,在什么信息都没有的时候,我们也不得不尽力去做样本量估算。

a.理(拍)论(脑)推断(袋)

根据现有的信息,或是理论上的可能性,通过理论推断得出逻辑上合理的估计值。

b.定性研究

如果觉得自己拍脑袋风(责)险(任)太大。我们也可以通过广泛咨询专家、开展设计讨论会等形式,通过引入更多的决策者来提高拍脑袋定参数的可靠程度。当然,如果精力允许,或是课题很重要,我们值得为此开展一个规范的定性研究,甚至使用Delphi法来推测可能的效应大小。

c.开展预实验或采用更为灵活的设计类型

如果拍也拍不出来,那还有几个备选方案,留在这里供大家自己百度吧:

(1)老老实实开展预实验;

(2)进行序贯设计、成组序贯设计,也就是多设计几个期中分析,根据期中分析的结果明确后续是否继续进行以及进展到什么时候停止;

(3)采用适应性设计的方案。

作者:李楠 赵一鸣 临床流行病学和循证医学

 
 
免责声明
• 
本文为会员免费发布,仅代表发布者个人观点,本站未对其内容进行核实,请读者仅做参考,如若文中涉及有违公德、触犯法律的内容,一经发现,立即删除,作者需自行承担相应责任。涉及到版权或其他问题,请及时联系我们删除处理。