▲医疗器械动物实验中误差是如何产生和控制的?
▲如何选择对照组?常见设计有哪些类型?
▲如何选择受试对象和评价指标?
▲如何估计样本量?
▲实验中还有哪些常见的误区?
题记
2017年11月24日,医疗器械动物实验研究与发展高峰论坛暨动物实验协会成立大会中,泰格捷通的单彬总监就医疗器械动物实验方案设计的统计学考虑进行了专题讲座,旨在动物实验方案中完善并解决以上这些问题。
/ 01 /
动物实验设计的目的
动物实验是医疗器械临床前研究的重要组成部分,是连接基础研究和临床试验的重要桥梁。通过动物实验可获得有关生物学、医学等方面的新知识或解决具体的问题,并且初步验证医疗器械的安全性和有效性。实验设计的首要目的是从总体中抽取样本,通过样本来推断总体水平(见图1);其次是通过科学的实验设计,在特定的受试对象中获得研究产品的无偏估计;最后是通过合理的实验设计可消除偏倚,减少偶然性,得到客观的实验结果。
图1-抽取样本推断总体
/ 02 /
动物实验误差产生及控制
单彬博士介绍误差即测量值与真实值之差,是指事物的某一特征的度量偏离真实值的部分,其分为随机误差(random error)和系统误差(systematic error)即偏倚(bias)。
随机误差是由于受试对象的个体差异和在研究过程中许多微小的不可控制的因素造成的误差(包括测量误差和个体差异)。随机误差普遍存在且不可避免,但其具有规律性,一般呈正态分布,因而可以用置信区间来估计,重复是控制和缩小随机误差的主要方法。
系统误差(偏倚)是由于研究设计、实施、分析和推断过程中存在的对各种处理因素与实验效应的错误估计而系统地歪曲了处理因素与实验效应的真实联系,其分为选择偏倚、观察偏倚和混杂偏倚。系统误差造成了研究结果系统性地偏离真实情况,在研究过程中应当加以控制和消除。由于系统误差具有一定的倾向性和周期性,应找到造成偏差的原因,并通过随机化和盲法予以消除,应当注意的是,单纯增加样本量不能解决偏倚问题或其他研究设计的缺陷(见图2)。
图2-误差与样本量大小的关系
单彬强调医疗器械动物实验方案设计过程中,偏倚主要通过随机化和盲法来减少或消除。随机化可确保组间基线可比,对已知或无法测量的影响起到平衡作用,同时避免引入大小和方向不明的偏倚而导致的研究证据水平的下降。盲法原则是避免主观性的有效方法,应在动物实验中受到重视,其可避免实验人员由于对处理措施的了解而造成观察上的偏倚。
/ 03 /
动物实验对照组的选择
实验效应是处理因素施加于受试对象并经过一定时间,受试对象产生的各种反应及表现(见图3)。动物实验效应是处理因素和非处理因素的总和,合理地设置对照组可使非处理因素在组间更加均衡,消除非处理因素对实验结果的影响。对照组可分为同期对照和非同期对照两大类(见表1),同期对照相较非同期对照的偏倚要小,对照组的设立要符合专设、齐同可比、同步的原则(专设原则:通常每一个处理组专设对照,不用文献上或以往结果作对照;齐同可比:除处理因素外,对照组应具备与实验组对等的非处理因素;同步原则:实验各组在整个研究中始终处于同一时间、空间)。
图3-实验效应的构成
表1-对照类型
/ 04 /
常见设计类型
实验评价目的可分为评价主效应和评价交互作用,可根据不同的评价目的来选择实验设计类型。在医疗器械动物实验中,多侧重对主效应的评价,因此多采用完全随机设计、配对设计和随机区组设计。在一些基础研究的实验中,有时也会评价因素间的交互作用,因此会用到析因设计和正交设计。
01
仅评价主效应
① 完全随机设计
一个处理因素,两个或多个水平
设置多个对照组
受试对象随机分配到不同的处理组
总样本量固定,各组例数相等时效率最高
设计、分析方法简单
各组样本量无限制,个体结果缺失影响小
缺乏对非研究因素的控制,实验误差较大、精度较低
适用于个体同质性较好的研究,未考虑个体差异的影响
② 配对设计
一个处理因素,一个配对(区组)因素
按受试对象某些特征(种属、性别等)配对
把研究对象间的部分差异转化成对子间的差异
处理因素为二水平
控制已知的非处理因素,提高组间均衡性,减少实验误差,提高实验效率
对研究对象要求较高,配对是难点
采用自身对照时,应设立平行对照
③ 随机区组设计
配对设计的扩展
一个处理因素,一个区组因素
按受试对象某些特征(种属、性别等)配成区组
把研究对象间的部分差异转化成区组的差异
各区组内受试对象个数(≥3)与处理组数据相同
控制已知的非处理因素,减少实验误差,提高实验效率
对研究对象要求较高,匹配与区组较繁
实验结果中有缺失值时,同区组的其他数据无法利用,信息缺失大
④ 拉丁方设计
一个处理因素,两个区组因素
三个因素水平数相同,以处理因素的水平数为基准
三因素之间不存在交互作用
比随机区组设计多了一个控制因素,均衡性好、误差小、效率高
对研究对象要求较高,匹配较繁
有缺失值时,信息损失大
因素的水平数较少时不够稳定,采用多个拉丁方设计提高精度
⑤ 交叉设计
一个处理因素,不同水平的处理按次序先后施加
两个与处理因素无交互作用的非处理因素
减少个体间差异,节省样本量
误差小、效率高,平衡两个非处理因素,如实验的顺序和阶段
处理不能有延滞效应
因素间不能分析交互作用
适用于处理影响短、观察时间短的研究
02
评价交互作用
① 析因设计
实验中涉及1个及以上的因素
多因素交叉分组,每个因素所有水平都相互交叉形成处理组,全搭配实验
实验时,每次均涉及全部因素,各因素同时施加
分析各因素内部不同水平间有无差别,及各种组合的交互作用
处理组数=水平数因素数目
每个处理组至少要做2次独立重复实验
因素和水平不宜太多
结论较为可靠
② 正交设计
处理因素数量较多
利用规格化正交表,合理安排每次实验的因素和水平
分析不同因素和水平的组合,用部分试验代替全面试验了解全面试验情况
高效多因素实验设计
通常假定各因素间没有交互作用或只有少量的一级交互作用
实验次数少
/ 05 /
实验动物和评价指标的选择与样本量的估计
根据研究目的来选择实验动物,再从实验动物品系、年龄、体重、性别、生理条件与健康状况、遗传背景等方面综合考量。动物实验的评价指标可根据评价目的来选择,如急性毒性、长期毒性与遗传毒性等,也可选择处理作用所直接影响的指标。动物实验的样本量的估计可以借鉴同类研究的经验也应在统计学方面有所考虑,统计学上影响样本量估算的因素主要有预期组间差异、离散程度、显著性水平等。
01
实验动物的选择
品系 根据生物学特征,选择敏感动物
年龄 对于幼年敏感、慢性实验、观察期长的实验宜选用幼年动物;老年医学研究宜选用老年动物
体重 小鼠18~22g;大鼠180~220g;狗10~15kg
性别 不同性别的实验动物对同一刺激的敏感性和反应性差异大
实验动物生理条件与健康状况,饲养环境(如温度、光照、噪声)
遗传背景
02
评价指标的选择
① 主观指标和客观指标
主观指标 行为测量、病理观察等
客观指标 血液学检查、生化检查等
② 敏感指标
特异性强、灵敏度高
容易观察、测量
测量方法准确、可靠,可重复、重现
03
影响样本量的估算因素
评价指标的预期效应
预期组间差异
离散程度
显著性水平(α)
把握度(β)
/ 06 /
动物实验的常见统计学误区
最后,单彬博士梳理了动物实验中常见的统计学误区有以下四个方面:一是对照组的选择偏差,实验人员往往重视实验组而轻视对照组;二是对“随机”的理解偏差,随机并非随便,更不是随手抓来;三是对干扰因素的考虑不足;四是盲法意识的不足容易带来观察上的偏倚。
泰格捷通检测 任倩倩|供稿
陈婕|责编