复旦中山检验科郭玮教授团队于国际顶尖检验医学杂志Clinical Chemistry发表“回归调整
2021-08-16 11:01 文章来源:
作者:段昕岑
单位:复旦大学附属中山医院检验科
近日,复旦大学附属中山医院检验科郭玮、潘柏申、王蓓丽教授团队开发的回归调整实时质控系统RARTQC(Regression-adjusted real-time quality-control)发表于国际检验医学顶级期刊《Clinical Chemistry》(DOI:10.1093/clinchem/hvab115)[1]。
RARTQC是团队在前期研究成果基于患者样本实时质控系统PBRTQC(patient-based real-time quality-control)[2]的基础上对算法研究的全新突破,能够大幅提高原有模型的运行性能,给未来实时质控算法研究提供了一种全新的思路。
PBRTQC的应用背景
临床医学检验的目的是发出准确的检测报告,基于统计学理论的室内质量控制(IQC)经过多年发展成为医学实验室应用最广泛、最基本的保证检测质量的方法。
IQC的实施需要检验人员按照一定的频率检测质控品,并采用一系列方法进行分析,通过统计学理论计算评估检测结果的可靠程度,及时发现并排除检测环节中的失控因素,确保发出检测报告的准确性。
然而,IQC存在一些固有的局限性,如当失控发生时,我们无法得知系统误差的起始时间点,需要通过留样再检进行追溯;质控样本与患者样本间存在一定基质差异,因此对检测系统变化(误差)响应的程度也存在一定差异;基于风险评估需要增加质控频次以减少系统误差漏检时,相应的质控样本与试剂的消耗也随之增加[3,4]。
不同于IQC,PBRTQC是将患者样本的检测数据经过一定算法的处理,监测计算值的波动,判断检测系统是否出现误差。正因为PBRTQC具有实时监测、成本低的特性,许多研究者希望使用PBRTQC来弥补IQC的不足。
最早的PBRTQC是由Hoffman等在1965年提出的AON(average of normals,平均正常值法)[5],受制于当时的信息化条件,仅能进行每日回顾性分析。上世纪八十年代,医学实验室逐步实现信息化,诸如Bull‘s算法[6],新的实时AON法[7],能对患者样本结果进行连续计算,PBRTQC才较IQC更具有一定实时性,开始在实际工作中有所应用。
进入二十一世纪,信息技术的进步为PBRTQC的研究带来了新的可能,不断涌现新的模型方法。IFCC也专门成立了PBRTQC工作小组,让更多人了解到了PBRTQC的潜力。虽然目前不断有关于改进PBRTQC的研究报道,但这些算法都仅仅是对前期实时AON法的补充,或将浮动均值(MA)替换为如指数加权浮动均值(EWMA)等算法,局限于上世纪八十年代的统计过程控制理论方法,并没有研究提出PBRTQC突破性改进的方法。随着近期大数据、人工智能技术的兴起,为数据分析和利用提供了更多的思路,也为PBRTQC的发展提供了新的方向。
PBRTQC迈出的一小步
复旦中山检验团队历经多年研究,致力于通过利用大数据技术改进并将PBRTQC技术应用于实际工作中。
研究初期,我们首先建立了一套完整的PBRTQC模型构建和验证体系,对现有的PBRTQC算法模型在分布特点不同的检测项目以及不同类型的分析误差条件下的性能进行了比较分析,研究结果发表于《Clinica Chimica Acta》杂志(https://doi.org/10.1016/j.cca.2020.10.006)[2]。我们发现,现有PBRTQC算法模型仅在少数检测项目中显示了较好的误差检出性能,无法广泛应用[2]。进一步分析模型的实验数据,发现有三个影响模型性能的主要原因。
首先,影响患者检测指标的因素有很多,包括性别、年龄、疾病等。当这些影响因素混杂到一起时,检测指标的数据分布会过于分散,导致PBRTQC模型的误差检出率较低。虽然根据影响因素进行患者分组可提高分组模型的检出率,但分组后的患者样本数也随之减少,因此模型性能并不会较之前有所提升。
其次,检验数据本身会随着时间有一定的变化趋势,如部分检验指标存在季节性变化,又或者因试剂批号更换导致的细微分析差异。这些细微的差异并不影响检测结果和报告,但对PBRTQC模型的性能会造成巨大影响。只要有一点细微的数据波动就会使PBRTQC的假阳性报警率大幅上升,增加质控人员的工作量。
最后,PBRTQC模型在呈正态分布且分布较窄的项目中应用效果较好,如血钠;但在偏态、分布较宽的项目中应用效果则不理想,比如ALT。虽然截断值和正态化转换有一定帮助,但对PBRTQC模型实际性能的提升并不明显。、
RARTQC“回归调整”提升的一大步
基于这些前期研究,复旦中山检验团队在PBRTQC常规数据处理的基础上增加了回归调整的步骤,比较好地解决所有困扰,能够大幅度地提高模型性能,因此将方法命名为回归调整实时质控(RARTQC)。
图1:RARTQC和PBRTQC的结构对比
RARTQC在常规的截断和正态转换之后,利用通过大数据建模得到的回归模型调整检测结果,并将调整后的数据代入浮动均值模型进行质控判断。
使用RARTQC有多个优势。首先,回归模型可以解释影响检测结果的因素,如性别、年龄、疾病等,所以不需要对患者数据进行细化分组建模。其次,只需在回归模型中加入时间相关的变量即可解决上文提到的数据存在季节变化趋势的问题,大幅提高实时质控的性能。最后,利用回归模型也可以提高调整后数据的正态性。
图2:回归调整前后数据趋势的对比,绿色为调整前,橘红色为调整后。
图2显示检测数据回归调整前后的差异。例如图2(B)中的血氯数据,我们可以看到在回归调整前数据存在向上的趋势(绿色),该趋势是由于电极的微弱损耗导致的细微差异。而经过回归调整后,数据趋于一条平稳的直线,且数据上下波动幅度也有所减小,在假阳性报警率一定的情况下,可使浮动均值模型误差检出率提升。
为了更直观地体现RARTQC相较于PBRTQC的优势,使用误差检测曲线表示模型的性能,横坐标是误差水平,纵坐标是误差出现后平均检测出误差所需的患者样本量(ANPed),相同误差水平时,ANPed越低的模型,越能更快发现误差,因此曲线越低说明该模型误差检出的敏感度越高。
图3:RARTQC与PBRTQC误差检测曲线比较——ALT
图4:RARTQC与PBRTQC误差检测曲线比较——血氯
图3和图4显示了RARTQC和PBRTQC两种不同架构下建立的指数加权浮动均值模型(EWMA),在ALT和血钠两个检测项目上对百分比误差检测性能的比较。对于ALT,RARTQC构建的模型性能远远好于PBRTQC建立的模型;而对于血氯,PBRTQC已经有很好的性能,RARTQC依然可以进一步提升模型性能。总体上,RARTQC在允许总误差(TEa)水平下较PBRTQC性能平均提升了接近50%。
总之,相比于PBRTQC,RARTQC具有显而易见的优势。常规改进PBRTQC算法性能的研究思路是通过改进浮动均值算法实现的,而中山团队另辟蹊径,率先提出RARTQC,通过改进PBRTQC架构的方法,大幅地提高了PBRTQC模型性能,巧妙地解决了目前PBRTQC在许多项目上误差检测性能不足的问题。
团队希望在不久的将来,将理论投入临床实践,不断改进实验室质量控制水平,提高检测结果质量,进而更好地服务于临床和患者。