1 引言

      Westgard对医学实验室评定测量不确定度的第二个批评是:“?要求按GUM/QUAM推荐办法,即从下而上,找出所有不确定度分量。从耗费的资源和能力,对医学实验室是很困难的”。
      看来这批评的是对的。GUM推荐的评定测量不确定度的办法,是所谓“模式办法(modelling approach)”或习惯称为“自下而上”的办法。此办法在计量界得到广泛的应用和传播。单单中文书籍不少近百本,论文更不可枚举。
      用模式办法评定测量不确定度相当复杂,下面是QUAM推荐评定化学测量中测量不确定度的步骤:

      它是基于“测量模型”,将被测物的量值视为相关输入量的函数。要考虑所有测量不确定度来源,然后简化来源,按组量化分量和其它分量。再将所有分量转化为标准差(标准测量不确定度),按不确定度传播律计算合成不确定度,最后按所选概率选择合适因子得到扩展不确定度。
      此法研究了所有影响测量结果不确定的组分,对方法的改进有明显好处,但计算繁烦,花费大量人力、物力和财力。
      中国参考实验室应用此办法时,还发现此法计算的测量不确定度的正确性并不高,有可能出现人为偏低,见下例。此图为国际酶学参考实验室比对计划(RELA)的各个实验室的评定的相对测量不确定度数值。

      第一个结果(黄绿色)为计划组织者,德国Schumann教授实验室的扩展不确定度,后面蓝色为中国实验室的结果,它们都比Schumann实验室的小。我们能说中国实验室的准确度都优于Schumann吗?Schumann教授用下图对此做了回答:

      此图是Schumann教授对构成合成不确定度各分量的分析。由于试剂不同引起的标准不确定度占全部1/2以上,而所有中国实验室在计算合成不确定度时,都未考虑此组分,因此得到人为的小的测量不确定度数值。
      以上提到了GUM/QUAM介绍的模式办法的一些缺点。这并没有掩盖它的优点和对实验室质量改进的极大促进。所以Westgard也没有完全否定测量不确定度,只是认为“总误差向实验室提供了一个实用、自上而下的办法来评估测量不确定度,而ISO/GUM 模型应该指导并用于生产厂商。检验界中的校准(参考)实验室在给参考物质和质控品赋值和评定测量不确定度时都应该很好地应用此类自下而上的模式办法。

2 评定测量不确定度的取代办法

      由于自下而上的模式办法广为人知。常给人以错觉,似乎要评定测量不确定度,只能使用此办法。并使Westgard认为“用从上向下办法评定总误差比从GUM从下向上评定(不确定度)更为实用”。事实上,GUM/QUAM并不排除使用自下而上评定测量不确定度的办法。GUM意识到,它的自下而上评定测量不确定度办法繁烦、复杂,检测实验室应用有困难。2008年公布了JCGM 100:2008发布的“附有微小纠正的GUM 1995”。在此最新文件的附录D中对不确定度补加了下述说明:
      “?当测量物是确定的,标准品或仪器能用溯源到国家标准品进行校准时;当校准纠正的不确定度与仪器,或一定量测量的随机效应引起的不确定度相比较是很小时。非常幸运地,在这些实际测量情况时,不一定采用此附录中讨论的很多(复杂计算)。”说明GUM并不反对用其它取代办法(alternative approach)评定测量不确定度”。
      2000年颁布的QUAM第二版中也提到“使用以前联合开发和确认方法的研究数据采评估不确定度”和“使用实验内开发和确认研究评估不确定度”。
      欧州的一个化学检测实验室组织,“欧州各国家测量、检测和分析实验室学会的联合会(EUROLAB)”从一开始就致力于寻找一种不同于GUM/QUAM,但适用于一般化学检测实验室的评定测量不确定的办法。在2002年 公布了第1个“定量检验中的测量不确定度”技术报告。提出了不同于GUM/QUAM的办法,当时命名为“黑匣子(black box)办法”。2006年发布了名为“评估定量检验中的测量不确定度的导则”第2个技术报告 。对第1个报告中的办法命名为“经验办法(empirical approach)”。在2007年第3个文件“测量不确定度的回顾:评定不确定度的替代办法”中,提出了一个对评定MU办法的分类方法,见下图:

      在此分类中,首先按评定测量不确定度的数据来自单一实验室还是多个实验室分为二大类:
      第一大类的数据来自单一实验室,文件将其命名为“实验室内办法”,进一步分为:
??模式办法:用算学模型(计算公式)对所有来源组分的测量不确定度进行合成。
??单一实验室确认办法:数据来自单一实验室对方法性能评估的数据。
      第二大类为“实验室间办法,可分为下列二类:
??按ISO 5725,使用实验室合作评估方法的方案或计划。实际工作中,常是校准(参考)实验室网络对参考物质(校准品)赋值。
??使用PT数据评定测量不确定度。
      EUROLAB 将后3 类方法命名为“ 经验办法(empirical approach)”。模式办法则是GUM/QUAM推荐的经典评定测量不确定度的办法。
      EUROLAB对“经验办法”作了如下说明:
??基于对整个方法性能的确认研究。
??设计为包含尽可能多的测量不确定度来源,并需要很好执行。
??此方法所用的典型数据为偏移(bias)和精密度(precision),它们可来自a)实验室内确认研究,质控数据;b)实验室间确认研究,或者PT。
      特别指出“应用实际可得到数据???来评定“总误差”不仅容易,而且此办法本质就是可靠的。实验表明用数学分析办法(模式办法)所得到的不确定度往往太小。这是因为很难得到一个完整的模型公式,常有忽视某些重要组分的可能。因此用模式办法评估的不确定度要与用实际数据的相比较。当然,理想的是二法评定的不确定度是一样的。”
      经验办法基本使用统一的计算公式。合成测量不确定度(uc)是不精密度的标准不确定度[标准偏差(s)平方,以及偏移的标准不确定度(ubias)平方之和的开方,见下式:
                                        uc=√(ubias2+sRw2)
      此式中不精密度数据来应来自实验室内复现性标准偏差(SRw)或复现性标准偏差(SR)。不应使用 重复性标准偏差(sr)评定测量不确定度,因为sr不包括一些重要不确定度的组分。
      多个文件建议使用较长时间,如6个月实验室室内质控的实际精密度数据,并希望在此期间使用了多个批号的试剂和校准品。用实际数据评定的测量不确定度更符合实验室的实际情况。如有困难,至少也应有20个工作日的数据,并最好使用2个批号试剂和校准品。专门按EP5进行精密度实验并不可取,所得精密度往往比实际的小。

      式中偏移的不确定度(ubias)往往由三个组分合成:实测偏移(△))、测量参考物质产生的不确定度(sRw/√n)、以及参考物质赋值的不确定度(uref),以下式表示:
                              ubias=√△2+ uref2+ sRw2/n
      2007年EURACHEM/CITAC颁布的“源自采样的测量不确定度”导则对“经验办法”进行下面的论述:“经验(从上向下)办法是想在不需要了解每个来源情况下,来得到一个可靠的评定不确定度。它建立在由实验室内部或组织间实验得到的总的复现性(数据)。它可能叙述为笼统的(不确定度)来源,如随机或系统作用,以及将其细分为源自采样或者分析过程。?”
      看来国际上已经有不少专家认可在化学测量实验室可使用如Westgard建议的自上而下的办法来评定测量不确定度。这些办法有可能在医学实验室,用于对某些常规检测项目测量结果评定测量不测定度。下面将着重介绍单一实验室用方法确认数据和利用PT数据评定测量不确定度的办法,并简单介绍使用实验室合作评估方法数据来评定测量不确定度的办法。

2.1 单一实验室通过正确度验证计划评定测定不确定度

      EUROLAB将此类办法称为“应用实验室内评估和质控数据评定测量不认确定度”。医学实验室如建立了正确度验证计划,就可以用此法评定测量不确定度,也可能是目前医学实验室评足测量不确定度的实用的办法。此办法使用实验室自身对方法评估的主要数据(精密度、偏移)来得到合成不确定度(uc)。精密度为本实验室内复现性精密度(以前曾称为总精密度),最好来自本实验室的室向质控数据;通过正确度验证计划得到偏移数值。最后按通式求得合成测量不确定度。
                                              uc=√(ubias2+sRw2)
在此办法中,大致是:
      通过在多个批次反复多次测量(有证)参考物质求得下列2个数据:测量均值和参考物质之差,即偏移(△);以及实验室内复现性精密度sRw。
      此办法中,偏移的不确定度(ubias)包含下列3个组分,即:
??测量参考物质产生的不确定度,即测量均值的标准偏差(标准误),公式为sRw/√n,n为测量次数;
??参考物质赋值的测量不确定度(uref);
??测量的偏移(△)
      按下式代入上述3个数值,求出本办法中的偏移的测量不确定度:
                                        ubias=√△2+uref2+sRw2/n
      然后从本实验室IQC图表得到实际不精密度数据(sRw)。
      代入经验办法中评定测量不确定度的通式,可计算出此检测项目测量结果的测量不确定度。
                                        uc=√(ubias2+sRw2)
      如果认为还存在其它重要不确定度来源的组分,可以对这些重要单个影响因进行实验,求出其测量不确定度,再与上式进行合成。

      可以看出,此办法的关键是要有一个合适的正确度验证计划。进行此办法中应注意:
??被选用的参考物质应是无基体效应并具互通性,二级参考物质往往使用与医学实验室检测对象相同基体,如人血清。为了保证所选用参考物质的互通性,实验室往往需要进行附加的实验。最简单和实用办法是收集人血清做为实测标本,进行方法比较,可按EP14文件判断所用的参考物质有无互通性。
??应使用以决定性方法或国际公认,如在JCTLM参考方法表中的方法对所使用的参考物质赋值,并应提供相应的测量不确定度。实施正确性验证计划还涉及到所选参考物质的数量、测量批次、每批重复测量次数等。因为不同检测项目情况不一,而参考物质价格很高、每瓶含量往往偏少等,都给实施正确度验证计划以不少限制,很难给出一个固定的方案。下面介绍某一酶学校准(参考)实验室测量RELA样本的方案:
      每个项目发放5个样本,该实验室在4个工作日进行4个批次测量,每个批次开启1瓶样本测量3次,共测量12次。计算12次的标准标差得sRw。以此sRw除以测量次数(n=12)的平方根得测量该RELA样本的测量不确定度。
      随者参考体系在检验界的建立和发展,例如我国已批准了愈来愈多适用于医学实验室的有证参考物质。卫生部临检中心和检验界和厂家校准(参考)实验室研究和提供更多的无基体效应具互通性的样本,这些都有利在我国开展此项工作。
      今年卫生部临检中心已开始试行“正确性能力验证计划”。参加的医学实验室可收到由决定性方法赋值、无基体效应有互通性的多个样本。用这类样本很容易进行正确度验证。用本文介绍办法不难评定测量不确定度。

2.2 单一实验室通过能力比对计划评定测定不确定度

      在ISO 15189“5.6.3?如果上述无法实现或不适用,应用其它方式提供对结果的可信度,包括但不限于以下方法:”第一项就是“a) 参加适当的实验室间比对计划”。这一办法可能适合ISO17511中的第4和第5类检测项目。它们的测量值无法溯源到第一层的参考体系,很难制定正确性验证计划。只能退而求次,参加适当的实验室间比对计划,并利用能力比对计划的数据来评定测量不确定度。在此办法中,单一实验室常仍可应用自已室内质控数据来评定不精密度,但是偏移的测量不确定度要根据PT数据算出。由于目前PT计划存少在着各种问题,不同专家提出不同的办法来避免这些问题。似乎尚无一个公认可靠的办法。
      本文介绍EUROLAB推荐的由斯堪地维亚地区国家根据ISO/DTS21748在2003年编写的“环境实验室计算测量不确定度手册”中提出的办法。在此推荐办法中,不是从一次PT结果,而是首先从多次(一般为6次)PT结果计算出一种所谓“方法和实验室偏移的不确定度(RMSbias)”。RMSbias是每次实验室测量结果与PT靶值之间偏移值(biast)平方和均值的开方值,公式如下:

      在此办法中的偏移的测量不确定度(ubias)由方法和实验室偏移的不确定度(RMSbias)和PT计划的测量不确定度(Cref)合成,可以下述公式表示之:
                                 ubias=√RMSbias2+u(Cref)2
      每次PT计划的测量不确定度由每次PT计划的复现性不精密度sR和参加PT计划的实验室数n,由公式sR/√n算出。最后求出6次的均值(Cref)。
      用本办法计算合成测量不度定度的完整公式为:
                             uc=√RMSbias2+u(Cref)2+sRw2
      下面将以实例计算加以说明。
      首先是要知道6次PT结果的平均u(Cref)。例如在6次PT的平均sR为9%,参加实验室的平均数n=12。代入公式得:
                             u(Cref)=sR/√n =9/ √12=2.6%
      目前越来越多PT提供者都报告其赋值的不确定度u(Cref)。如有,实验室可以不必计算,直接使用组织者提供的测量不确定度。
      其次是评定某一实验室参加PT的偏移的测量不确定度,由下式组成:
??u(bias)=√[RMSbias2+u(Cref)2]
      前面已计算出u(Cref)为2.6%,下面进行u(bias)的计算,比较麻烦,大致有三步计算:
??第一步 先记录多次实验室测量值与PT靶值之差的相对偏移,例如为:2%、7%、-2%、3%、6%、和5%。
??第二步 求RMSbias:先求相对偏移值平方和的均值,然后将均值开方而得到,上述6个值计算结果如下:
??√{[22+72+(-2)2+32+62+52]/6}= √(127/6)= 4.6%
??第三步 将RMSbias和u(Cref)合成得该实验室参加PT得出的偏移不确定u(bias):
??u(bias)=√[RMSbias2+u(Cref)2]
=√(4.62+2.62)
=5.3%
最后求出合成与扩展不确定度:
      如从室内质控数接确定实验室内复现性精密度sRw为2.0%。从下式可得出合成不确定度(uc)和扩展不确定度(U):
=2x5.5
=11.0%
      一般说来从PT数据评定测量不确定度得到的数值往往较大,常大于从正确度验证计划所计算的测量不确定度。在某种情况,从PT计算出的赋值不确定度会大于实验室预设的目标不确定度。此时应检查所参加的PT计划是否合适,因为要得到一个合适的测量不确定度,一个组织良好的PT是前提:
      实验室参加的室间质评应是组织较严密的,有大量优秀医学实验室参加,与它们比对才可能判断结果的可信度;其次分组应适当:不仅按不同厂家分组,最好同组实验室使用相同的分析(测量)系统;同一组的实验室数量应足够多,应在10个以上。PT样本最好具有互通性,无明显基体(质)效应,赋值可溯源上一级参体体系。

2.3 通过多个实验室比对实验评定测量不确定度

      最后,简单介绍通过多个实验室比对实验评定测定不确定度。此办法在表面与PT相似,都是通过多个实验室测量同样的样本而取得数据,但实质上有明显不同。PT计划是一个疏散组织,PT组织者提出一些基本要求,实验室自愿参加。而本法的多个实验室比对实验多用于:a)多个校准(参考)实验室(网络)对参考物质赋值和b)厂家用于对产品校准品的赋值。为了得到满意的结果,此类实验室合作计划应是:
??设计严密 使用参考方法或其它可靠方法,在适当质控下,制定一个详尽的研究步骤,一个详尽的SOP文件,参加实验室的测量条件和测量样本应保持一致;
??组织良好 对参加实验室有严格要求,选择一批有经验的实验室, 检测必须严格按方案进行,各实验室所得到偏移和不精密度数据应互相兼容以得到互相一致和通用的数据。对数据有应用(剔除)的要求和标准;
??结果评定的测量不确定度应该较小。
      通过实验室比对得出赋值的测量不确定度(umeas)可由下式求出:
??umeas=√sR2/n
      通过多个实验室合计比对研究所得到的sR,不同于实验室内复现性标准标差sRw,sRw只能表示单一实验室内的不精密度。sR是多个实验室结果的(实验室间)复现性标准偏差,包含了几乎所有引起测量结果变异的组分,如不同实验室、不尽相同的分析(测量)系统、不同操作者、不同批号校准品/试剂等等。不仅包含对正确度,也包含对不精密度的影响,故直接以sR/√n就可以表达测量(参考)物质赋值的测量不确定度。
      在实际工作中,还会遇到复杂的多种多样情况,如:
??当赋值的参考物质、产品校准品、质控品还需溯源到上级参考物质。则最后计算的测量不确定度必须增加上级参考物质赋值的不确定度以及出现的偏移,此时可用下列公式;
                               ubias=√△2+uref2+sR2/n
??又如赋值的物质是厂家的商品校准品,则合成测量不确定度还需考虑其它组分的影响。 ISO导则35介绍在此情况下,完整的计算合成不测定度公式:
uref=√umeas2+ubb2+ults2+tsts2
式中 uref为商品参考物质的测量不确定度
       umeas为测量参考物质的测量不确定度
       ubb为瓶间差的不确定度
       ultt为长期稳定性的测量不确定度
       usts为短期稳定性的测量不确定度

2.4 不同评定测定不确定度办法的比较

       使用EUROLA介绍的上述4种评定测量不确定度的办法所得出的结果最难一致。有人曾以水中测氨方法为例,对浓度为0.2mg/L的样本,比较4种办法所评定的扩展不确定度,结果为:
??专业实验室按EN-ISO 11732,用“模式办法”求得不确定度为3-4%。
??一个水检测实验室按EN-ISO 11732,用“经验办法”中“单一实验室方法确认办法” 求得不确定度为7%。
??一个水检测实验室按EN-ISO 11732,用“经验办法”中“实验室间(网络)方法确认办法”求得不确定度为16%。
??常规检测水实验室使用不同方法,用“经验办法”中“用PT数据办法”求得的不确定度在18-22%之间。
      作者认为前两种办法计算的测量不确定度应比较接近。第一个模式办法可能忽略某些组分,得到的结果会偏小。后二种办法结果往往偏大。Westgard指出“?如果实验室要对很多不同测量程序评定不确定度,则需要更清楚的导则”。此意见是不错的,只在ISO 15189对评定测量不确定度提出一个条款在不够的,认可组织还应制定具体实施的导则或技术文件。

3 总结

      由于医学实验室中不少检测方法缺乏溯源性,不易按GUM要求,纠正显著的偏移,评定测量不确定度;又由于在医学实验室长期存在Westgard建立的,以误差为基础的医学实验室质量管理体系。长期来医学实验室评定测量不确定度存在不少困难和阻碍。
      从21世纪开始,在近十年期间,测量不确定度取得明显进展,特别在评定测量不确定度的办法方面发展了自上而下的取代办法。其中有一些办法已成功应用于普通化学测量检测实验室。有望可用于医学实验室。
      随着检验医学建立起越来越多的参考体系,制备出越来越多的(有证)参考物质,出现越来越多的具确性室间比对计划,医学实验室将建立越来越多的正确性验证计划。这些都将有力推动和促进医学实验室进行评定测量不确定度工作,又可能促使医学实验室的质量管理体系取得新的、飞跃性的进展。

                                   摘自定向点金《临床实验室》杂志2010年第六期