参考物质互通性评价方案

2021-03-30 04:54刘庆香张天娇龙琪琛周伟燕张传宝

检验医学 2021年3期

刘庆香，张天娇，龙琪琛，周伟燕，张传宝

（1.北京医院国家老年医学中心中国医学科学院老年医学研究院国家卫生健康委临床检验中心北京市临床检验工程技术研究中心中国医学科学院北京协和医学院，北京 100730；2.北京医院国家老年医学中心中国医学科学院老年医学研究院国家卫生健康委临床检验中心北京市临床检验工程技术研究中心，北京 100730）

互通性是参考物质的一个重要属性，也是参考物质在不同测量程序间保持结果一致的关键性能参数。参考物质具有互通性是保证患者结果可溯源的关键环节，也是参考物质用于量值溯源与传递的技术基础[1]。当前，由于绝大多数临床项目分析物对被测量的代表性不足、参考物质基质不同等原因，导致参考物质和临床样本在不同测量系统之间不具有互通性。因此，无论是参考物质生产者，还是临床实验室工作人员均应重视互通性。2010年和2014年，美国临床和实验室标准化协会（the Clinical and Laboratory Standards Institute，CLSI）发布的EP30-A[2]和EPl4-A3[3]文件、2018年国际临床化学和检验医学联合会（the International Federation of Clinical Chemistry and Laboratory Medicine，IFCC）介绍的互通性评价更新方案[1，4-5]提供了详细的参考物质互通性评价方案，有助于参考物质生产者、临床实验室制备及使用互通的参考物质，促进临床实验室检验结果的准确、可比。

1 互通性的概念及重要性

互通性的概念起源于1973年，首次被应用于酶活性测量，以强调用于内部和外部质量控制程序的材料必须具有与临床样本相似的特性[6]，目前已被广泛应用于所有的定量测量。互通性指用不同测量程序测量参考物质时，各测量程序所得的测量结果之间的数字关系，与用这些测量程序测量实际临床样本时测量结果的数字关系的一致程度[7]。互通性评价可建立和验证常规测量结果到参考系统的溯源性及各方法检测结果的协调性[8]。对参考物质进行互通性评价可判断其是否适合被用作校准品、正确度质控品或室间质量评价（external quality assessment，EQA）材料。具备互通性的参考物质可直接用于生产者校准品的定值，以确保计量溯源链的连续性及实验室结果的正确性[2]。使用互通的参考物质进行校准时，可确保在临床实验室中无论使用哪种测量程序测量临床样本，结果都是等效的；使用不互通的参考物质进行校准会在校准过程中产生偏差，导致在测定临床样本时可能会产生不正确的结果[9]。因此，对参考物质进行互通性评价是十分必要的。

2 互通性评价方案

EP30-A文件、EP14-A3文件及IFCC互通性评价方案详细叙述了参考物质互通性的评价方案，本文对这3个方案进行归纳。互通性的评价方案应包括准备材料、制备参考物质和临床样本、选择测量程序、确定各样本需要重复检测的次数、分析数据及评价结果。

2.1 材料及样品制备

2.1.1 材料评价互通性所需的材料包括试剂、校准品和仪器系统等，应对所使用的材料情况进行说明。EP14-A3文件指出，同一测量程序应使用同一批试剂[3]。

2.1.2 样品样品包括待评价的参考物质及临床样本，应详细说明样品收集、处理和储存条件。（1）参考物质。进行互通性评价的参考物质一般为校准品、正确度质控品或EQA材料。EP30-A文件要求当参考物质需要被稀释来制备测量程序范围内的样品时，每个稀释的样品必须被视为1个单独的样品，并进行互通性评价。稀释剂可能会影响所测样品的性质，因此有必要验证稀释液是否适合在制备过程中使用[2]。（2）临床样本。临床样本应按照设定的标准来收集。单人份临床样本应来自健康人和患者，其浓度或活性应大致均匀地分布，并包括参考物质的浓度或活性，其体积应足够用于所有测量程序进行分析。收集样品时应避免那些因存在已知干扰或交叉反应物质而被认为不适合分析的样品。EP14-A3文件指出单人份临床样本数应＞20个[3]；IFCC认为单人份临床样本数应＞30个，可根据测量程序的性能特征而有所不同[4]。只有不能收集足够体积的单人份临床样本时，才允许收集混合临床样本。混合临床样本会稀释单个样本中存在的物质的影响，可能减少少数单个样本特异性效应的影响，相比于单人份临床样品，混合临床样本的基质可能会有所改变。因此，在用于互通性评价之前，应根据CLSI-C37文件[10]要求，验证混合临床样本与单个临床样本的互通性。临床样本应避免进行添加，当在实际情况下无法收集到高浓度或活性的样本而需要进行添加时，应对添加得到的样本进行标记说明[3]。

2.2 测量程序

IFCC互通性评价方案[1]指出，用于互通性评价的测量程序应具备如下特性：（1）足够的精密度，精密度不足会导致更大的不确定度，影响互通性的评价；（2）对被测量具有足够的选择性，采用选择性不足的测量程序可能会产生错误的互通性评价结果；若测量程序包含参考测量程序，则参考测量程序为比对方法，常规测量程序为待评价方法；若不含参考测量程序，则将常规测量程序进行两两比较。

2.3 分析

使用测量程序对参考物质和临床样本进行分析时，参考物质和临床样本应随机穿插排列。EP14-A3文件[3]要求样品至少要重复测量3次，不同测量程序样品重复测量次数可不同。IFCC互通性评价方案[4]要求样品重复测量次数至少为2次，推荐重复测量3次，在同一批测量中应在不同位置对参考物质进行测量，建议测量位置的数量至少为5个。

2.4 数据分析

数据分析方法应该根据参考物质、临床样本和测量程序的数目以及是否包含参考测量程序来进行选择[2]。EP30-A文件、EP14-A3文件及IFCC互通性评价方案中的数据分析方法不同。

2.4.1 EP30-A文件（1）选择回归方法来评价互通性。回归分析方法是假定1组变量（X，Y）间具有线性关系，并估计线性模型参数和标准差。常用的回归方法有：普通最小二乘法（ordinary least square，OLS）、戴明回归法和Passing-Bablock（PB）回归法。回归方法的选择和正确使用在很大程度上取决于数据的特性，即X和Y的标准差以及参考物质和临床样本的重复检测次数。OLS和戴明回归法均采用最小二乘法拟合，但对数据的假设不同。OLS假设变量Y服从标准差恒定的正态分布，自变量X无随机误差，主要适用于比对方法为参考测量程序的情况。戴明回归法假定2个测量程序所得的结果都含有随机误差，根据观察点到回归线的垂直距离的平方和最小来估计回归模型斜率和截距。戴明回归法不需要X和Y数据标准差相等，当标准差不相等时，根据观察点到回归线的非垂直（合适的角度）距离的平方和最小来估计回归模型斜率和截距，但前提是标准差在数据范围内是恒定的。当X和Y的标准差在测量范围内都近似恒定时，可以对测量结果的均值使用常规的戴明回归法；若标准差与浓度成比例时，推荐使用加权戴明回归法或者非加权戴明回归法对结果进行对数转换。戴明回归法适用于2种常规测量程序间的互通性评价。OLS和戴明回归法最大的区别在于参数的估计，OLS在估计参数时只考虑了因变量来源的随机误差，而未考虑自变量来源的随机误差；戴明回归法在估计参数时同时考虑了自变量、因变量来源的随机误差。因此，相对于OLS，从回归的科学性、合理性上来说，戴明回归法在估计参数时更为严谨，估计的参数与实际情况的一致性更好，得到的回归线对测量点的代表性更强，从统计学角度考虑，戴明回归法在互通性研究中的适用范围更广[10]。PB回归是一种非参数程序，对误差分布类型没有规定，可用于标准差恒定或标准差与浓度成比例的误差，唯一的限制是假设标准差的比例等于斜率的平方。PB回归法使用任意2个数据点之间的斜率来估计回归线的斜率；截距的估计是使50%的数据点落在直线的上方，50%落在下方。PB回归法的优点在于稳健性好，离群值对结果的影响小；缺点是其会造成的较宽的置信区间。

不同的回归方法可能会导致不同的数学关系和互通性评价结果，因此在互通性报告中应提供所使用回归方法的适当信息，如描述所检测的浓度范围的标准差。考虑到上述3种回归方法的优点和局限性，在互通性评价中，当数据可以通过线性关系拟合时，Deming回归分析似乎是建立等价数学关系最合适的方法。

（2）使用95%预测区间进行回归分析。以2个测量程序（A、B）测得结果的均值（或log10均值）为相应X、Y轴进行回归分析，计算临床样本对于相应的X值，其Y值的预测值和双侧95%预测区间，并绘制回归图，见图1。若参考物质的检测结果在预测区间内，则认为参考物质具有互通性；若在预测区间外，则认为参考物质不具有互通性。

图1 使用回归方法和95%预测区间来评估A、B测量程序之间的互通性

（3）使用回归标准差sy-x的倍数进行回归分析。用临床样本数据点与回归分析的最佳拟合线之间的残差制定残差评估标准。用2个测量程序的临床样本结果计算回归线和回归标准差sy-x。因为PB回归是非参数估计，所以使用PB回归法算出的sy-x会比OLS和戴明回归法大。这部分所考虑的测量标准差在测量范围内是恒定的，临床样本数在参考物质浓度范围内是适当的。参考物质也由2个测量程序检测，预测值通过临床样本的回归标准差计算，相对残差的计算公式为：相对残差=（测量值-预测值）/sy-x，评价标准为±2sy-x，±2sy-x表示参考物质与临床样本具有相同数值关系的大约95%的置信范围。若相对残差在±2sy-x范围内，则认为参考物质具有互通性；若超出了±2sy-x范围，则认为参考物质不具有互通性。

（4）多元统计方法。用于进行互通性评价的多元统计技术为主成分分析和相应分析。主成分分析和相应分析是描述性的方法，不进行数据模型的假设。这2种方法能够将临床样本中可能的属性差别展示出来，也可以将参考物质处理为“非活动元素”，使之不会被“活动元素”临床样本的模式影响。这2种方法主要适用于没有参考测量程序的多种方法比较。相应分析是将原始数据转换成二维的表格（样品栏和方法栏），不同单位的方法间进行对比不需要重新计算或转换。因子平面是由2个因子轴来确定的，每1个数据点可以通过将其投射到因子平面上使之可视化。评价参考物质的互通性时，使用临床样本建立主轴，参考物质作为非活动元素，置信区间可以通过临床样本参考集来确定，投射在临床样本确定的点群中心的参考物质代表了高度的互通性，远离中心的参考物质被认为缺乏互通性。

2.4.2 EP14-A3文件首先使用OLS检查数据是否适用于线性回归分析，并检查是否存在异常值；然后通过差异图检查2个测量程序（A、B）获得的临床样本结果的均值分布，差异图的X轴为2个测量程序所得结果的均值，Y轴为2个测量程序所得结果的差值，见图2。若偏差/移是恒定的，则可进行戴明回归分析；若偏差/移随着被测量浓度的增加而增加，则需将数据进行对数转换，若转换后的偏差/移恒定，则将转换后的数据进行戴明回归分析，经对数转换的戴明回归分析结果见图3。以2个测量程序测得结果的均值（或对数均值）为相应的X、Y轴，计算临床样本对于相应的X值，其Y值的预测值和双侧95%的预测区间，并绘制回归图，见图1。若参考物质的检测结果在预测区间内，则认为参考物质是互通的，若在预测区间外，则认为参考物质不互通。

图2 A、B测量程序差分图

图3 检测结果进行对数转换的戴明回归图

2.4.3 IFCC互通性评价方案 IFCC互通性评价方案采用偏差差值法评价参考物质的互通性。以2个测量程序（A、B）检测结果均值为X轴，检测结果（或经对数转换）的相对偏差为Y轴绘制偏差图，见图4。计算dRM及U（dRM），dRM为参考物质在2个测量程序间检测结果的偏差与临床样本在2个测量程序间检测结果偏差均值的差值，u（dRM）是dRM的合成不确定度，U（dRM）为dRM的扩展不确定度，U（dRM）=k×u（dRM），k为扩展因子。设定1个可接受的最大值为互通性评价标准（以C表示），若dRM±U（dRM）在±C范围内，则参考物质具有互通性，如图4中的RM1、RM4、RM5；若dRM±U（dRM）超出±C范围，则参考物质不具有互通性，如图4中的RM3；若dRM±U（dRM）与±C范围存在重叠，则参考物质的互通性难以确定，如图4中的RM2。C可以根据参考物质作为校准、正确度控制或外部质量评估的预期用途来选择，并且该标准可以与基于临床实验室测试结果的医疗决策要求相关。一般来说，参考物质用作溯源链中的校准品时应该使用严格的标准来评价互通性，当其作为质控品时，可采用较广泛的标准[9]。在选择可互通性标准时，可参考2014年在米兰召开的欧洲临床化学和检验医学联盟会议定义的模型[12]。

图4 检测结果进行对数转换的偏差/移图

2.5 评价结果

总结参考物质在测量程序间的互通性情况，可采用表格的形式将互通性评价的结果更加简洁、明确地展示出来。

3 互通性评价方案优缺点

EP30-A文件详细描述了OLS、戴明回归法和PB回归法，还介绍了能够同时测试参考物质在多个测量过程中互通性的分析技术。EP14-A3文件主要对戴明回归法进行了描述，可帮助临床实验室、监管者和参考物质生产者了解被评价物质的互通性，以及样品的基质效应，还可帮助区分测量过程故障和使用人工或人工处理的样品造成的影响，但无法获得不互通的确切机制或原因。EP30-A文件及EP14-A3文件也存在一些问题。（1）95%预测区间是一个基于统计学公式计算的变化的标准，与参考物质的医学预期用途无关。测量程序的随机误差越小，95%预测区间越窄，标准物质获得互通性结果的可能性也越小；反之，测量程序的随机误差越大，95%预测区间越宽，标准物质得到互通性结果的可能性也越大。（2）95%预测区间的方法主要基于参考物质与临床样本的测定结果从属于同一分布的假设，该假设不一定符合所有情况。（3）通过回归方程计算得到的基质相关偏移评价是参考物质与临床样本组的差异，因此95%预测区间的方法不能量化在所关注的浓度，如医学决定水平、参考物质与临床样本之间的差异。

IFCC互通性评价方案采用偏差差值法，强调互通性评价标准应是一个固定且与医学预期用途相关的标准，该评价标准可克服回归分析法的不足，对参考物质的预期用途进行更相关的评估。鉴于每个检验项目的测量原理、方法、技术水平等的不同，每个项目的医学预期用途和允许偏移/差都有相应的标准，因此评价标准表达形式也不尽相同[13]。在IFCC互通性评价方案中，互通性评价标准起着至关重要的作用。DELATOUR等[14]认为，宽松的标准不能区分材料之间微小的互通性差异，不能准确地评价参考物质的互通性，严格的标准可能与临床实验室的实际测定水平不适配，并可能遗漏符合预期用途的参考物质[13]。因此，制定一个适用于参考物质预期用途并考虑测量程序性能特征的标准非常必要，而制定科学、合理的评价标准是偏差差值评估法实施过程中的一个难点。在制定互通性评价标准时，可参考2014年在米兰召开的欧洲临床化学和检验医学联盟会议定义的模型[12]，如临床需求、生物学变异和当代技术水平。生物学变异最常被用于制定质量要求，但Westgard网站上大多数检测项目的生物学变异数据引自1篇或少数几篇文献，且部分文献年代较为久远，其科学性和严谨性不足[15]。因此，需依据欧洲临床化学和检验医学联盟发布的核查表对生物学变异相关文献进行质量评估，筛选可靠的生物学变异数据，结合参考物质预期用途及测量程序性能特征的标准，制定出一个合适的评价标准。

4 互通性方案的临床应用

目前，国内外尚没有文件明确规定在进行互通性评价时应选择的方案。在IFCC互通性评价更新方案发表前，临床上一般采用EP30-A文件或EP14-A3文件方案来评价互通性，在IFCC互通性评价更新方案发表后，临床上大多采用EP30-A文件或EP14-A3文件与IFCC互通性评价方案分别对同一参考物质进行互通性评价，虽然不同方案评价互通性的结果可能会存在一定的差异，但这能更好地说明参考物质互通性的情况。

5 总结

互通性是参考物质的重要属性，互通性评价可建立常规测量结果到参考系统的溯源性，也可验证各常规方法检测结果的一致性，因此对参考物质进行互通性评价是必要的。在进行互通性评价时，采用不同方案评价同一参考物质互通性的结果可能不同，因此临床应根据参考物质的预期用途和测量程序的性能特征来选择合适的互通性评价方案。本文对EP30-A文件、EP14-A3文件及IFCC互通性评价方案进行了归纳、比较和总结，希望能为参考物质的互通性评价提供一定的帮助。