18F-FDG PET/CT SULpeak测量方法可靠性分析

2016-02-29 03:10马文超徐文贵张青菊甄玉莎
中国实验诊断学 2016年1期
关键词:测量方法重复性一致性

马文超,徐文贵,张青菊,甄玉莎,朱 磊

(天津医科大学肿瘤医院 分子影像及核医学诊疗科,国家肿瘤临床医学研究中心,天津市肿瘤防治重点实验室,天津300060)



18F-FDG PET/CT SULpeak测量方法可靠性分析

马文超,徐文贵*,张青菊,甄玉莎,朱磊

(天津医科大学肿瘤医院 分子影像及核医学诊疗科,国家肿瘤临床医学研究中心,天津市肿瘤防治重点实验室,天津300060)

摘要:目的分析手工及PET VCAR(PET Volume Computed Assisted Reading)软件自动测量肝脏及肺癌病灶SULpeak的重复性和一致性。方法回顾性分析50例原发性肺癌患者18F-FDG PET/CT显像结果。两名医生、同一医生一周前后分别测定肝右后叶及肺癌病灶感兴趣区内高代谢区域的5个体积为1 cm3(直径为1.2 cm球形)的随机像素点的SULmax,取5个SULmax的均数定义为SULpeak-手工;同时应用AW46工作站的PET VCAR软件自动测定肝右后叶及肺癌病灶SULpeak-自动。采用Bland-Altman分析和配对T检验评价SULpeak-手工和SULpeak-自动的重复性和一致性。结果通过PET VCAR测量肝右后叶和肺癌病灶的SULpeak-自动误差均为0 g/ml*,重复性均为100%。肝右后叶同一医生不同时间及不同医生手工测量的SULpeak-手工值均低于SULpeak-自动(P<0.001);Bland-Altman分析示同一医生不同时间及不同医生间分别有1/50(2%)、2/50(4%)个点位于95%一致性界限外。肺癌病灶SULpeak-手工值均高于SULpeak-自动(P<0.05);Bland-Altman分析示同一医生不同时间及不同医生间分别有1/50(2%)、2/50(4%)个点位于95%一致性界限外。结论SULpeak-手动受手工操作的影响明显,重复性和一致性均较SULpeak-自动差,而SULpeak-自动有良好的可靠性。PET VCAR自动测量SULpeak为PET/CT精确定量提供了重要平台,有助于推动以SULpeak为主要评价指标的PERCIST(Positron Emission tomography Response Criteria In Solid Tumors)标准的临床应用及推广。

(ChinJLabDiagn,2016,20:0032)

18F-FDG PET/CT对恶性肿瘤的疗效评估及随访发挥着重要的作用。根据PERCIST1.0(Positron Emission tomography Response Criteria In Solid Tumors 1.0)标准的要求[1],以SULpeak作为治疗反应的最主要定量指标,SULpeak降低≥30%,且绝对值≥0.8×SUL定义为部分代谢反应;SULpeak升高≥30%,且绝对值≥0.8×SUL则定义为疾病代谢进展。因此,多次18F-FDG PET/CT检查尤其同一患者治疗前后所测SULpeak的重复性对于判断患者的治疗反应至关重要。本研究回顾性分析50例肺癌患者18F-FDG PET/CT显像结果,分析手工及PET VCAR(PET Volume Computed Assisted Reading)软件自动测量肝右后叶及肺癌病灶SULpeak的重复性和一致性。

1资料与方法

1.1临床资料回顾性分析2014年10月至2015年4月间由我院18F-FDG PET/CT诊断并经病理确诊为原发性肺癌患者共50例,其中男25例,女25例,平均年龄:65.08±10.82岁(范围:36-86岁)。所有患者原发灶体积均大于1 cm3。

1.2显像方法18F-FDG由回旋加速器生产、合成器合成,PH值5-7,放化纯≥95%。患者禁食4-6 h,血糖控制在6.8 mmol/L以下,禁止使用镇静药物。静脉注射18F-FDG注射剂量为3.7-4.81 MBq/kg,安静休息60分钟后进行扫描。使用GE Discovery PET/CT Elite进行PET/CT扫描。扫描范围:颅顶至股骨中段。PET使用3D+飞行时间技术(TOF)+点扩展函数(SharpIR)采集及重建技术,矩阵:192×192,2min/床位。CT扫描参数:

常规全身螺旋扫描,120 kV,自动曝光控制技术(30-210 mA,噪声指数25),层厚3.25 mm。详细记录患者的身高(cm)、体重(kg)。

1.3图像分析由两名具有3年以上PET/CT阅片经验的核医学科医生独立完成进行图像处理及代谢指标测量,所有图像通过AW4.6后处理工作站进行处理。两名医生及同一医生一周前后分别测定,同一医生测量结果定义为测量者内,不同医生测量结果定义为测量者间。测量部位:正常肝右后叶及肺癌原发病灶。SULpeak:手工和自动测量的感兴趣区为同一感兴趣区;(1)测量感兴趣区内高代谢区域的5个体积为1 cm3(直径为1.2 cm球形)的随机像素点的SULmax,取5个SULmax的均数定义为SULpeak-手工[2],测量过程中尽量避开空洞及周围的炎症组织。(2)应用PET VCAR软件自动测定的感兴趣区域的SULpeak,定义为SULpeak-自动。

1.4统计学分析所有数据均以Mean±SD表示,应用SPSS 19.0及GraphPad Prism 5.1软件进行统计学分析。测量者内及测量者间测量结果一致性检验采用Bland Altman分析,可信区间为95%;SULpeak-手工与SULpeak-自动的比较采用配对T检验。P<0.05为差异有统计学意义。

2结果

2.1SULpeak-自动一致性分析

测量者内及测量者间肝右后叶及肺癌病灶SULpeak-自动测量结果一致,差异为0 g/ml*,即重复性为100%(图1)。

图1 肝右后叶及肺癌病灶SULpeak-自动一致性分析

2.2肝右后叶SULpeak统计学分析

正常肝右后叶测量者内SULpeak-手工测量一致性Bland-Altman分析显示:差异及其标准差分别为-0.017 g/ml*及0.15 g/ml*,95%一致性界限为-0.318~0.283 g/ml*,其中1/50(2%)个点位于95%一致性界限外(图2a)。测量者间SULpeak-手工测量一致性Bland-Altman分析显示:差异及标准差分别为-0.006 g/ml*及0.127 g/ml*,95%一致性界限为:-0.255~0.243 g/ml*,其中2/50(4%)个点位于95%一致性界限外(图2b)。

图2 肝右后叶SULpeak-手工一致性分析

医生1不同时间点及医生2测量结果肝右后叶SULpeak-手工低于SULpeak-自动(表1),且差异有统计学意义(P<0.001)。

表1 肝右后叶SULpeak-手工与SULpeak-自动的对比

2.3肺癌SULpeak分析

肺癌原发灶测量者内SULpeak-手工测量一致性Bland-Altman分析显示:差异及其标准差分别为-0.17 g/ml*及0.80 g/ml*,95%一致性界限为-1.77~1.40 g/ml*,其中1/50(2%)个点位于95%一致性界限外(图3a)。测量者间SULpeak-手工测量一致性Bland-Altman分析显示:差异及标准差分别为-0.17 g/ml*及0.96 g/ml*,95%一致性界限为-2.06~1.72 g/ml*,其中2/50(4%)个点位于95%一致性界限外(图3b)。

图3 肺癌病灶SULpeak-手工一致性分析

医生1不同时间点及医生2手工测量肺癌病灶SULpeak-手工高于SULpeak-自动(表2),且部分差别有统计学意义(P<0.05)。

表2 肺癌病灶SULpeak-手工与SULpeak-自动的对比

3讨论

随着定量化技术的不断发展使得PET/CT的临床应用除了常规的肿瘤诊断、分期之外,在治疗反应评估及预后判断方面亦逐渐发挥重要作用。尤其应用于治疗反应评估时,18F-FDG代谢视觉上的改变可能不是很明显,因此精确定量很重要。2009年Wahl RL提出PET评估实体瘤疗效标准-PERCIST1.0标准中[1],以瘦体重标准化的SUL取代临床常用的体重标准化的SUV,采用病灶感兴趣区内单一最小单元(直径为1.2 cm的球形区域,其体积约为1 cm3)的峰值(SULpeak)代替传统的SUV最大值(SUVmax)或平均值(SUVmean),以减少误差。以SULpeak为18F-FDG摄取代谢指标在定量分析恶性肿瘤治疗反应方面发挥重要作用。本研究对比分析了肝右后叶及肺癌病灶SULpeak手工测量与PET VCAR自动测量值,结果显示无论测量者内还是测量者间手工测量SULpeak均有2-4%差异,且肝右后叶SULpeak-手工低于SULpeak-自动,而肺癌病灶SULpeak-手工高于SULpeak-自动,提示测量者的手工操作对SULpeak准确性和重复性带来一定影响;而PET VCAR软件自动测量正常肝右后叶及肺癌病灶的SULpeak重复性为100%。

SULpeak测量的可靠性对于恶性肿瘤治疗疗效评估及预后判断具有重要意义。AmitBhoil等观察ⅢB-Ⅳ期非小细胞肺癌患者EGFR-TKI治疗反应结果显示与18F-FLT(3’deoxy-3’-fluorine-18-fluorothymidine)SULpeak及18F-FDG TLG(total lesion glycolysis)相比,18F-FDG SULpeak能更好的预测OS(over survival)及PFS(progression free survival)[3]。Masahiro Yanagawa等研究分别以54%、69%SULpeak为界值分组,结果示两组间OS与DFS(disease-free survival)有明显差异(P<0.05)[4]。最近的一项研究提示SULpeak降低率是影响NSCLC化疗后DFS的独立影响因素(P<0.05)[5]。但是,Tahari AK等[6]研究肝脏SULmean的测量重复性,结果示两次扫描门脉、门脉以上及门脉以下位置VOIs测量SULmean的平均误差百分比分别为3.55%±23.19%,4.65%±23.87%及4.30%±23.03%,95%一致性界限值为-0.5~0.60,其重复性一般。本研究结果显示手工测量肺癌病灶SULpeak测量者内有2%的差异,而测量者间有4%的差异,该结果略优于Minn H与Weber WA等研究结果(6%-10%)[7,8];关于18F-FDG代谢指标SUV、SUL及SULpeak的测量的研究得到相似的重复性或一致性,提示在临床诊断的层面,手工测量或许可以替代自动测量结果。但本研究中肝脏SULpeak-手工低于SULpeak-自动,而肺癌病灶SULpeak-手工高于SULpeak-自动,且大部分差别均有统计学意义(P<0.05),提示检查者的手工操作对SULpeak测量准确性和重复性带来一定影响,手动测量可能导致肺癌病灶T/N比值增高,从而高估肺癌病灶的18F-FDG摄取,不能满足肺癌病灶的18F-FDG代谢定量及治疗反应分析评估的要求。

本研究50例患者的肝右后叶及肺癌病灶的SULpeak-自动测量结果的差异为0 g/ml*,重复性为100%。PET VCAR自动测量病灶SULpeak避免操作者的影响、同时能够自动避开空洞、炎症组织的干扰,保证了结果的准确性及重复性,为PET/CT精确定量提供了重要平台,能够满足PERCIST标准定量评价肿瘤治疗反应的要求。肝右后叶及肺癌病灶的SULpeak受手工操作的影响明显。PET VCAR软件测量SULpeak-自动的可重复性高,有助于推动以SULpeak为主要评价指标的PERCIST标准的临床应用及推广。

参考文献:

[1]Wahl RL,Jacene H,Kasamon Y,et al.From RECIST to PERCIST:evolving considerations for PET response criteria in solid tumors[J].J Nucl Med,2009,50(Suppl 1):122S.

[2]Frings V,van Velden FH,Velasquez LM,et al.Repeatability of metabolically active tumor volume measurements with FDG PET/CT in advanced gastrointestinal malignancies:a multicenter study[J].Radiology,2014,273(2):539.

[3]Bhoil A,Singh B,Singh N,et al.Can 3'-deoxy-3'-(18)F-fluorothymidine or 2'-deoxy-2'-(18)F-fluoro-d-glucose PET/CT better assess response after 3-weeks treatment by epidermal growth factor receptor kinase inhibitor,in non-small lung cancer patients Preliminary results[J].Hell J Nucl Med,2014,17(2):90.

[4]Yanagawa M,Tatsumi M,Miyata H,et al.Evaluation of response to neoadjuvant chemotherapy for esophageal cancer:PET response criteria in solid tumors versus response evaluation criteria in solid tumors[J].J Nucl Med,2012,53(6):872.

[5]Ding Q,Cheng X,Yang L,et al.PET/CT evaluation of response to chemotherapy in non-small cell lung cancer:PET response criteria in solid tumors (PERCIST) versus response evaluation criteria in solid tumors (RECIST)[J].J Thorac Dis,2014,6(6):677.

[6]Tahari AK,Paidpally V,Chirindel A,et al.Two-time-point FDG PET/CT:liver SULmean repeatability[J].AJR Am J Roentgenol,2015,204(2):402.

[7]Minn H,Zasadny KR,Quint LE,et al.Lung cancer:reproducibility of quantitative measurements for evaluating 2-[F-18]-fluoro-2-deoxy-D-glucose uptake at PET[J].Radiology,1995,196(1):167.

[8]Weber WA,Ziegler SI,Thödtmann R,et al.Reproducibility of metabolic measurements in malignant tumors using FDG PET[J].J Nucl Med,1999,40(11):1771.

关键词:测量方法;脱氧葡萄糖;瘦体重标准化摄取值峰值;一致性;重复性

Reliability analysis of measurement methods for18F-FDG SULpeakin PET/CT scanMAWen-chao,XUWen-gui,ZHANGQing-ju,etal.(DepartmentofMolecularImagingandNuclearMedicine,TianjinMedicalUniversityCancerInstituteandHospital,NationalClinicalResearchCenterforCancer,KeyLaboratoryofCancerPreventionandTherapy,Tianjin300060,China)

Abstract:ObjectiveTo compare peak standardized uptake normalized to lean body mass (SULpeak) of manual and automatic measurement by PET VCAR (PET Volume Computed Assisted Reading ) and evaluate the repeatability of manual SULpeak.MethodsFifty patients with primary lung cancer confirmed by18F-FDG PET/CTwere included in our study retrospectively.We used PET VCAR software of AW4.6 workstation to automatically measure SULpeak(SULpeak-auto) and the average SULmaxof five random pixels in fixed sized (1.2 cm in diameter,about 1 cm3volume) spherical VOI drawn over lesions was calculated by two doctors and same doctor at different time,defined as SULpeak-manual.ResultsThe bias of SULpeak-autowere 0 g/ml* and repeatability was 100% for liver and lung cancer lesions.While liver SULpeak-manualof two doctors and same doctor at different time were lower than SULpeak-auto(P<0.001).And Bland-Altman analysis results showed that 1/50 (2%) 2/50(4%) points located outside 95% limit of agreement respectiveby.Lung cancer lesions SULpeak-manualof two doctors and same doctor at different time were higher than SULpeak-auto(P<0.05).And Bland-Altman analysis results showed that 1/50(2%),2/50(4%) points located outside 95% limit of agreement respectivly.ConclusionThe SULpeak-manualmainly depended on manual measurement,whose repeatability and consistence were inferior to SULpeak-auto,while the SULpeak-autohad good reliability.The accuracy and reliability of SULpeak-autofrom PET VCAR could be suitable to assess treatment response,and be helpful to PERCIST clinical application and promotion,which evaluates response mainly by SULpeak.

Key words:Measurement methods;Deoxyglucose;Peak standard uptake value of lean body mass;Consistence;Repeatability

(收稿日期:2015-08-10)

文献标识码:A

中图分类号:R817

文章编号:1007-4287(2016)01-0032-04 1007-4287(2016)01-0036-04

*通讯作者

基金项目:国家重大科技专项经费资助(2013ZX09303001),天津市卫生局科技基金(2013KZ090)

猜你喜欢
测量方法重复性一致性
注重教、学、评一致性 提高一轮复习效率
对历史课堂教、学、评一体化(一致性)的几点探讨
化学分析方法重复性限和再现性限的确定
IOl-master 700和Pentacam测量Kappa角一致性分析
航空发动机推力测量方法
论重复性供述排除规则
基于应变原理随钻钻压测量方法研究
基于事件触发的多智能体输入饱和一致性控制
自由风扇声功率级测量方法与测量不确定度
一种星上微振动引起像移量的测量方法