基于BP算法的血液指标联合检测在肝癌及肝炎诊断中的应用

2016-04-19 07:21尹咪咪张建华张萍萍
郑州大学学报(医学版) 2016年2期
关键词:肝炎特异性肝癌

尹咪咪,张建华,张萍萍

郑州大学电气工程学院 郑州 450001



基于BP算法的血液指标联合检测在肝癌及肝炎诊断中的应用

尹咪咪,张建华#,张萍萍

郑州大学电气工程学院 郑州 450001

关键词BP算法;血液指标;特异性;肝癌;肝炎

摘要目的:分析8种血清及血常规指标在原发性肝癌和肝炎患者鉴别诊断中的特异性,建立BP诊断模型。方法:采用回顾性研究的方法,收集经病理确诊的96例原发性肝癌患者为肝癌组,对应收集同期109例肝炎患者作为肝炎组。分别收集两组患者的高尔基体蛋白73(GP73)、甲胎蛋白(AFP)、α-L-岩藻糖苷酶(AFU)、谷草转氨酶(AST)、谷丙转氨酶(ALT)、白细胞计数(WBC)、红细胞计数(RBC)和血小板计数(PLT)等8种血清及血常规指标数据。利用ROC曲线分析各指标的敏感度,根据尤登指数计算两组界限值,然后建立纳入不同指标的BP神经网路模型,并计算模型的准确率。结果:GP73、AFP、AFU、AST、ALT、WBC、RBC、PLT 等8个指标的ROC曲线下面积分别为0.996、1.000、0.990、0.806、0.680、0.800、0.419和0.460。分别纳入8种指标和去掉RBC、PLT后的6种指标成功建立BP神经网络诊断模型,其准确率分别为86.0%(39/45)和95.5%(43/45)。结论:GP73、AFP、AFU、AST、ALT、WBC指标在肝癌和肝炎患者的鉴别诊断中具有重要意义,对于肝炎患者的病情进展具有一定的提示意义。

Application of blood indexes combined detection in diagnosis of liver cancer and hepatitis based on BP algorithm

YINMimi,ZHANGJianhua,ZHANGPingping

DepartmentofElectricalEngineering,ZhengzhouUniversity,Zhengzhou450001

Key wordsBP algorithm;blood index;specificity;liver cancer;hepatitis

AbstractAim: To analyze the specificity of eight serum and blood indexes in differential diagnosis of liver cancer and hepatitis,and establish a BP diagnostic model.Methods: A total of 96 primary liver cancer patients confirmed by pathology were enrolled as case group, 109 hepatitis patients were treated as control group. The data of Golgi protein 73(GP73),alpha fetal protein(AFP), alpha-L-fucosidase(AFU), aspartate transaminase(AST), glutamic pyruvic transaminase(ALT), white blood cell count(WBC), red blood cell count(RBC) and blood platelet count(PLT) in two group were collected respectively,and their specificity and sensibility according to the ROC curves were obtained.The BP network models were established with different indexes and the efficiency was evaluated.Results: TheAUCof GP73,AFP,AFU,AST,ALT,WBC,RBC,and PLT were 0.996,1.000,0.990,0.806,0.680,0.800,0.419 and 0.460, respectively, and RBC and PLT were filtrated.The accuracy of the BP network models with all the indexes and the 6 indexes were 86.0%(39/45) and 95.5%(43/45).Conclusion: The indexes GP73,AFP,AFU,AST,ALT and WBC have a relatively higher specificity in differential diagnosis of liver cancer and hepatitis, which may have certain implications in the progression of hepatitis patients.

原发性肝癌(primary liver cancer,PLC)是目前世界范围内比较常见的消化系统恶性肿瘤,其中约90%的原发性肝癌为肝细胞性肝癌(hepatocellular carcinoma,HCC)[1]。全球每年有大约60万人死于肝癌,使得肝癌成为第3位与癌症相关的死亡原因[2]。大量研究资料表明,慢性乙型肝炎病毒(hepatitis B virus,HBV)和丙型肝炎病毒(hepatitis C virus,HCV)感染是导致肝癌的两个主要原因,超过50%的肝癌由肝炎引起。我国约有1亿人为HBV携带者,约2 000万人为慢性乙型肝炎患者,而HCV感染主要流行于欧美国家,一直呈上升趋势的肝癌发病率与此有很大的关系[3-4]。HBV感染者在后期进展为肝纤维化和肝炎时,有一定的概率恶化为肝癌,从而使治疗变棘手。因此,对于肝炎患者的病情进展一定要提前预测和及时控制。已有研究[5]发现,肝炎患者在恶化为肝癌的过程中,其部分血清标记物和血液指标会发生变化。因此,临床上密切监视肝炎患者的血液状态对于后期病情的进展具有一定提示意义。作者回顾性分析肝癌患者和肝炎患者常见的8种血清及血常规指标,分别为高尔基体膜蛋白73(Golgi protein,GP73)、甲胎蛋白(alpha fetal protein,AFP)、α-L-岩藻糖苷酶(a-l-fucosidase,AFU)、谷草转氨酶(aspartate transaminase,AST)、谷丙转氨酶(alanine aminotransferase,ALT)、白细胞计数(white blood cell count,WBC)、红细胞计数(red blood cell count,RBC)和血小板计数(blood platelet count,PLT),试图筛选出对肝炎和肝癌鉴别特异性较高的指标,并建立基于BP神经网络的诊断模型,以期为临床工作者提供理论参考和实验依据。

1对象与方法

1.1研究对象选择郑州大学一附院消化内科2013年9月至2015年6月的住院患者。其中肝癌组96例,均为原发性肝癌;男54例,女42例,年龄31~73(42.6±10.3)岁。肝炎组109例,其中83例为乙型肝炎,12例为丙型肝炎,9例为自身免疫性肝炎,5例为胆囊炎;男67例,女32例,年龄26~69(39.4岁±9.8)岁。样本量的确定是根据已知百分比的随机抽样样本量计算公式[6]计算得出。

1.2血清及血常规指标检测采集两组患者的空腹静脉血样标本,通过酶联免疫吸附法(ELISA)测定各组GP73、AFP的表达量;AFU指标采用日立7600全自动生化分析仪和北京利德曼生化试剂公司生产的试剂进行测定。其余指标均是通过贝克曼库尔特LH 755全自动血液分析仪进行的血常规分析测定。样本采集时均排除其他炎症或相关疾病干扰。

1.3统计学处理采用SPSS 19.0软件对所收集数据进行受试者工作曲线分析(receiver operating characteristic,ROC),并计算曲线下面积(area under curve,AUC)。根据AUC的大小筛选出区分肝癌和肝炎特异性及灵敏度都较高的指标。根据ROC曲线坐标和尤登指数计算特异性较高的指标在两组之间的界限值。

1.4基于BP算法的数据仿真模型的建立与应用对全部纳入研究的8种指标GP73、AFP、AFU、AST、ALT、WBC、RBC、PLT 进行神经网络训练,建立基于BP算法的数据仿真模型,计算其准确率;纳入筛选后的指标,重新建立神经网络模型,计算其准确率并与前者比较。具体过程如下:纳入指标为模型的输入变量,添加GROUP变量为输出变量,其中肝癌组定义为1,肝炎组定义为0。所收集肝癌组96个样本中,随机抽取76个样本用于模型训练,其余20个样本用于模型仿真的验证;肝炎组109个样本中,84个样本用于模型训练,其余25个样本用于模型验证。

所建立BP网络模型为包含一个单隐层的BP网络模型,已有研究表明单隐层神经网络可以很好地映射分类问题[7]。所设置输入层到隐层的转换函数为“tansig”;隐层到输出层的转换函数为“purelin”,所选训练方法为弹性梯度下降算法“trainrp”、L-M梯度递减算法trainlm和一步正割算法“trainoss”;输入层节点为所纳入指标变量的个数,输出节点为输出向量的个数1。隐层神经元节点数应符合一定的规律,一般可通过试凑进行确定[8]。设置最大训练次数为1 000;训练误差阈值为0.005。程序编写及仿真基于MATLAB 2012a平台实现。在进行实际的网络训练时,使用不同的参数设置组合会有不同的训练效果,最终会采用效果最好的设置方式。

2结果

2.1两组患者血清学指标比较肝癌组和肝炎组的血清和血常规指标的比较见表1。

表1 两组患者血清学指标比较

2.2ROC曲线分析结果见图1。GP73、AFP、AFU、AST、ALT、WBC、RBC、PLT的AUC分别为0.996、1.000、0.990、0.806、0.680、0.800、0.419、0.460,95%CI(P)分别为0.991~1.000(<0.001)、1.000~1.000(<0.001)、0.971~1.000(<0.001)、0.747~0.865(0.001)、0.604~0.756(0.001)、0.738~0.862(0.001)、0.335~0.504(0.047)、0.380~0.539(0.318)。GP73、AFP、AFU、AST、ALT、WBC指标的特异性较好,曲线下面积均在0.8以上。RBC和PLT的AUC较小,均小于0.5。

图1 8种指标的ROC曲线

取约登指数最大时所对应的坐标为两组之间的界限值。P73、AFP、AFU、AST、ALT、WBC计算结果分别为163.11 μg/L、167.54 μg/L、130.93 U/L、56.40 U/L、48.18 U/L、7.24×109L-1。

2.3BP网络模型首先纳入全部8个指标进行BP神经网络模型的建立。输入训练数据集对模型进行训练,训练结束后,输入验证数据集对所建立的模型进行仿真,并将模型预测输出与实际输出进行比较。结果如图2所示,空心圆圈表示实际结果,红色三角符号表示所建立模型的仿真输出,其准确率为86.0%(39/45)。

图2 纳入全部8个参数时建立模型的准确率

纳入筛掉RBC和PLT指标的剩余6个指标GP73、AFP、AFU、AST、ALT、WBC,再次建立BP神经网络模型。模型仿真验证结果如图3所示,结果可见其模型准确率为95.5%(43/45)。

图3 纳入全部6个参数时建立模型的准确率

3讨论

肝癌是我国高发的危害极大的恶性肿瘤,其发病原因主要有HBV和HCV感染、肝硬化、黄曲霉素、乙醇和其他环境原因等。肝炎患者病情得不到控制后,有可能转为肝癌。血液指标的检测为肝癌及肝炎的检测提供了一种较好的诊断方式,在临床上应用较多。该文通过对比研究肝癌组和肝炎组的临床数据资料,筛选出了对于鉴别肝癌和肝炎患者特异性较高的指标,并建立了基于BP算法的诊断仿真模型,然后根据ROC曲线,计算出区别肝癌和肝炎患者的界限值,为今后临床上对于肝炎患者的观察和化验指标提供理论依据。

已有大量研究[9-11]表明,AFP和GP73是对肝癌诊断较为敏感的血清标记物。GP73作为一种新的临床肝癌诊断标记物,在肝癌患者中呈高表达状态,在正常肝组织中几乎不表达,但HBV、HCV的感染和肝炎等疾病的发生会导致GP73表达的显著上升[12]。AFP也是诊断肝癌的首选血清标准之一,在肝癌患者中的表达高于正常肝炎患者数倍[13]。Liu等[14]发现AFP在慢性肝炎和肝硬化患者中的表达水平也会随着病情的进展而升高。AFU是一种广泛存在于肝、胰腺、肾纤维细胞等溶酶体内的酸性水解酶,以肝、肾等组织中活性最高。当肝细胞癌变时,酶合成增加并释放入血液,使血清中AFU升高。另外,ALT和AST是公认的反映肝细胞受损的指标,可用于肝硬化、肝纤维化、肝癌的检测[15]。WBC是一项血常规指标,一般在人体出现炎症、感染、恶性肿瘤或中毒等免疫反应时会升高。因此可以看出,肝癌和肝炎患者的上述指标都处于非正常范围,且肝癌患者组理论上会高于肝炎患者。这可能说明,肝癌患者体内的免疫反应要较肝炎患者强烈,其肝细胞的损害程度也要更严重一些,肝癌的发生是由于肝炎一步步的恶化而来的。现今尚无大量文献报道二者之间在血液指标上明确的诊断界限值。该研究结果显示,肝癌组和肝炎组之间的 GP73、ATP、ATU、ALT、AST和WBC差异具有统计学意义。且根据ROC曲线分析可得6个指标的两组之间界限值。临床上GP73的肝癌诊断界限值为150 μg/L,而AFP的正常范围一般视为0~20 μg/L,AFU 0~40 U/L,AST 13~35 U/L,ALT 0~40 U/L。当这些指标处于正常范围之外和界限值之间时,可提示为肝炎患者;高于该界限值,提示为肝癌患者。因此,当肝炎患者的指标持续升高且超过界限值时,要警惕是恶化为肝癌的信号,需及早采取控制措施。

目前,BP神经网络是研究较为成熟的人工神经网络模型之一,它被广泛应用于信号处理和模式识别等学科的理论研究和实践应用中[16-17]。该研究采用BP算法进行了神经网络诊断模型的建立和仿真,成功建立了肝癌及肝炎疾病和血液指标之间的数学关系模型,可用于肝癌及肝炎疾病的辅助鉴别诊断。并发现纳入GP73、ATP、ATU、ALT、AST和WBC这6种特异性较好的指标时,建立模型的诊断准确率要高于纳入全部指标。BP神经网络是为数据分析工作者中常用的数据建模方法,但其过程由于所设置参数的不同、所收集样本数据的质量等原因存在一定主观性,因此,所建立的模型只是为疾病诊断结果提供参考,不能替代医务工作者的主观作用。在后期的研究中,随着样本量的增多和研究方法的优化,结果的精确度会得到进一步提高。

参考文献

[1]中华人民共和国卫生部.原发性肝癌诊疗规范(2011年版)[J].临床肝胆病杂志,2011,27(11):1141

[2]YANG JD,ROBERTS LR.Hepatocellular carcinoma:a global view[J].Nat Rev Gastroenterol Hepatol,2010,7(8):448

[3]EL-SERAG HB,DAVILA JA,PETERSEN NJ,et al.The continuing increase in the incidence of hepatocellular carcinoma in the United States: an update[J].Ann Intern Med,2003,139(10):817

[4]CHEN CF,LEE WC,YANG HI,et al.Changes in serum levels of HBV DNA and alanine aminotransferase determine risk for hepatocellular carcinoma[J].Gastroenterology,2011,141(4):1240

[5]薛如意.乙型肝炎病毒感染的肝细胞肝癌患者血液标志物筛选[D].上海:复旦大学,2009.

[6]张国友.关于抽样调查中样本容量的确定[J].安徽理工大学学报(社会科学版),2003,5(1):30

[7]曹飞龙,张永全,张卫国.单隐层神经网络与最佳多项式逼近[J].数学学报,2007,50(2):385

[8]郑绪枝,雷靖,夏薇.基于快速确定隐层神经元数的BP神经网络算法[J].计算机科学,2012,39(S1):432

[9]杨晓莉.高尔基体糖蛋白GP73在肝脏疾病中的意义及其生物学功能的研究[D].北京:中国人民解放军军事医学科学院,2014.

[10]CHEN JG,LU WZ,ZHU YR,et al.Retrospective observation of dynamic levels of serum Golgi protein 73 in patients prior to the onset of liver cancer[J].Zhonghua Yu Fang Yi Xue Za Zhi,2013,47(8):731

[11]XU WJ,GUO BL,HAN YG,et al.Diagnostic value of alpha-fetoprotein-L3 and Golgi protein 73 in hepatocellular carcinomas with low AFP levels[J].Tumour Biol,2014,35(12):12069

[12]HU JS,WU DW,LIANG S,et al.GP73, a resident Golgi glycoprotein, is sensibility and specificity for hepatocellular carcinoma of diagnosis in a hepatitis B-endemic Asian population[J].Med Oncol,2010,27(2):339

[13]GIANNINI EG,SAMMITO G,FARINATI F,et al.Determinants of alpha-fetoprotein levels in patients with hepatocellular carcinoma: implications for its clinical use[J].Cancer,2014,120(14):2150

[14]LIU YR,LIN BB,ZENG DW,et al.Alpha-fetoprotein level as a biomarker of liver fibrosis status: a cross-sectional study of 619 consecutive patients with chronic hepatitis B[J].BMC Gastroenterol,2014,14:145

[15]BAK-NAFALSKA K,PIOTROWSKA A,WJCICKI M,et al.Prognostic indices in liver cirrhosis and transplant assessment[J].Pol Merkur Lekarski,2010,28(167):410

[16]LIN WM,HONG CM.A new elman neural network-based control algorithm for adjustable-pitch variable-speed wind-energy conversion systems[J].IEEE Trans Power Electron,2011,26(2):473

[17]GEORGIEVA A,JORDANOV I.Intelligent visual recognition and classification of Cork tiles with neural networks[J].IEEE Trans Neural Netw,2009,20(4):675

中图分类号R735.7

#通信作者,男,1971年9月生,博士,副教授,研究方向:电气工程,E-mail:petermailsm@163.com

doi:10.13705/j.issn.1671-6825.2016.02.013

*国家自然科学基金青年基金资助项目813D3150;中国中医药行业科研专项基金资助项目201007001

猜你喜欢
肝炎特异性肝癌
CT联合CA199、CA50检测用于胰腺癌诊断的敏感性与特异性探讨
《世界肝炎日》
世界肝炎日
世界肝炎日
管家基因突变导致面部特异性出生缺陷的原因
隐源性肝癌与病毒性肝癌临床特征比较
LCMT1在肝癌中的表达和预后的意义
关注肝炎 认识肝炎
管家基因突变导致面部特异性出生缺陷的原因
前列腺特异性膜抗原为靶标的放射免疫治疗进展