潜在类别分析在缺血性中风病患者证候数据中的应用*

2013-09-07 09:02胡良平柳伟伟
中国卫生统计 2013年5期
关键词:中风病类别血瘀

王 琪 胡良平 高 颖 柳伟伟 马 斌 张 杨

潜在类别分析在缺血性中风病患者证候数据中的应用*

王 琪1,3胡良平1△高 颖2柳伟伟1马 斌2张 杨2

目的 探讨观测结果为证候数据时潜在类别分析在样品聚类中的应用,及不同首发证候缺血性中风病患者各证候随时间的变化规律。方法 采用潜在类别分析将1023例缺血性中风病住院患者按首发证候进行聚类,计算各组患者各时点各证候的频率,并绘制线图。结果 根据潜在类别分析模型的拟合统计量及似然比检验得出4个潜在类别的模型是首选模型,缺血性中风病住院患者可聚为4个亚组,“内湿+血瘀”组98人,“痰+血瘀”组485人,“血瘀”组266人,“多种证候”组160人。经潜在类别分析聚成的4组患者,各证候的发生率及随时间的变化趋势不尽相同。结论 潜在类别分析可用于观测结果为证候数据的样品聚类,聚类后各组各证候随时间的变化规律不同,对更深刻地揭示缺血性中风病的病机本质,更准确地指导临床中医药干预有实际意义。

中风病 证候 潜在类别分析 变化规律

*国家重点基础研究计划(973计划)课题(课题编号2003CB517102),国家重点科技专项“重大新药创制”(课题编号2009ZX09502-028)

1.军事医学科学院生物医学统计咨询中心(100850)

2.北京中医药大学东直门医院(100700)

3.军事医学科学院放射与辐射医学研究所

△通信作者:胡良平,E-mail:lphu812@sina.com

20世纪中期以后传染病得到了有效的控制,现代人类主要的死亡原因为心血管病、脑血管病、恶性肿瘤这3类非传染病。随着社会老龄化趋势日益加速,老年人口比重越来越大,故中风病作为现代社会的重大疾病,其防治和相关基础研究一直得到国家的重点支持〔1〕。缺血性中风由于患者自身病机不同,必然具有不同的证候特征和演变趋势〔2〕。中医领域中搜集的证候资料是分类或称定性资料,适合用潜在类别分析对样品进行聚类。

资料与方法

1.资料来源

病例取自2004年9月-2009年8月在北京中医药大学东直门医院、北京中医药大学东方医院、首都医科大学附属宣武医院、广州中医药大学第二附属医院、天津中医药大学第一附属医院、天津中医药大学第二附属医院住院的缺血性中风病患者。本研究在住院后第 0、7、14、28、90 天对患者内风、内火、内湿、痰、血瘀、阴虚和气虚等七种证候(均为二值变量)进行观测,其中,将第0天的证候定为首发证候。

2.潜在类别分析(LCA)

潜在类别分析模型主要用于社会学、生物医学和市场研究中,有探索性和验证性两种,其目的是以最少的潜在分类数据解释显在变量间的关联程度。传统的潜在类别分析可以估计潜类别概率和潜类别中外显变量的条件概率两类参数〔3〕。类别概率参数表示随机抽取的个体属于一个特定类的概率,相当于因子分析中的解释变异百分比;而条件概率反应个体某观察变量属于特定类别的可能性,相当于因子分析中的因子载荷。在没有先验知识的情况下一般采用探索性潜在类别分析。常用的探索性潜在类别分析方法有潜在类别聚类分析模型和潜在类别因子分析模型〔4〕。

结果变量为分类变量的潜在类别聚类分析模型,假定K个分类观察变量y和包含L类的分类潜变量x,其一般表达式为:

LCA的思想类似于因子分析。它假定分类潜变量对多个观测变量产生反应。LCA较经典聚类分析有一些优势。首先它非常灵活,可以处理分布类型复杂的分类变量;此外,它不需要确定每个观测变量的分布。

确定类别数目的最佳方法目前存在争议,有文献指出〔5〕,可以用 BIC联合似然比检验来确定模型。BIC用于比较模型,BIC值越小说明模型拟合越好。对数似然比检验用于比较k-1类模型和k类模型的差别是否具有统计学意义。分类数目的建立使用似然比检验,一般认为最少类别数的模型P<0.05。使用这个合并策略确定类别数目,之后我们基于最大后验概率将每个受试者进行分类。

因发病时首次出现的证候在临床上有重要意义,故根据患者的首发证候对患者进行聚类。

3.统计学处理

采用SAS9.2软件对数据进行分析。其中,PROC LCA是用作潜在类别分析的一个新的SAS过程,它是一个外挂模块,可以从http://methodology.psu.edu免费下载,安装后使用。

结果与分析

共收集1 023例缺血性中风病住院患者的证候资料,去除14例未观测首发证候的患者,共纳入1 009例患者进行分析。

表1 潜在类别分析模型的拟合统计量

对这1 009例缺血性中风病住院患者(结果变量为中医证候中的内风、内火、内湿、痰、气虚、血瘀和阴虚7个分类变量)进行探索性潜在类别分析。首先估计含有1个潜在类别的模型(基准模型),接着依次增加潜在类别数目至7,潜在类别分析模型的拟合统计量见表1,可以看出,当潜在类别数为4时BIC的值最小且P<0.05,表明4个潜在类别的模型是首选模型。

表2 潜在类别概率

表2为缺血性中风病住院患者的潜在类别概率,潜在类别概率值分别是0.086 5、0.441 8、0.293 3、0.178 3,总和为1。可以看出,比重排序:类别2>类别3>类别4>类别1。这里的概率值与因子分析中的因子贡献率类似,潜在类别的概率值越大表示在潜变量中的地位越重要,对显变量的影响越大〔6〕。因此认为模型中潜在类别2的作用最大,其次是潜在类别3,接着是潜在类别4,最后是潜在类别1。

表3 潜在类别条件概率

与因子分析中的因子载荷类似,条件概率表示各潜变量与显变量之间的关系,条件概率值越大说明潜变量对显变量的影响越大,可以协助研究者解释潜变量各类别的内容和性质。由表3可以看出证候取值=1时,潜在类别1中显变量内湿和血瘀发生的条件概率最大,分别为100.00%和87.44%,其它显变量的概率都很小,因此潜在类别1主要影响显变量内湿和血瘀,因此可以把该组定义为“内湿+血瘀”组;潜在类别2中显变量痰和血瘀发生的条件概率分别为94.78%和83.37%,其次为内风和内火,进而可定义为“痰+血瘀”组。在潜在类别3中的显变量血瘀发生的条件概率为100.00%,其次为气虚和阴虚,可定义为“血瘀”组。在潜在类别4中的显变量的条件概率大多接近0.5,可以定义为“多种证候”组。

基于最大后验概率将缺血性中风病患者进行分组的结果如下:

(1)潜在类别1:“内湿+血瘀”组(98人)

(2)潜在类别2:“痰+血瘀”组(485人)

(3)潜在类别3:“血瘀”组(266人)

(4)潜在类别4:“多种证候”组(160人)

根据第0天患者的后验概率将1009例缺血性中风病住院患者聚类后,再观测各时点各证候的发生频率,绘制线图。

图1 “内湿+血瘀”组患者各征候发生率

图2 “痰+血瘀”组患者各征候发生率

图3 “血瘀”组患者各征候发生率

图4 “多种征候”组患者各征候发生率

由图1~4可以看出,经潜在类别分析,将缺血性中风病住院患者按首发证候聚成4类,各类患者各证候的发生率及随时间的变化趋势是有所区别的。与其他组患者相比,“痰+血瘀”组患者内风下降幅度最大;“多种证候”组患者内火发生率一直居高;“内湿+血瘀”组患者内湿下降趋势明显;“痰+血瘀”组患者痰呈下降趋势,其他组别痰变化相对平稳;“多种证候”组患者血瘀呈上升趋势,其他组别缓慢下降;“内湿+血瘀”组患者气虚发生率整体较低;“多种证候”组和“血瘀”组患者阴虚变化趋势相近,其他两组相近。

基于首发证候,采用潜在类别分析对缺血性中风病患者进行聚类,解决了结果变量为证候数据的受试对象的聚类问题。

讨 论

证候是疾病某一发展阶段病因、病理、病位、病势的综合表现,中风病的证候研究作为中风病研究中的基础、核心,始终是中医药领域研究的热点、难点。证候研究中的关键问题是如何客观准确地把握中风病不同时点的证候特征,即证候的动态时空性。中风病自起病后,证候随着病情的变化在动态演变,这种动态演变的过程有其内在的规律性。

本研究结果显示中风病发病时主要是非单一证候的形式,并且也与认为痰湿和血瘀是中风病的基本病机的研究报道相符合。火性炎上,性质猛烈,易挟痰挟瘀上窜为患,是加重中风病病情的主要病理因素,“多种证候”组合患者证候演变趋势表现为内火发生率一直居高,血瘀也呈上升趋势,说明发病时即为多种证候组合形式的患者病情复杂,易变生他故,预后较证候组合形式少的患者可能要差,故应早期对此类患者干预,尤重点观察火热证的变化情况,辨证施治,以期改善其预后。

缺血性中风病患者根据首发证候分为4组,掌握以上各组各证候分布及其发展规律,可以更深刻地揭示疾病的病机本质,更准确地指导临床中医药干预,为我们基于缺血性中风病首发证候来制定临床治疗方案提供了有力的证据,更具有针对性,从而提高疗效。

1.马斌,高颖.中风病发病第7天和第14天证候要素演变规律初步研究.辽宁中医杂志,2006,33(12):1561 -1563.

2.王建华,王永炎.出血性中风、缺血性中风急性期证候演变规律的研究.中国中医急症,2001,10(4):215 -217.

3.张岩波主编.潜变量分析.北京:高等教育出版社,2009.

4.Magidson J,Vermunt JK.Latent class factor and cluster models,bi-plots,and related graphical analysis.Sociological Mehtodology,2001,31:223-264.

5.Ranak B,Brian J,Carolyn T,et al.Is there a nonadherent subtype of hypertensive patient?A latent class analysis approach.Patient Preference and Adherence,2010,4:255 -262.

6.郭小玲,裴磊磊,张岩波.潜在类别模型及数据模拟分析.数理医药学杂志,2009,22(6):631 - 635.

The Application of Latent Class Analysis for Syndrome Data of Ischemia Stroke Patients

Wang Qi,Hu Liangping,Gao Ying,et al.Consulting Centre of Biomedical Statistics,Academy of Military Medical Sciences(100850),Beijing

ObjectiveTo explore the application of latent class analysis in sample cluster of syndrome data response variables,and syndrome variation regularity of ischemia stroke patients with different first syndrome.MethodsUsing latent class analysis,we gave 1023 patients a classification according to first syndrome,and calculated the syndrome frequency of different days,then drawed line graph.ResultsFour-class model is preferred according to fit statistics and likelihood ratio tests,and the four sub-groups number of patients was 98,485,266,and 160 respectively.The syndrome variation regularity of four sub-groups is different.ConclusionLatent class analysis can resolve the sample classification of syndrome data response variables.The difference in syndrome variation regularity of sub-groups is more helpful to unveil the mechanism essence of ischemia stroke,and guide clinical intervention.

Ischemia stroke;Syndrome;Latent class analysis;Variation regularity

(责任编辑:丁海龙)

猜你喜欢
中风病类别血瘀
话说血瘀证
一起去图书馆吧
缺血性中风病复发危险因素中西医的研究进展
脉血康胶囊联合雌孕激素治疗血瘀型原因不明的月经过少
朝医凉膈散火汤治疗少阳人中风病的临床研究
多类别复合资源的空间匹配
基于混沌和替代数据法的中风病人声音分析
补肾活血祛瘀方治疗中风病恢复期100例
中西医结合治疗气虚血瘀型冠心病慢性心衰46例
中风防治灵Ⅰ号治疗气虚血瘀型脑梗死66例