基于粗糙集的药品不良反应风险评价指标体系研究

2021-06-24 02:19王培培叶明全童九翠

山西大同大学学报(自然科学版) 2021年3期

王培培，叶明全，童九翠

（1.皖南医学院医学信息学院，安徽芜湖 241002；2.皖南医学院健康大数据挖掘与应用研究中心，安徽芜湖 241002；3.皖南医学院弋矶山医院临床药学部，安徽芜湖 241001）

近年来，针对药品不良反应（Adverse Drug Reaction，ADR）和精神障碍药品不良反应的研究备受关注[1-6]。ADR 现象的产生是多种相关因素综合作用的结果[1-4]，其产生是一个复杂、不确定且庞大的系统，需要研究人员通过数据挖掘方法对用药处方、用药人群、用药疾病等相关因素进行评价、筛选，确定ADR 风险影响因素的评价指标及其客观权重，构建ADR 风险指标评价体系，从而为联合用药或特定人群中出现的ADR 现象提供更多、更合理的解释[3-10]。韦梦玲等[7]通过专家评分结合熵权法氟喹诺酮类ADR 信号进行调整和评级，但熵权法易忽略指标本身的重要度，且专家评分存在主观倾向性；林哲人等[8]采用风险矩阵法对某院中药注射剂ADR 风险水平进行评价，筛选出高风险等级药品并提出预警方案，但风险矩阵法容易产生风险结问题；徐瑾等[9]利用主成分分析法研究头孢呋辛ADR 风险信号的强弱，但其指标缺少可解释性。目前，国内研究大多停留在ADR 定性分析上，样本量较小且对ADR 风险因素缺乏量化评估，没有建立真正有效的ADR 风险评估模型，具体到每个风险因素所占的权重仍不明确，且缺乏针对精神障碍患者ADR 的风险评价研究[10]。粗糙集作为一种有效分析和处理不确定信息的软计算方法，已被一些研究者应用于计算机安全漏洞评价[11]、毕业生就业质量评价[12]、MRI 设备扫描序列评价[13]、雷达抗干扰性能评价[14]、水利工程投资风险评价[15]、互联网金融风险评价[16]等指标筛选和赋权，避免主观选择强关联指标集和依赖专家先验知识，在指标约简和指标权重的计算上取得较好效果，从而为构建ADR风险指标体系提供了新思路。

针对精神障碍ADR 风险评价指标信息不完整和指标权重不确定等特点，采用粗糙集理论确定精神障碍ADR 风险评价指标体系，然后利用粗糙集中属性重要度原理及其拓展方法，定量分析ADR 风险与评价指标之间的依赖度，确定精神障碍ADR 风险评价指标的客观权重，从而构建精神障碍用药ADR 风险评价指标体系，为今后合理用药提供参考依据。

1 粗糙集理论

粗糙集理论是由Pawlak 提出的一种数学工具，在分析处理信息系统或决策信息系统中不确定、不一致信息等方面具有一定优势[17]。粗糙集理论应用到指标体系综合评价中，能够通过自身特有的属性依赖度和重要度等特征，客观、有效地筛选指标和确定权重大小[11-16]。

决策信息系统是一个二维信息表（决策表），包含对象集和属性集两部分。其中，属性集是研究对象的特征集合，可分为条件属性集和决策属性集。

在一个决策信息系统中，不同属性（知识）其作用不同，有些属性甚至是冗余的。根据属性依赖度和重要度，可以客观地获取指标体系中各个指标对决策或分类的贡献大小。

通过归一化处理每个条件属性集的重要度，则可获取每个条件属性集的权重。

2 基于粗糙集理论的ADR风险评价流程

本文运用粗糙集理论[11-17]进行ADR风险评价，具体流程包括构建ADR 评价决策表、离散化处理评价指标、简化风险评价指标、计算评价指标重要度和计算评价指标权重，如图1所示。

图1 基于粗糙集理论的ADR风险评估流程

2.1 构建ADR评价决策表

ADR 风险评价指标体系和评价对象可以表示为决策表的形式，其风险评价过程可以看作评价指标体系和评价结果所构成决策表的综合决策过程，挖掘决策表条件属性（评价指标）和决策属性（评价结果）之间的关系。根据ADR 监测报告原始数据，收集ADR 风险评价对象的所有指标和评价结果，确定条件属性集和决策属性（集），构建ADR 风险评价决策表，其中：U 为收集到的ADR 样本集；C为本次ADR风险评价指标优化过程中涉及到的ADR风险评价因素，D为ADR名称。

2.2 离散化处理评价指标

通常，评价指标体系中包含连续型指标和离散型指标。Pawlak 提出的粗糙集不能直接处理连续型指标。因此，利用Pawlak 粗糙集方法简化评价指标之前，必须先离散化处理连续型指标。ADR 风险评价指标离散化处理，本质上是在保持原始指标体系的分类能力（即不改变评价结果）的基础上，利用断点将评价指标所构成的n 维空间划分成若干个离散区域[11-16]。

2.3 简化风险评价指标

ADR 原始风险评价指标体系中通常存在大量无关和冗余的指标，运用粗糙集属性约简方法[11-16]，能在不改变原始指标体系的分类能力（即保持评价结果）的前提下，删除其中不相关或冗余的指标，构建约简后的ADR 风险评价指标体系。也就是，在保持ADR 风险评价结果不改变的基础上，找到一个指标个数最少的简化风险评价指标体系来取代原始风险评价指标体系。

2.4 计算评价指标重要度

根据约简后的ADR 风险评价指标体系，利用定义6计算依赖度KC(D)以及删除任一指标p后的依赖度KC-{p}(D)；然后根据定义7 确定所有指标p 的重要度sig{p}(D)。

2.5 计算评价指标权重

根据定义8，对所有ADR 风险评价指标p 的重要度sig{p}(D)进行归一化处理，从而确定各个ADR 风险评价指标p 的权重sW({ p})。根据粗糙集属性依赖度和重要度定义，可以确定相应指标的权重，反映不同指标在粗糙集决策支持中所起作用的大小[10-12]，揭示ADR 风险评价指标对评价结果的贡献度大小的不同。由于粗糙集方法能够避免指标权重计算过程中人为因素的干扰，从而保证了评价结果的客观性和可信性。

3 实验结果及分析

本实验所采用的ADR 数据来源于某医院2012年1 月～2019 年6 月精神障碍患者用药后发生ADR监测报告数据。实验数据共包含2453 份ADR 报告，涉及到14种药品和15种ADR 表现，每份报告包括患者基本情况、用药情况、药品不良反应情况、报告单位/人名称等信息共58 个指标。根据ADR 风险评价指标体系研究需要，本实验去除无效变量（即与ADR发生无关的变量），保留患者性别（A1）、患者年龄（A2）、患者体重（A3）、原患疾病（A4）、怀疑/并用药品（B1）、药品名称（B2）和服药时长（B3）等7 个变量（即影响因素）作为风险评价指标，即作为条件属性C，而ADR名称作为1个决策属性D。

通过填补数据空缺值，以及离散化处理患者年龄（A2）、患者体重（A3）和服药时长（B3）等变量，完成数据预处理后，对数据进行编码。各个变量的数据编码结果如表1所示。

表1 精神障碍ADR数据中各个变量的编码结果

根据表1，精神障碍ADR风险评价指标体系分别从用药人群（A）和临床用药（B）两个一级指标设定7个二级指标。通过粗糙集方法计算ADR 风险评价一级指标和二级指标重要度和权重，结果如表2所示。

由表2 可知，风险因素对精神障碍患者ADR 风险的影响程度从大到小的排序依次是：药品名称（B2）、患者年龄（A2）、服药时长（B3）、患者体重（A3）、原患疾病（A4）、患者性别（A1）、怀疑/并用药品（B1）。由此可知，在二级指标中药品名称（B2）、患者年龄（A2）、服药时长（B3）和患者体重（A3）相对于其它指标来说尤为重要，由此增加药品不良反应发生的概率。

表2 ADR风险评价一级和二级指标重要度和权重

通过表2 结合表1 可知，精神障碍患者服用药品种类是引起ADR 风险的最重要指标。由于精神障碍疾病的特殊性，以及发病机制的复杂性，导致精神障碍临床药物不断更替迭代，其产生的ADR 广泛多样、难以预测，这与相关研究吻合[4-6]。这提示精神障碍临床用药时，应该及时收集分析ADR 报告，以便评判该类药物引起的ADR，实施安全有效的个性化用药方案。同时，密切观察患者临床用药情况以及患者已有一般ADR，预防发生严重ADR。

另外，患者年龄、服药时长和患者体重等指标也是引起精神障碍ADR 风险的重要影响因素。这与近年来精神障碍ADR 高发人群集中于青壮年，发病总体趋势呈现出偏瘦型、低龄化以及长期服药特点相吻合[4-6]。提示精神障碍临床用药时，应该重视ADR高发用药人群与长期服药的监测工作，注意患者年龄、患者体重与ADR 之间的关系，对长期服药患者应该进行定期复查，对已经产生ADR 的患者则应及时调整用药方案。

4 结语

通过粗糙集理论中属性依赖度和重要度计算方法，针对目前ADR 风险评价指标体系存在的主观确定问题，构建了一种基于粗糙集理论的精神障碍ADR风险评价指标体系。本文实验对2453份精神障碍ADR报告进行了预处理，从用药人群（A）和临床用药（B）两个方面进行研究和分析，确立了7 个二级指标组成的精神障碍ADR 风险指标体系及各个ADR风险评价指标的权重，能够有效地避免主观确定指标权重的问题，客观地反映出各个风险因素对ADR监测的影响程度，可为用药安全提供临床风险决策依据。