基于双清合剂人用经验数据的儿童中成药用药剂量模型构建

2023-10-17 03:46栾奕博张依郭圣璇李璇胡思源
中国中医药信息杂志 2023年10期
关键词:双清合剂中成药

栾奕博,张依,郭圣璇,李璇,胡思源

天津中医药大学第一附属医院,国家中医针灸临床医学研究中心,天津 300381

目前,我国儿童用药存在品种少、剂型少、规格少和标识少的问题,中成药作为儿童用药的重要组成部分,在缓解儿童用药需求、保障儿童生命健康方面有重要价值和良好前景。然而中成药在儿童人群的合理应用面临问题和挑战,主要为用法用量信息不完善,难以规范地指导临床应用,超说明书用药现象普遍存在,如儿童专用中成药的低年龄段用法用量缺失、成人儿童共用中成药大多仅标注“儿童酌减”或“儿童在医师指导下服用”、成人中成药应用于儿童等。因此,完善用于儿童的中成药用法用量信息十分必要。

随着中医药理论、人用经验和临床试验相结合的中药注册审评证据体系的构建与优化,以及《“十四五”中医药发展规划》[1]、《基于人用经验的中药复方制剂新药临床研发指导原则(试行)》[2]、《中药注册管理专门规定》[3]等的发布,人用经验证据在中药注册审评中的应用日益受到高度重视。真实世界研究(RWS)是形成人用经验证据的重要方法,利用RWS整理和分析基于医院信息系统(HIS)的人用经验数据,可总结中成药的适应证、适用人群、疗程、用药剂量等基本要素,以提供人用经验证据,支持儿童中药新药注册和说明书变更等情形的探索性临床研究[4]。

双清合剂是治疗风温肺热、卫气同病型急性支气管炎的中成药,属成人用药品种,缺乏儿童用法用量信息,但在儿科临床应用多年,人用经验丰富,具有大样本量、可靠真实和结构完整的来源于HIS的人用经验数据[5]。本研究以双清合剂的HIS数据为切入点,通过机器学习方法,整理和分析其人用经验数据,构建探索年龄段成人-儿童用药剂量折算模型和儿童中成药用药剂量多分类预测模型,获得符合临床实践的儿童人群用法用量,以期优化双清合剂的临床用药方案,为变更儿童人群的注册申请或说明书的完善提供人用经验证据支持。

1 资料与方法

1.1 研究设计

本研究为回顾性数据库研究,数据来源于天津中医药大学第一附属医院HIS数据库,提取2012年9月—2021年10月至少使用过1次双清合剂的患儿的诊疗信息。

1.2 研究对象

1.2.1 纳入标准

①年龄1~14岁;②就诊方式为儿科门诊/急诊。

1.2.2 排除标准

①处方存在明显逻辑错误;②合并使用中药汤剂;③无法对疾病诊断进行规范化的患儿。

1.3 观察指标

①基本信息:年龄、性别、就诊方式;②诊断信息:西医诊断、中医诊断;③用药信息:研究用药(包括疗程、剂量)、合并用药(包括名称、类别)。

1.4 数据处理

1.4.1 数据提取与清洗

以Excel2021建立数据库,采用Python3.8.12软件进行数据处理。

数据提取:根据纳入和排除标准,剔除不符合标准的患儿数据。

数据清洗:包括重复数据、逻辑错误和缺失数据的清洗等。在保证数据完整的前提下,去除重复数据及不相关数据;进行逻辑检查,去除逻辑错误的数据,包括出生年月与按年龄推算不符、单日用药剂量为100 mL、给药途径为皮试等;对缺失数据进行处理,根据完整的数据分析进行必要填补。

1.4.2 数据规范

规范诊断信息和处方信息。西医诊断信息参照《国际疾病分类(第11次修订本)》[6]和《儿科学(第8版)》[7]进行规范化,中医诊断信息参照《中医病证分类与代码(修订版)》[8]进行规范;西药采用《药物的解剖学、治疗学及化学分类系统》[9]分类合并;中成药以药物成分为准,将成分相同、剂型不同者合并,参照药品说明书对其名称进行规范。

1.5 统计学方法

采用R语言4.2.0对数据进行统计分析,主要采用描述性统计和建模分析的方法。

用药特征的描述性统计:组合运用dplyr及ggplot2函数库,分别对年龄、性别、就诊方式、西医诊断、中医诊断、研究用药疗程和剂量、合并用药名称和类别进行描述性统计。定量数据描述例数、均数、标准差;定性数据描述频数、百分率或构成比。

用药剂量建模分析:①采用一维优化K-means算法[10]构建探索年龄段成人-儿童用药剂量折算模型。设置排名前5位西医诊断为筛选条件,各诊断对应的诊疗数据为数据子集,患儿年龄为特征变量(自变量),双清合剂儿童用药剂量较成人用药剂量的折算百分比为目标变量(因变量)。将K-means模型的聚类数量的初始范围设定为3~5,以Calinski-Harabaz指数[11]为评估指标,针对不同诊断的数据子集,采用迭代检验的优化策略。②基于患儿用药特征的描述性统计结果,采用XGBoost算法[12]构建儿童中成药用药剂量多分类预测模型。设置年龄、性别、就诊方式、西医诊断、中医诊断、研究用药疗程、合并用药数量、合并用药名称等为特征变量(自变量),目标变量被整合为[0,10)、[10,20)、[20,30)、[30,40)、[40,50)、[50,60)、[60,70)、[70,80)和[80,90]的区间进行多极分类预测。随机抽取样本中80%数据训练模型,20%数据验证模型,经过多次随机交叉检验,根据计算预测结果的混淆矩阵检验模型准确度,对各年龄段患儿最佳用药剂量区间进行预测。

2 结果

2.1 基本信息

本研究共收集用药记录51 958条,按纳入标准、排除标准筛选和处理数据后,纳入用药记录31 303条。男性16 861例(53.86%),女性14 442例(46.14%)。急诊17 882例(57.13%),门诊13 421例(42.87%)。年龄1~14岁,平均(5.44±3.14)岁,各年龄段均有分布,以学龄前期患儿最多,共11 181例(35.72%)。

2.2 诊断信息

31 303例患儿信息中包含诊断信息44 146条。西医诊断主要涉及呼吸系统,除说明书中明确的急性支气管炎外,还涉及急性上呼吸道感染、急性扁桃体炎、急性喉炎、肺炎等上呼吸道感染和下呼吸道感染。急性上呼吸道感染有广义和狭义之分,广义指外鼻孔至环状软骨下缘包括鼻腔、咽或喉部急性炎症的总称,临床表现主要类型为普通感冒、急性病毒性咽-扁桃体炎,还可包括疱疹性咽峡炎、咽结合膜热、急性细菌性咽扁桃体炎、急性喉炎等;狭义指普通感冒这一临床表现。通过分析原始数据特点,本研究所指急性上呼吸道感染属狭义范畴。结果显示,患儿以急性上呼吸道感染最多见,共17 733例(40.17%),其次为急性支气管炎(8 330例,18.87%)和急性扁桃体炎(2 044例,4.63%)。中医诊断主要涉及肺系和脾胃系疾病,集中在感冒(6 275例,14.21%)和咳嗽(5 188例,11.75%),也可见于肺炎喘嗽、乳蛾和积滞等。见表1。

表1 使用双清合剂患儿主要中西医诊断(前5位)

2.3 用法用量

2.3.1 用药疗程

用药疗程平均为(3.06±1.16)d,排名前5位西医诊断的疗程分别为急性上呼吸道感染(3.01±1.17)d、急性支气管炎(3.09±1.01)d、急性扁桃体炎(3.04±0.95)d、肺炎(3.0±1.11)d和急性喉炎(3.38±0.96)d。

2.3.2 用药剂量

单日用药平均剂量为(40.61±12.15)mL,急性扁桃体炎的用药剂量最多,为(45.56±12.9)mL,急性喉炎的用药剂量最少,为(39.67±10.77)mL。

无儿童用量的儿童中成药用药剂量,一般采用基于国内通用年龄分期、分年龄段、按成人用药剂量的折算方法,固定年龄段折算比例为幼儿期用1/2成人量、学龄前期用2/3成人量和学龄期用成人量[13]。本研究中,排名前5位西医诊断的固定年龄段成人-儿童用药剂量折算比例的趋势一致,均在幼儿期用1/2~3/5成人量、学龄前期用2/3~3/4成人量和学龄期用4/5~1成人量,幼儿期高于用1/2成人量、学龄前期用2/3成人量、学龄期用成人量的范围内。不同诊断的各年龄段内折算比例存在差异,考虑与适应证的病情严重程度有关。相同诊断的单独用药和合并用药的各年龄段内折算比例差异较小。见表2。

表2 西医诊断排名前5位的固定年龄段成人-儿童用药折算比例(%)

2.4 合并用药

22 272例患儿采用合并用药,包含合并用药信息36 031条。共使用60种西药和43种中成药。合并用药使用频率前10位的药物和药物作用类型见表3、表4。可见,西药最常与抗生素类药物合用,使用频率最高为阿奇霉素(8.05%);中成药最常与解表清热剂合用,使用频率最高为小儿豉翘清热颗粒(12.10%)。

表3 使用双清合剂患儿合并用药情况(前10位)

表4 使用双清合剂患儿合并用药药物类型(前10位)

2.5 用药剂量模型

2.5.1 探索年龄段成人-儿童用药剂量折算模型

固定年龄段成人-儿童用药剂量折算比例大多为相对较大的区间。本研究在双清合剂的儿童用药剂量中寻找规律,结合不同适应证特点,采用一维优化K-means算法构建探索年龄段儿成人-儿童用药剂量折算模型,以Calinski-Harabaz指数为评估指标,针对不同诊断的数据子集,分别通过20次迭代检验确定模型的最优聚类数量与对应结果,合理划分为3个或4个年龄段,并分别计算出用药剂量折算比例。见图1、图2。

图1 不区分用药的探索年龄段成人-儿童用药剂量折算比例

图2 单独使用双清合剂的探索年龄段成人-儿童用药剂量折算比例

2.5.2 儿童中成药用药剂量多分类预测模型

为探索不同年龄段划分规则下的各年龄段最佳用药剂量阈值,基于双清合剂在儿童临床应用的基本信息、诊断信息和用药信息,采用XGBoost算法构建用于预测儿童用药最佳剂量区间的多分类模型,经过10次随机交叉检验,完成对模型准确度的验证,结果发现,当n_estimators=100,max depth=10,gamma=0,colsample_bytree=1,min_child_weight=1,subsample=1时模型表现最佳,准确度为84.1%,见图3。通过特征变量在模型中的重要性得分,发现对模型准确度影响最大的是患儿年龄,对模型准确度影响最小的为是否合并中成药。各特征变量对模型影响程度的评分和排序见图4。

图3 模型准确度评估

图4 特征变量对模型准确度的重要性评分

本研究建立黑箱式应用系统,系统后端为建模结果,前端为用户界面,临床医生或研究者可在用户界面输入数据,并得到预测用量区间。同时,所得的预测用量区间与临床医生或研究者输入的数据绑定,传递给儿童中成药用药剂量多分类预测模型,扩展模型的训练数据。系统界面示意图见本文OSID码。

3 讨论

本文采用回顾性数据库研究方法,整理并分析双清合剂在儿童人群的人用经验数据,构建探索年龄段成人-儿童用药剂量折算模型和儿童中成药用药剂量多分类预测模型,探索本品种适应证、适用人群范围和儿童用药剂量,以优化临床用药方案并支持后续临床研究的开展。

研究结果显示,患儿各年龄段均有分布,以学龄前期最为多见,提示若需增加儿童适用人群时,建议优先考虑3~7岁患儿。诊断信息方面,急性支气管炎和咳嗽属说明书适应证,临床还常见于急性上呼吸道感染(感冒)、急性扁桃体炎(乳蛾)、肺炎(肺炎喘嗽)和急性喉炎等,提示若需增加功能主治时,可考虑上述适应证。

用药剂量是儿童中成药合理应用于临床的关键要素,如何确定用药剂量是儿童药品上市前和上市后密切关注的内容之一,儿童中成药一般采用分年龄段给药的方式,儿童用药剂量可以按成人剂量折算,即按照一定比例直接折算到儿童,折算比例多为相对较大区间。目前,大多采用基于国内通用年龄分期的固定年龄段成人-儿童用药折算比例,本研究中,幼儿期用药剂量为通用折算比例,学龄前期和学龄期用药剂量低于通用折算比例。但通用的年龄段划分区间较大,可考虑根据具体品种特性、适应证特点和临床经验,合理划分1个或多个年龄段并分别计算使用剂量[14]。因此,根据双清合剂的数据特点,通过基于一维优化K-means算法的建模分析的方法,合理划分年龄段,并分别计算出各年龄段的用药剂量折算比例。

另外,合并用药亦是影响用药剂量的因素之一。本研究发现,合并其他药物治疗时,双清合剂的用药剂量更低;合并用药数量、合并用药种类可能对研究药物的用药剂量产生影响。

因此,本研究设置年龄、性别、就诊方式、西医诊断、中医诊断、研究用药疗程、合并用药数量、合并用药名称等特征变量,输出用药剂量区间为目标变量,构建基于XGBoost算法的儿童中成药用药剂量多分类预测模型,探索不同年龄段划分规则下的各年龄段最佳用药剂量阈值,即模型输出的用药区间由2个数值界定的范围构成,最小剂量和最大剂量均为药物有效剂量,临床医生处方时和临床研究设计可在区间内选择合适剂量。

本研究尚存在局限性:①为单中心研究,数据来源缺乏广泛性,今后将开展多中心、更深层次的研究。②提取的数据缺乏处方医生的职称信息,可能对处方准确性产生影响。③本研究方案中包含对中医证候诊断信息的提取,但经过筛选和数据处理后,中医证候诊断信息的数据样本量较小,因此未纳入分析。④仅以成人中成药双清合剂为示范品种,探索为扩大到儿童适用人群提供证据支持的方法,今后还需要应用在更多的同类型品种,以及推广到其他类型儿科中成药开发,如院内制剂,儿童中成药或成人儿童共用中成药增加新的儿童适用人群、增加功能主治等用法用量的选择与确定,提供方法学借鉴。

4 结论

本研究揭示了双清合剂在儿科真实医疗环境的用药特征,其适用人群以3~7岁为主,适应证常见于急性上呼吸道感染(感冒)、急性支气管炎(咳嗽)、急性扁桃体炎(乳蛾)、肺炎(肺炎喘嗽)和急性喉炎等。本研究构建了基于机器学习算法的模型,规范儿童分年龄段用药剂量折算比例和各年龄段最佳用药剂量阈值,可为双清合剂在儿童临床应用提供用药方案参考,并为本品种变更儿童人群的注册申请或说明书的完善提供人用经验证据支持。

猜你喜欢
双清合剂中成药
赓续将军革命精神 谱写双清时代新章
老年人便秘,中成药如何选择
骨质疏松怎样选择中成药
石硫合剂熬制与保存
毛泽东与北京香山双清别墅
骨质疏松怎样选择中成药
HPLC法同时测定退银合剂中6种成分
HPLC法同时测定二陈合剂中8种成分
追忆双清别墅红色印记
小儿双清颗粒治疗急性呼吸道感染38例