基于真实世界的中医临床科研大数据平台研发现状、不足及展望❋

2023-01-23 06:35杨亦含胡元会贾秋蕾袁果真段城林杜宜航
中国中医基础医学杂志 2022年11期
关键词:真实世界循证中医药

杨亦含,胡元会,陈 婷,贾秋蕾,袁果真,段城林,杜宜航

(1.中国中医科学院广安门医院,北京 100053; 2.北京中医药大学,北京 100029)

随机对照试验(randomized controlled trial, RCT)为临床实践指南的制定提供了基础,但RCT的纳排标准严苛,无法全面评估药物或干预措施在真实临床环境下带给患者的影响。为补充其不足,效果试验的概念被提出和应用。其中,开展真实世界研究(real-world study, RWS)以获取更符合临床实际的证据被提出和广泛认可。2010年,RWS概念被引入中国[1]。RWS更符合中医的“整体观念”“辨证论治”“因人制宜”的特点,可以更好地评价中医药治疗的安全性和有效性。

真实世界中医临床科研范式的核心是临床科研一体化[2]。但是真实世界数据庞大,内容繁杂,为促进真实世界研究,更好地利用真实世界数据,将中医药真实世界信息数字化是十分必要的。之前的中医科研信息化平台多围绕着中医药标准化[3]、文献知识库查询[4]及科研共享平台[5]建立,缺少信息化、数字化的针对临床研究的大数据平台。为补充这一不足,许多研究者投身于中医临床科研大数据平台的研究,并有了一定的成果。

1 临床科研平台研发现状

1.1 创建临床科研一体化技术平台

中国中医科学院刘保延等引入系统生物学湿干研究模式[6],提出“从临床中来到临床中去”的中医临床科研模式,建立了临床与科研一体化的技术平台。该平台由中国中医科学院牵头创建,注重对临床数据的转换、储存和挖掘,侧重于中医临床科研。

该平台的建设分为应用层和基础层[7]。平台由“医疗业务平台”“数据管理平台”与“临床研究平台”三部分组成。“医疗业务平台”以全结构化的电子病历作为应用,其基础是数字化中医临床术语应用系统。该系统用以规范临床语义,提高数据质量。“数据管理平台”主要应用数据仓库技术(data warehouse,DW),以进行大量的临床数据储存。“临床研究平台”以中医临床数据预处理系统(extract transform load,ETL)和中医临床数据模型与数据仓库为基础层,支持临床数据整理分析与展示平台(online analytical processing,OLAP)和数据统计分析与平台数据挖掘(Data Mining)两种数据挖掘方式[8]。

该平台建立后应用于全国多地。目前已成功建设了中西医结合中风、冠心病、糖尿病、传染病等数个结构化电子病历平台[9]~[13],在儿童肺炎、多囊卵巢综合征、肾病、颈椎病[14-17]等疾病的研究中亦有应用。在针灸治疗上,贾文等[18]也进行了探索。利用该科研平台,大量的专病组方用药挖掘、临床名老中医经验挖掘和古籍文献数据挖掘研究得到了发表。该平台可以很好地进行名老中医经验传承、重大疾病的诊疗分析,实质性地提高中医临床研究水平和临床研究能力,更好的指导临床诊疗。

1.2 广东省中医院研发临床科研一体化平台[19]

广东省中医院自2009年起建设的临床科研一体化平台,偏重在临床工作正常运行的前提下进行开发。该临床科研一体化平台以电子病历为核心,在医院已成熟的检验系统(laborary information system,LIS)、影像系统(picture archiving and communication systems,PACS)、信息系统(hospital information system,HIS)等基础上进行开发建设。该平台的核心系统有三个,分别是科研整合共享仓库、临床业务集成平台和企业资源管理。

以广东省中医院为代表、由医院作为核心进行平台开发和建设的临床科研一体化平台,强调平台除了要满足医院的科研工作外,更需支持医院的日常临床诊疗工作和行政管理工作。在平台建设的调度上,强调主要院领导要对平台建设和医院各部门的组织协调重视和亲自参与。

1.3 现阶段关于中医临床大数据平台建设的研究

随着科技发展及临床诊疗及研究的需求不断增加,已有大量的科研工作者投身于中医药临床大数据平台建设的研究中。王苹等[20]提出应用基于Hadoop进行平台基础架构,从技术层面上保障平台的稳定运行。吴燎等[21]从平台构建和功能应用上进行了讨论,尤其是从中医药数据的独特性、中医药数据获取方式及数据的质量评估上进行了探讨,从而保证数据来源与质量,方便进一步的临床及科研研究。王甜宇等[22]也提出基于区块链的中医药大数据云存储共享模型,该模型可解决数据存储与共享时的安全和流通问题,可为大数据平台建设和运行提供有力的技术保障。在平台的具体应用上,已有关于糖尿病病证结合、电子病历服务和医联体大数据管理等需求的平台设计和研究的报道[23-25]。

2 现有平台及平台设计的不足

2.1 不足以支持前瞻性临床研究

以上科研平台只能对已有的临床信息进行回顾性或横断面研究,难以进行前瞻性的循证医学研究,难以达到对疾病进行监测预警、辅助临床决策和评价中医药治疗疗效的目的。虽然国内外已有一定数量基于真实世界的前瞻性临床研究的文献报道,也有针对真实世界循证医学研究标准制定的探讨[26],但是现在还未出现针对前瞻性研究的临床科研平台建设构想的探讨或报道。

2.2 研究疾病数量、纳入病例数量有限

目前建成的中医专病数据库数量依旧有限。基于现有的科研临床一体化平台,已有一定数量的中医疾病库建成并能在一定程度上实际指导临床应用,但是还有相当数量的疾病未能建成专病疾病库。基于现有文献我们发现,还缺少中医皮科、中医外科等专病数据库建设的探讨或实践的报道。

在全国各地中医药研究人员的努力下,已有大量的中医药专病数据库建成,且大部分数据库都是基于上百上千份的临床数据完成的。谢雁鸣等[27]也根据大数据特点,对真实世界中使用醒脑静注射液53075位患者的临床用药特征进行分析。而随着大数据时代的来临,临床研究将不再满足于上百上千上万份的数据,而可能一下子扩为几十万上千万级别的数据资料。不仅如此,不同省份、不同医院、不同医生临床用语习惯不同,都会给临床数据的提取和应用造成困难。

2.3 临床信息采集不全面

以上平台虽可以调取医院的临床数据,但临床数据来源丰富,部分病人纸质化信息或媒体信息(如舌诊、脉诊、闻诊信息)不能录入平台并进行相应的分析。同时也缺失了患者在社区、医院外的重要疾病信息的收集。

因为临床数据来源广,临床医生工作任务重,导致部分临床信息不能自动化、信息化、结构化的录入临床科研一体化平台中。为了解决该问题,已有基于ios系统的多媒体医案采集移动平台的建成[28]。但是该系统只能应用于ios系统,在其他系统中的应用还需进一步开发。另外该系统所录入的临床医疗信息有限,信息不能直接进行数据分析,这都需要进一步的研发。

2.4 对临床病人的结局预测功能有待进一步研发

目前的平台研究结果已经对临床医生在疾病的认识、诊断、用药和愈后有了一定的指导。许玲[29]也探讨了如何应用科研平台对肿瘤病人进行健康管理。但研究成果尤其是对病人的临床结局预测,还不能完全再返回临床、应用于临床、具体指导医生临床日常工作,最终完成“临床-科研-临床”的临床研究模式的建设。

3 对中医临床科研大数据平台建设的展望

3.1 平台可支持中医前瞻性临床研究,建设可支持基于真实世界的单病例随机对照科研平台

搭建可支持前瞻性研究和辅助进行临床决策的中医大数据平台是十分必要的。平台设计不仅要符合循证医学实验设计要求与规范,还要利用科学技术手段减少重复性工作,更要符合中医药临床研究特点。基于此,我们构想了一个人工智能为技术支持、真实世界为数据管理方式、单病例随机对照试验为临床研究方法的中医大数据平台。

机器学习等人工智能技术的发展和成熟为建设大数据平台提供了技术保障。目前,自然语言处理、机器学习等人工智能分析海量临床数据[30]~[31]已逐步应用至临床研究中来。在数据挖掘上,随着技术的发展,更多模型、算法也被应用于医学临床数据挖掘。如戴国华等[32]借助HanLP分词系统、隐马尔可夫模型(hidden markov model,HMM)分词算法和python医案信息提取提高数据库的构建效率和数据挖掘质量。

真实世界数据管理方式,即平台抽取数据都直接来自于真实世界,来自于日常所收集的各种与患者健康状况和(或)诊疗及保健有关的数据,常见的来源包括HIS、医保系统、疾病登记系统、自然人群队列等[33,34],这不仅会大大减少研究人员整理实验资料的工作量,也可以保障实验研究的真实性。

在平台的临床研究方法上,单病例随机对照试验既满足大数据平台功能需求,又符合中医药真实世界循证医学研究特点。单病例随机对照试验是针对单个患者开展的试验。从真实世界中,每个单病例随机对照试验一般由2个用药期组成一个治疗轮次,一般需进行3个及3个以上治疗轮次。用药期内患者随机接受试验药或对照药的治疗,每2个用药期间需间隔1个洗脱期用于消除一个治疗期的延迟效应。单病例随机对照试验是一种前瞻性、循证医学研究,更关注在真实环境下干预患者的疗效结果短时间内从多种治疗中选出最有效者,符合RWS的需求。患者从试验中可直接获益,易被患者接受且失访率低。2011年,牛津循证医学中心(the Oxford Centre for Evidence-Based Medicine)将单病例随机对照试验列为评估临床治疗效果的“一级”证据[35],这种研究方法也符合中医诊疗中强调的辨证论治、因人制宜的特点。虽然,现在国内外已有研究者进行了相应的研究,但单病例随机对照试验的相关文献报道数量较少、质量良莠不齐,无法满足进一步医学研究的需求。单病例随机对照试验操作本身也有困难,其过程复杂易出现多基线和易混淆的数据[36],造成试验结果偏倚、实验结论不客观。这就需要一个大数据平台对实验整体流程进行统一的规范化操作和管理,提高实验的严谨性和客观性,增强实验的可操作性,以便更好地评价中医药治疗疗效。

除了可以对前瞻性研究进行设计和管理外,平台也可以参考或结合已有的科研共享平台的功能,如辅助伦理审查、临床试验注册登记和完善基础实验技术支持等。此外,中医药循证研究证据库系统(evidence database system,EVDS)[37]的研发也为我们提供了一个思路,平台也可以开发已完成的临床实验的循证证据评价的功能。

综上,中医临床科研大数据平台的设计需要既符合中医药循证医学特点,又兼顾个体精准施治方案的临床疗效评价。

3.2 平台可分析更大规模、更丰富类型数据

正如前文提到的,随着大数据时代到来,数据资料规模和种类将显著提升[38]。

在大数据平台中,数据规模可从原先的以MB、GB单位上涨到以TG、PB为基本处理单位。在医疗大数据平台中,平台数据除了来自医疗系统中的病人资料,科研人员也可以通过患者自愿安装在手机上的随访APP、小程序,在进行病程和随访管理的同时远程收集患者院外信息[39],完善临床资料,保障研究质量。

大数据平台中涉及的数据类型也从原先的一种或少数几种增加为数以千计,数据资料也从原先以结构化为主资料,变化成包含更多半结构化和非结构化数据的资料。如林一凡等[40]设计了中医智能脉诊系统与家庭医生平台,医生可以远程获得病人的舌象和通过仪器智能分析后的病人脉象,以便于病人四诊信息的采集。病人的舌象脉象都属于非结构化资料,这些资料不仅数据量大,还需要专业人员应用新技术、新方法进行数据分析解释。科研人员可结合近年来的计算机辅助智能舌象诊断成果完善在平台中中医舌诊信息[41],为临床科研提供客观研究指标。

3.3 平台可即时综合临床科研成果辅助临床决策

建设科研临床一体化平台的最终目的,也是要将科研成果即时返回临床辅助临床决策。囿于技术发展,之前的平台只能对已有临床数据进行分析。随更多的技术被应用和补充进来,分散在不同系统、媒介中的临床数据资料可以被大数据平台实时抽取、集成,再根据已有算法对数据进行分析解释,得到结果可辅助临床工作者作出决策。这样的平台,不仅能基于真实世界进行临床科研,还能对海量真实世界数据进行统计、挖掘和分析,并利用自然语义、知识图谱等技术对疾病发病人群、人群发病特点和病人结局进行预测和管理。

目前首都医科大学附属北京天坛医院[31]建立了以神经介入专病库为核心的临床科研一体化研究模式。该平台可利用全过程诊疗时间轴及智能预测引擎对取栓后患者颅内出血的发生风险进行预测。胡萍[42]等研发了基于机器学习的耳鼻喉科专病科研大数据平台,并以甲状腺疾病为例,展示了该平台如何应用多种方法对筛选出的临床样本进行建模分析并选择出最优机器学习算法进行诊断预测。以上研究模式和研究方法为我们提供一个思路,我们可以借鉴其已有成果,探索和建设具有中医特色的“临床-科研-临床”研究模式。

4 总结

真实世界研究是符合中医药内在规律的临床研究模式。中医临床科研一体化是中医真实世界研究的核心,建设中医临床科研大数据平台是实现方法。目前中医临床科研一体化平台完成了建设并投入应用,其成果很好地推动了中医药临床科研的发展。随着技术的发展,中医临床科研大数据平台也将会被开发和应用,这不仅能够促进中医临床研究的深入,也可以促进中医药现代化发展,推动中医药走向世界。

猜你喜欢
真实世界循证中医药
多替拉韦联合拉米夫定简化方案治疗初治HIV感染者真实世界研究
庆祝《中华人民共和国中医药法》实施五周年
《中医药传承创新发展这十年》
参麦宁肺方治疗223例新冠病毒感染者的真实世界研究
基于真实世界证据的人工髋关节假体临床使用研究
基于真实世界研究分析输尿管软镜手术前留置输尿管支架管的必要性
中医药在恶性肿瘤防治中的应用
《循证护理》稿约
循证护理在新生儿静脉采血中的应用
循证护理在ICU患者中的临床应用观察