基于AdaBoost算法的珠三角地区中老年慢性病患者就诊机构选择及其影响因素

2021-11-16 09:45宋玮琦郭卓源程梦娇刘俊荣张雪琴马金香
医学与社会 2021年11期
关键词:珠三角决策树慢性病

刘 焱,宋玮琦,郭卓源,程梦娇,刘俊荣,张雪琴,马金香

1广州医科大学公共卫生学院,广东广州,510182;2广州医科大学卫生管理学院,广东广州,510182

2000年和2010年的人口普查数据显示,广东省人口老龄化程度逐渐加深,随着粤港澳养老产业的兴起,湾区内老龄化形势日趋严重[1]。加之中老年慢性病患病率是其他年龄组的2-3倍[2],并且超过70%的老年人患2种及以上的慢性病[3],中老年慢性病患者的卫生保健需求不断增加。然而珠三角地区存在卫生资源供给不足、配置不公平、基层卫生资源利用率低等问题[4-5]。基层医疗机构已被认为是承担慢性病防控的重要角色。珠三角作为我国医疗改革的先行者,了解该地区中老年慢性病患者基层卫生机构利用情况,对于落实分级诊疗制度,提升慢性病防治效果具有重要意义。

国内外研究表明,影响患者就诊机构选择的因素众多,包括个人特征、社会经济因素以及医疗保险类型等[6-8]。目前我国多以国家健康卫生数据这类大型调查数据为依托[9-10],研究结论虽具普遍性,但在一定程度上忽视了地域文化、政策制度等方面的差异,不利于精准干预。而且在统计方法上多选择logistic回归,该模型虽可发现各种影响因素,但不能直观获得各变量的相对重要性,还可能因多重共线性增加误差,AdaBoost算法刚好可以弥补这些缺陷。在卫生资源有限的情况下,如果能在众多影响因素中直观地获得各变量的相对重要性,将有助于实现卫生资源的利用最大化。本研究基于AdaBoost模型探讨珠三角地区中老年慢性病患者就诊机构选择及影响因素,以期筛选出主要影响因素,为引导患者自愿选择基层医疗机构就诊、减少卫生资源的浪费、促进医疗系统满足庞大的卫生保健需求等提供参考。

1 资料来源与方法

1.1 研究对象

本研究的目标人群为珠三角地区中老年(≥45岁)慢性病患者。数据来源于2018-2019年在珠三角地区开展的15岁以上常住居民慢性病防控调研项目,该调查以户为单位开展,调查对象为个人。首先按照珠三角地区经济水平进行分层随机抽样,然后按照社区与行政村的常住人口比例(1∶1),随机抽取社区或行政村(社区12个,行政村26个),最后在抽中的社区/行政村中通过系统抽样,抽出需要调查的家庭户,抽中的家庭户中的所有家庭成员均为调查对象。问卷内容包括社会人口学特征、居民慢性病患病情况以及卫生服务利用情况等。慢性病患病情况采用居民自报的形式评估,调查共纳入高血压、糖尿病、脑卒中等18种常见慢性病。本研究提取了中老年自报慢性病患者共2663人。

1.2 研究方法

1.2.1 变量定义。基层医疗机构指符合下列情况之一者:社区卫生服务站/中心,乡镇卫生院,私人诊所/门诊部。非基层医疗机构指符合下列情况之一者:区级医院,市级医院,省级及以上医院,民营医院,其他。其他变量赋值见表1。

表1 变量赋值

1.2.2 研究方法。本研究采用AdaBoost算法[11]进行影响因素分析。该算法是一种经典的集成学习算法,训练过程简单,收敛性好,具有较强的泛化性和特征选择性等优点,其模型构建如下:①将最近1年就诊最多的机构作为因变量,将表1中的其他变量作为自变量,选用经典的弱分类器——决策树,作为基分类器进行分析。基分类器数量根据以往的研究经验设置400次迭代[12],即产生400棵树,在模型过拟合之前筛选出正确率最高的迭代次数。②为了防止模型泛化能力丧失,基分类器复杂度不宜过高。本研究使用循环语句,设置决策树深度从1至5进行训练,选择正确率最高所对应的深度。③采用十折交叉验证法计算模型错分率,评估模型的泛化能力。选取错分率最小的模型结果进行讨论。

1.3 统计学方法

使用EpiData 3.0 进行数据双录入并进行质控。使用R 4.0进行统计分析。定性资料以例数和构成比表示,组间比较采用卡方检验,就诊机构选择影响因素采用AdaBoost算法分析。检验水准α=0.05。

2 结果

2.1 调查对象基本情况

研究对象中,女性1340例(50.32%);60-74岁1169例(43.90%);已婚2145例(80.55%);受教育程度小学及以下1663例(62.45%);离退休1402例(52.65%);家庭人均月收入1000-2999元960例(36.05%);离家最近的医疗机构为基层医疗机构2302例(86.44%);从家步行至最近基层医疗机构≤15分钟2067例(77.62%);居住在城镇1528例(57.38%);户籍人口1903例(71.46%);自评健康良好1622例(60.91%)。

2.2 中老年慢性病患者就诊机构选择情况的比较

最近1年就诊最多的机构为基层医疗机构的有2001例(75.14%),为非基层医疗机构的有662例(24.86%)。不同年龄、受教育程度、就业情况、家庭人均月收入、离家最近的医疗机构类型、居住地区、户籍情况及自评健康状况的中老年慢性病患者在选择不同就诊机构上的差异具有统计学意义(P<0.05)。见表2。

表2 不同基本情况的珠三角地区中老年慢性病患者就诊机构选择情况比较 n(%)

表2(续)

2.3 AdaBoost建模及结果

对Adaboost算法进行训练后,计算出最佳迭代次数为161次,最佳决策树深度为4,即产生了161棵深度为4的决策树。对2663例样本使用十折交叉验证,10次错分率范围为0.097-0.180,平均错分率0.151,符合判定标准0-0.3[13],表示对本资料,使用该模型精确度较高。见表3。

表3 十折交叉验证法逐次错分率

AdaBoost算法所得的变量相对重要性排名前3依次为离家最近的医疗机构类型、从家步行至最近的基层医疗机构所需时间及受教育程度,可见这3个因素是影响患者决策的主要因素。见图1。

图1 影响珠三角地区慢性病患者就诊机构选择影响因素的相对重要性

分别绘制能够说明这3个因素影响患者就诊机构选择的决策树,结果显示,当离家最近的医疗机构类型为基层医疗机构、从家步行至最近的基层医疗机构所需时间在15分钟以内、受教育程度为小学及以下时,患者选择基层医疗机构就诊的比例分别由0.49增加到0.51、0.48增加到0.51、0.49增加到0.53。见图2-图4。

图2 第147棵决策树

图3 第16棵决策树

图4 第65棵决策树

3 讨论

3.1 珠三角地区中老年慢性病患者基层医疗机构就诊率有待提高

2017年,国务院印发《中国防治慢性病中长期规划(2017-2025年)》,鼓励并逐步规范常见病、多发病患者首先到基层医疗卫生机构就诊,提出长期的慢性病管理更适宜在基层医疗机构开展。目前我国人口老龄化和中老年慢性病患病情况均较为严峻,引导该群体正确选择就医机构,合理使用卫生资源,对于分级诊疗格局的形成尤为重要。本研究显示,珠三角地区中老年慢性病患者选择基层医疗机构就诊的比例为75.14%,高于镇江市慢性病患者(42%)[14],低于重庆市慢性病患者(79.4%)[15]。虽然珠三角地区已经在大力推进三级联动医联网的建设和增强基层医疗机构对慢性病的管理,但是慢性病分级诊疗的落实工作依旧任重而道远。

3.2 中老年慢性病患者就诊机构选择的影响因素多样化

AdaBoost算法结果显示,离家最近的医疗机构类型、从家步行至最近的基层医疗机构所需时间和受教育程度是影响中老年慢性病患者决策的主要因素,在各变量相对重要性中占据较大比重。当离家最近的医疗机构为基层机构,从家步行至最近的基层医疗机构所需时间在15分钟内,患者都倾向于选择基层就诊,与Liu[16]等的研究结果一致。与社会经济地位相比,获取服务的便利性对患者就诊机构的选择影响更大[6]。距离基层医疗机构近,距离大医院远时,方便快捷的基层医疗卫生机构成为慢性病患者就医的首选。曹阳等人的研究也表明患者住区建成环境对患者就医选择具有重要影响[17]。中老年群体可能存在行走困难、出行不便等问题,而且慢性病病程长、迁延不愈、就诊频繁,因此空间与时间上的高可及性有助于吸引中老年慢性病患者选择基层医疗机构。

受教育程度高的中老年慢性病患者多选择医院,反之,受教育程度较低的更倾向于选择基层医疗机构,此结果和以往的研究结果一致[9]。可能是文化程度高的患者自身健康意识较强,有着“就高不就低”的就医观念,希望能得到高质量的治疗,对于提供服务的人员以及治疗环境有较高的要求,大多将综合医院作为首选,基层就医的比例相对较低。

以往的研究表明,收入也是影响患者就诊决策的重要因素[18],本研究结果与之一致。低收入家庭可支配收入较少,对医疗服务价格较为敏感,更倾向于选择费用低且报销比例大的基层医疗机构。除此之外,自评健康状况、居住地区、年龄、及户籍情况等也是影响中老年慢性病患者是否选择基层机构就诊的因素。自评健康较好的患者病情多趋于稳定,基层医疗机构能够满足其医疗保健和疾病康复治疗的需求[19]。城镇和农村地区在获得医疗资源的公平性和可及性存在差异,居住在农村的中老年患者可选择性小,多直接就诊于基层机构。年龄在60岁以上的慢性病患者多选择基层就诊,可能原因是年龄与收入存在交互作用,离退休的老年患者收入减少,所以也倾向于选择基层机构就诊。与本市户籍人口相比,流动人口倾向于选择非基层机构就诊,可能与异地利用和报销的限制有关。虽然珠三角率先开展了异地就医“一站式”住院结算,但是门诊业务暂未纳入异地直接结算范畴,这一定程度上限制了流动人口对基层卫生资源的利用。

4 建议

合理有效的就医行为是开展分级诊疗制度及防控慢性病发生发展的重要环节。从AdaBoost算法分析结果的影响因素相对重要性来看,患者住区建成环境与宣传教育是影响珠三角地区中老年慢性病患者就诊机构选择的重要因素。促进该地区合理有效就医行为的形成,可以采取以下措施:①增加基层机构的数量,增强基层机构的硬件建设,充分发挥其在慢性病管理工作中便利和普及的特点,积极分担大医院的诊疗压力,尽可能满足中老年慢性病患者就医的地域性需求,早日达到15分钟医疗圈的建设目标。同时也应注重人才队伍建设,下沉优质资源,给患者提供高质量的医疗服务。②加强分级诊疗的政策宣传,提高民众认可度和支持度,引导公众改变传统就医习惯,形成“小病在社区,大病到医院,康复回社区”的就医观念;同时让居民了解基层机构就诊的优越性,促进居民合理使用医疗卫生资源。

猜你喜欢
珠三角决策树慢性病
肥胖是种慢性病,得治!
养殖面积逐年减少!珠三角这条鱼曾风靡一时,为何现在渔民都不愿养殖它?
健康体检常见慢性病及指标异常流行病学分析
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
制造业“逃离”珠三角?
珠三角世界级城市群建设进入施工期
居民慢性病患病率十年增一倍
逆转慢性病每个人都可能是潜在的慢性病候选人!
基于决策树的出租车乘客出行目的识别