在线健康平台信息质量与可读性计量分析

2024-03-18 04:54付裕添邱均平张廷勇黎远波

现代情报 2024年3期

付裕添邱均平张廷勇黎远波

关键词：在线健康平台；信息质量；DISCERN；可读性；计量分析

据统计，截至2022年12月，我国已拥有10.67亿互联网用户．超过76%的用户有在各类互联网信息发布平台中搜索健康信息的经历，超过68%的移动网络终端用户有日常在线搜索健康信息的习惯。此外，国务院办公厅也于2018年4月25日，根据《“健康中国2030”规划纲要》和《国务院关于积极推进“互联网+”行动的指导意见》提出要健全“互联网+医疗健康”服务体系，发展基于互联网的健康服务。

得益于互联网技术的持续进步，社会大众在线获取健康信息已成为一种必然趋势，各类信息发布平台成为了当下社会大众获取在线健康信息的重要渠道，“互联网+健康信息”也将成为今后社会大众提升个人健康信息素养的重要组合。健康信息素养作为现代社会人健康生活的必备素养之一，其定义在涉及个人构建有效搜索和理解健康信息能力的同时，还包括通过判断和应用健康信息就健康相关问题做出正确决策的能力，当前环境中个人实现建立或提升这一素养的基础则主要依靠相关在线健康平台信息资源。

时下，与“互联网+健康信息”日趋重要形成鲜明反差的是在线健康平台信息的类型和领域范围虽被不断丰富，但互联网固有的开放属性也使许多虚假、失实、甚至逻辑混乱的劣质健康信息在各类信息发布平台中自由流通和任意传播，导致在线健康平台信息质量与可读性水平纷杂不一，在影响用户理解、判断、应对自身健康状态及治疗动作外，也严重削弱了大众对在线健康平台信息的信任、有效利用以及对个人健康信息素养的建立与提升。因此，从现状出发对在线健康平台信息质量与可读性进行计量分析，有助于推动在线健康平台信息的标准化和规范化，增强其效用性，这是今后大众获取优质在线健康平台信息、培养和提升个人健康信息素养的重要基础，也是国家发展互联网健康服务、实施健康中国战略的必然要求。本研究将分别以刊载于7类常见互联网信息发布平台的10种备受关注的疾病相关健康信息为代表，运用DISCERN健康信息质量评价指南，并改进现有中文健康信息可读性计算公式来进行相关分析研究，以期揭示当前我国在线健康平台信息总体质量与可读性的现状和不足。

1在线健康平台信息相关研究综述

1.1信息质量

在线健康平台信息间的可靠性与准确性差异显著，质量良莠不齐的问题一直备受社会关注，国外相关领域学者也从健康信息来源、信息发布准则、信息质量标签等角度聚焦于健康信息质量评价问题，并基于信息内容、编写设计等维度提出若干相关评价标准与工具。在质量相关评价标准研究方面，Eysenbach G等将在线健康平台信息质量标准分为技术性、设计性、可读性、准确性与完整性5类评价指标：O'Grady L将健康信息发布网站的质量标准分为假定可信度、展示可信度、声誉可信度和参考可信度4种评价类型：钱明辉等则从权威性、归因性、全面性、补充性等9个维度出发，构建出我国在线健康咨询平台信息质量评价指标体系。在质量相关评价工具研究方面，DIS-CERN、HON Code、JAMA等均是当下广泛使用的评价工具，其中DISCERN运用最为普遍，其可面向不同学科领域或特定医学领域进行质量评价，专业医疗人员或普通社会人群均可使用。此外，Habib M等、Afsana F等部分国外学者也尝试利用深度学习算法开发自动化分类器以对在线健康平台信息实现智能化评价。在评价对象方面，我国学者大多针对特定疾病的相关健康信息网站进行质量评价研究，对社交媒体、搜索引擎、健康公众号、健康医疗应用等平台刊载的相关健康信息质量则关注较少。

1.2信息可读性

可读性是衡量阅读一段文本难易程度的指标，它被定义为“通过系统公式确定个体理解书面文本所需的阅读理解水平”。当前，社会大众在线搜寻并浏览健康信息时，由于其中包含医学专业术语较多，往往使用户难以阅读和理解，相关研究也表明社会大众对在线健康平台信息的可读性有所担忧。难以阅读理解的健康信息可能会使用户误解或混淆相关内容，不利于用户根据所获信息做出正确的个人健康判断或指导，而易于阅读理解的健康信息是社会大众最为基本的需求。目前，国外学者对于在线健康平台信息可读性的研究主要着眼于不同可读性计算工具的对比梳理及相关公式的应用研究，并在英语环境中发展出多种可读性计算工具来为书面信息的可读性分配数值，例如GunningFOG指数、Flesch-Kincaid等级分数（F-K）、SMOG公式和Flesch Reading Ease（FRE）量表等，这些基于英语字符、音节、单词或句子数量的函数文本样本，已被广泛用于衡量在线健康平台信息的可读性。我国关于信息可读性的研究起步较晚且相较缓慢，利用可读性计算工具或公式的评价研究与应用分析整体较少，涉及在线健康平台信息的相关研究更为稀缺，目前尚未发展出成熟的中文健康信息可读性计算工具。

综上所述，在英语环境中，针对在线健康平台信息质量与可读性已有广泛研究，形成了一些成熟的评价指标体系与工具，但在中文环境中的相关研究，在内容、数量和研究角度上均尚有局限。同时，考虑到在线健康平台信息质量与可读性水平是影响我国社会大众健康信息素养构建与提升的关键因素，因此，探究我国在线健康平台信息质量与可读性水平，并针对其中存在的问题提出改进对策是必要且亟需的。

2研究对象与方法

2.1研究对象选择

为全面创建研究分析文本数据集，本文首先选取了7种社会大众能够普遍实现搜索获取与阅读在线健康信息的平台途径，分别是“百度搜索引擎”“微信公众号”“微博平台”“知乎问答平台”“平安健康APP”“39健康网”以及“健康中国网”。这7种途径均分別是在当前搜索领域、社交领域、移动端应用领域和健康专题网站等领域拥有大量用户与访问量的热门信息发布平台，基本可代表当前大众在线搜索、获取与阅读在线健康平台信息的各种主流途径。同时，根据互联网评选出的中国十大最受关注疾病，假定其作为社会大众最有可能寻求相关在线健康平台信息的对象，涉及癌症、糖尿病、高血压、痛风、艾滋病、胃病、失眠、高血脂、冠心病、肝病共10类疾病的相关健康信息。

在进行具体搜索动作前，研究人员对各平台访问记录、缓存图像和Cookies等进行了删除或重置操作以防止影响搜索结果的准确性。随后运用人工方式分别在7种平台中同时检索10类疾病的相关健康信息，以求达到完全模拟用户的信息搜索、选择与阅读行为，所有搜索与下载行为均在24小时内完成，以便将平台对信息内容可能的更改保持在最低限度。考虑到用户对搜索结果的阅读量一般在10个有效信息内，因此，在排除中断链接、无关主题、广告新闻、期刊文章及篇幅过低的信息后，最终共选取700份在线健康平台信息作为评价在线健康平台信息质量与可读性的评价样本，部分样本数据如表1所示。

2.2健康信息质量评价方法

DISCERN是英国牛津大学开发用于评价书面健康信息质量的一种标准化测量方法，已广泛用于各种健康网站信息的评价研究，以往研究也对DISCERN的可靠性进行了心理测量学上的评价，并表明其能够较为准确地区分健康信息的质量高低。DISCERN由15个基础问题和1个整体质量评价问题共16个题项组成，各题项均采取5分制评价方式，由“否”到“是”来依次表明信息满足题项标准要求的程度：1分表示“完全不满足”，2～4分表示“在某种程度上满足”，5分表示“完全满足”。并可将题项按问题类型分为3个部分：健康信息可靠性质量评价部分（题项1～8号）、治疗方案信息质量评价部分（题项9～15号）以及整体质量汇总评价部分（题项16号），如表2所示。

对样本的质量评价由3名主要研究人员进行，为确定评价者之间对每项评估标准的理解一致，主要利用评价工具中提供的评价事例进行试评价，并通过参考评价指南、共同评价与分歧讨论后，取得对各在線健康平台信息样本质量进行判断时在评判标准理解上的共识。

2.3健康信息可读性计算方法

通过对相关样本的检验查阅后发现，时下在线健康平台信息多以图文的形式呈现，同时相关研究也指出健康信息文本是否提供与文本内容相关的非文本图像也是影响健康信息可读性的一类因素。因此，为更贴近现实地计量在线健康平台信息的可读性，本文将以秦琴等学者构建出的中文在线健康信息可读性计算公式为基础进行改进，如式（1）所示，提出包含非文本图像因素的在线健康平台信息可读性计算公式，如式（2）所示：

其中，S表示健康信息是否提供与内容相关的非文本图像（S=0未提供、S=1提供）；CR表示相比于纯文字状态时健康信息在含有非文本图像状态下非文本图像对健康信息可读性的提升贡献率。研究人员通过完成非文本图像对各样本可读性的贡献评价后，得出CR的值约为21.857%，计算如表3所示，R值（可读性值）代表在线健康平台信息的可读性水平，R值越小，可读性越强，信息越容易阅读；式（1）中TWC（总字数）为去除标点符号后的文本字数；ASL（平均句长）为总字数与完全句数的商；PMT（医学专业术语占比）为医学专业术语字数与总字数的比值，其中医学专业术语确定的依据是根据LetPub网站上提供的医学健康类专业术语词典，囊括46个分类学科的16229个医学专用词汇和专业术语词汇，具体研究则运用Python软件实现相关元素的数值计算。由于目前国内尚未出现与可读性值对应的中文阅读水平分级标准，因此，本文仅对在线健康平台信息可读性值本身进行分析评价。

3在线健康平台信息质量评价

3.1信息质量总体评价

运用DISCERN健康信息质量评价工具对在线健康平台信息进行质量评价，具体描述统计如表4所示。

具体来看，在线健康平台信息的整体质量评价得分平均值约为2.772分，整体质量近似达到中等质量水平，但信息间质量差距较大。可靠性质量评价部分的平均值约为2.544分，在该部分中1、2、3、6号题项的评价得分平均值略高于3分，5、8号题项的评价得分平均值介于2～3分之间，4、7号题项的评价得分平均值则小于2分，其中7号题项的评价得分平均值仅为1.105分，反映出在线健康平台信息在涉及信息来源表明、提供其他信息来源方面欠缺严重。而治疗方案信息质量评价部分总体未得到足够的关注，其中涉及治疗风险描述、未治疗后果说明以及治疗方案选择讨论建议等方面存在着非常严重的缺陷。

3.2不同平台与提供主体间的信息质量评价对比

3.2.1不同平台间信息质量评价对比

研究通过分别计算7种不同平台各自刊载健康信息的整体质量评价得分平均值并结合Friedman检验，进一步探究不同平台刊载的健康信息质量是否具有不同，结果如图1、表5所示。

研究发现，不同平台刊载的健康信息质量有所不同，其中健康中国网刊载的健康信息质量评价得分平均值最高，约为3.220分；39健康网刊载的健康信息质量评价得分平均值最低，约为2.010分：其余平台的评价得分平均值介于2.5～3.0分之间，与前文整体质量评价得分平均值相近。

由Friedman检验分析结果可知，显著性P值<0.01，统计结果显著，表明7种不同平台刊载的健康信息质量之间存在差异，其差异幅度Cohen's f值为0.505，差异程度较大。

3.2.2不同提供主体间信息质量评价对比

在线健康平台信息除平台不同外，大部分信息的提供主体也有所不同，大体可分为公立机构提供主体和私立机构提供主体，其中公立机构提供主体是指在线健康平台信息主要由各大公立医院、高校附属医院、政府资助网站等来源编写提供，私立机构提供主体主要是指信息由私立盈利性医疗网站、私立医院、医疗盈利APP应用、私人医生等来源编写提供。具体质量评价得分平均值对比如图2、图3所示。

公立机构主体提供的在线健康平台信息可靠性部分质量评价得分平均值约为2.658分，虽高于私立机构的2.565分，但在统计学意义上并没有显著差异。具体来看，除4、5．6号题项中的私立机构主体提供的在线健康平台信息质量平均值略有凸显以外，其余编号题项均略低于公立机构。

在治疗方案信息质量评价部分平均值对比中，公立机构主体提供的在线健康平台信息在各题项的评价得分平均值上均稍略高于私立机构，这表明在治疗方案相关信息提供方面，公立机构提供主体能够在治疗方案内容信息方面提供更多的参考和建议。

4在线健康平台信息可读性评价

4.1信息可读性总体评价

运用改进型可读性公式对700份评价样本进行计算可知，在线健康平台信息的平均总字数、平均句长、医学专业术语占比及可读性值分别约为1453.31、42.39、0.29和11.41，在信息总字数、平均句长以及可读性方面有着明显差异，而医学专业术语占比方面仅存在细微差异。此外，大约有65.29%的在线健康平台信息提供非文本图像来辅助用户阅读，如表6所示。

此外，在线健康平台信息文本的可读性值在7～9之间分布最多，并且可读性值不超过9的在线健康平台信息占比约75%以上，如图4所示。这表明对于社会大众而言，需要具备可读性值9及以上的健康信息阅读能力才足以理解大部分在线健康平台信息内容。

4.2不同平台和提供主体间信息可读性对比

4.2.1不同平台间信息可读性对比

研究同样通过运用可读性计算公式分别计算不同平台刊载健康信息的文本总字数、平均句长、医学专业术语占比和可读性值的平均值和标准差（SD），并结合Friedman检验来进一步探究通过不同平台获取的健康信息可读性间是否存在差异，结果如表7、表8所示。

通过表7的各项统计结果可知，由平安健康APP平台刊载的健康信息平均可读性值最低，说明其刊载的健康信息最易阅读，信息间可读性值相差最小且提供非文本图像的信息比例高達89%：由百度搜索引擎刊载的健康信息平均可读性值最高，说明其最难阅读，并且各信息间的可读性值差距也最大。其中值得注意的是，百度搜索引擎和39健康网两者分别刊载的健康信息虽在平均总字数和句长上占据着两个极端，但医学术语占比的平均值均为0.34，这说明在线健康平台信息的篇幅长短并不能导致在医学术语占比上的差异。

Friedman检验分析结果可知，显著性P值<0.01，统计结果显著，表明7种不同平台刊载的在线健康平台信息可读性间存在差异，其差异幅度Cohen's f值为0.407，差异程度较大。

4.2.2不同提供主体间信息可读性对比

通过分别对公立机构、私立机构为主体提供的在线健康平台信息进行可读性值计算，可以发现公立机构主体提供的健康信息可读性值略高于私立机构，在信息平均总字数上大幅高于私立机构，在平均句长上低于私立机构，在医学术语占比方面二者近似，在提供非文本图像的健康信息比例上公立机构提供主体比私立机构提供主体高出约14.22%，如表9所示。

4.3信息质量与可读性值的关系

在上述探究中值得注意的是，39健康网和平安健康APP两种信息来源平台刊载的健康信息质量评价得分平均值最低，但却有较高的可读性。因此，本文也利用散点图对在线健康平台信息的质量与可读性值间关系进行探究，可以发现在线健康平台信息质量与可读性值之间存在一定关联，两者具有一定相关关系，如图5所示。

通过Person相关分析结果可知，在线健康平台信息质量与可读性值间的相关系数为0.401，显著性P值<0.001，两者间呈正相关关系，即健康信息质量越高，其可读性值越高，可读性越差，如表10所示。

5讨论

5.1在线健康平台信息质量与可读性现状及问题

5.1.1信息质量现状及问题

通过运用DISCERN健康信息质量工具对在线健康平台信息进行分析研究发现，在线健康平台信息的总体质量平均值为2.772分，尚未达到中等健康信息质量水平，仍有提升的较大空间。从可靠性质量与治疗方案信息质量两部分的评价得分平均值来看，各部分同样尚未达到中等水平，即便如此，后者仍比前者的评价得分平均值低出约1.08分，说明目前在线健康平台信息中治疗方案信息内容过少，重视力度不够。从具体题项来看，在线健康平台信息在信息来源表明、其他相关信息提供、治疗方案风险描述、未治疗后果描述、治疗方案选择表明等方面均未达到2分的质量水平，相关信息欠缺十分严重。总的来说，目前在线健康平台信息的总体质量不高，缺乏有效的治疗方案信息，用户无法得到精准的诊断和治疗建议。另外，较低的健康信息质量也会导致用户误解或者因误用健康信息而对个人健康造成潜在的风险。因此，提高对在线健康平台信息质量的重视程度，提升用户获取和应用在线健康平台信息的效果是首要的。

5.1.2信息可读性现状及问题

通过分析计算在线健康平台信息的相关统计量与可读性值，发现目前在线健康平台信息可读性主要存在以下问题：首先，在线健康平台信息的篇幅较长，平均字数超过1400字，平均句长超过40字，篇幅和语句的长度容易导致用户的阅读疲劳，同时也会使用户在阅读时被迫需要持续维持对前后信息内容与逻辑的记忆，进而影响用户对有效健康信息的判断与理解，因此，在线健康平台信息的篇幅和语句长度切分需要得当，以兼顾信息的逻辑性与可读性；其次，信息中的医学词汇占据了较大的比重，平均来看，这些词汇约占总篇幅的29%，虽然医学专业性强的文章往往更科学、严谨以及更具说服力，但对于健康信息素养和医学知识薄弱的用户而言可能会带来阅读理解上的困难，因此，平衡专业性与可读性，以简单易懂的方式来传达准确、有效的健康信息应是健康信息提供者们下一步的追求目标。

5.2不同平台与提供主体间的信息差异

分析发现，不同平台刊载的健康信息质量与可读性均具有一定差异，其中质量上的差异更为明显。由于研究选取的7种信息平台涉及搜索引擎、社交媒体、问答平台、专业医疗等代表着完全不同的在线健康平台信息获取渠道，因此可以认为不同来源的在线健康平台信息由于各平台在提供信息的内容、方式、目的、服务、要求的不同，以及各平台相关信息编写者的专业背景和知识水平的差异等，导致了在线健康平台信息在质量与可读性上的区别。

另外，在线健康平台信息提供主体的不同，使其在质量与可读性上也存在一定的区别。以公立机构为主体提供的健康信息在大部分质量评价题项上的平均分均略高于私立机构，这可能是由于公立机构更加注重健康信息的公益性和专业性，对于健康信息的真实性、可靠性和准确性有更高的要求，并在信息编辑和呈现方式上也有更多规范和标准，但从整体上看，两者差距并不十分明显。而在可读性方面，公立机构主体提供的在線健康平台信息可读性值相比较高，可读性弱于私立机构，这或许是因为私立机构为主体提供的健康信息在编辑和制作上会因商业盈利需求而编写出为便于吸引用户而易于阅读的健康信息。

5.3信息质量与可读性间的关系

通过回归分析发现，在线健康平台信息质量与可读性值的相关系数为0.401，表明在线健康平台信息质量与可读性值间呈正相关关系，即在线健康平台信息文本的质量越高，其可读性值越高，可读性越低。高质量的在线健康平台信息在编辑时使用了过于专业化和抽象化的医学术语，文章虽丰富全面且涵盖了大量具有组织结构性的内容，但代价是提高了用户理解所需的阅读水平，增加了健康信息的可读性值，降低了可读性。

6增强在线健康平台信息效用性的对策建议

在质量提升方面，在线健康平台信息在编写时应注重信息的完整性，尽可能完整地包括例如病因、治疗、预防和康复等方面的具体信息；在线健康平台信息提供者还应广泛参阅相关医学权威著作或期刊文献，确保编写内容的准确性，提供符合当今前沿医学知识和实践标准的在线健康平台信息。在可读性提升方面，相关从业者在线传播健康信息时，应确保信息易于用户阅读理解，在编辑过程中可尽量使用简单明了、通俗易懂的语言，循序渐进地引导出最重要、最基本的健康信息内容，对内容中较为生涩的医学专业概念或术语进行降维解释，并配合相关图表或非文本图像进行辅助解释。此外，提供清晰的行文结构和组织、采取多样化的信息呈现方式、鼓励读者参与讨论和互动，来帮助用户更好地阅读理解和应用健康信息也是可读性提升的重要形式。在信息发布方面，平台方可根据参考研究，确定一系列涵盖信息内容、可靠性、真实性等方面的质量评价指标和标准来制定一套明确的信息发布规范，规范需要明确指出健康信息内容应该是基于科学证据的，不包含任何误导或虚假的信息，还可以通过与医疗机构、专业协会或权威机构合作，以实现建立专业的审核机制和认证制度，确保发布的健康信息经过专业人士的审查和认证，避免出现错误信息误导用户，以及采用相关健康信息质量有效标识认证（例如HON Code等）的形式对在线信息平台进行第三方健康信息质量认证，并向用户宣传相关认证标准。

7结语

社会大众在线获取健康信息已成为一种必然趋势，从现实出发对在线健康平台信息的质量与可读性水平进行计量分析，在揭示当前在线健康平台信息总体状态的同时也探究其中可能的改进之处，这对今后提升我国在线健康平台信息整体水平、帮助社会大众有效构建和提升健康信息素养、科学地发展基于互联网的健康服务具有重要意义。

本文运用DISCERN健康信息质量评价工具，并改进现有中文健康信息可读性计算公式对广受关注的疾病相关在线健康平台信息代表样本进行质量与可读性计量分析研究。研究发现，目前我国在线健康平台信息的总体可靠性质量接近中等水平，缺乏对治疗作用、治疗相关的风险与选择等内容的描述，在线健康平台信息整体的可读性差异显著，并且不同平台和主体提供的健康信息质量和可读性水平均存在差异。此外，研究还揭示了健康信息质量与可读性值间存在的相关关系，提出了增强在线健康平台信息效用性的对策建议，以期为今后提升我国在线健康平台信息整体水平、提高社会大众健康信息素养等方面提供一定的参考。