基于政社舆情的公众关注与政策关注差异分析

2022-07-13 08:55高影繁刘志辉
全球科技经济瞭望 2022年4期
关键词:列表

姚 新,浦 墨,李 岩,高影繁,刘志辉,3

(1.科学技术部高技术研究发展中心,北京 100044;2.中国科学技术信息研究所,北京 100038;3.富媒体数字出版内容组织与知识服务重点实验室,北京 100038)

科技发展规划作为国民经济发展规划的重要组成部分,诠释了国家科技发展的总目标和总策略,不仅是国家科技发展水平的重要表征,同时也是国家科技体制改革进程的记录仪。1982 年,我国提出“科学技术工作必须面向经济建设,经济建设必须依靠科学技术”的科技工作方针,诠释了我国“科技发展既要面向经济,又要带动经济”的战略定位。因此,制定正确的科技发展规划,对国家近期和长远的发展都有重要意义。科技规划的编制不仅要做好顶层设计,还要广泛听取民意。从以往的科技规划编制工作历程来看,一般规划的顶层设计都执行得比较好,民众意见的听取方面则普遍做得不足。随着互联网技术的推广和应用,社会公众会对国家层面提供的信息进行解读、传播和再生产,这种解读、传播和再生产行为在很大程度上代表了社会成员的诉求,反映了公众对政策或规划的关注与态度,其本质是一种政社互动。经验表明,能否对已制定的规划进行动态评估且依据评估结果对新一轮规划编制工作进行优化,已经成为衡量一项科技规划编制工作成熟与否的标志[1]。其中,政社互动舆情数据分析就是规划评估的一个重要手段。

互联网等新兴技术的兴起不仅重塑了公众生活、丰富了公众生活模式,也提高了公众网络数字足迹采集的可能性,优化了政府治理模式。随着大数据分析方法在因果推论方面的逐步完善,公众在网络上的政策搜索行为数据和再加工传播行为数据为分析和研究公众的政策偏好和注意力提供了有力支撑。政府与社会公众以政策为媒介的互动关系一直以来都是政策制定者努力探索的研究热点,如Ripberger 等[2]、赵曙光[3]以公众关注度(Public Attentiveness)评价公众的政策偏好和注意力;Macintosh 等[4]认为用户借助于新媒体可以更便捷和更真实地表达自己的政策观点;Auer[5]也指出公众在新媒体上交流的政策意见会形成影响政策的因素;毛炎新等[6]用文本分析工具提取了各级林业系统官网信息中的关键词,通过统计关键词频度、权重等因子,分析总结了林业系统关注的重点内容;孟天广等[7]通过分析2011—2017 年间的政策议题关键词,探究了公众的政策关注度及其关注原因。从现有的研究来看,当前的研究更多的是通过分析公众对政策及相关领域的关注量来对比公众关注与政策关注的异同,进而为政策的调整和制定提供借鉴,几乎没有学者从内容表达本身去分析和研究公众关注和政策关注之间的差异。国家科技发展规划一直都是科研人员关注的焦点,从科技需求的征集、任务方向的凝练到实施方案的编制,每一个环节都开放吸收了领域专家以及科技界、产业界、相关地方的意见和建议,充分考虑了行业科技需求和领域的均衡发展。回顾其编制及发布历程可以发现,尽管以往的科技发展规划编制在不断精进的顶层设计下,都尽可能周全地吸纳了业界各层意见,但鲜有学者从社会的需求出发研究社情民意。因此,为了充分利用政社互动舆情数据对已制定的科技规划和科技文本进行动态评估,本研究以国家重点支持的高新技术领域文件为分析媒介,通过检索与该技术文件中的关键技术主题词相关的微信和微博信息,并据其分析公众对国家重点支持的高新技术领域的关注侧重点,进而对比公众关注主题内容和政策表达内容之间的差异,提出政策制定的优化建议。

1 基于政社舆情数据的公众关注与政策关注差异分析

1.1 研究思路

本研究以《国家重点支持的高新技术领域》文件中的第二大类高新技术领域(即“生物与新医药”技术领域)为政策解读内容,首先通过人工判别的方式提取其中的关键技术主题词,解读国家重点支持的高新技术指导思想;其次,运用提取出的关键技术主题词检索相关的微信和微博信息,并从量的角度分析公众关注内容和政策内容的匹配情况;然后,从舆情文本数据中抽取关键词,并分析关键词之间的共现关系,识别出公众关注的内容主题;最后,对比分析公众关注的主题内容和政策内容之间的差异,为政策的制定、优化及评估提供重要的参考依据。

1.2 “生物与新医药”技术领域的关键词提取与解读

从《国家重点支持的高新技术领域》文件中各领域的关键技术表达数量分布可以看出国家对重点领域的关键技术布局与规划。因此,本文通过文本中的关键技术表达提取和统计的方式来解读国家对各技术领域的重视程度。

1.2.1 数据来源与研究方法

文本分析对象“生物与新医药”技术领域节选自《高新技术企业认定管理工作指引》附件中《国家重点支持的高新技术领域》文件,该文件来源于高新技术企业认定管理工作网,由科技部、财政部及国家税务局修订印发。《国家重点支持的高新技术领域》文件中共包含“电子信息”“生物与新医药”“航空航天”“新材料”“高技术服务”“新能源与节能”“资源与环境”和“先进制造与自动化”八大高新技术领域,本次研究节选了其中的“生物与新医药”技术领域作为分析对象。根据《国家重点支持的高新技术领域》文件的编制提纲和设计框架,可以将“生物与新医药”划分为“医药生物技术”“中药、天然药物”“化学药研发技术”“药物新剂型与制剂创制技术”“医疗仪器、设备与医学专用软件”“轻功和化工生物技术”以及“农业生物技术”七个领域,依据每个技术领域下的技术方向描述和技术说明提取其中的关键技术表达。

1.2.2 “生物与新医药”领域的关键技术表达提取与分析

根据提取的关键技术表达数量从大到小对技术领域和技术方向进行排序,每个领域下不同技术方向的关键技术表达提取结果见表1。

从领域描述文本中提取的关键技术表达数量来看,“生物与新医药”中有七个技术领域,每个技术领域下又划分了不同的技术方向,关键技术表达最多的领域是医药生物技术(79)和农业生物技术(74),其次是医疗仪器、设备与医学专用软件(59)。这在一定程度上也说明了国家对医药生物技术、农业生物技术以及医疗仪器设备等方面的技术改进与提升的重视。

具体来看,“医药生物技术”领域中新型疫苗(20)、生物大分子类药物研发技术(20)、生物治疗技术和基因工程药物(16)三个技术方向下抽取的关键技术表达较多,这说明在生物医药技术领域,新型疫苗、生物分子类药物、生物治疗技术及基因工程药物的研发是国家重视的技术方向;在“农业生物技术”领域,现代农业装备与信息化技术(21)、重大农林生物灾害与动物疫病防控技术(19)这两个技术方向是关注的重点;“医疗仪器、设备与医学专用软件”领域则是新型治疗、急救与康复技术(18)以及新型电生理检测和监护技术(11)这两个技术方向更受关注。

表1 “生物与新医药”领域的关键技术表达数量

1.3 基于舆情关注量的公众关注内容和政策内容匹配情况分析

与“生物与新医药”领域的关键技术表达相关的舆情数据在一定程度上可以代表民众对“生物与新医药”的衍生关注度,将不同技术方向的关键技术表达对应的关注度加总可以得出不同领域的媒体关注度。本文通过检索与“生物与新医药”领域的关键技术表达相关的舆情数据,探索公众的搜索行为与政策关注度之间的关系。

本文舆情数据来源于清博应用平台。该平台提供微信、微博和App 两微一端的数据接口,可为不同领域客户提供舆情数据,满足个性化需求,合作模式便捷,实现信息分享、数据分析、数据报告等。

在清博应用平台检索双微数据的过程中,为了方便分析公众对“生物与新医药”技术领域各技术方向的关注情况,本文实验所用微博、微信数据的时间区间是2020 年1 月1 日至2020 年12 月31 日。舆情数据检索方式:以“生物与新医药”领域各技术方向提取的关键技术表达作为清博微博、微信平台的检索入口词,通过清博平台提供的数据接口共获得数据2 005 651 条。其中,“生物与新医药”领域的不同技术领域下不同技术方向的相关舆情数据如表2 所示。

不同技术领域及技术方向的相关舆情数据量可以用于表征民众对不同技术领域及技术方向的关注度。从表2 中不难看出,“医药生物技术”“医疗仪器、设备与医学专用软件”以及“化学药研发技术”这三个技术领域相关的舆情数量最多,这表明在“生物与新医药”领域民众关注点主要集中在这三大技术领域上。另外,从不同技术领域下不同技术方向的民众关注度来看,在“医药生物技术”领域,民众更关注生物治疗技术和基因工程药物(819 644)、新型疫苗(466 692)以及生物大分子类药物研发技术(409 121)三个技术方向;“医疗仪器、设备与医学专用软件”领域民众最关注的则是医学检验技术及新设备(182 055)和新型治疗、急救与康复技术(68 423)这两个技术方向;“化学药研发技术”领域最受民众关注的技术方向则是创新药物技术(116 928);“农业生物技术”领域的民众关注度相较而言偏低,重大农林生物灾害与动物疫病防控技术(53 542)、农林植物优良新品种与优质高效安全生产技术(21 313)及现代农业装备与信息化技术(12 503)这三个技术方向的民众关注度更高;“中药、天然药物”领域的中成药二次开发技术(53 340)、中药资源可持续利用与生态保护技术(15 708)的民众关注度明显高于该领域下的其他技术方向;“药物新剂型与制剂创制技术”领域下的创新制剂技术(39 020)的民众关注度也明显高于该领域下的其他技术方向;“轻工和化工生物技术”领域下的各技术方向的民众关注度都偏低。

表2 “生物与新医药”领域各技术领域及各技术方向的舆情关注量

续表

对比表中各技术方向的关键技术表达数量和相关舆情数据量,发现并非是关键技术表达数量多的技术方向民众关注度就高,即从量的分析视角来看,国家规划和指引文件重视的技术方向与民众关注的技术方向存在差异。

1.4 基于内容主题的公众关注内容和政策内容匹配情况分析

1.4.1 公众关注内容主题分析

对1.3 节获取到“生物与新医药”领域的关键技术表达相关的舆情数据进行如下处理:数据做中文分词、停用词过滤等基础操作处理;采用TF-IDF方法对分词处理后得到的舆情关键词进行权重排序处理;依据权重排序结果选取前2 000 的舆情语料关键词进行人工筛选过滤后,保留1 000 个关键词;用上一步骤筛选得到的1 000 个舆情关键词在初始舆情数据语料集中进行统计分析,并依据统计结果构建共现矩阵;利用Ucinet 和VOSviewer 软件对上一步骤中得到的共现矩阵进行主题和热点聚类分析处理,得到主题聚类分析图和舆情热点图。

(1)领域相关舆情数据分词及停用词过滤处理。

本文采用中文分词领域性能比较好的jieba 工具和提取自中国科学技术信息研究所中文核心期刊论文库的关键词词典短语对检索到的“生物与新医药”领域相关的舆情数据进行分词和停用词过滤处理,得到了舆情文本中的关键词列表,如表3 所示。

表3 舆情数据关键词列表阵示例

(2)舆情数据主题词选取结果。

对从舆情数据文本中抽取的前2 000 关键词进行人工筛选,遴选出1 000 个关键词构建舆情数据主题词共现矩阵。共现矩阵的部分数据如表4 所示。

(3)“生物与新医药”领域的公众关注主题词聚类图。

采用知识图谱可视化软件Ucinet 和VOSviewer,将表4 所示的共现矩阵进行网络格式转化后输入VOSviewer,处理后得到“生物与新医药”领域的公众关注主题词聚类图,如图1 所示。

分析图1 的“生物与新医药”领域的公众关注主题词聚类结果,可以较为清晰地解读出不同主题区域所代表的类别信息:

编号①主题区域是疫情防控相关的话题,如疫情防控技术、专业人员、药品、医疗工程、企业就业岗位调整、疫情爆发地、武汉、北京等热点话题;

表4 舆情数据关键词共现矩阵示例

图1 “生物与新医药”领域的公众关注主题词聚类图

编号②主题区域是医学科技发展相关的话题,如医学科技项目、医学教育、医保、医生职业体系规划等热点话题;

编号③主题区域是重大疾病(如癌症)治疗相关的话题,如免疫治疗、靶向治疗及副作用等相关的热点话题;

编号④主题区域是新型冠状病毒相关的话题,如病毒感染机理、人体反应机理、治疗方法、防控方法等话题;

编号⑤主题区域是人体免疫力相关的话题,如免疫力与体温的关系、免疫力调节相关因素等话题。

需要说明的是,由于噪声的关系,部分主题词的聚类结果可读性不足,如编号③主题区域内的词的类别界限不是很清楚,与其他主题类别有交叉。

(4)“生物与新医药”事件舆情热点图。

在用Ucinet 和VOSviewer 软件处理表4 所示的共现矩阵时,除了可以得到图1 所示的主题聚类图,还可得到“生物与新医药”领域的公众关注热点图,如图2 所示。

图中的虚线圈出区域展示出了疫情防控、医学科技发展、免疫治疗以及免疫力提升等相关的热点表达,如“疫情”“技术”“专业” “人员”“药品”“医学”“科技”“项目”“计划”“免疫治疗”“疾病”“癌症”“副作用”“免疫力”“细胞”“糖尿病”“饮食”等。

1.4.2 基于内容主题的公众关注内容与政策内容匹配情况分析

图2 “生物与新医药”领域的公众关注热点图

从公众关注内容的主题划分来看,公众关注的内容主要集中在以下几个主题方向上:(1)疫情防控相关的疫情防控技术、疫情防控产品、疫情防控药品研发、医疗团队组建、高校人才选拔、医学领域强基建设、医疗队伍人才培养等内容;(2)医学领域科技发展相关的医学科技项目、医疗机器人、医学教育、医保、医生职业体系规划等内容;(3)重大疾病治疗相关的疾病症状、免疫治疗、靶向治疗、治疗副作用、治疗风险等内容;(4)新冠肺炎相关的新冠病毒感染机理、患者人体反应机理、治疗方法、防控方法、新冠肺炎重症表现等内容;(5)人体免疫力相关的免疫力高低判断、基础代谢、血糖变化、体温高低等内容。

结合《国家重点支持的高新技术领域》文件中陈述的“生物与新医药”技术领域的不同技术方向表达内容来看,公众关注的主题内容部分可以映射到“医药生物技术”这个技术领域下的新型疫苗和生物治疗技术和基因工程药物这两个技术方向上,如疫情防控、重大疾病诊疗相关的话题。

1.5 公众关注内容和政策内容差异性分析

综合1.2、1.3和1.4的分析结果可以看出:在“生物与新医药”领域,国家非常重视医药生物技术、农业生物技术以及医疗仪器设备等方面的技术改进与提升,尤其重视新型疫苗、生物分子类药物、生物治疗技术和基因工程药物、现代农业装备与信息化、重大农林生物灾害与动物疫病防控及新型治疗、急救与康复等方面的技术研发、改进;从民众对该领域的关注舆情量来看,民众的关注度主要集中在医药生物技术,医疗仪器、设备与医学专用软件以及化学药研发技术这三个技术领域;从公众关注内容的主题看,公众关注的内容主要集中在疫情防控、医学科技发展、重大疾病诊疗、新型冠状病毒以及人体免疫这五个主题方向上。对比分析不难发现:在“生物与新医药”领域,民众关注的内容在疫情防控、重大疾病诊疗、新型冠状病毒等方面与国家重视的技术领域有重叠,如新型疫苗、生物治疗技术和基因工程药物。另外,从民众关注的主题内容表达来看,民众对“生物与新医药”领域所关注的内容更贴近民生,如疫情下的就业情况、人体免疫力强弱表征、民众就医相关的医保、医学教育以及医生职业体系规划等热点话题。

2 结论

本文通过人工判别提取政策文本关键技术表达的方式对《国家重点支持的高新技术领域》文件中的第二大类高新技术领域(即“生物与新医药”技术领域)的文本内容进行了解读,发现国家非常重视医药生物技术、农业生物技术以及医疗仪器设备等方面的技术改进与提升。通过利用政策文本中提取的关键技术表达检索并分析相关舆情数据发现:从舆情关注量来看,民众对“生物与新医药”领域的关注点主要集中在医药生物技术,医疗仪器、设备与医学专用软件以及化学药研发技术这三个技术领域;结合民众关注的主题内容分析可以看出民众尤其关注“医药生物技术”这一技术领域下的新型疫苗以及生物治疗技术和基因工程药物这两个技术方向。相较于政策内容关注的重点而言,民众关注的内容更贴近民生。

猜你喜欢
列表
山东航空新开航线列表
图形机器人
Python核心语法
学习运用列表法
Scratch算法练习
扩列吧
论高中数学方程思想的妙用——浅谈列表法解不等式
用列表法列方程解应用题
列表“小策略”,突破循环“大难点”
列表法解分式方程问题探索