精准扶贫辅助测评系统设计

2021-04-20 12:46那晏禾张宇杰
无线互联科技 2021年4期
关键词:词库贫困人口精准

杨 超,文 展,那晏禾,张宇杰

(成都信息工程大学 通信工程学院,四川 成都 610225)

0 引言

国家的扶贫政策对帮助贫困人群有着重要意义,我国高度重视扶贫攻坚的问题。如何精准识别出农村贫困人口是进行精准扶贫的基础性工作, 决定着精准扶贫在资金、措施、驻村帮扶和脱贫成效方面目标精准。然而,在实践中还存在一些问题,如遭遇农村熟人社会的关系网络、不规则的乡土社会,导致扶贫资源的冒领,在一定程度上制约了扶贫工作的有效开展[1-2]。因此,有必要开发一款扶贫辅助测评系统,帮助扶贫工作人员鉴别申请人所处的经济水平,判断申请人是否有冒充贫困户领取福利的嫌疑,更好地为扶贫战略服务。

1 系统设计思路

心理学家表示,贫富差距产生的原因可能是个体某种能力的缺失或者个性缺陷。具体来说,贫穷与富裕之间的差距除了财富之外,还有认知层面的差距。该系统将心理学领域的研究方法与机器学习算法进行结合,以心理学背景下可能造成个体经济水平差异的个体心理特征为背景,使用多种机器学习模型对不同经济水平个体的文本数据进行分类,得到个人经济水平分类最优模型,通过文本识别经济水平。

首先,采集大量不同经济水平人群的文本。然后,对不同的经济阶层进行分类,按照其关键词频率来建立不同经济水平人群的特征词库。接下来,通过研究机器学习算法并实现,得到最优个人经济水平模型。最后,开发软件提供用户接口。

2 精准扶贫辅助测评系统设计方案

根据设计思路,可以得到精准扶贫辅助测评系统的设计方案,如图1所示。

由图1可知,本系统主要分为数据采集、数据处理、特征词库构建、建立个人经济水平分类模型、手机APP开发这几个步骤,下面分别进行阐述。

2.1 数据采集

通过编写爬虫程序采集网络上大量不同经济水平人群的文本数据,并将爬取到的数据存入文本文件。本方案将经济水平人群分为3类:富裕人口、普通收入人口、贫困人口。其中,富裕人口主要采集对象为大V的微博数据、名人新闻、富人传记、书籍。普通收入人群可以采集普通新闻、小说等文本。贫困人口主要采集扶贫网上的新闻、贫困户访谈等。将这3类数据分类存入不同的文本文件。

2.2 数据处理

将采集到的富裕、普通和贫穷3类经济水平的原始数据文本,通过中文分词工具进行分词。并设计高效实用的文本数据清洗算法,计算每一类经济水平文本的词频逆文本频率指数( Term Frequency-Inverse Document Frequency,TFIDF),该指数值越大,则表明该词汇在文本中的重要性越高,由此可以获取对应案例文本的关键词[3]。

2.3 建立特征词库

在关键词基础上,进行特征选择、特征构建和特征提取。特征选择的过程需要由专家基于贫困人口的社会认知模式相关背景知识,筛选最有可能影响到个体社会认知的关键词,并对筛选出的关键词按照影响程度的大小进行优先级排序。特征构建与提取是将可能属于同一类簇的关键词进行整合,以免特征过多造成信息冗余。该过程可以利用TF-IDF值计算关键词之间的相似度划分类簇,也可以利用无监督学习技术如主成分分析,K-means算法等进行关键词降维和自动聚类[4]。上述步骤可以进一步提高特征的准确性,确保特征的低冗余度,最终得到个人经济水平特征词库。

最后根据富裕、普通和贫困人口3种分类,给不同案例获得的特征词打上相应标签,代表不同的个人经济水平,便于下一步进行有监督的机器学习。

2.4 构建个人经济水平模型

在有了不同经济水平人群的特征词库后,便可设计一种高效实用的文本数据分析算法,对申请人输入的文本进行分析,与特征词库进行对比分析,利用多种机器学习模型,如逻辑回归、支持向量机、最近邻算法等,对不同经济水平个体的文本进行分类,根据精确性、实用性等关键指标,获得针对此项目的分类准确性最高、误差值最小的模型。

2.5 手机APP开发

开发手机APP提供界面,输入贫困补助申请者的文本数据。通过个人经济水平模型,得到申请人所处的经济水平,并生成个人经济水平报告,供扶贫工作人员辅助进行扶贫对象识别。

本系统完成后,可以广泛应用到扶贫工作中,帮助扶贫工作人员对贫困补助申请人所处的经济水平进行判断,助力精准扶贫工作。

图1 精准扶贫辅助测评系统的设计方案

3 结语

本文中提出一种结合心理学与机器学习算法设计的精准扶贫辅助测评系统。该系统采用网络爬虫收集各个经济水平人群在网上的文本数据,通过中文分词、关键词提取、文本向量化等方法进行文本处理,构建特征词库,建立机器学习模型,最后开发手机APP提供输入界面。当输入贫困人口相关文本数据,本系统能得到该贫困户对应的经济水平分析报告,辅助扶贫工作人员核实扶贫对象的身份,更好地推进精准扶贫工作。

猜你喜欢
词库贫困人口精准
精准防返贫,才能稳脱贫
一“吃”多用
精准的打铁
精准扶贫 齐奔小康
十八大以来每年超千万人脱贫
输入法词库乾坤大挪移
精准扶贫二首
词库音系学的几个理论问题刍议
要让贫困人口真正受益