浅谈计算机技术下食品安全信息的收集与处理

2022-11-05 04:27林婕江西新能源科技职业学院
中国食品 2022年20期
关键词:爬虫添加剂新闻报道

⊙ 文 林婕 江西新能源科技职业学院

近年来,食品安全问题屡见不鲜,如果蔬农药残留超标、食品过期或者添加剂超标等,导致人们对我国食品安全状况的信任度逐渐下降。为了保障人民群众“舌尖上的安全”,国家相关部门出台了《中华人民共和国食品安全法》《关于规范使用食品添加剂的指导意见》等法规与政策。虽然这些法规与政策在一定程度上保障了食品安全,但仍然有各种食品安全问题不时被曝光,这就需要监管部门引入更加先进的管理技术与方法,比如计算机技术,通过该技术,监管部门能有效获取食品相关信息,并对这些信息进行深入研究,为解决食品安全问题提供思路和方法。本文主要对计算机技术下食品安全信息的收集与处理进行了浅析。

一、计算机技术对于食品安全信息收集与处理的意义

随着中国经济的不断发展,餐饮行业、食品加工业都不断壮大,市场上出现了越来越多的食品种类,正是随着食品种类的多样化,越来越多的食品安全问题开始浮出水面,引起了广大消费者的关注。综合来看,食品安全问题的产生无非是源于商家的私心或者不严谨的生产程序。例如:有部分商家为了追求食品的美味以获得更多的利益,在生产过程中会违规添加食品添加剂;还有部分商家为了节省成本,采购不合格的食品原料,在不合规的条件下进行食品生产,所生产的食品多是“三无”产品。要知道,这些食品安全问题并非近几年才发生的,而是由于近年来随着互联网信息技术的不断发展,使得隐性问题逐渐显性化,人们才得以发现这些食品安全问题。在这种情况下,就需要借助计算机技术,不断加大对食品安全的监管。

有专业数据统计研究机构曾对世界数据总容量进行分析和预测,指出到2025年,全球数据的总容量将增长至175ZB,是当前总容量的3倍。与传统的信息传递方式相比,互联网的信息传递具有诸多优势和特点,如数据量大、实用性强、覆盖面广等,如果能利用互联网的优势和计算机功能,将数据的采集和处理与食品安全监督相联系,那么必然能够有效控制食品生产过程中的安全问题。

二、食品安全数据采集及处理方法研究

随着计算机技术的不断更新,食品安全数据的采集方式逐渐变得简单、详细,如网络爬虫技术,可以自动化方式启动程序从而下载网页,大大提升了食品安全信息采集的质量和效率。针对爬虫技术的采集功能,有众多研究者提出了相关观念。如国外研究者DeBra等人提出FishSearch算法,即引入文本相似度计算的方式对网络爬虫技术进行分析研究;Mccallum等人采用贝叶斯分类器的原理,对聚焦爬虫链接进行分类,并按照链接所呈现的重要程度对链接进行排序,在排序的基础上再次进行访问。国内研究者也针对爬虫技术进行了分析,如杨定忠、李勇、张翰驰、吴强强等,其中杨定忠等人提出了有关的体系结构,包括数据挖掘和web信息搜索;李勇等人提出了网络蜘蛛模型,并得出EPR算法;张翰驰等人借助爬虫技术对食品安全新闻进行了空间模型塑造,目的在于去除和食品安全主题联系度较少的无作用新闻;吴强强利用HTML代码,改善了正文抽取方法,并结合文字密度组合的方式进行。

在网络时代,食品安全信息的表现形式多样,要想深入把控食品安全问题的产生原因,必须明确具体的对象和来源,并从多个方面对其进行分析。在信息技术领域,依据信息的表现形式,可以分为多媒体信息、文字信息和超文本资料;依据结构形式可以划分为三种,分别是半结构化信息、非结构化信息和结构化信息。例如:互联网上的信息数据是以文本的形式呈现,所以属于非结构化的自由文本,是当前对食品安全问题的研究中所占文献频率最少的一部分,内容涵盖了专业检测机构结果、各媒体对有关食物安全性的报道以及政府部门印发的关于食品安全问题的法律法规。

在我国,食品安全问题每年在不同时期、不同地方都会发生,由于时间和地点的不确定性,这为食品生产和食品安全问题带来了较大的影响。若能直观地显示出食品安全的时间、地点等方面的特征,就可以更好地反映其时空规律,从而对食品安全问题防治工作提供一定的参考价值。由于有关资料是以中文的方式呈现,因此在进行文本数据的处理与解析时,必须结合NLP(自然语言处理)技术,而不能使用传统的资料分析方法。以数据的形式收集食品安全问题,具体方式包括文本筛选、数据预处理和信息抽取等,其中数据预处理是非常重要的一环,主要是通过爬虫对最初的文本信息进行数据信息去重、格式转换、数据集成和删除无用符号等操作。信息抽取是获取食品安全信息的重要技术,能够有效地对食品安全信息进行分析和筛选。

三、食品安全数据结构化处理及可视化方法

如果直接从计算机中获取食品安全数据,其格式会更加多样化,导致信息密度较低,不利于存储。为防止这些问题影响食品安全数据的收集和处理,下面从三种结构形式着手,对食品的安全性进行研究。这三种结构形式是食品检测公告、食品安全新闻报道和食品安全刑事判决文件。在对上述三种食品安全性结构形式进行分析的过程中,需要借助辅助手段,如ECharts(数据可视化),这样做有利于实现数据从抽象向具象的转换。

上述三种结构形式虽然都是关于食品安全问题,但是由于结构和内容的差异,在进行模型构造时需要结合三种结构形式的基本特征再进行结构化研究,从而做出相对应的模型。首先介绍食品检测公告。食品检测公告的结构包括标题正文和落款,是在生产商将食品生产和加工出来后,有关检测部门对这些食品进行抽样检测,最终将检测结果以文字的形式公布出来,让消费者明晰。在书写具体的食品检测公告时,公告书的题目应清晰,内容应简单明了,题目应包括本次食品检测的批次和目的,正文应包括食品检测结果、添加剂种类或含量、超标项目等内容,落款位置要写明检测时间和检测单位。其次介绍食品安全新闻报道。食品安全新闻报道,是以一种新闻的形式将食品安全问题公布出来,从而使消费者更加了解食品安全问题。从结构上看,食品安全新闻报道主要包括4个部分:导语、正文、结语和落款。报道食品安全问题,需要严格遵守新闻报道形式的规范性,例如先表明此新闻的由来,以及新闻报道的时间和发生事件的时间、地点,再用简单、直白的文字传达事件发生的内容和细节。最后介绍刑事案件的食品安全法律文件。从结构上看,刑事案件的食品安全法律文件包括标题、正文和结语,该文件是对食品安全问题的审判和进展进行详细的记录,内容包括涉案食品、企业、具体情况等。

通过介绍上述三种不同的文本可以得知,食品安全信息的传达方式比较多样化,且具有不同的表达要点。例如:食品检测公告将重点放在了食品安全问题的检测、是否添加违禁添加剂,以及添加剂之间是否有冲突作用等;食品安全新闻报道则是将食品安全问题这一情况转述给消费者,以曝光的形式呈现在消费者眼前。

本文以违法添加添加剂导致的食品安全问题为例,同时采用ECharts技术,介绍下食品安全信息的收集及处理方法。具体来说可以分为两个步骤:第一,抽取数据库中的食品检测公告数据,并利用有关技术将该数据转换为列表形式,以便调查和审视。第二,单独统计数据中的违法添加剂和食品的基本信息,将其放在独立的清单中显示出来,并将这些节点资料作为参数制定节点尺寸,从而更加明晰地观察食品中的违禁添加剂和食品的关系。通过对食品安全问题的相关资料进行收集,并对食品安全信息的特征加以研究,可以分析食品安全信息的评估标准,以此为基础对食品信息来源和调查目标进行进一步的分析,从而得出详细的结果。

综上,现如今,随着经济全球化发展,中国的经济有了明显的进步,在此情况下,人们对食品的需求也呈现出多样化的趋势。为顺应市场环境和消费者需求,商家们开始绞尽脑汁地生产多样化的产品,但由于有的生产商家一味追逐利益,导致出现了很多食品安全问题。为了加强食品安全管理,相关监管部门应该借助计算机技术,为食品安全监管寻求新的更加有效的管理方法,从而提高监管效率,保障人民群众“舌尖上的安全”。

猜你喜欢
爬虫添加剂新闻报道
利用网络爬虫技术验证房地产灰犀牛之说
基于Python的网络爬虫和反爬虫技术研究
“她时代”新闻报道中的“时代精神”呈现
基于Scrapy框架的分布式网络爬虫的研究与实现
被误解的食品添加剂
谁抢走了低价机票
湖南省饲料添加剂尧混合型饲料添加剂生产许可证企业名单
食品添加剂有多可怕?
会变魔术的添加剂
让新闻报道充满正能量——江西宜春“夺刀少年”报道的启示与思考