大数据时代智慧机场建设的策略研究

2021-09-10 23:06何俊
无线互联科技 2021年6期
关键词:数据分析大数据

何俊

摘 要:大数据作为计算机互联网技术发展的特征与产物,对人们的工作、生活和学习等各个方面影响日益显著。在智慧机场建设过程中,大数据为自动化运维带来海量数据,为航班正常性提升创造可能、为机场旅客提供个性化服务,但也面临着互联互通存在障碍、数据价值稀疏分布以及信息安全问题凸显的实际挑战。因此文章提出了建立统一层次架构数据平台,运用技术手段加强分析挖掘,多种措施并举保障网络安全。

关键词:大数据;智慧机场建设;数据分析

0 引言

民航局在《中国民航四型机场建设行动纲要(2020—2035年)》文件中指出,综合运用大数据、人工智能等新技术,收集、融合、统计和分析各类数据,最终实现机场智慧化运行。大数据从本质上看是一种超过普通计算机硬件和软件物理存储空间和运行计算能力的海量数据集合,由于其蕴含着人们生产生活进步的潜在知识和价值,对大数据的分析使用成为民航高质量发展和民航强国建设的重要组成部分。智慧机场建设作为实现未来“四型机场”的关键路径和重要支撑,要积极适应大数据所带来的时代机遇和应用挑战。

1 大数据时代智慧机场建设面临的机遇

1.1  为自动化运维带来海量数据

国际数据公司(IDC)在其《数据时代2025》白皮书指出,伴随着传统产业与移动互联网技术深度融合,传统产品不断数字化转型,数字经济不断崛起,核心数据、边缘数据、终端数据将快速增长,到2025年全球数据量预计达到175ZB,数据总量将会是现在的4倍以上。如果将这些数据存储至普通固态硬盘当中并首尾相连摆放,是地球赤道长的12倍多。在大数据时代中,纸质书籍通过扫描识别成为数据,交流谈话通过模数变换成为数据,秀美风光通过动态感应成为数据,当一切现象都被数据化并抓取后,大量数据就会被收集存储起来,供使用者进行分析挖掘[1]。对于智慧机场而言,候机楼温度和亮度传感信息的收集分析,有助于动态调节冷暖设备和照明设备的使用功率,在提升旅客舒适性的同时有效降低能耗;航空器离港进港数据和机场机位信息的挖掘处理,有利于平衡过夜机位资源,促使区域内机场机位合理设计规划。大数据倚靠海量抓取和分布存储提供了传统方式难以获取和收集的海量、客观、真实数据,为智慧机场高效、环保、精细的自动化运维奠定基础。

1.2 为航班正常性提升创造可能

数据有着显著的时效性特征,对于连续发生运动变化的事物,只有在最快的时间单位内进行解析,才能更好地利用其中难以挖掘的价值。大数据拥有对数据高速处理的独有能力,百度运用大数据技术,在1秒钟之内就能对全国人民       1 000万次的密集服务器请求进行处理,并保证手机APP应用和网站服务访问稳定流畅。2010—2019年,全国定期航班航线由1 880条增加至5 521条,年旅客吞吐量100万人次以上的运输机场由51个上涨至106个,但航班正常率仅从75.8%提高至81.65%,正常率相比稳定的公路运输和铁路运输仍具有一定差距。借助大数据对天气信息、空域流量、航空器位置、候机楼旅客人数等动态数据采取实时监控,利用相关关系分析建模,合理预测可能发生的延误情况,在关键时间节点进行主动预警。一方面可以让机场服务人员提前进行应急预案,预先采取应对措施,帮助减少大规模滞留旅客情形;另一方面也可以让航空公司及时应对,合理调配资源,降低因各种意外事件而导致航班延误的经济损失[2]。大数据高速分析数据的特性使得智慧机场提升航班正常性成为可能。

1.3 为机场旅客提供个性化服务

大数据万物皆可量化的特性使其内容包涵了人们浏览网页历史、餐厅消费记录、微博微信评论等,最难能可贵的是这些信息避免了传统问卷调查可能造成的主观影响,是人们内心所思所想、动态变化的真实写照。在大数据背景下,智慧机场“以体验为导向”的建设运营理念更容易得以实现,来源各异的旅客行为轨迹经过清洗和建模形成独一无二的“旅客画像”,从而进行有针对性服务内容推送。例如,对行李较少、时间紧促的旅客适当提早推送值机提醒,并在其到达候机楼时提示使用自助值機和通过快速安检通道的路线;对消费较高、时间宽松的商务旅客推荐专车接送、贵宾室候机服务;对空铁联程旅客则及时发送航班执行情况、铁路列车运行时刻和公共交通工具线路,帮助他们提前做出规划,实现绿色便捷出行。通过大数据收集分析和互联共享技术,机场部门、航空公司、商业实体、驻场单位等各个模块可以紧密联系,深度合作,实现“千人千面”的个性化服务,让旅客体验全面突破。

2 大数据时代智慧机场建设面临的挑战

2.1 互联互通存在障碍

当前机场部署运行了包括民航管理部门、本场部门、航空公司、驻场保障单位的协同决策、运行控制、离港航班等各种信息服务系统,每日收集处理着航班起降、货物转运、现场监控等纷繁复杂的大量数据。大数据加剧了不同数据格式、数据维度、数据类型的差异性,减少了同一平台进行数据加工分析的兼容性,降低了采用规模化集成化手段的可能性。同时,不同系统中提取、去重、转换的大数据清理流程和手段造成了质量各异的数据,这些信息定义不一、解释模糊,缺乏统一严格的数据标准,无法在多机器进行消息互联互通时保证其正确性、精准性和可信度,数据价值大大下降。此外,各方对数据资源的管理权、使用权和共享义务暂不明确,数据拥有者自成体系、各行为政,数据交换通道狭窄,边界效应明显,信息壁垒森严;数据使用者往往需要经历复杂漫长的申请审批流程才能获得原始内容,难以挖掘利用具有时效性的数据。

2.2 数据价值稀疏分布

一方面,随着人们对数据的认知不断更新和计算机软硬件设备不断迭代,来自航站楼的环境温度湿度感测,来自机坪的工作人员轨迹数据、和来自仓库物品分拣路径信息等AOBD精细化数据也被大数据自动化系统和多阵列硬盘所记录和存储,数据总量不断增大,数据厚度不断提升。这些数据状态不一、内容各异,包含的价值也不尽相同,有助于提升智慧机场建设的有效信息往往只是异构多态大数据的沧海一粟,需要运用算法进行分析挖掘。另一方面,集成网络架构和无人值守设备的大量投入虽然降低了机房烦琐人工运营成本,但让日常调试信息、设备告警提示、服务异常报告等冗余数据日积月累。同时,由于传统介质年久失修,部分记录了航班起降历史、设备性能状态、旅客出港记录的纸张和磁盘破损失效,经过量化后错误进一步增加,具有特定价值的数据比例持续降低。大数据时代数字信息价值密度稀疏,从数据提取出为特定目标精准的有效信息难度加大。

2.3 信息安全问题凸显

在旅客吞吐量迅猛增加的背景下,民航重要信息系统中的离港系统、安监系统、运维系统、广播系统等各种子系统均存储着海量高维度数据,这些数据内容不同、相互依赖、关系错综复杂,其中不免包含了旅客身份识别、个人消费习惯、机位调度信息、货运交互数据等大量重要信息。2017年  2月,纽约斯图尔特国际机场包含了电子邮件、政府文件和交易密码的750GB内部敏感数据被泄露至互联网上;2020年   1月,国航员工通过提取航班数据将部分明星的乘机信息、活动轨迹等私人信息发布至微博;2020年3月,旧金山国际机场的两个网站被黑客攻破,备用航线、机场运营、机场建设信息被不法人士获取。大数据背景下,越来越多的终端通过无线信号和电缆光纤连接至服务器上,设备“接入点”数量增加、范围扩大,传统的内外分开、风险隔离的边界防护被打破,一旦出现物理设备故障、信息系统被攻击、通信线路干扰等,都会使信息安全受到严重威胁,轻者会造成非正常航班增加、部分旅客信息泄露,重者会危及飞行安全甚至国家安全。

3 大数据时代智慧机场建设的策略

3.1 建立统一层次架构数据平台

应构建以机场为中心的统一智慧大数据处理应用平台,自上而下分为5个层级,其中包括具体应用层、门户界面层、支撑服务层、感知接入层和基础资源层。具体应用层为基于机场、航空公司的旅客服务、安全生产等业务需求而定制开发的各项服务应用;门户界面层给不同权限的平台应用人员和系统支撑人员提供管理接口界面,便于访问和检索多维度数据;支撑服务层承载平台收集清洗、变换分析、挖掘建模的大数据技术核心应用,同时运行面向事务消息和过程队列的中间件,提供资源管理、负载均衡、故障恢复等必要服务;感知接入层集合无线局域网、Bluetooth mesh、NB-IoT多途径通讯模块,为各种接入设备建立覆盖广阔、安全稳定、低延迟低功耗的数据传输通道;基础资源层包括客户端、服务器硬件设备资源,基础操作系统、分布式计算系统及环境配置等软件资源,以及结构化和非结构化存在的数据资源。同时还要综合实际业务需求、硬件设备计算能力和预留未来需要,制定标准化的数据采集、处理、储存的处理流程,规定数据在常用应用场景的语义解释,在平台内建立统一数据视图来减轻和消除数据差异,为大数据技术助力智慧机场建设奠定坚实基础。

3.2 运用技术手段加强分析挖掘

在智慧机场建设的过程中订座系统、地服系统、监控平台积累了数以万计的数据和信息,要运用大数据技术手段对其进行处理分析,使数据在交叉复用中发挥更大价值。对于设备运行数据,将服务器滚动日志、门禁动态数据、硬件告警事件等海量信息进行实时聚类分析,快速定位异常离群点,智能调度维护人員,提高管理效率,减少运维成本;同时采用相关关系分析,找到与系统故障出现高度关联的“标示值”,加强对特定数据的采集监控及管控,促使故障发生率降低。对于航班状态数据,借助决策树和随机森林算法,使飞行路线、机场服务、气象预报、交通管制数据流在清洗和转换后经个体学习和集成学习,建立航班预测模型,根据实际情况细化各个流程的阈值,在超过时间节点时主动实施响应措施,实现航班延误由“事后处理”到“事前干预”的转变。对于人员流动数据,一方面利用离港信息、位置定位、人脸数据的互联互通,实现候机楼旅客的全流程自助无纸化通关和便捷改签机票;另一方面可以使用逻辑回归把个人基本信息、航班日期时间、交通方式偏好、餐食饮用习惯等特征映射到向量空间,利用贝叶斯算法构建属于个人独一无二的“旅客画像”,借助画像标签推荐旅客采购当地特色产品,运用协同过滤将拥有相似特征旅客的出行工具、便捷通道、贵宾厅服务进行同步推送,采用自然语言处理分析微信微博中旅程评价的情感倾向,提供个性化服务,完善人性化措施。

3.3 多种措施并举保障网络安全

首先,要加强网络攻击检测和应对。在日常网络维护管理时需要进一步加固系统,及时更新软件版本、关闭危险端口、使用扫描工具进行安全巡检。同时,运用系统运行日志、监控状态记录、异常行为表现进行关联分析,建立攻击检测模型框架从而对APT攻击、DDoS洪泛攻击等针对大数据系统的常见网络攻击进行识别,以便形成快速响应特殊情况,最大程度减少损失。其次,要完善数据访问控制。大数据场景下,用户跨系统、跨安全域访问操作增多,信息流转、分析挖掘等处理流程烦琐,必须采取有效的访问控制手段确保数据免遭非法用户的读取与改写。基于属性的访问控制改变了以服务提供商为分配管理中心的常规模式,利用主体与客体之间的属性关系将访问结构与密文密钥高度关联,数据拥有者只需要通过修改访问结构即可实现灵活多变的权限管理[3]。它解决了面对庞大用户群体频繁访问服务器的问题,无须逐一分发属性密钥,实现了由“一对一”管理向“一对多”管理,有效降低计算开销和传输压力。最后,要确保数据服务隐私保护及关键信息脱敏。机场在进行数据共享和挖掘时不免涉及旅客个人身份、航空器位置、设备运行日志等隐私信息和关键信息,采用高效可靠的隐私保护与数据脱敏技术,为解决隐私泄露问题提供坚实保障。可以在信息交换分析时引入脱敏和k-匿名方法,对数据中可以定位到个人的标示符值进行保留格式加密或直接删除,对具有潜在风险的准标示符值运用泛化和压缩脱敏,再将全体数据归为若干个等价组,每个等价组最小包含k条数据,防止不法分子通过大数据链式攻击无法确定与特定用户相关的记录,保护个人隐私。

[参考文献]

[1][英]维克托·迈尔·舍恩伯格,肯尼思·库克耶.大数据时代[M].杭州:浙江人民出版社,2013.

[2]孙召利,董桂枝,吴艳,等.大数据在民航领域应用的初步研究[J].空运商务,2014(2):11-16,64.

[3]毋涛,张帆.云计算下基于属性的访问控制方法[J].计算机系统应用,2016(2):231-234.

(编辑 傅金睿)

猜你喜欢
数据分析大数据
新常态下集团公司内部审计工作研究
浅析大数据时代对企业营销模式的影响
基于读者到馆行为数据分析的高校图书馆服务优化建议
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究