位置大数据隐私保护研究

2021-05-31 07:41
中文信息 2021年3期
关键词:攻击者加密用户

(北京信息职业技术学院,北京 100081)

引言

21世纪是大数据的时代,它为人们带来的巨大的机遇与财富,各行各业通过对大数据进行分析及深挖,从中找到有用信息进而提高企业效益。但是在另一方面来看,用户个人数据的网络化、透明化成为不可阻挡的大趋势,如何对其隐私保护成为业内人士注重的问题。如果不能加以有效保护,用户在网络中留下的数据信息很可能被恶意利用,造成意外甚至是难以挽回的经济损失。

一、何为位置大数据

现阶段,传感器可以自动采集用户位置信息,其采集用户位置信息的能力(速度、规模等)发展迅速,远超当前系统的处理速度。在将来,随着移动传感设备的发展与通信技术的进步,位置信息产生的速度会更快,频率则更高,其均会为人们的日常生活及科学研究带来极大的便利,这类包含位置信息且具有规模大、产生速度快、蕴含价值高等特点且被普遍认可的数据被称为位置大数据。

二、大数据隐私概念与表示模型

隐私是指与本人相关的且在不经过本人的同意不可能在某些时间、某些地点以某种方式被公开,与一般的隐私定义有共同之处,大数据隐私是指用户对自己位置信息的掌握。在当今社会,企业与商家可以用各种各样的方式获取用户的位置信息,并且企业与商家可以利用位置信息得到用户的活动轨迹,利用活动轨迹可以对用户的家庭住址、生活习惯、健康状况及社会地位等进行初步推断。比如,可以依据用户出现在医院的时间段及次数可以推断用户是医院工作者还是身体出现了健康问题,进而对用户进行下一步的推销。

大数据隐私攻击模型有统一的标准描述对用户位置隐私信息的攻击效果,不同的攻击方法提供给攻击者的用户位置的数据量不同,攻击者得到用户的位置数据是需要用r(攻击者取得的用户的一条位置信息)、p(用户的位置数据)、t(收集到的用户位置信息所对应的时刻),因此攻击者可以根据采集到的位置数据推断用户在t时刻处于某个敏感位置的概率。

三、位置大数据隐私保护的关键技术

1.位置大数据加密方法设计

在对大数据加密的方法进行设计时,我们需要引入模糊加密理论。这个模糊理论包括两方面,一方面是对位置数据的空间模糊,另一个是对位置数据的时间模糊。位置数据的空间模糊是通过降低位置数据的精确度来对位置的空间数据进行模糊进而达到对用户数据进行隐私保护的目的,这种方法可以将用户的位置信息从一个点扩大到一片区域,使攻击者无法直接得到用户的具体位置信息。

图1 位置数据空间模糊示意图

图2 位置数据时间模糊示意图

a图表示某一时刻内A、B、C、D、E五个用户的空间位置信息,b图表示用户之间的空间关系。

用户如果想将黑色区域作为自身的模糊位置范围,需要在符合各项要求的前提下对用户的周围区域进行保护,进而对系统内的所有数据进行加密。针对本次设计的具体情况,进一步提高针对隐私保护的修正速度是重中之重。针对位置数据的模糊加密理论,他是通过对位置数据时域进行模糊,降低位置数据的精确度,进而加密位置数据。

在对用户位置数据定位与表示准确的情况下,利用位置数据的时间模糊加密理论与空间模糊加密理论选定位置数据信息的加密保护强度,假定用ε表示位置数据的隐私预算,对于用户的隐私保护,需要对用户的关联位置的数据集合进行集权化处理:

U代表大数据集,他的特点为具有位置特征,Qi表示最初位置信息的查看结果,S是范数距离,但是暂时不使用。

为避免位置数据时时刻刻在变化对加密的效果产生影响,在计算中加入一个位置数据的敏感系数Δβ和阈值N,若计算目录到达或超过敏感度阈值则停止计算,针对数据集进行调整。

综合以上所述,设计数据加密算法模型,可以得出最后加密系数为:

数据越近似加密系数越大,这表明对用户位置数据的隐私保护越好。

2.仿真试验与结果

在对本加密方法进行仿真时需要提供合适的仿真环境。在进行仿真时为保证实验的准确,需要进行对比实验。对用户的位置数据采用两种加密方法:传统加密方法与上文的隐私保护加密方法,在阈值确定时,分析两种方法对用户隐私信息的保护程度。本文方法的恶意数据拦截量为97.68%,而传统方法对恶意攻击数据的有效拦截量仅为85.91%。综上所述,本文的加密方法对用户的隐私保护效果更加理想。

结语

互联网在渗透进入人们生活的方方面面,因此对于用户的隐私保护问题更应该受到人们的重视,本文特针对这一问题设计了用户位置隐私保护加密方法,但是该方法仍然存在一些不足,希望在后续研究中可以针对这些不足加以改进。

猜你喜欢
攻击者加密用户
基于微分博弈的追逃问题最优策略设计
一种基于熵的混沌加密小波变换水印算法
正面迎接批判
关注用户
关注用户
关注用户
认证加密的研究进展
有限次重复博弈下的网络攻击行为研究
基于ECC加密的电子商务系统
如何获取一亿海外用户