元组_参考网

基于词嵌入的元组级数据溯源方法

注法的实现需要为元组保存完整的半环多项式(即标注),由于通过查询产生的元组依赖于先前查询的元组,导致半环多项式的数量大量增长,存在存储空间爆炸的问题。因此,国外学者Leybovich M等[4]提出基于词嵌入的元组级数据溯源方法,该方法有效避免存储数据标注。文中主要贡献如下:(1)在元组向量化编码机制的基础上给出属性重要性优化算法,解决词嵌入方法中溯源精确率低的问题。(2)引入近似最近邻搜索算法后又给出元组过滤优化策略,解决时间消耗长溯源效率低的问题。1 

计算机技术与发展 2023年12期2023-12-30

流数据实时接收方案的研究

同，逻辑上相同的元组可能具有不同的值，在数据进入数据仓库时，需要通过关联表进行统一，保证数据的一致性。为了更具体地理解这种半流连接关联更新操作，图1 展示了数据仓库中涉及该操作的一个例子。由于数据来源的不同或数据的延迟到达，系统中同一个id 可能具有不同的名称，在数据进入数据仓库之前，需要使用一张关系表将id 转换为系统内部的id，对不同的名称进行统一。图1 数据仓库关联更新示意在真实的数据仓库系统中，R保存在磁盘上，一般占用空间较大，无法全部放入内存；S

通信学报 2022年4期2022-04-29

嵌入式数据库SQLite上多版本并发控制的设计与实现

中，关系的每个元组都有多个版本（version），每个版本带有一个时间戳（timestamp），版本越新，其时间戳越大。MVCC 实现了并发事务之间的快照隔离（snapshot isolation），保证每个事务在读数据库时读到的是事务开始时的数据库实例（即快照）。因此，在支持MVCC 的RDBMS 中不存在读写冲突（read-write conflict），即当一个写事务和一个读事务并发执行时，读事务会读取它应该读的数据库版本，写事务会写入新版本的元组

计算机应用 2022年1期2022-02-26

Top-k近似否定约束的发现

级约束指只对单个元组或者单个字段有约束，比如域约束、检查约束等；表级约束指定义在两个元组间的多个字段的约束，常见有函数依赖、条件函数依赖、次序依赖和差分依赖等。在现实中，字段级约束与表级约束可以同时存在于同一个数据中，且数据间的关系不仅仅有等于或者不等，还有着大于、小于的次序关系。否定约束[1]是一个表达能力极强的数据依赖的形式，它满足了以上的需求。常见的域约束、主键约束、函数依赖、条件函数依赖和次序依赖等都可以转为相应的否定约束形式。在数据约束的相关工作

计算机应用与软件 2021年12期2021-12-14

带有可信度标记的增量式数据修复方法研究

组成，分别表示为元组编号、员工编号、办公室电话、办公室、所在部门。其中，Employee：D0是由若干空值和正确数据组成的原始数据集。在员工信息管理的过程中，由于人员的调动、办公室的迁移等产生了信息的更新，这些更新处理存放在操作日志（operator log）中，D0在经过了七步操作之后形成了Employee：D7，如图1所示。图1 中的φ1为数据集D7上的函数依赖，表示办公室电话唯一决定办公室的值，用于检测D7的一致性。D7中的元组t1～t4违反了该约束

计算机与生活 2021年10期2021-10-12

关系代数在数据库实验教学的实践研究

自同一个域，t是元组变量，t∈R表示t是R的一个元组。（1）并运算：将R与S合并，并且去掉重复元组后所构成的一个关系。例1：将Stud与Other合并成SU关系，关系代数运算表达式为：关系运算的结果如表5所示。因为Other关系中的“714002”“714004”所对应的元组已经存在于Stud关系中，所以合并后的关系只保留了一份。表5 并运算后的SU关系表6 交运算后的SN关系（2）交运算：由既属于R又属于S的元组组成的新关系。例2：将Stud与Other

现代计算机 2021年18期2021-08-06

面向高速乱序流的top-k连续查询方法

区用来缓存到达的元组，缓冲区内的数据最多等待K个时间单位，然后被提交至查询处理模块进行查询。MP-K-slack方法[2]是基于流元组延迟的动态变化来不断调整K值，如果延迟不断增大，会使数据越积越多，导致查询时延的上升和查询吞吐量的下降。AQ-K-slack方法[3]以用户给定的结果精度为目标，通过聚合函数与窗口覆盖率的定值关系，动态调整K值大小。但由于top-k查询这类聚合函数过于复杂，会造成AQ-K-slack方法难以实施。另外，基于缓存的方法大多会对

郑州大学学报（理学版） 2021年3期2021-07-26

时态数据质量规则的研究及检测

于R中的任意两条元组ti和tj，若ti[X]=tj[X]，则必有ti[Y]=tj[Y].依照该规则，不难发现表1中存在不一致数据.例1.表1中，关系模式Accident(ID，TeaID，TeaName，Level，Title，AccidentType，Salary，VT)由8个属性组成，分别表示为元组编号、教师编号、教师名、等级、职称、教学事故类型、工资和发生教学事故的有效时间.表1 教学事故信息表(Accident)Table 1 Teaching a

小型微型计算机系统 2021年7期2021-07-08

Python核心语法

表以及和它相似的元组。一、列表1. 列表的定义：我们可以把列表当作一种容器，用它来存放数据。可以在其中存放相同类型的数据，也可以存放不同类型的数据，但是为了提高程序的可读性，建议在一个列表中存放同一种数据类型（图1）。2. 數值列表的创建（list（）函数）：当我们需要创建拥有一定数值的列表，而又不想手动输入时，可以用list（）函数嵌套range（）函数直接进行创建。但是需要注意range（）函数中遵循左闭右开的规则（图2）。3. 删除列表：可以用del

电脑报 2021年14期2021-06-28

Witt代数的r元组交换簇

李代数 g 的r元组交换簇Cr(g) 是 g 中所有互相交换的r元组的集合, 即则Cr(g) 是 gr的闭子簇. 当 c harF=0 , g 是简约李代数, 且r=2 时, Richardson[1]证明了C2(g) 是不可约簇. 此结论被Levi[2]推广到了素特征域上简约李代数的情形. 对于一般线性李代数 g ln, Gerstenhaber[3]证明了当n≥4 且r≥5 时,Cr(gln) 是可约的. 进一步, Kirillov和Neretin[4

华东师范大学学报（自然科学版） 2021年3期2021-06-03

基于约束聚类的k-匿名隐私保护方法

个簇至少包含k个元组，以满足生成k-匿名等价类，并要求簇内间距总和最小。基于聚类的k-匿名问题的最优解是划分完成后的等价类集合E={e1,e2,…,em} 满足以下条件：(1)∀i≠j∈{1,2,…,m},ei∩ej=∅;(2)∪i=1,2,…,mei=T;(3)∀ei∈E,|ei|≥k;1.2 距离度量函数在聚类算法中，定义距离函数用来度量数据之间的相似度是衡量聚类结果的关键因素。由于准标识符属性中包含数值型数据、二元型数据和分类型数据3种不同的数据类型

计算机工程与设计 2021年3期2021-03-23

基于区块链的物联网大坝监测系统架构①

收到了发票中所有元组的付款.无人机云:由一组无人机小云组成,并与无人机代理进行交互.无人机云可以通过添加更多无人机提供商来提供可伸缩性,并且可以为许多应用程序提供服务.每个小云均由提供商控制,并由一组基站(BS),一组维护中心和一组无人机(例如四旋翼飞机)组成.无人机从CP 收集数据并将其传输给提供商.无人机作用有:(1)接收和存储请求:它从DMC 接收请求,然后将其存储以供以后验证;(2)选择将要处理请求的无人机提供商;(3)发票的产生:它创建一个发票,

计算机系统应用 2021年2期2021-02-23

一种基于特征的LED晶元自动定位与检测方法

的特征,确定将晶元组上的铜柱作为特征,选取的特征少,计算速度快。首先用阈值分割和边缘查找的方法提取这些特征的位置;然后利用晶元组和特征的几何关系,实现晶元组的定位;再利用晶元在晶元组中的几何位置和图像分割技术实现晶元的提取和检测。检测完毕后,利用晶元组的定位关系,实现整个图像的拼接,显示全部晶元组和各个晶元的检测结果,方便最后人工复核。1 晶元图像的特征分析我们要检测的是一整板零件,每个底板包括多个晶元组,每个晶元组上又焊接了多个晶元。典型的零件如图1,该

中国计量大学学报 2020年4期2021-01-28

基于语义相似性的选择题自动生成优化方法

方法是基于本体的元组，利用简单的SPARQL查询模板来生成问题。对于已生成的问题需要进一步进行筛选，否则问题的数量过于庞大、问题不具有代表性，不适合用于测试特定领域的知识。干扰项生成模块用于生成选择题的干扰项，使用可能答案减去正确选项的方法生成干扰项，选择题的质量难以保证，难易程度无法估计。通过计算干扰项与正确选项之间的相似性，进一步选择干扰项，可以控制选择题的质量以及难易程度。为了解决上述问题，生成高质量的选择题题库，应用基于图的最小顶点覆盖问题的相似性

计算机与数字工程 2020年12期2021-01-19

基于参数化排序的不确定Top-k查询算法

有最大概率的k个元组，U-kRanks[7]返回k个元组的列表，使得第i个排名的元组在所有的可能世界中具有最高的聚合概率.而这两种查询算法，由于缺少相应的剪枝方法从而增加了需要搜索的可能世界实例的数量，所以导致了效率低下.而PT-k查询返回的是所有可能世界中Top-k概率不低于给定概率阈值的元组集合，使得在不展开可能世界的前提下，提高算法的性能.参数化排序中的E-score[8]查询语义返回数据概率和属性分值乘积最大的前k个数据，由于缺少相应的剪枝方法，E

江苏大学学报（自然科学版） 2020年6期2020-11-23

PSP：一种高效的偏序域上skyline 查询处理方法

NL 算法对待测元组建立临时表，通过将每个待测元组与表内元组比较来进行轮廓查询，因此BNL 算法性能受主内存大小的限制；D&C 算法是将数据集划分为多个分区，在每个分区内进行查询，计算出局部的skyline 点，再将得到的结果进行合并，然后对合并的结果再进行查询来得到最终结果.这两种算法都会产生多次迭代，查询效率较低.之后，Chomicki 等[6]提出了SFS 算法，该算法是在BNL 的基础上对数据按单调函数进行预排序，然后再进行skyline 查询，减

湖南大学学报（自然科学版） 2020年8期2020-09-06

针对隐藏Web数据库的Skyline查询方法研究*

的Skyline元组可以支持众多基于Web的第三方应用，比如在Web信息集成中，通过获取多个隐藏Web 数据库的Skyline 元组，可以有效地解决满足用户偏好的top-k查询和推荐问题。通过top-k查询接口来获取服务器端“隐藏”数据库的Skyline 面临着诸多挑战，其中主要包括：（1）受top-k查询限制，每次查询结果最多返回满足条件的k个元组；（2）用户选择的查询条件受到Web接口类型和属性类型的限制；（3）用户端查询次数受到Web服务器的限制等。

计算机与生活 2020年8期2020-08-12

QJoin：质量驱动的乱序数据流连接处理技术*

分析处理系统的流元组，si.v表示该流元组的值，si.ts表示该流元组的产生时间，称为该流元组的时间戳。对数据流的分析处理，通常是基于流元组的时间戳语义进行的。例如，手机导航跟踪用户移动设备地理位置数据流，就是基于时间顺序的最新元组信息，给用户实时推荐行进的路线。但是，由于网络延迟、处理器的并行操作或是异步数据流合并等原因[4]，使得数据流上流元组不能按其时间戳的先后顺序到达后端分析处理系统，导致数据流出现乱序现象。例如在高速公路上，当手机导航上传数据中心

广西科学 2020年3期2020-08-02

基于身份的两方跨域认证密钥协商协议

列表LH2中加入元组Corrupt(ID*)A发送一个身份ID*给C，C查询列表LH1。如果ID*在列表LH1中,则返回d*作为回答。如果ID*不在列表LH1，C先进行H1(ID*,R*)查询并获得d*，然后返回d*作为回答。当ID*=IDI，则返回⊥作为回答。①如果T=⊥,若IDi∈PKGA,C在列表LH1中找到元组(IDi,Ri,di,hi)，在列表LE中找到元组(IDi,ti,Ti)，返回(Ti,Ri,PpubA)作为回答。②如果T=(Ti,Ri,P

贵州师范大学学报（自然科学版） 2020年2期2020-03-18

拟态通用运行环境的资源管理与调度技术

序的异构执行体N元组表及全局映像按需调度具有异构性和负载均衡的N元组,包括运行节点、云容器和虚拟机。图4为拟态资源调度功能模块及交互示意图,反映了拟态资源调度(拟态资源调度初始化、拟态资源对象调度服务)两个部分的交互和功能。图4 拟态资源调度功能模块及交互示意图Fig.4 Mimic resource scheduling function module and interaction diagram4.4 拟态资源调度初始化图5为拟态资源异构执行N元组的

计算机工程 2020年2期2020-02-19

一种基于时间戳的简单表缩减算法∗

一种可以动态维持元组集有效部分的算法.STR 使用一种简单的数据结构sparse set[3,4]表示元组的序号,具有增量维持元组集的有效部分以及单位时间的回溯代价的性质.STR2[5]对STR 提出两点改进:(1)只对相邻两次调用中元组对应变量论域发生改变的位置检测有效性,实现了增量检测元组有效性;(2)当变量中所有值均找到支持时,停止为该变量查找支持,避免了无用的支持查找.STR3[6]类似GAC4 是路径最优的,通过查询dual table,找到并删

软件学报 2019年11期2019-12-11

一种改进的回溯试探组卷算法*

xn）是一个n 元组，其中si是xi的定义域，且|si|有限［12］；定义2：定义一个约束集D={di| i=1，2，……，m}，其中，di是对xi的一个约束［13］；定理1：如果状态空间E 中存在一个n 元组满足D 的全部约束，称该n 元组为问题Q 的一个解。定理2：如果一个i 元组（x1，x2，……，xi）满足约束集D 中仅涉及到x1，x2……，xi的约束，那么对于任意j 元组（x1，x2，……，xj）也满足约束集D 中仅涉及到x1，x2，……，xj的

火力与指挥控制 2019年9期2019-11-06

海量数据上有效的top-kSkyline查询算法*

查询返回不被其他元组支配的所有元组。确切地说，元组t1支配元组t2，如果t1的所有Skyline准则中的属性值都不大于t2的对应属性值，并且在其中至少一个属性上，t1在该属性值小于t2在该属性值。Skyline查询的优点在于，它不需要特定的评分函数，并且不受维度之间不同标度的影响。由于其实际应用的重要性，Skyline查询已经引起了研究人员的广泛关注。人们提出了一系列的算法来处理Skyline查询[1-8]。不同于top-k等返回固定数量结果的查询，Sky

计算机与生活 2019年5期2019-07-18

基于功能结构元组的技术文档的特征提取研究

始聚集于基于语义元组模型的文档结构特征提取。一些研究中以SAO(subject-action-object)[3]或AO(action-object)[4]结构表达功能信息。这种结构可以使用文本挖掘技术提取。目前，大量研究采用了自然语言处理技术(NLP)进行文本包含功能结构元组(SAO,AO)的挖掘，并对提取的功能结构元组进行了广泛应用。如基于(SAO)结构专利挖掘开发的半自动构建客户作业图的方法[5]，通过功能结构元组挖掘识别专利技术发展趋势和新兴技术[

计算机技术与发展 2019年5期2019-05-17

DR-RDC:基于校准否定约束集的数据修复方法

该方法只考虑错误元组对函数依赖置信度的影响,根据置信度的大小来判断函数依赖对数据集的符合程度,并未涉及函数依赖之间的冲突检测.文献[12]通过扩展阿姆斯壮定理,开发规则推理系统来分析条件函数依赖之间存在的冲突及其对数据集的符合程度.该方法认为,如果元组与条件函数依赖中的常量相匹配,则支持该条件函数依赖,但否定约束中可能不含常量,所以该方法不适合否定约束之间的冲突检测.综上,我们提出了基于校准否定约束集的数据修复方法,DR-RDC(Data Repair A

小型微型计算机系统 2019年5期2019-05-10

两两比较模型的Why-not问题解释及排序∗

整的?为什么这个元组没有出现在查询的结果集?由于在用户得到结果之前需要对数据进行较多步骤的计算,所以这种问题的答案较难寻找.数据起源,或者可以叫做一段数据的历史信息,曾经被用于研究解释数据从哪里来[1-3]和在原始数据变成结果集的过程中都发生了什么[4-7].对于这些信息的整合,可以帮助我们理解为什么某些元组并没有出现在结果集中[4,7,8].数据起源在这些工作中可以帮助人们解释一些结果集中非正常的结果.对于数据库用户,一个常见的场景是这些编程人员被问为什

软件学报 2019年3期2019-04-18

Mixly开源项目设计28：秒懂74HC595移位寄存器（三）

一次只能送一个位元组（概念请参考下面的注释），所以程序4，我们只用了一个shiftOut模塊，因此也只能向移位寄存器里送一个位元组，从结果来看，送往移位寄存器的位元组只能是从二进制最低位开始的8位。注：位元组一般指字节，字节（Byte）是计算机信息技术用于计量存储容量的一种计量单位，通常情况下一字节等于有8位。（这是来自百度百科的解释）位元组是计算机的一个记忆单元。位元是电脑最小的记忆单元，一个位元只能储存0或1的资料，将8个位元组合起来称为位元组。（这是

中国信息技术教育 2018年21期2018-11-23

不确定数据的有效查询处理评估技术研究

，把不确定关系中元组分为不相容元组和相互独立元组，有效的评估哪线查询是线性时间内可计算，哪些是不可计算的。在表 1 Productp、表 2 Order、表 3 Buyerp三个关系中，其中右上角的p表示表1、表3为不确定关系，表1 Productp中name属性为确定属性，memory和color两个属性为不确定属性，第1个元组表示产品iphone 6s plus在上取值为的概率为p1=0.21，取值为的概率为 p2=0.19，p1+p2=0.4。 ip

铜陵职业技术学院学报 2018年3期2018-10-26

用于重复充电运营记录的基于块采样的高效聚集查询算法

示相同实体的重复元组。文献［1－2］概述了近年来实体识别问题的研究现状及成果，文献［3］研究如何提升实体识别的效率，文献［4－6］研究了复杂数据上的实体识别技术，文献［7－8］致力于提升实体识别准确性。这些方法将实体识别作为线下预处理过程用来清洗整个数据集，找出全部的同一实体。然而，随着数据规模的不断增大，这种高计算复杂性的线下清洗模式已经很难满足实时性分析应用的需求。文献［9－17］研究了多种渐进式实体识别方法，旨在通过部分清洗过的数据给出较好的查询结果

计算机应用 2018年6期2018-08-28

数据库中不等式查询语句的resilience计算

思想，分析表中的元组对某个查询结果的因果关系。在查询中，如果某些数据库元组被删除，将会对查询结果产生较大影响。resilience[5]是一个将因果关系与数据库SQL查询结合研究的典型应用，根据resilience的定义，在查询中若删除最小个数的元组，查询将不成立时，此最小元组集合即为resilience解。通过resilience的量化描述，人们可以更充分地理解查询语句的因果性质，以及更好地知道在查询中哪些元组是对查询成立起决定性作用的元组，透过表象的数

计算机应用 2018年7期2018-08-27

基于减少检索的负表约束优化算法

种去除遍历不相关元组的方式, 达到减少遍历次数, 最终提高检索效率的效果[5]. STR3算法基于该方法, 实现了对STR和STR2算法的优化[6], 但STR3算法不能直接运用到负表中, 当约束中支持元组过于庞大时, 其处理元组依然很多. 因此, 受STR3算法的启发, 本文提出了一种负表约束算法STRN3, 对STR-N算法进行优化.在STRN3算法中, 如何准确、 高效、 快速地寻找值支持的方式成为其最大的难点, 在直接对负表约束进行处理的算法STR

吉林大学学报（理学版） 2018年2期2018-03-29

基于启发式搜索代价的多查询结果分类方法

能具有大量的结果元组，而另外一些目录下可能就具有少量的结果元组。为了解决信息过载问题，本文提出一种对查询结果进行分类的方法。该方法根据元组内容对元组聚类，然后在查询结果集上生成一个带标签的分类树。该分类树是在查询进行过程中生成的，所以不会出现预分类问题。该方法通过鉴定分类空间开始，然后开发一个探测模型，这样用户可以跟着导航层次结构进行逐步细化查询。1 相关工作解决Web数据库信息过载的2种方法是对查询结果进行排序和分类。目前已经有大量工作对查询结果排序方法

辽宁工业大学学报(自然科学版) 2017年2期2017-10-13

使用C# 7元组语言特性优化数据驱动软件研究

简单灵活的轻量级元组类型。分析了元组的几个典型应用场景，并给出了具体示例，包括多变量初始化、多变量赋值、多变量互换、封装函数返回的多变量、作为中间层的数据容器、用于LINQ select表达式获得语义信息，以及利用析构（deconstructing）实现对象到元组的自动转换等。实践表明，元组适合数据驱动领域开发，提高了生产效率，达到了动态语言效果。对C# 7 tuple存在的缺陷，如deconstructing的非对称性、赋值的非传递性和可变性（mutab

软件导刊 2017年9期2017-09-29

浅谈数据库安全与隐私保护

据库中执行的许多元组签名。在数据库中做委托给DSP，多组控制的签名也交给DSP。让Dreq是元组的可靠来源的综合测试，使用合适的沟通方式，使其高效的公钥Dreq。在Dreq的DSP中，DSP不返回查询，只在搜索结果的要求，但也会返回所有结果的元组控制签名，所以Dreq可以使用签名的验证分析，是否返回的元组接受。如果验证失败，则意味着可以修改，而不能识别元组Dreq。3.2 基于挑战-响应模式的方法在网络中，非集中和复杂的环境中，DSP可以实现被公众怀疑查询

中国高新技术企业 2017年4期2017-05-06

TMS:一种新的海量数据多维选择Top-k查询算法

分，每一个分片的元组以面向列的模式存储，并且度量属性的列表根据其属性值降序排列.给定多维选择条件，TMS算法利用选择属性网格确定相关网格单元，有效减少需要读取的元组数量，提出双排序方法执行多维选择的渐进评价，并提出有效剪切操作来剪切不满足多维选择条件和分数要求的候选元组.实验结果表明：TMS算法性能优于现有算法.TMS算法;有序列表;选择属性网格;渐进选择评价;剪切操作在许多应用中，Top-k是一种十分重要的查询类型，它在潜在的巨大数据空间中返回用户感兴趣

计算机研究与发展 2017年3期2017-04-20

基于游标的元组重构应用研究

00)基于游标的元组重构应用研究许俊(四川职业技术学院计算机科学系，四川遂宁629000)抽取数据库关系模式的多个元组的多个属性值进行重构，得到单个元组单一属性的实体表示.本文以三个模式为实例，详细分析了这类关系模式的结构，设计元组重构算法，并基于游标方案实现.数据库；元组；重构；游标1　关系模式设计及需求关系模式Student、Course、ChooseCourse的设计如下：Student表设计Course表ChooseCourse表三个模式的关系图如

四川职业技术学院学报 2016年4期2016-12-16

概率数据库中元组间关系的表示

1）概率数据库中元组间关系的表示张美茹（常州铁道高等职业技术学校 轨道交通系，江苏 常州 213011）文章从介绍概率数据库的概念入手，分析了在实际应用中为了更灵活地操作关系中的元组，在原来的概率数据库基础上增加对元组之间存在的关系操作的必要性。文章提出在概率数据库中表示元组间存在的各种关系的方法，并且对这种改进进行了可行性分析。概率数据库；元组；关系表示；模型1 概率数据库的概念传统的关系数据库处理的是确定的精确的数据，对不确定的非精确数据无能为力，描述

无线互联科技 2016年21期2016-12-10

一个高效可完全模拟的n取1茫然传输协议

2.2 批量DH元组的知识的零知识证明给定一个q阶群G，其生成元是g,h，且q为素数.我们说群G上的一个四元组(g,h,u,v)是一个DH元组，当且仅当存在一个值w满足u=gw且v=hw；反之，则称该元组为非DH元组.DH元组知识的零知识证明旨在证明给定一个元组是DH元组，换言之，即证明关系RDH={(G,q,g0,g1,h0,h1)},其中，G，q如上所述；g0,g1是生成元，且存在一个证据w满足h0=(g0)w,h1=(g1)w.上述单一DH元组知识的

计算机研究与发展 2016年11期2016-11-25

基于聚类分析的数据流隐私保护算法

为，且新数据流中元组的输出时延不超过δ）定义1：匿名数据流，设数据流的属性序列为(pid,a,a,…,a,q,q,…,q,ts)，其中pid为用户身份标识，q,q,…,q为准标识符属性，a,a,…,a为其他属性，为元组到达时刻，为由生成的匿名数据流，其中属性id和被隐去，映射,若满足：1）对任意t∈,存在与对应；2）对任意，|DP(EQ)|≥,EP=·q·q,i=1,…,n},DP(EQ)为EQ（t'）中元组对应的pid属性不同的用户组成的集合，则称为匿名

重庆三峡学院学报 2016年3期2016-10-14

高效可证明安全的无证书代理签名方案*

：最后攻击者输出元组(mw,A,PKA,θ)或(m,mw,A,PKA,B,PKB,σ)作为它的伪造。若能满足下列情况之一，说攻击者赢得了这个游戏。情况1元组(mw,A,PKA,θ)满足：（1）(params,mw,A,PKA,θ)是有效的部分代理钥；（2）若攻击者为α1，不曾询问原始签名人A的部分私钥，若攻击者为α2，不曾询问A的秘密值；（3）(mw,A,PKA)没有进行过部分代理钥询问。情况2元组(m,mw,A,PKA,B,PKB,σ)满足：（1）(pa

计算机与生活 2016年9期2016-09-20

大数据集成中确定数据准确属性值的WR方法

在数据库中的不同元组确定其准确属性值．最新的R－topK方法在数据上实施人工设计的规则确定属性值间的准确程度，得到了相对准确的属性值．然而这种方法在处理多个可能的准确值或设计的规则存在冲突等情况下需要较多人工交互．为此提出基于权重规则的WR（weighted－rule）方法确定大数据集成中数据的准确属性值．该方法为属性值间准确程度的判断规则扩充了权重，在准确值发生冲突时避免了R－topK方法中人工交互干预．基于追逐过程设计了约束条件推理算法，并证明它能够在

计算机研究与发展 2016年2期2016-07-31

面向数据融合的半环溯源计算方法

止，通过分析结果元组的半环多项式溯源的特点，证明这2种近似算法最坏可在n次迭代后终止．最后，通过实验说明了本文提出的方法是可行和有效的．数据融合；半环溯源；多项式系统；派生树；递归查询随着网络的飞速发展，Web技术以其广泛性、交互性、快捷性和开放性等特点迅速风靡全球，并且已经渗入到社会的各个领域，网站及网页数量正以指数级飞速增长．如何准确、有效地集成海量高价值的Web信息，对于诸如市场情报分析、舆情分析、商业智能等分析型应用尤为重要，具有非常重要的应用价值

计算机研究与发展 2016年2期2016-07-31

条件函数依赖的增量计算

s，而且针对插入元组采用增量方法计算FDs，但基于删除元组采用非增量方法计算FDs。文献［8］介绍了CFDs在违例元组的增量检测方面的应用，即在CFDs集保持不变的情况下，针对插入、删除、修改元组增量检查是否有违例元组出现。本文主要创新点如下：①基于非增量计算算法CTane，针对数据表的增加、删除、修改元组等不同操作，分别分析了在相应情况下CFDs变化规律；②提出了增量计算CFDs算法CTane-IncProc，且分析并验证了此算法的正确性与高效性。该研究

系统工程与电子技术 2015年11期2015-06-05

k匿名数据上的聚集查询及其性质＊－

年，文献［6］对元组间有约束的不确定数据OLAP进行了研究，基于元组间约束，构造约束超图，提出了新的扩展数据库分配策略。文献［5］给出了计算扩展数据库更加有效的分配策略。针对不确定数据的OLAP查询，研究者的技术路线是将不确定数据库展开成可能世界，然后为可能世界中的元组进行概率分配，将已经分配的可能世界合并得到扩展数据库，在扩展数据库上执行OLAP查询。其中概率分配算法是指数级时间复杂度，虽然文献［6］对算法进行了优化，但仍然是指数级的时间复杂度，查询的时

计算机工程与科学 2014年1期2014-09-05

基于集合运算的房屋共有建筑面积普适分摊模型研究

相同、确定的建筑元组之间的服务关系，从建筑元组之间的联系中确定共有建筑面积的分摊去向，依文献[1]规定的共有建筑面积处理原则，实施共有建筑面积分摊处理，进而得出房屋相关建筑元组分摊所得面积和分户建筑面积的数值处理工作。建筑元组包括共有建筑元组和分户建筑元组。建筑元组由确定的相关建筑元构成。建筑元是指建筑面积最小计算单元，包括共有建筑元和分户建筑元。共有建筑面积分摊处理是房产测量中重要的数值处理环节，共有建筑面积分摊模型是房产测量不可或缺的数值处理工具。房屋

测绘通报 2014年3期2014-08-16

实时数据仓库中一种改进的数据流更新算法

,合理调度了实时元组和准实时元组的执行。文献[11]提出一种支持服务质量的更新和查询的调度算法,实现了更新和查询的实时调度。虽然MESHJOIN算法能有效地分摊快速的输入流带来的磁盘I/O开销,但它不能适应实际应用中的一般特征,比如在许多市场上少数产品具有较高的购买频率[12]。本文针对实际中常见的数据偏斜分布情况,提出一种改进的数据流更新算法:扩展混合连接算法(EH-JOIN)。EH-JOIN的关键特征是将存储在磁盘的关系集使用最多的部分存在内存中,使其

计算机工程 2014年10期2014-06-07

基于差异化聚类的分级隐私保护数据发布方法

出每个簇中的敏感元组的分布应该接近于该属性的全局分布.杨晓春[5]等在2008年提出了多维桶模型，并设计了三种优先算法来解决了非单一敏感属性隐私泄露等相关问题.Tiancheng Li[6]在2012年初提出了Slicing模型，其没有明确区分准标识符属性和敏感属性，而是依据属性之间的关系先行切片，切片内属性间关系保持，切片外属性间关系打乱，通过这种方式来处理隐私保护数据发布.以上的这些模型在一定的领域或范围内也取得了良好的使用效果.本文提出的方法是通过分

海南师范大学学报（自然科学版） 2014年1期2014-03-22

关系数据库对象级别检索结果相关性排序算法研究

点针对关系数据库元组检索、对象构建以及相关性评估等，对相关性排序算法的实现进行了简要说明。1 关系数据库分析关系数据库是一种应用数学集合概念的数据库模型，并且用集合的方法来处理数据库中的数据。从构成结构上看，可以将关系数据库看成是一个具备描述性功能的表格，在这个表格中每一列代表一种数据种类，而每一行则包含着这类数据的唯一实体，总结起来关系数据库就是由数据实体集合而构成的一个应用领域。与网络相比关系数据库有其独特之处：（1）关系数据库中由数据实体组成的元组之

河北水利电力学院学报 2014年4期2014-03-13

数字图书馆联盟中概率数据集成系统上的top-k查询

这样结果中的每个元组都会具有不同的概率，我们可以采用 top-k算法来获得最近似的k个结果。在一个DLF中，最终用户会希望获得结果中最符合其偏好且概率最高的结果。这样，在传统的 top-k算法中，需要同时考虑依据偏好形成的得分函数与概率直接的关系。1 数字图书馆联盟DLF的概率的信息集成模型Lenzerini 等[3]提出了一种数据集成的理论模型，基于该模型，本文定义了概率性的数据集成模型，其形式化描述如下：一个数据集成系统Δ 是一个四元组，其中G是全局

网络安全技术与应用 2014年4期2014-02-27

基于MHBT的数据库隔离与恢复模型

改[4]，对单独元组的属性值建立MHT，从而在验证时能够精确到数据元组，提升了验证精度和效率。Pang H 等人从查询结果的完整性和可靠性两个方面对文献[3]中提出的方法作了实验性验证[5]，内容涵盖了查询、查询投影、多点查询等数据库常用服务功能，并从通信代价、数据库升级代价等角度对模型进行了量化分析，具有很强的现实意义。以上基于MHT的方法都是建立在第三方（外包）数据库服务方静态环境条件下（许多是基于理想化模型条件），解决的问题为数据库查询的正确性和完整

网络安全技术与应用 2013年10期2013-10-17

面向数据流处理的元组跟踪方法

节点的算子相同的元组。也就是说，当主节点的算子出现故障时，可以使用这个备份节点的算子替换它。这种容错技术会带来较高的开销，其中主要的开销是保存副本的空间开销，因为它们在数据处理的大部分时间中并没有被利用。此外，元组必须发送到多个节点，这也会带来额外的时间开销。最后，备份节点的算子必须和主节点的算子保持相同的元组处理顺序，这会产生额外的时间开销。此外，当主节点出现故障时，主动备份技术需要把主节点的输出流切换到备份节点，因此故障恢复的时间也较长。被动备份技术把

电信科学 2013年10期2013-08-10

基于敏感元组的聚类匿名数据发布

刘 海﻿基于敏感元组的聚类匿名数据发布刘 海*(浙江金融职业学院 经营管理系, 浙江 杭州, 310018)在数据发布的过程中, 为了保护个人隐私常需对所有准标识符进行泛化操作, 而实际涉及到个人隐私相关敏感属性元组是非常少的. 据此, 从这些涉及个人隐私的敏感属性的元组出发, 将剩余大量仅涉及非敏感属性元组依据敏感属性值不同进行分组, 最后对分组中元组以计算与个人隐私属性相关敏感属性距离的方式, 选取距离最短的元组进行泛化, 其余元组并不进行泛化, 通过

湖南文理学院学报(自然科学版) 2013年4期2013-05-13

关系代数中除法运算相交算法的探讨*

。其结果由 R中元组到唯一于R的属性名字(就是说只在R表头中而不在S表头中的属性)的限制构成，并且它们与S中的元组的所有组合都存在于 R中［1］。在关系运算中，除法运算可理解为笛卡尔积的逆运算。设被除关系R为r元关系，除关系S为s元关系，那么它们的商为r-s元关系，记为R÷S。商的构成原则是:将被除关系R中的r-s列，按其值分成若干组，检查每一组的s列值的集合是否包含除关系S，若包含则取r-s列的值作为商的一个元组，否则不取［3］。2 除法定义的理解除运算

河南工学院学报 2012年6期2012-11-11

基于灰关联的k匿名数据流隐私保护算法

连续聚类过程.当元组的到达时间超过一个时延阈值时，它们将以连续的方式被发布.B-CASTLE算法[16］通过设置簇大小上限解决CASTLE算法生成不平衡簇的问题.笔者提出一种基于灰关联分析的数据流匿名算法（DSAoGRA），采用灰色关联度描述元组间的相似度并结合聚类思想，将元组划分成k匿名簇，得到满足k匿名准则的隐私保护数据流.通过在真实数据集上与CASTLE算法的对比实验，表明新算法能够实现数据流的快速匿名化，并保证匿名后数据的高可用性.1 数据流匿名数

东北石油大学学报 2012年6期2012-10-12

基于似然的航迹关联算法研究＊

，定义一个集合量元组T，假设每个元组由来自同一个目标的状态估计组成，这样所有元组的组合就构成了一个全局的关联假设H，一个元组对于一个传感器最多只能包含它的一条航迹，且元组必须是非空的，所以每个元组的大小一定是限制在0＜NT≤Ns之间。fi是来自传感器i的航迹，如果一个元组中没有航迹来自传感器i，那么fi＝0，传感器上报的每一条航迹都是一个元组的成员，且一条航迹只能在一个元组中，因此，在一个全局假设H中，所有元组的大小之和一定等于所有传感器上报的航迹数之和，

舰船电子工程 2012年9期2012-07-11

用于关系数据库关键词查询的基于划分的候选网络生成算法

词的查询分为相关元组获取、候选网络(candidate network，CN)［1］生成和候选网络执行3个阶段.由于候选网络执行阶段是整个系统的性能瓶颈，所以一直是重点关注的对象［1-6］，而对前2个阶段算法的改进很少.文献［7-8］最先提出通过广度优先查询方法生成所有组合关键词的候选网络.但是组合关键词的候选网络数量会随着网络大小成指数增长，执行时间急剧上升［1，9］.Markowetz等［10］提出了减少中间结果和避免同构检查的算法.文献［11］利用半

东南大学学报（自然科学版） 2012年4期2012-06-28

关系数据库中近似查询的自动采样改进方法研究

，然后根据每一个元组在样本关系表中出现的次数，将每个元组需要的存储信息作为元组的属性添加进数据表中，并通过DBMS在整个自动抽样过程对它们进行管理，对所得的结果进行分类并统计，得出每次采样过程中某个元组出现的次数，实验表明方法是有效的。关系数据库;自动采样;SQL采用传统精确查询技术处理海量数据，查询任务将显得极其繁重，从而导致整个查询的响应时间超出用户可以接受的限度。因而往往采用近似匹配，通过对部分或采样数据的查询，而不是整个数据集本身进行的查询，此外，

湖南人文科技学院学报 2011年2期2011-12-20

时间序列不确定数据流中异常数据检测方法

包含的不确定离散元组以数据点概率模型描述。在该模型中，元组的属性值确定，而存在性不确定，用一个[0，1]之间的概率值表示[4]。由于不确定数据流具有非线性及强绕动性，文中采用小波变换来满足自适应时变信号分析的要求，从而可聚焦到信号的任意细节以识别不确定数据流中异常数据。定义1.1时间序列不确定数据流是一个由相互独立的k维不确定元组构成的序列，S （t）={（w1（t），p1），（w2（t），p2），……，（wn（t），pn）}，其中 wi（t）为 t时刻第

电子设计工程 2011年19期2011-10-09

半监督聚类的匿名数据发布

k个元素，且簇内元组有相同的属性值．为使相同的簇内元组有相同的属性值，需要对元组进行概化/隐匿处理，该方法建立在预定义的域概化层次树结构和值概化层次树结构之上，因此会带来不必要的信息损失．为减少信息发布时的信息损失，不少学者研究使用聚类方法实现k-匿名［4-5］．随着对k-匿名模型的研究深入，研究者发现k-匿名模型可以有效的抵御连接(link)攻击，但是不能抵御背景知识攻击和同质攻击［6］．为防御背景知识攻击和同质攻击，学者研究了各种方法［6-8］．其中l

哈尔滨工程大学学报 2011年11期2011-06-06

一种模糊级别的多级安全关系数据模型研究*

ation)和伪元组(Cover Story)的概念，使得真实世界的单个实体在一个多级关系表中会产生多个元组，每个元组对应着不同密级的实例，并为每个字段设置相应的密级附加字段，以记录各数据项的密级信息。当不同实例间的数据差异很大时，这样的设计是合理的。然而，研究表明实际应用时，数据库中敏感数据(即需要对低许可级主体隐藏的数据)所占的比例通常仅仅只有约5%[2]，这意味着多实例间的数据差异通常非常小，高密级的元组除个别字段外，绝大部分数据(90%以上)与低密

网络安全与数据管理 2010年17期2010-07-25