时代双雄:大数据与云计算

2014-03-05 08:22
北方经济 2014年1期
关键词:分布式计算数据仓库海量

近几年,云计算的概念受到了学术界、商界,甚至政府的热捧,一时间云计算无处不在,这真让同时代其他的IT技术相形见绌,无地自容。

目前,虽然对云计算的定义各自表述,无法统一(虚拟化技术、分布式计算、网格计算、效用计算,软件的硬件的都一股脑的端上来了),但对云计算主流的理解大多建立在软件即服务、平台即服务、基础设施即服务这三个层次上(虽然也有非主流的认识,如流程即服务等);也正是由于云计算没有统一的定义,给众家各自发挥的空间……

当云计算炒得火热之时,另外一个名词也渐入人们的视野:大数据!一看这个名字就可以感受到高端大气上档次,霸气十足!早在上个世纪九十年代,数据仓库之父BILL INMON就对这个BigData情有独钟。后来2008年9月,自然杂志上一篇《Big data:science in the petabyte era》再次将bigdata搞得一发不可收拾!与云计算出道时让大家云深雾罩的感觉不同,对于大数据的感受是实实在在的。进入IT时代以来,我们积累了海量的数据,这些数据急速增加,给我们的时代带来两个方面的巨变:一方面,在过去没有数据积累的时代无法实现的应用现在终于可以实现;另一方面,从数据匮乏时代到数据泛滥时代的转变,给数据的应用带来新的挑战和困扰。简单地通过搜索引擎获取数据的方式已经不能满足我们千变万化、层出不穷的应用需求,如何从海量数据中高效地获取数据,有效地深加工并最终得到感兴趣的数据变得异常困难。

大数据无论给我们带来利也罢,弊也好,总之大数据时代已经来临。在这种背景下,“数据为王”的说法即呼之欲出。

猜你喜欢
分布式计算数据仓库海量
一种傅里叶域海量数据高速谱聚类方法
海量快递垃圾正在“围城”——“绿色快递”势在必行
基于数据仓库的住房城乡建设信息系统整合研究
分布式存储系统在液晶面板制造数据仓库中的设计
探析电力系统调度中数据仓库技术的应用
云计算中MapReduce分布式并行处理框架的研究与搭建
一个图形所蕴含的“海量”巧题
面向异构分布式计算环境的并行任务调度优化方法
基于数据仓库的数据分析探索与实践
基于文件系统的分布式海量空间数据高效存储与组织研究