大数据的内涵、4V特性,与传统数据库的区别

大数据
后台-插件-广告管理-内容页头部广告(手机)
大数据的内涵、4V特性,与传统数据库的区别

大数据是云计算的升级方向:云计算的本质是数据处理技术,大数据是资产,云为数据资产提供保管、访问场所和渠道。如何盘活数据资产,使其为企业决策服务,是大数据核心议题,也是云计算的灵魂和必然的升级方向。

大数据赋予我们洞悉未来的能力:海量的数据经过数据预处理、数据清洗和加工,剔除无用的和有缺陷的数据,在有价值数据的基础上采取适当的数据分析和挖掘,为企业生产经营、管理创新提供决策支持。

大数据的4V特性:

1、大量化(Volume

在大数据时代,数据特征趋势是已不能用GB或TB单位来衡量,而是向着PB、EB或ZB级别发展。

国际数据公司(IDC)的研究显示,全球数据量大约每两年翻一番(被称之为“大数据摩尔定律”),2011年全球数据量已经达到1.8ZB,到2015年达到近8ZB,预计,2020 年可能达到35ZB,相当于2010 年的30 倍,对数据存储、安全、管理与使用能力均是巨大挑战。

2、多样性(Variety

数据种类繁多,包括文档、报表、网页、声音、图像、视频、流式记录数据、实时数据、数据库以及用户网络行为数据等多种类信息,形成了大量种类繁多的异构数据,对当今现有的结构化和非结构化数据的采集、处理、管理与使用能力提出了巨大的挑战。

3、快速化(Velocity

数据产生、获取快,物联网时时都在采集数据,互联网内容随时都在更新;数据处理、分析快,速度可达到每小时10TB或更高,往往需要在1秒钟内获得处理结果。

4、价值化(Value

以往并无太多价值的单条数据汇聚成庞大的数据群,这个数据群就蕴含着巨大的价值。运用有效的方法、模型、工具,可以充分挖掘数据群中的价值和持续发展数据中的新价值。

大数据与传统数据库的区别:

结构化程度:传统数据库保存的是结构化和半结构化数据,以二维表或标准的XML文件形式存储数据,由于结果清晰,处理相对容易;大数据是指一切计算机存储的数据,包括网页、图片、音视频文档、报表以及搜索引擎中输入的关键词、个人上网喜好、物理网采集的数据等,显然异构数据的处理更加困难。

噪声(异常)数据的处理:传统数据库通常含有数据过滤机制,把不符合数据采集规则的数据清除掉,属于高精度数据;大数据则允许异常数据的存在,更多应用在预测方面,找出大量数据中的隐含关联关系,少量异常数据不会对总体结果产生影响。

后台-插件-广告管理-内容页尾部广告(手机)
标签:

评论留言

我要留言

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。