返回顶部
分享到

什么是大数据?

互联网资讯 2022-7-13 15:08 319人浏览 0人回复
摘要

虽然很多人将其简单理解为“大数据就是大规模的数据”。但是,这个说法并不准确!“大规模”只是指数据的量而言。但是数据量大,并不代表着数据一定有可以被深度学习算法利用的价值。例如:地球绕太阳运转的过程中, ...

虽然很多人将其简单理解为“大数据就是大规模的数据”。

但是,这个说法并不准确!

“大规模”只是指数据的量而言。

但是数据量大,并不代表着数据一定有可以被深度学习算法利用的价值。例如:地球绕太阳运转的过程中,每一秒钟记录一次地球相对太阳的运动速度、位置,可以得到大量数据。可如果只有这样的数据,其实并没有太多可以挖掘的价值!

大数据这里我们参阅马丁•希尔伯特的总结,今天我们常说的大数据其实是在2000年后,因为信息交换、信息存储、信息处理三个方面能力的大幅增长而产生的数据:


  • 信息交换:


据估算,从1986年到2007年这20年间,地球上每天可以通过既有信息通道交换的信息数量增长了约217倍,这些信息的数字化程度,则从1986年的约20%增长到2007年的约99.9%。在数字化信息爆炸式增长的过程里,每个参与信息交换的节点都可以在短时间内接收并存储大量数据。



  • 信息存储:


全球信息存储能力大约每3年翻一番。从1986年到2007年这20年间,全球信息存储能力增加了约120倍,所存储信息的数字化程度也从1986年的约1%增长到2007年的约94%。1986年时,即便用上我们所有的信息载体、存储手段,我们也不过能存储全世界所交换信息的大约1%,而2007年这个数字已经增长到大约16%。信息存储能力的增加为我们利用大数据提供了近乎无限的想象空间。



  • 信息处理:


有了海量的信息获取能力和信息存储能力,我们也必须有对这些信息进行整理、加工和分析的能力。谷歌、Facebook等公司在数据量逐渐增大的同时,也相应建立了灵活、强大的分布式数据处理集群。

本文暂无评论,快来抢沙发!

热门问答
达内教育:成立于2002年。致力于面向IT互联网行业,培养软件开发工程师、测试工程师、系统管理员、智能硬件工程师、UI设计师、网络营销、会计等职场人才 达内使命:缔造年轻人的中国梦、缔造达内员工的中国梦 达内愿景:做管理一流的教育公司
  • 商务合作

  • Powered by Discuz! X3.4 | Copyright © 2002-2024, 达内教育 Tedu.cn
  • 京ICP备08000853号-56 |网站地图