这篇文章来自bilibili视频
33559 www.bilibili.com/video/b v1 JT4y1 G7 nm? from=search seid=8564723321108653442
大数据概念大数据(bigdata )是指常规软件工具在一定时间内无法捕获、管理和处理的数据集合,需要新的处理模式才能具备更强的决策力、洞察力和流程优化能力,规模巨大、成本高
大数据特征Volume (大量):
目前人类生产的所有印刷材料的数据量为200PB,而历史上全人类所说的数据量约为5EB。 目前,普通个人计算机的硬盘容量为TB级,一些大企业的数据量已经接近EB级。Velocity (高速):
这是大数据区别于传统数据挖掘的最明显的特点。 根据IDC的《数字宇宙》报告,预计到2020年,全球数据使用量将达到35.2ZB。 面对如此庞大的数据,处理数据的效率是企业的生命。 3358 www.Sina.com/http://www.Sina.com/:
这种类型的多样性将数据分为结构化数据和非结构化数据。 对于传统的以数据库/文本为中心的结构化数据,Variety包含web日志和音频。 诸如视频、图像、地理位置信息等这多种类型的数据对数据的处理能力提出了更高的要求。(多样):
价值密度的高低与数据总量的大小成反比。 例如,在某一天的监控视频中,在健身的一分钟内,如何快速“提炼”有价值的数据成为当前大数据背景下需要解决的课题。