什么是大数据?:大数据具有以下特征: Volume (数据量大)、Variety (值)、Velocity (值)数据生成速度快)、Value (数据价值密度低)
大数据技术是指至少实现这四个特征中的一些(一些)。 不是有几百TB才能计算出来的。
让我们逐一详细看看4V这4个特征。
1.Volume指的就是数据体量非常大pgddgk,大数据量特别大,某三甲医院的图像数据可能有几百TB,全国医疗图像数据超过Pb级(1Pb=1024 TB ) 据统计,世界数据量为40zb(1zb=1024EB )。 课件的大数据首先是数据量大。
可以分为2.Varietry指的就是数量类型繁多。结构化数据、半结构化数据、非结构化数据。 其中,结构化数据是指数据库可以存储,主要由关系数据库存储和管理,财务数据库、各种管理系统等可以用二维表结构表示的数据。 非结构化数据一般存储在文件系统中,例如以视频、音频、图像、文档、文本等形式,例如有医疗图像系统、教育视频系统等; 半结构化数据是介于完全结构化数据和非完全结构化数据之间的数据。 例如,日志、邮件、HTML、报告、json等。 80%以上的数据是非结构化数据和半结构化数据。
3.Velocity是指大数据往往以数据流的形式,动态、快速的产生,具有很强的时效性。数据本身的状态和价值也经常随时空而变化。 例如环境监测和天气预报数据、交叉口屏幕监测数据等。
4.Value是指数据已经成为一类新型的资产,蕴藏着很大的价值大数据价值密度低就像垃圾堆放错了位置,只有有效挖掘和合理准确分析,数据才能带来高价值和效益。 例如,电视机顶盒频道频繁切换数据,各电视台分析该数据以准确判断观众的喜好。