首页 > 编程知识 正文

定义大数据:浅显易懂的大数据入门

时间:2023-05-05 07:25:53 阅读:158292 作者:3636

目前,许多企业面临着从四面八方涌来的数据流冲击。 涓涓细流汇成大河,科技企业、专家、分析师和技术顾问们将这条数据之河定义为大数据。 但是,在这些众说纷纭的大数据定义中,存在着很多常见的误解。 许多企业都面临着挑战,需要识别有价值的数据流,挖掘它们的价值,帮助企业形成强大的竞争优势,做出最佳决策。

“大数据”一词的含义远远超出了“大”和“数据”的含义。 大数据确实数量很多,但它还有很多特性。 这是由财富分析师DMDqz(BrianHopkins )和长龙水果(Boris Evelson )撰写的《首席信息官,请用大数据扩展数字视野》报告,他们是大数据的四个典型特征: ——大容量) 高速) Velocity )后,将简要介绍这些特性,重点阐述大数据对前瞻性商业领袖的重要意义。

海量

企业面临着数据量的大规模增长。 例如,根据IDC最近的报告,预计到2020年全球数据量将增长50倍。 目前,大数据规模是一个不断变化的指标,单数据集的规模范围从几十TB到几PB不等。 这意味着存储1PB的数据需要2万台配备50GB硬盘的PC。

它还可以从各种意想不到的来源生成数据。 例如,在从巴塞罗那到沙特阿拉伯首府利雅得的单程航行中,一架商用喷气飞机所收集的传感器数据量将超过1PB。 如果将每次飞行的数据量乘以每天所有飞行的航班数,数据总量将非常惊人。

多样性

人们普遍认为利用互联网搜索是形成数据多样性的主要原因,这种看法部分正确。 但数据多样性的增加主要是由于新的多结构数据和网络日志、社交媒体、互联网搜索、手机通话记录、传感器网络等数据类型。 其中,部分传感器设置在列车、汽车、飞机上,各传感器提高了数据的多样性。

高速

高速描述的是创建和移动数据的速度。 在高速网络时代,基于实现软件性能优化的高速计算机处理器和服务器,建立实时数据流已十分流行。 企业不仅要知道如何快速创建数据,还必须知道如何快速处理、分析并返回给用户以满足实时需求。

根据IMS Research研究机构对数据制作速度的调查,发现通过跟踪网络设备的激活量,网络设备增加的第二波浪潮正在加速。 本轮增长后,将出现更多新的支持网络的设备增长浪潮。 预计到2020年全球将有220亿台互联网连接设备。

易变性

大数据具有多层结构,这意味着大数据将呈现出多种形式和类型。 与传统的业务数据相比,大数据具有不规则和模糊的特性,难以或不可能使用传统的APP应用进行分析。 传统的商业数据具有标准化的格式,并被标准化的商业智能软件所识别。 当前,企业面临的挑战是从以各种形式表现的复杂数据中获取价值。

新型分析法

术语“大数据”还与用于从数据中获得价值的分析法的类型相关联。 需要从现有和新兴的数据类型中获取商业智能,这给现有的APP系统带来了巨大的压力,迫使企业寻找新的解决方案。 创建新的分析APP应用程序以进行多结构数据分析通常需要对专业资源和工具进行战略投资。

对企业来说,大数据既是机会也是威胁。 能够管理复杂数据并获得准确业务洞察力的企业将拥有比竞争对手更重要的优势。 相反,无法智能管理数据的企业在竞争中处于劣势。

资料来源: http://miit.ccidnet.com/art/32561/2012 08 23/4190925 _1. html

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。