首页 > 编程知识 正文

大数据平台建设工作方案,大数据中心建设规划

时间:2023-05-03 21:09:53 阅读:53184 作者:1330

那山石,可以攻玉——谈大数据平台的建设目标,可以先了解行业先进的实践经验,了解别人的数据平台是什么样的,然后根据自己的实际情况设定合适的目标和方向。

1别人的大数据平台是什么样的? 其他人的大数据平台是什么样的? 如果参加过大小技术共享论坛和会议,在“公司的大数据平台实践无敌干货共享”等各种新PPT中,谈大数据平台的技术组件时,通常大同小异的系统系统

在此体系结构图中,各种日志和数据库数据收集组件、存储和计算引擎、监控和调度系统(无论其实际操作情况如何)都在图中不缺少所有组件,而是单个组件

因此,如果要问大数据平台的基础架构图的长度,直接在HortonWorks的HDP分发工具包图中展示它,而不是自己画,似乎不会有什么大问题。 请参照下图。

除了各种公开会议外,这几年我还经常和北上杭的很多大数据平台商有个人交流。 交流过程中,在讨论大数据平台建设方向时,一些人直言不讳地告诉我。 请不要折腾。 大数据平台建设的总体思路其实是一样的。 找一两家可靠的公司交流就行了。

因此,关于大数据平台的技术交流,只能比较与具体组件相关的技术细节、组件性能、平台稳定性以及各自的开发平台与公司具体业务流程的匹配和应用等方面

如此看来,稍微靠谱一点的公司大数据平台,整体水平应该差不多在同一个水平上,差距不就在于踩空的量和经验的积累程度吗?

那么,现实真的是这样吗? 显然不可能!

2与业界领先的大数据平台的差距——以蘑菇街大数据平台为例,客观来说,与领先的行业巨头,如阿里、腾讯大数据平台的整体建设水平相比,无疑存在不小的差距但是,这些差距真的只体现在具体组件的技术深度上吗? 我觉得事情没那么简单。

我还接触过很多来面试我们大数据平台开发岗位的同学。 他们大多已经在不同的公司(有些实际上不是小公司)从事数据平台的建设。

与这些学生交流他们的项目经验后发现,在众多公司的大数据平台体系中,大数据生态中的各种主要组件也是如此。 数据规模虽小,但平台五脏俱全。 绘制平台整体组件的结构图时,可能比蘑菇街的大数据平台多两三个组件。 但是,谈及平台的实用水平和提供的服务,这些公司的平台往往非常原始简陋。

那么,各公司大数据平台成熟度水平的差距究竟体现在哪里呢?

对于基础组件,不用说阿里,不赚钱,要创办飞天项目,自己做一整套各种基础组件,建设和谐吐司大数据平台主要是成熟的开源

从技术层面来说,填孔水平存在差异,但填孔水平的差异真的是导致各个平台整体水平差异的最重要因素吗?

对于和谐吐司来说,因为您的业务还没有达到BAT的规模,平台体系结构的理论先进性、平台在各种极端负载情况下的稳定性、各种集群和资源的灵活扩展能力,都是大数据平台的实际你的平台和别人的平台的差距真的是人工智能、流媒体SQL等新技术的应用速度的差距吗? 几年前别人还没有开始引进这些技术的时候,平台的服务能力不是同样甩了你几条街吗?

换个角度,举几个大家更熟悉的例子吧。

比如说制作手机,从外观上看,不就是触摸屏上有摄像头吗? 内部组件结构也受到蓝牙、WiFi、NFC、GPS、内存、CPU等极端成熟的产业链的支撑。 所以,你觉得山寨和iPhone的差距在哪里?

比如消费无人机,机身结构不是有电池、电机、还有几个螺旋桨吗? 那么,大疆无人机如何压倒各种竞争对手,市场占有率遥遥领先呢? 那个产品和淘宝上几十元的玩具四轴飞行器有什么不同?

所以,在我看来,和谐吐司在大数据具体组件的应用水平上存在差距,但这并不是平台整体成熟度差距的根本所在。

而在一些具体组件的技术深度和先进技术的探索上,小公司和大公司不能匹配——在大公司和体量和人才储备方面存在现实差距,使得小公司几乎学不到也跟不上。 从支撑公司业务发展和人员投入产出效益的角度看,小公司也不需要学习这些,只要拿来相关技术成熟就行了。

那么,贫富差距到底在哪里呢? 我认为,产品和服务形态等看似软件、容易被忽视的方面,才是体现各大数据平台成熟度水平的最核心要素。 幸运的是,在真正意识到并重视这方面存在差距的前提下,产品和服务建设思想还可以快速学习、借鉴、改进和提高。

3大数据平台建设目标的总结,那么大数据平台建设的目标是什么? 谁的组件更丰富,谁跟进社区技术更快跟进,谁的团队有更多的承诺? 不,不,不! 在这些方面,它只是手段而不是目标,不一定是实现目标的最有效手段。

在评估大数据平台的能力和成熟度时,重点不在于提供了多少种存储计算引擎、涵盖大数据生态圈的技术组件数量,或者团队的技术能力如何无敌。 为使用平台的用户解决了哪些问题,消除了哪些障碍?

提升了多少工作效率,附加了哪些增值收益。进一步来说,还包括平台内部组件的横向联通能力和业务流程上纵向贯穿打通上下游链路的能力,这些才是数据平台建设的根本目标和衡量平台成熟度水平的评估标准。

这不是我鼓吹用户至上所喊出的无关痛痒的漂亮话,这是我们在过去多年的实践中,对实际的经验教训的总结。不过,所谓知易行难,每隔一段时间,你可能都会发现之前所做的工作和这个目标还是有不小的差距。加上公司业务会发展,技术会变革,大数据平台建设目标的确定也不可能一成不变,是一个需要持续思考和检验的过程。

本文选自《大数据平台基础架构指南》,作者dfdsg,电子工业出版社7月出版。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。