时间:2023-05-03 13:55:00 阅读:111103 作者:4438
1 .现有数据量
2 .每日增加数据量
3 .中间计算结果
4 .各阶段数据存储时间
5 .数据冗余。 例如复印数
CPU和内存、总存储空间根据需求设置,集群间网络带宽较大,宜采用内网。 hadoop具有备份数据的功能,因此数据磁盘不需要为raid。
如果计算任务复杂且很多,则CPU需要较高的处理能力。 使用的大数据组件需要高配比才能吃掉内存。
版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。