首页 > 编程知识 正文

大规模分布式存储系统,分布式存储如何实现

时间:2023-05-04 19:43:41 阅读:41497 作者:357

在分布式存储技术体系中,分布式文件存储是其中的一种分类,常用于大数据架构中。 由于Hadoop的受欢迎,Hadoop本机HDFS分布式文件系统也广为人知。 但是,分布式文件存储系统不仅仅是HDFS。 当今的大数据开发共享主要介绍典型的分布式文件存储系统。

分布式文件系统可以说是分布式系统下的子集。 我们选择市场上几种广泛使用的产品,包括HDFS、Ceph、FastDFS和MooseFS,进行简要分析——

HDFS如上所述,HDFS在分布式文件系统中非常受欢迎。 基于Hadoop基础架构,HDFS自然具有很好的优势,尤其是面对大型离线批处理任务,地位难以动摇。

HDFS为分布式计算框架(如Spark和MapReduce )提供了大量的数据存储服务,同时HBase和Hive的基础存储也依赖于HDFS。 与Hadoop生态的密切联系也稳定地占据着市场主流。

优点:

容错能力—数据会自动存储多个拷贝,并在拷贝丢失后自动恢复

适用于批处理。 移动计算而不是数据。 数据位置将公布在计算框架中

适用于大数据处理。 是GB、TB、甚至GB级的数据。 百万以上的文件数。 10K节点规模。

访问流文件:一次写入,多次读取。 保证数据的一致性。

可构建在廉价的设备上:通过多拷贝提高可靠性。 提供容错和恢复机制。

缺点:

不适合低延迟的数据访问场景。 毫秒级别、低延迟、高吞吐量等

不适用于占用NameNode大量内存的小文件访问场景。 搜寻时间超过了读取时间。

不适合同时写入。 文件随机更改场景。 一个文件里只有一个写手。 仅支持append

不符合posix语义,需要在SDK上进行读写操作。 java支持良好,其他语言一般

Ceph企业级存储要求通常分为块存储、文件存储和对象存储,但Ceph可以同时满足这三个要求。 Ceph将企业中的三个存储需求整合到单个存储系统中,并提供三个存储界面,提供分布式、横向扩展和高可靠性存储,具有高可用性、高性能和可扩展性等特点。

优点:

支持对象存储(OSD )集群,CRUSH算法可完成文件的动态定位,提高处理效率

符合posix语义,支持FUSE装载,降低客户端开发成本,通用性强

支持分布式MDS/MON,无单点故障

强大的容错能力和自我修复能力

支持在线扩展和冗馀备份,提高系统可靠性

缺点:

目前正处于试验阶段,系统的稳定性有待研究

部署和运输复杂,集群管理工具少

FastDFSFastDFS是用c语言开发的开源轻量级分布式文件系统,包括文件存储、文件同步和文件访问(文件上传/下载) 特别适用于以图像网站、视频网站等文件为媒体的在线服务。 追求性能和可扩展性的FastDFS适合视为基于文件的key value pair存储系统,称为分布式文件存储服务。

优点:

支持在线扩展机制,提高系统可扩展性

实现了软RAID,提高了系统的并发处理能力和数据容错能力

支持主从文件,自定义扩展名

学好追踪器服务,提高系统可用性

缺点:

不支持POSIX通用接口访问,通用性低

公共网络之间的文件同步有很大的延迟,需要应用适当的容错策略

同步机制不支持文件正确性检查,这会降低系统可用性

通过API下载,存在单点性能瓶颈

MooseFSMooseFS出现在HDFS之后,也是类似的MDS OSS架构。 与HDFS不同,MooseFS没有假设在其上运行的业务,也没有假设业务是大文件或大文件。 也就是说,MooseFS是ext4、XXT那样的定位

优点:

扩展成本低,支持在线扩展,不影响业务,体系结构可扩展性非常高

支持访问POSIX通用接口,支持FUSE装载,降低客户端开发成本,通用性强

文件对象具有高可用性,可以设置任何文件冗馀(提供高于Raid 10的冗馀级别) ) ) ) ) ) ) ) ) ) ) )。

提供系统负载,将数据读写分配给所有服务,提高读写性能

实现了软RAID,提高了系统的并发处理能力和数据容错能力

数据恢复相对容易,提高了系统可用性。 有垃圾桶功能,方便业务定制

缺点:

主服务器点解决方案的稳健性。 如果主服务器出现问题,则Metalogger Server可以恢复到主服务器的升级,但需要恢复时间

主服务器本身的性能瓶颈。 MFS的主从体系结构类似于MySQL的主从复制,可以从扩展,但主站不容易扩展

存储在MFS体系结构中的文件总数增加会增加主服务器的内存需求

以上简要介绍了大数据开发、分布式文件存储系统。 分布式文件系统是解决大数据存储问题的重要基础支持,需要了解市场上的主要分布式存储产品。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。