java架构设计,mpp分布式数据库

MPP即大规模并行处理(massively并行处理器)。

1在数据库非共享群集中，每个节点都有独立的磁盘存储系统和内存系统

2业务数据根据数据库模型和应用特点分为各节点

3每个数据节点通过专用网络相互连接，相互协作计算，从而总体上提供数据库服务

好处：

1非共享数据库群集具有完全可扩展性、高可用性、高性能、高性价比和资源共享等优点。

2并行查询处理提高查询性能

缺点：

1由于“木桶短板效应”、单节点stragglers (落后者)，engine的性能降低到了该stragglers的能力

示例：

MPP体系结构：

impala、presto、postgreSQL、es

非MPP体系结构：

sparkSQL :需要共享数据库、共享资源、磁盘遗漏中间计算结果