MPP即大规模并行处理(massively并行处理器)。
1在数据库非共享群集中,每个节点都有独立的磁盘存储系统和内存系统
2业务数据根据数据库模型和应用特点分为各节点
3每个数据节点通过专用网络相互连接,相互协作计算,从而总体上提供数据库服务
好处:
1非共享数据库群集具有完全可扩展性、高可用性、高性能、高性价比和资源共享等优点。
2并行查询处理提高查询性能
缺点:
1由于“木桶短板效应”、单节点stragglers (落后者),engine的性能降低到了该stragglers的能力
示例:
MPP体系结构:
impala、presto、postgreSQL、es
非MPP体系结构:
sparkSQL :需要共享数据库、共享资源、磁盘遗漏中间计算结果