首页 > 编程知识 正文

PostgreSQL citus从入门到放弃不是标题党,c语言从入门到放弃片

时间:2023-05-06 07:35:51 阅读:276031 作者:4248

不知道这样的标题会不会被微软警告,最近,微软收购了 ? 年历史的 CitusData 公司,而我这里却要说Citus的不好?其实不是的,Citus确实有它适合的场景,但是,就像之前文章提到的,它也有不适合的场景,而我平时工作的很多需求就在不适合的场景之列。

这里咱们复习一下Citus是什么?主要做什么?适合做什么,不适合做什么?

Citus是什么?主要做什么?

Citus是PostgreSQL的一个插件,通过citus,你可以让多个PostgreSQL机器组成一个集群,利用这个集群,你可以将一张大数据量的表自动水平分表,而无需担心分配的逻辑。具体citus可以做如下的事情:

自动分片和分布数据。你可以选择一个列,citus依据这个列将大数据表进行分片(sharding),然后将各个分片分配到各个worker节点;可以实现数据高可用。通过设置"citus.shard_replication_factor"控制每个分片的副本数量,每个分片的副本会被分配到不同的机器,如果包含该分片副本的某个机器宕机,数据还是查询的到,除非所有包含该副本的机器全部宕机,数据才会不可用。

而且查询来了,citus也会对查询进行处理:

自动分割任务。如果查询是针对的某条记录,citus会根据分布数据时记录的元数据,只到相应的分片(sharding)去查询,那么查询的数据量就降下来了,查询速度会快很多;并行查询。如果查询是针对表的大多数记录或者全部记录时,Citus适合做什么

Citus适合做单表查询,且该单表数据量越大,Citus的优势就越明显。

Citus不适合做什么

Citus集群相对于单机PostgreSQL,对SQL有一些支持不完善的地方。

对regregate函数支持不好,要求必须可以分解。实际上PostGIS中很多聚集函数都不支持,例如ST_ClusterWithin,st_extent;

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。