MPP架构概念
1.什么是MPP
MPP (Massively Parallel Processing),即大规模 并行处理。
什么是并行处理?
在数据库集群中,首先每个节点都有独立的磁盘存储系统和内存系统,其次业务数据根据数据库模型和应用特点划分到各个节点上,MPP是将任务并行的分散到多个服务器和节点上,在每个节点上计算完成后,将各自部分的结果汇总在一起得到最终的结果。
什么是大规模?
每台数据节点通过专用网络或者商业通用网络互相连接,彼此协同计算,作为整体提供数据库服务。整个集群称为非共享数据库集群,非共享数据库集群有完全的可伸缩性、高可用、高性能、优秀的性价比、资源共享等优势。
MPP 处理数据的思路
面对海量数据和计算时,采用大事化小的思路,对数据进行分割,数据分割后单独存储,数据处理消耗的资源也是相互隔开的,对于MPP数据库来讲,整个数据库由多个完全独立的数据库构成,各个拥有完整的数据存储、数据管理、数据操作能力。基于网络实现节点互联,形成一个整体对外提供服务,节点间互不干扰,即Share Nothing,不共享磁盘和计算能力。
2.MPP架构特性
MPP 具备以下技术特征:
● 任务并行执行;
● 数据分布式存储(本地化);
● 分布式计算;
● 高可用、易维护:数据通过副本提供冗余保护,自动故障探测和管理,自动同步元数据和业务数据。提供图形化工具,以简化管理员对数据库的管理工作;
● 高并发:读写不互斥,支持数据的边加载边查询,单个节点并发能力大于 300 用户;
● 高扩展、高可靠:支持集群节点的扩容和缩容,支持全量、增量的备份/恢复;
● 行列混合存储:提供行列混合存储方案,从而提高了列存数据库特殊查询场景的查询响应耗时;
● 标准化:支持SQL92 标准,支持 C API、ODBC、JDBC、ADO.NET 等接口规范。
3.Master和Worker
“worker”进程天生就是来”干活”的,真正负责处理请求的进程就是你看到的”worker”进程,那么”master”进程有什么用呢?
“master”进程其实是负责管理”worker”进程的,除了管理” worker”进程,master”进程还负责读取配置文件、判断配置文件语法的工作,“master进程”也叫”主进程”,一般”master”进程只能有一个,而”worker”进程可以有多个,worker”进程的数量可以由管理员自己进行定义
今天的文章MPP架构概念分享到此就结束了,感谢您的阅读。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/5133.html