您好!欢迎访问华体会体育!
专注精密制造10载以上
专业点胶阀喷嘴,撞针,精密机械零件加工厂家
联系方式
0679-623185140
您当前的位置: 主页 > 案例展示 > 医疗行业 >

医疗行业

【华体会体育】Flink未来将与Pulsar集成提供大规模的弹性数据处理

更新时间  2022-06-25 23:09 阅读
本文摘要:问题简介1.什么是Pulsar?2.Pulsar都有哪些概念?3.Pulsar有什么特点?4.Flink未来如何与Pulsar统合?ApacheFlink和ApachePulsar的开源数据技术框架可以以有所不同的方式构建,以获取大规模的弹性数据处理。在这篇文章中,我将详细讲解Pulsar及其与其他消息传递系统的差异化元素,并叙述Pulsar和Flink可以协同工作的方式,为大规模弹性数据处理获取无缝的开发人员体验。

华体会体育

问题简介1.什么是Pulsar?2.Pulsar都有哪些概念?3.Pulsar有什么特点?4.Flink未来如何与Pulsar统合?ApacheFlink和ApachePulsar的开源数据技术框架可以以有所不同的方式构建,以获取大规模的弹性数据处理。在这篇文章中,我将详细讲解Pulsar及其与其他消息传递系统的差异化元素,并叙述Pulsar和Flink可以协同工作的方式,为大规模弹性数据处理获取无缝的开发人员体验。Pulsar概述ApachePulsar是一个开源的分布式pub-sub消息系统,由ApacheSoftwareFoundation管理。

Pulsar是一种用作服务器到服务器消息传递的多租户,高性能解决方案,还包括多个功能,例如Pulsar实例中对多个集群的本地反对,横跨集群的消息的无缝geo-replication,非常低的公布和末端到末端-延后,多达一百万个主题的无缝可扩展性,以及由ApacheBookKeeper等获取的长久消息存储确保消息传递。现在让我们辩论Pulsar和其它pub-sub消息传递框架之间的主要区别:第一个差异化因素源自这样一个事实:虽然Pulsar获取了灵活性的pub-sub消息传递系统,但它也有长久的日志存储反对-因此在一个框架下融合了消息传递和存储。

由于使用了分层架构,Pulsar获取即时故障完全恢复,独立国家可扩展性和无均衡的集群拓展。Pulsar的架构遵循与其他pub-sub系统类似于的模式,因为框架在主题中被的组织为主要数据实体,生产者向主体发送数据,消费者从主题(topic)接收数据,如下图右图。Topic是Pulsar的核心概念,回应一个“channel”,Producer可以载入数据,Consumer借此消费数据(Kafka、RocketMQ都是这样)。

Topic名称的URL类似于如下的结构:{persistent|non-persistent}://tenant/namespace/topicpersistent|non-persistent回应数据否长久化(Pulsar反对消息长久简化和非长久化两种模式)Tenant为租户Namespace一般单体一系列涉及的Topic,一个租户下可以有多个NamespacePulsar的第二个区别是该框架就是指一开始就考虑到多租户而建构的。这意味著每个Pulsar主题都有一个分层的管理结构,使得资源的分配以及团队之间的资源管理和协商显得高效和更容易。利用Pulsar的多租户结构,数据平台确保人员可以在没摩擦的情况下重新加入新的团队,因为Pulsar在属性(租户),命名空间或主题级别获取资源隔绝,同时数据可以在集群中分享以便于协作和协商。

右图中Property即为租户,每个租户下可以有多个Namespace,每个Namespace上有多个Topic。Namespace是Pulsar中的操作者单元,还包括Topic是配备在Namespace级别的,还包括多地域拷贝,消息过期策略等都是配备在Namespace上的。最后,Pulsar灵活性的消息传递框架统一了流式和排队数据消费模型,并获取了更大的灵活性。如下图右图,Pulsar留存主题中的数据,而多个团队可以根据其工作阻抗和数据消耗模式独立国家用于数据。

华体会体育

Pulsar获取了灵活性的消息模型,反对三种订阅者类型:Exclusivesubscription:分列他的,不能有一个Consumer,接管一个Topic所有的消息Sharedsubscription:分享的,可以同时不存在多个Consumer,每个Consumer处置Topic中一部消息(Shared模型是不确保消息顺序的,Consumer数量可以多达分区的数量)Failoversubscription:Failover模式,同一时刻只有一个有效地的Consumer,其余的Consumer作为可用节点,在MasterConsumer不能用后展开替代(看上去限于于数据量小,且解决问题单点故障的场景)Pulsar对数据的观点:分段数据流ApacheFlink是一个流优先计算出来框架,它将批处理视作东流的类似情况。Flink对数据流的观点区分了有界和无界数据流之间的批处理和流处置,假设对于批处理工作阻抗,数据流是受限的,具备开始和完结。

对于数据层,ApachePulsar与ApacheFlink的观点相近。该框架还用于流作为所有数据的统一视图,而其分层体系结构容许传统的pub-sub消息传递用作流式工作阻抗和倒数数据处理或分段东流的用于以及批量和静态工作阻抗的有界数据流。用于Pulsar,一旦生产者向主题(topic)发送数据,它就不会根据数据流量展开分区,然后在这些分区下更进一步细分-用于ApacheBookkeeper作为分段存储-以容许分段数据处理,如下图右图。

这容许在一个框架中人组传统的pub-sub消息传递和分布式并行计算。当Flink+Pulsar统合ApacheFlink和ApachePulsar早已以多种方式构建。在接下来的部分中,我将讲解框架之间的一些潜在的未来构建,并共享可以一起用于框架的现有方法的示例。


本文关键词:华体会体育,【,华,体会,体育,】,Flink,未来,将,与,Pulsar

本文来源:华体会体育-www.stscshy.com