Prometheus 在五个行业落地的案例

Prometheus 在五个行业落地的案例组织正在受益于开源监控工具包的定制,简单性和成本节约。 Prometheus是一个开源的容器和微服务监测和预警工具包。这个项目受到了很多不同组织的欢迎,不管他们的规模和行业。该工具包是高度可定制的,设计用于交付丰富的指标,而不影响系统性能。基于采用它的组织,Prometheus…

Prometheus 在五个行业落地的案例

组织正在受益于开源监控工具包的定制,简单性和成本节约。

Prometheus是一个开源的容器和微服务监测和预警工具包。这个项目受到了很多不同组织的欢迎,不管他们的规模和行业。该工具包是高度可定制的,设计用于交付丰富的指标,而不影响系统性能。基于采用它的组织,Prometheus已经成为主流的、开源的监测工具,对于那些严重依赖容器和微服务的人来说,它们是最好的选择。

2012年,普罗米修斯在SoundCloud成立,并于2016年成为云原生基金会(CNCF)的一员。2018年8月,CNCF宣布普罗米修斯是该组织历史上第二个“毕业”项目。

Prometheus为现代DevOps工作流提供了关键组件:监视云原生应用程序和基础设施,包括另一个流行的CNCF项目Kubernetes。

下面是一些DevOps组织如何将使用Prometheus的开源监控变成了运营优势。

1.金融业务使用Prometheus

金融服务巨头北方信托公司(Northern Trust)在2017年6月转向Prometheus,不是为了应用程序监控,而是为了更好地了解该公司的一些硬件。“我们还能得到容量和性能报告,告诉我们何时遇到问题,并将其用于预测和增加硬件,”Strader在一次演示中解释道。

虽然Northern Trust喜欢Prometheus的灵活性和粒度,但Strader承认其“相当陡峭的学习曲线”和高昂的前期团队培训成本。“但我们认为它比商业解决方案便宜得多,因为每月或每年的服务都不会产生经常性的货币成本,”Strader说。他说,Northern Trust使用Prometheus来监控其平台上的750多个微服务。

2.应对警报疲劳

当你的内容交付网络(CDN)由分布在全球的116个数据中心组成时,你需要密切关注事情,特别是当你平均每秒有500万个HTTP请求时。Cloudflare为超过600万个网站提供DNS和DDoS缓解服务。Cloudflare平台运营团队的马特•博斯托克(Matt Bostock)表示,该公司需要监控帮助,尤其是在“警报疲劳”开始显现的情况下。

Cloudflare在全球范围内使用188个Prometheus服务器,外加4个顶级的Prometheus服务器,用于对关键生产问题、事件响应、事后分析和指标发出警报。

Bostock表示,该部署采用了Prometheus Alertmanager,它复制了Prometheus警报。“Alertmanager通过POP和警报名称对传入的警报进行分组,这有助于我们减少收到的警报噪音,”他解释道。Cloudflare还针对症状而非原因设置警报,Bostock表示这将降低整体警报量,并使组织更加主动。“如果你在机器或原因上设置警报,你将会收到很多警报,”他警告说。

3.简化一项服务来管理所有服务

蒙特利尔的L’Atelier Animation公司的开发人员在拍摄完第一部长篇电影后,幸运的是有了一些停机时间,他们开始寻找现有监控系统的替代品。据工作室的it主管Barthelemy Stevens说,它混合了Nagios、Graphite和influence xdb,是“一个有太多活跃部件的组合”。该团队开始为其基础架构寻找新的监视选项,其中包括大约300个呈现用刀片服务器、150个工作站和20个服务器,几乎所有内容都运行在基于linux的CentOS上。

L’Atelier Animation在指出了Prometheus的四个关键特征后,选择了Prometheus这个产品:它的节点出口可以定制,能从主机那里获取任何数据;SNMP支持消除了对第三方服务的需求;其报警系统优于Nagios;Stevens说,它还拥有Grafana的支持。

这次升级给了动画工作室一个机会来改变它监控一切的方式,并激发了从Prometheus数据衍生而来的新的定制楼层地图的创作。Stevens说:“使用一种服务来管理它们,设置要简单得多。”L’Atelier Animation公司也在与Prometheus公司整合软件许可。Stevens补充道:“这些信息将让艺术家们清楚地知道谁在使用什么和在哪里。”

4.提高洞察力

Life360是一个移动应用程序,用于定位,安全驾驶和家庭成员之间的信息共享,管理大约20个生产服务,主要是来自移动客户的位置请求,可以达到150多个实例。

“我们主要使用MySQL,NSQ和HAProxy,我们发现所有以前使用的监控解决方案都非常局部,需要进行大量定制才能实现全部协同工作,”Life360基础架构工程师Daniel Ben Yosef说。

该公司需要一种更好的方法来监控其MySQL多主集群和一个12节点的Cassandra环,它可以容纳大约4TB的数据。Prometheus在初步测试中表现良好。 “结果令人难以置信。” Daniel Ben Yosef说。“MySQL的监控范围非常惊人,我们也非常喜欢Cassandra的JMX监控,而这种监控一直非常缺乏。”

在对Prometheus进行有限部署之后,Life360报告了可视化方面的巨大收益,并设想在数据中心基础设施的其他部分使用它。“随着我们建立新服务,Prometheus正在成为我们的有力工具,并将帮助我们获得有关我们基础设施的极其有意义的警报和统计数据,”Ben Yosef补充道。

5.容器检查

作为一家专注于改善癌症患者生活的数据公司,Cota Healthcare丰富了医疗记录,以创建研究级数据,并将其与一套分析,可视化和管理工具相结合。它拥有数以百万计的患者记录,可见性和安全性对其业务至关重要。随着Cota迁移到云上的Kubernetes,该公司意识到需要监控和保护其容器环境。

“我们也知道我们需要了解所有内容,”Cota基础设施副总裁Ashley Penney说。 “你不能操作一个你不知道发生了什么的系统,这是行不通的。”为了获得有关其应用程序性能和行为的更多深入信息,Cota选择利用Sysdig的Prometheus指标,Sysdig是一种性能和安全监控解决方案,利用Prometheus的自定义指标进行监控,警报和故障排除。

“从基础设施团队的角度来看,很高兴我们可以告诉我们的开发人员,’通过Prometheus发布指标,我们将使用我们的监控工具来提取它们’,”Penney说。“我们使用Prometheus为Stackdriver甚至Google Cloud生成指标。我们可以使用其他大量的Prometheus输出。”

今天的文章Prometheus 在五个行业落地的案例分享到此就结束了,感谢您的阅读。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/21265.html

(0)
编程小号编程小号

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注