云监控可以收集一系列的性能数据,但是,网络的关键因素往往不能满足要求。必须借助于第三方网络监控工具,保证云运行能够符合标准。
云监控服务收集到的服务器性能数据、存储和其他服务,在提供商的生态系统内部。不幸的是, 这些工具的网络监控功能往往是有限的,这意味着这些工具可能会错过云环境中的主要性能问题。密切关注网络,捕捉潜在的问题,使用建立的网络监控工具来跟踪和报告更深入的性能。
网络监控工具分为三类:基本监测,可视化和报告,以及先进的异常检测。先进的产品具备多个类别工具的功能。但是,如果担心可视化,担心先进的异常检测和安全性,可以专门寻找那些功能在一个单一的产品。
Nagios是一个开源网络监控工具,很难使用,但很全面。它捕获网络协议、监控网络服务,通过短信、电子邮件或自定义脚本执行生成警报。报告的模块提供了过去的中断和中断响应相关的文档。
对于那些希望Nagios监控功能,没有管理学习曲线,第三方工具基于Nagios也许是正确的选择。像Opsview有限公司提供的服务,高级功能,服务支持和几种不同的计划——从一个免费的开源企业级核心选项的选择。后者包括统一的仪表板,企业报告和数据聚合,来自多个分布式主服务器。
另一个开源IT基础设施选择,包括网络监控、来自Zabbix ISA。Zabbix监控工具,管理员可以收集服务器和网络设备的详细指标。提供了可视化,呈现大量easy-to-evaluate格式的数据。代理启用分布式监控,基于主体和无代理监控选项都是可用的。
网络监控服务所带来的挑战之一是:它可以生成大量的数据。报告工具可以过滤和聚合数据。可视化可以巩固大量数据,将数据以显示显著关系的方式呈现出来。
对于可视化,云管理员可能希望使用开源网络监控工具,如PRTG,建立在RRDtool基础之上,用于数据日志记录和图形应用程序。商业PRTG支持对Paessler是可用的。基于RRDtool的另一个可视化的工具,对AWS JumpBox市场伙伴是可用的。Cacti包括一个接口,支持图模板和多种数据采集方法。
然而,仅仅依靠可视化技术,并不能满足要求。一些模式的网络流量更加微妙。例如,平均流量模式的变化,可以说明一个问题,但可能不会出现在典型的管理报告和可视化。这需要一种异常检测技术。对于更高级的先发制人的监控,异常检测应用程序可以识别网络行为预期以外的范围。
异常检测是重要的服务要求一致的应用程序和网络性能。一个成功的营销活动可以为网站带来流量高峰期。即使在负载平衡,存在的风险增加了客流量的延迟。工具,如Numenta可以识别峰值和其他异常。
理想情况下,如果启用了自动伸缩,应用程序将自动将节点添加到集群来处理负载的增加。工具,如识别潜在的性能问题,使系统管理员手动添加额外的服务器或确保伸缩应对增加的工作负载。