网络监控团队现在可以利用物联网,软件级网络和基于云的服务来确保最大的正常运行时间和最佳的网络性能。 但是,适应这些技术将意味着为遗留体系结构集成定义新的实践,重新设计监视工作流程以及评估工具包以增强全面和分层的网络管理。 本指南旨在帮助网络监控团队重新定义其操作方式,以采用更有效,基于数据,高效且响应迅速的NMS做法。

网络监控:最佳实践

对具有定义的网络监视实践的需求变得越来越需要随时间进行更新。 随着网络变得复杂,相互连接并集成到核心业务中,不同业务功能的依赖性使网络正常运行时间对于生产力至关重要。 团队,人员和操作将每分钟工作,并假设网络将启动并正在运行。 即使在较小的情节中出现网络问题,也会侵蚀团队之间的协作,降低客户的信任度,并对企业的底线造成明显损害。

因此,随着网络变得越来越密集和复杂,对具有自适应和基于启发式的方法进行监视的需求变得越来越关键。 您可以通过以下方式重新配置NMS做法,以更好地了解网络并最终更有效地管理网络:

1.定义问题:确定平均网络性能的基准。

了解网络是否在其设计水平上运行的第一步是通过量化基准将现有网络性能与理想网络性能进行比较。 挑战来自定义–理想的网络性能应该是什么?

网络管理员可以在不同的业务活动级别观察几周到几个月的网络性能。 在观察期结束时,网络管理员将获得平均网络性能基准。 这可用于建立整个网络的性能阈值。

设置阈值只是解决方案的一部分。 另一部分着重于一旦超过阈值即获得警报。

这样,网络中一个节点或元素的基准平均性能可以作为代理来显示网络其他部分的问题。 例如,如果CPU使用率相对于基准使用率激增,则值得在网络中进行一些研究。 这种基准可以帮助网络管理员主动解决问题,而不是被动地等待别人提出投诉。 这样可以节省更多的时间和资源,而这些时间和资源本可以用于处理停机时间和管理在线等待的客户。

2.定义问题所有权以加快解决方案。

第一步为第二步注入了动力。 一旦建立了基准,便会发出警报。现在,您要做的就是定义–在什么时候应该通知谁。

这是控制MTTR的关键步骤。 通常,拥有大型IT团队的企业最终会在正确的时间收到警报,但是解决方案的发布时间较长。 这可能是由于多种原因造成的-优先级错误,技术人员分配错误等。 这些挑战中的许多挑战甚至可以在它们尚未出现之前就得以解决,只需在整个网络上创建所有权层次结构即可。 此层次结构根据指示阈值突破的传入警报来确定何时收到警报。

此练习减小了警报监视与采取措施之间的差距。 由于已经划分了整个网络的所有权,因此基于规则的警报方法可帮助网络管理员将精力集中在眼前的问题上,而不会因他们可能无法解决的一系列问题而分心。

3.层敏感的报告生成。

跨复杂网络的通信通常由开放系统互连模型决定。 这使团队可以专注于系统的互操作性,而不是专注于基础技术。 就报告生成而言,必须确定相同的优先级。

数据流可能会在系统中的任何点失败。 监控系统应该能够检测和报告跨不同技术的故障。 本质上,网络监视系统应具有灵活性,可检测物理层,数据链路层,网络数据包转发,主机到主机的通信,会话,语法和应用程序中的错误。

因此,了解网络中节点和元素的不同性质并用正确的消息源标记每个警报的网络监视系统可以帮助NSM团队有效地启动故障排除协议。 可以在流程的早期发现即将被发现为问题的问题。

4.解决NMS数据可用性对网络正常运行时间的依赖性问题。

一般来说,网络监控团队更喜欢拥有 NMS 在网络内进行有效的数据收集和更快的报告。 但是,这会在 NMS 和网络之间产生不健康的依赖关系。 如果网络面临错误并关闭,团队将无法访问嵌入在 NMS 中的数据,无论它多么复杂。 高可用性 (HA) 可以通过确保 NMS 正在运行来解决这个问题,即使网络监视器因任何原因出现故障也是如此。 虽然 HA 似乎是次要措施,但它可以让您摆脱网络停机的循环问题。

5.跨时间线的数据可用性。

跨时间线的警报的可用性可以帮助您过滤问题中的问题并帮助RCA流程。 收到通知并解决它是日常监视的想法。 但是,拥有标记了问题的正确来源的警报存储库可以帮助构建智能系统,从而加快解决过程。 您的网络监视实践应具有过去几个小时,几天,几周和几个月的可用数据,以便您直观地了解如何加剧网络问题。

6.拥有统一视图。

随着公司规模的扩大,其网络监控实践也必须随之扩展。 拥有专用网络设置的小型企业和现场团队不会立即陷入危机,因为基本工具可以报告整个网络。 随着业务的扩展,他们以不同位置和云基础架构中的新办公室的形式在网络中添加新节点。 您的网络监控系统必须以一种使您能够在一个平台上以可访问的方式获得整个网络的集中视图的方式进行设计。 这将使您清楚地了解大型网络趋势以及网络中的每个节点如何与网络中的其他节点相互作用。

在结论

一些网络监视团队可能会认为,尽管这些最佳实践旨在提高网络监视效率,但就分配给NMS的资源而言,它们可能“太多了”。 使用在这些最佳实践的基础上设计的工具可以轻松解决该问题。

Motadata将每个最佳实践作为其本机功能。 您可以具有基于图层的报告,HA,历史记录以及整个网络的联合视图,包括同一位置的不同位置,节点和IT资产。 您无需花费更多时间来重新设计网络监视过程。 Motadata的功能使您的过程更加灵敏,高效和系统。