网络测试自动化是电信行业的热门话题之一,数据中心网络也不例外。
在特殊情况下,例如人们遇到的网络故障情况,自动化网络测试就显得尤为重要,因为网络运营和维护团队可能被迫远程工作。
完美的风暴
尽管整个行业普遍意识到网络流量将继续呈指数级增长,但没有人预期(或至少已计划)由冠状病毒疫情引起的情况。
这些挑战可能使人们感到头昏眼花:网络容量达到极限,供应链因生产/需求而陷入困境,以及负责使用网络服务在家中启动和维护网络的团队。发生故障时,这是影响网络性能的完美风暴。诸如Netflix之类的内容,诸如Fortnite之类的交互式游戏,诸如Skype或Zoom之类的通信服务以及大规模的企业VPN访问平均已将全球网络流量提高了30%。这使服务提供商和数据中心网络处于紧张状态,几乎没有错误余地。
数据中心已准备就绪,可以在电源、冷却甚至网络连接等许多方面进行灾难恢复。这在理论上通常是正确的。在现实世界中,即使采用冗余机制,中断也可能对提供商及其客户造成严重的业务影响。如果查看数据中心互连(DCI),则不再需要等待问题发生。
如果数据中心互连(DCI)光纤链路上的服务质量下降,则网络管理系统将自动切换到另一条路由以安全地传输该流量-虽然它可能不是最快的,但是在负载平衡的情况下,它可能会将剩余的流量链接到其性能极限)。
因此,延迟性能在这里起着重要的作用。面对现实,没有人喜欢重新路由,就服务可用性而言,这应该是最后的选择。那么如何预见这种情况呢?如果光纤的任何部分损坏或仅表现不佳,则可能需要派遣技术人员到特定位置或数据中心。
这可能需要一些时间来安排工作人员进行故障排除,这就是人们所理解的平均维修时间(MTTR),并且可以很大程度地减少此响应的影响时间正在使组织的收入最大化。
测试自动化和可预测性的重要性
数据中心知道,要减少平均维修时间(MTTR)并在网络中建立可见性,它们需要尽可能地集成和自动化网络测试功能。由于业务影响未知,因此对网络事件做出反应的风险太大,因此优秀策略是投资于网络故障预防,以使用自动化测试功能来增加可见性和控制。
停电的成本很高(根据调查数据,平均每分钟9,000美元)。目标是实现100%的网络正常运行时间,因此投资网络可见性不是一种选择,而是必须的。
如果分析现在看到的典型网络问题,那么仍然会在物理层中发现很大比例的问题。这些问题通常是由于外部因素和人们无法控制的。建立自动测试功能以主动测试光纤互连将有助于防止性能下降和最终停机。此外,至关重要的是要能够监视实时网络而不影响流量,即“服务中”测试。
但是故事还没有结束。工程师可以使用这些功能来构建机器学习机制,从而以对网络采取反应性测试方法无法实现的方式,基于网络数据(光功率、链路降级、等待时间等)做出决策。同样,人工智能算法需要数据,而网络状态数据完全不能从等式中排除。简而言之,可预测性将成为新一代网络向前发展的重要支柱。
以及这将如何影响网络工程团队?他们会消失吗?绝对不是。总是需要人为干预,但要以更有效率的方式进行。如上所述,工程师等不及要等到网络出现问题,他们的价值就不是花费数小时来随机测试网络,而是建立一个能够做出明智决策以确保优质性能的更智能的网络。
如今,数据中心大多数都与开放系统(开放硬件和软件)一起使用,当遇到供应商之间互操作性以及其快速增长的网络的可扩展性的障碍时,它们使他们的生活变得更轻松。工程师不仅要花时间优化网络参数,还需要花时间建立测试自动化。网络测试功能必须最终成为该策略的一部分,以集成网络可见性和智能。
结论
数据中心运营商将继续需要大量的网络容量来支持其客户。这将增加维护团队的复杂性。最终,网络测试自动化需要成为其网络扩展计划的一部分,以很大程度地利用人力和技术资源。人们再也无法承担对网络进行反应式测试的负担,因此工程师将需要在其网络扩展计划中实施测试例程,以推动自动化并提高故障可预测性。