10月6日消息 9月29日-9月30日,全球大部分的 Microsoft 365 服务出现了访问故障问题,从微软 Teams 到 Azure。宕机时间长达近5小时。
近期,微软公布了该问题的根源分析,微软表示,该问题是由于服务更新造成的,该更新本来是针对内部验证测试通道,但由于Azure AD后端服务安全部署过程(SDP)系统中的潜在代码缺陷,该更新直接部署到了微软的生产环境中。
微软表示,在2020年9月28日约21:25UTC至2020年9月29日00:23UTC期间,客户在对所有依赖Azure活动目录(Azure AD)进行身份验证的微软和第三方应用和服务执行身份验证操作时遇到了错误。到第二天2:25,所有的问题才得到完全缓解。
美国和澳大利亚是重灾区,美国只有17%的用户能够成功登录。
IT之家获悉,由于微软在SDP系统中的潜伏缺陷破坏了部署元数据,导致微软无法回滚更新,这意味着更新必须手动回滚,这让问题变得更加复杂。
微软向受影响的客户道歉,并表示他们正在继续采取措施改进微软Azure平台和他们的流程,以帮助确保未来不再发生此类事件。计划中的步骤之一包括对Azure AD服务后台SDP系统应用额外的保护措施,以防止发现的类问题。