2023年9月18日消息,Azure SQL 数据库在周末引起了一些麻烦,美国东海岸的管理员在网络基础设施电源故障后无法连接到该服务。
微软在其状态页面上确认,此次中断于 9 月 16 日 UTC 时间 07:33 开始,直到 12 个多小时后的 21:38 才完全缓解。
微软表示:“一些在美国东部使用 Azure SQL 数据库的客户在尝试连接数据库时可能会遇到问题。与美国东部地区托管的数据库的连接可能会导致持续错误或超时。”
正如一位客户在以前称为 Twitter 的平台上指出的那样:“Sql DB 连接在生产中丢失。故障转移无法启动,对日常活动造成影响。感谢上帝(原文如此)周六。”
会议不稳定的确切原因尚未确定。微软表示:“我们发现底层网络基础设施在短时间内出现了电源问题。这导致计算节点变得不健康,导致 SQL 数据库出现故障和超时。”
与通常的情况一样,多米诺骨牌效应开始显现,依赖 SQL 数据库的下游服务难以正常运行。
微软表示:“我们通过内部监控系统收到了有关此问题的通知,促使我们启动彻底调查。” “为了减轻最初的影响,我们重新启动了受影响的计算节点,从而恢复了大多数数据库的功能。随后,剩余的 SQL 数据库实例重新上线,并恢复了全部功能。”
服务降级的根源电源问题仍然是微软工程师调查的根源,他们试图“建立一个工作流程以防止未来再次发生”。
因此,这并不是导致客户咬牙切齿或拔头发的所有中断之母,而且对于 Azure 上的 Microsoft SQL DBV 来说也不是一个好兆头。不过,这并不像一周前报道的导致澳大利亚东部云区域的 Azure 服务瘫痪的事件那么令人尴尬。
在这种情况下,“公用事业电力骤降导致一个数据中心(位于一个可用区)的一部分冷却装置脱机。” 微软得出的结论是,人员不足和自动化导致了这一挑战。
文章来源:https://www.theregister.com/2023/09/18/azure_sql_database_outage/




