部分中断 Block storage · RO-BUH
Zoned-namespace firmware upgrade on a subset of drives. 已完全解决,后续跟进事项内部追踪中。
四个数据中心共 16 个组件的实时基础设施健康状况。由我们 ASN 之外的外部探针每 20 秒轮询一次;原始数据公开发布,包括不良数据。
Anycast DDoS shield · NVMe firmware upgrade on one storage shelf, rolling.
下方每个柱形代表一天,颜色表示当天最差状态。悬停柱形可查看日期及当天摘要。
所有组件最近 14 次已解决事故——每次页面加载时由探针自动刷新。
Zoned-namespace firmware upgrade on a subset of drives. 已完全解决,后续跟进事项内部追踪中。
Rebalance of a hot cell into a cooler shelf. 已完全解决,后续跟进事项内部追踪中。
IOMMU group re-mapping required a short guest stun — ~5% of hosts affected. 已完全解决,后续跟进事项内部追踪中。
Host-agent crash loop after a dependency rollout — ~11% of hosts affected. 已完全解决,后续跟进事项内部追踪中。
DDoS event absorbed — peak 22 Gbps, scrubbed to edge. 已完全解决,后续跟进事项内部追踪中。
Asymmetric routing detected at BIX Bucharest. 已完全解决,后续跟进事项内部追踪中。
Erasure-coding reconstruction throttled after a double disk failure. 已完全解决,后续跟进事项内部追踪中。
NVMe device failure, RAID rebuild in progress. 已完全解决,后续跟进事项内部追踪中。
Rebalance of a hot cell into a cooler shelf. 已完全解决,后续跟进事项内部追踪中。
Hypervisor-level memory pressure investigation — ~11% of hosts affected. 已完全解决,后续跟进事项内部追踪中。
Object-store index promotion briefly held the write lock. 已完全解决,后续跟进事项内部追踪中。
Slow-query regression on the metadata service. 已完全解决,后续跟进事项内部追踪中。
IOMMU group re-mapping required a short guest stun — ~5% of hosts affected. 已完全解决,后续跟进事项内部追踪中。
全部 17 个组件按月汇总的服务可用率。低于 99.99 % 的月份将触发 SLA 信用补偿——详见 SLA。
How we measure uptime, what counts as a Tier-1 incident, where to subscribe and how post-mortems are published.