Panne partielle Block storage · RO-BUH
Zoned-namespace firmware upgrade on a subset of drives. Entièrement résolu ; actions de suivi suivies en interne.
État de l'infrastructure en temps réel pour 16 composants dans quatre datacenters. Sondé toutes les 20 secondes par des sondes externes hors de notre ASN ; les mesures sont publiées brutes, y compris les mauvaises.
Anycast DDoS shield · NVMe firmware upgrade on one storage shelf, rolling.
Chaque barre ci-dessous représente un jour, coloré selon l'état le plus dégradé observé. Survolez une barre pour voir la date et le résumé journalier.
Les 14 derniers incidents résolus sur l'ensemble des composants — actualisés automatiquement à chaque chargement de page depuis nos sondes.
Zoned-namespace firmware upgrade on a subset of drives. Entièrement résolu ; actions de suivi suivies en interne.
Rebalance of a hot cell into a cooler shelf. Entièrement résolu ; actions de suivi suivies en interne.
IOMMU group re-mapping required a short guest stun — ~5% of hosts affected. Entièrement résolu ; actions de suivi suivies en interne.
Host-agent crash loop after a dependency rollout — ~11% of hosts affected. Entièrement résolu ; actions de suivi suivies en interne.
DDoS event absorbed — peak 22 Gbps, scrubbed to edge. Entièrement résolu ; actions de suivi suivies en interne.
Asymmetric routing detected at BIX Bucharest. Entièrement résolu ; actions de suivi suivies en interne.
Erasure-coding reconstruction throttled after a double disk failure. Entièrement résolu ; actions de suivi suivies en interne.
NVMe device failure, RAID rebuild in progress. Entièrement résolu ; actions de suivi suivies en interne.
Rebalance of a hot cell into a cooler shelf. Entièrement résolu ; actions de suivi suivies en interne.
Hypervisor-level memory pressure investigation — ~11% of hosts affected. Entièrement résolu ; actions de suivi suivies en interne.
Object-store index promotion briefly held the write lock. Entièrement résolu ; actions de suivi suivies en interne.
Slow-query regression on the metadata service. Entièrement résolu ; actions de suivi suivies en interne.
IOMMU group re-mapping required a short guest stun — ~5% of hosts affected. Entièrement résolu ; actions de suivi suivies en interne.
Disponibilité globale du service sur l'ensemble des 17 composants, par mois. Les mois en dessous de 99,99 % donnent droit à un crédit SLA — voir SLA.
Comment nous mesurons la disponibilité, ce qui compte comme incident Tier-1, où s'abonner et comment les post-mortems sont publiés.