La interrupción de Microsoft Azure muestra la dura realidad de las fallas en la nube

La nube Azure de Microsoft La plataforma, sus servicios 365 ampliamente utilizados, Xbox y Minecraft comenzaron a sufrir interrupciones aproximadamente al mediodía, hora del Este, el miércoles, como resultado de lo que Microsoft dijo que fue «un cambio de configuración involuntario». El incidente, que marca la segunda interrupción importante de un proveedor de nube en menos de dos semanas, pone de relieve la inestabilidad de una Internet construida en gran medida sobre una infraestructura administrada por unos pocos gigantes tecnológicos.

Los problemas de Microsoft se originaron específicamente en la red de entrega de contenido Front Door de Azure y surgieron apenas unas horas antes del anuncio de ganancias programado de Microsoft. El sitio web de la empresa, incluida su página de relaciones con los inversores, todavía estaba inactivo el miércoles por la tarde, y la página de estado de Azure donde Microsoft proporciona actualizaciones también tenía problemas intermitentes.

Microsoft describió en las actualizaciones de estado del miércoles que pasó por un proceso de reversión secuencial de las versiones recientes de su entorno hasta que pudo identificar la “última configuración buena conocida”. A las 3:01 pm ET, la compañía dijo que había identificado e impulsado esta configuración estable y que «los clientes pueden comenzar a ver signos iniciales de recuperación. Actualmente estamos recuperando nodos y enrutando el tráfico a través de nodos sanos».

Un portavoz de Microsoft dijo en un comunicado: «Estamos trabajando para solucionar un problema que afecta a Azure Front Door y que está afectando la disponibilidad de algunos servicios. Los clientes deben continuar revisando sus alertas de estado del servicio». La compañía no respondió de inmediato a las preguntas de WIRED sobre la naturaleza del cambio de configuración que provocó la interrupción.

Además de ocurrir el día de las ganancias de Microsoft, la interrupción se produce nueve días después de que Amazon Web Services, rival de Azure, sufriera una interrupción masiva que afectó a sitios y servicios en todo el mundo. Los principales proveedores de nube, a menudo llamados “hiperescaladores”, estandarizan y a menudo mejoran la seguridad y confiabilidad básica para sus clientes, pero los problemas e interrupciones pueden hacer que se conviertan en puntos únicos de falla para grandes poblaciones de servicios digitales críticos.

«Incluso la página de estado de interrupción de Azure está inactiva», dice Davi Ottenheimer, gerente de cumplimiento y operaciones de seguridad desde hace mucho tiempo y vicepresidente de la empresa de infraestructura de datos Inrupt. «Otro error de cambio de configuración: ahora más que nunca estamos en la era de la violación de la integridad».

Azure impidió que los clientes realizaran cambios de configuración en sus instancias mientras trabajaba para solucionar el problema. La compañía dijo en una actualización de estado a las 3:22 p.m. ET que espera una “mitigación total” de la situación para las 7:20 p.m. ET.

«Las organizaciones pueden pensar que están aisladas por su elección de proveedor de nube, pero las dependencias son más profundas», dice Munish Walther-Puri, profesor adjunto de IANS Research y ex director de riesgo cibernético de la ciudad de Nueva York. «Cuando los socios clave dependen de otros hiperescaladores, la exposición se multiplica. A medida que la IA se convierte en la siguiente capa de infraestructura crítica, estas interrupciones demuestran la fragilidad de nuestra columna vertebral digital».

We use cookies in order to give you the best possible experience on our website. By continuing to use this site, you agree to our use of cookies.
Accept