Hace un par de días varios sitios en internet presentaron problemas en su funcionamiento, tales como Trello, EdX y Slack. El día de hoy se confirmó que un error de dedo provocó la falla en la nube de Amazon, particularmente afectando a Amazon S3.

La causa del problema

Acordé a un comunicado publicado el día de hoy, se explica que la falla se presentó cuando unos ingenieros estaban revisando unos errores que estaba presentando el servicio de cobro del S3 y que provocaba que se comportara mas lento de lo normal.

Es así que al escribir un comando que tenía la intención de desactivar algunos cuantos servidores, presentaba un error lo que provocó que fueron mas servidores los afectados por lo que se afectaron otros subsistemas, creando una reacción en cadena que afectó una buena parte de la capacidad de respuesta del S3.

Esto afectó también a otros servicios que ofrece Amazon y que dependen del S3. Lo que obligó finalmente a realizar un reinicio general de los subsistemas afectados, algo que no se había realizado en años por lo que es fácil de imaginar que la reactivación no iba a tomar poco tiempo.

Tuvieron que pasar poco más de 4 horas para que el servicio regresará a la normalidad, pero habiendo tantos sitios afectados este tiempo fue una eternidad para muchos de ellos, ya que suelen depender de la confiabilidad que ofrece la nube de Amazon.

¿Qué es la Amazon S3?

Amazon Simple Storage Service (Amazon S3) ofrece un almancenamiento de objetos que a través de una sencilla interfaz web permite almacenar y recuperar los datos almacenados desde cualquier ubicación web. Cabe mencionar que la garantía que se ofrece con este servicio es una durabilidad del 99.999999999% por lo que es una verdadera sorpresa lo ocurrido.

También hay que considerar que la nube de Amazon cubre cerca del 31% de las necesidades que existen en el mercado, lo que hace notar el nivel de afectación presentado.

Por ahora solo quedará en confiar en que se reforzarán los protocolos de seguridad para que no se vuelva a presentar una situación similar y evitar que sus clientes empiecen a voltear a Microsoft, IBM o Google para alojar sus servicios.