Categorías
Blog
Tech Blog

ATENCIÓN: ¡ALERTAS!

Dejando de lado el alarmismo propio del titular, a estas alturas no cabe discusión sobre la importancia de disponer de una estructura de monitorización y alertas en la que apoyarnos para conocer el estado de nuestras infraestructuras.

Para entendernos, llamaremos “infraestructura” a algún servicio o conjunto de servicios que están a nuestro cargo y que necesitamos mantener vigilados, sin entrar en más detalle.

Las razones para elegir entre los múltiples sistemas disponibles son diversas, y en muchas ocasiones más basadas en los propios gustos que en las necesidades. Pero, en el fondo, a la hora de decidir montar un sistema de monitorización y alertas sobre nuestra infraestructura de aplicaciones y/o servicios, suele haber una carencia de información, una necesidad de conocimiento, o alguna otra sensación de urgencia relacionada con nuestra infraestructura.

Black Box monitoring

En el modelo de monitorización más clásico, ya casi obsoleto, los sistemas de alertas miraban la infraestructura como una caja cerrada, una caja negra, y lo único que podíamos hacer era preguntarle a la propia infraestructura, como un todo, si estaba bien o no.

Que nuestra infraestructura nos cuente que está bien o no, podemos decir que es útil, al mismo tiempo que fútil. Una alerta de estas características desencadenaba una serie de procesos para identificar el motivo que había hecho a la infraestructura «estar mal», pero sin más detalle, debían realizarse una serie de procesos para determinar el origen de esa alerta.

No había garantías de que este ejercicio de diagnóstico encontrase el problema, ni se podía estimar inicialmente cuánto se tardaría en resolverlo. Debía haber personal altamente cualificado y con un conocimiento profundo de la infraestructura disponible para resolver estas
alertas.

En perspectiva, ni siquiera parece que sea buena idea hacer este tipo de monitorización. Pero entendamos que las infraestructuras han evolucionado mucho en los últimos años y en esa evolución está el principal motivo para el cambio de modelo.

White Box monitoring

Actualmente, la monitorización se realiza sobre lo que se denomina sistemas de caja blanca. Es como si el sistema de monitorización mirase la infraestructura como una caja de cristal y pudiera ver todas sus partes bien engranadas.

Las alertas que un sistema de monitorización de este tipo pueden disparar, ya no ofrecen información binaria, de bien o mal, sino amplia información relacionada con cada pieza de la infraestructura, y por “pieza” aquí nos referimos a cualquier cosa.

Este tipo de monitorización nos ofrece entre otros beneficios el poder monitorizar desde las transacciones únicas que recibe nuestra infraestructura, hasta los consumos de memoria o tráfico de red que se generan entre los servicios que componen la infraestructura que está siendo monitorizada, pasando por el seguimiento de las transacciones que van de una de nuestras aplicaciones o servicios hasta el siguiente.

Keep Calm & Wait Alerts

Con todo lo dicho la decisión casi se toma sola. Este último modelo de monitorización si se decide implementarlo, permitirá a las empresas recuperar la inversión realizada en estos sistemas de forma rápida y efectiva. Se incrementa el rendimiento del equipo y se agilizan los procesos, ya que el diagnóstico se realizará ahora sobre el elemento que ha disparado la alerta, y la mayoría de las veces, ni siquiera eso será necesario, ya que la propia naturaleza de este tipo de alertas arroja información sobre los motivos de la misma, lo que permite ser más quirúrgicos a la hora de resolver las incidencias.

Podemos sentirnos más seguros, ya que no se diagnostica a ciegas, y por tanto las acciones derivadas del análisis de la incidencia y destinadas a solventar la incidencia tienen menos probabilidades de afectar de modo no controlado a la infraestructura. Se pueden asignar alertas determinadas a las personas que han participado en el desarrollo de esa parte de la
infraestructura, maximizando el uso de los recursos.

El tiempo como recurso invertido también mejora, por lo ya mencionado, puesto que la
empresa invertirá menos tiempo en diagnosticar las incidencias y resolverlas.

Se puede hablar de una mejoría en la salud del equipo a todos los niveles de la empresa, tanto mental como física. Alargando el símil, es indudable que observar lo que ocurre dentro una caja transparente en la que se ven todas sus piezas interconectadas es menos estresante, y genera más tranquilidad que esperar a que una caja negra nos diga qué se ha roto.

What’s next?

En este cambiante mundo esto es solo un paso más a dar. El destino siguiente sería pasar a la anticipación y que nuestros sistemas de alertas nos provean, usando información de tendencias y datos de tipo estadístico, de alertas sobre posibles eventos que podrían ocurrir en nuestra plataforma, pero antes de que se desaten.

De esta forma podremos llegar a corregir el funcionamiento de nuestras infraestructuras antes de que ciertas incidencias lleguen siquiera a manifestarse.

No queda más que hacer uso de las alertas de forma muy controlada, monitorizando únicamente aquello que sea necesario, midiendo y corrigiendo con mucha frecuencia los umbrales de las alertas, al tiempo que nuestra plataforma evoluciona.

 

 

Paco Solano,
System Ninja
Media Interactiva.