En la actualidad, las actividades humanas están potenciadas por un sinnúmero de servicios automatizados. Desde el funcionamiento de los semáforos viales hasta las cosas más avanzadas como automóviles que se conducen de forma autónoma.
En este artículo discutiremos algunos de los mecanismos necesarios para la gestión de servicios automatizados; es decir: ¿cómo nos aseguramos de que nuestros servicios automatizados están funcionando adecuadamente y permanecerán así en el futuro?
Para discutir este tema vamos a tomar como ejemplo un servicio automatizado que muchas veces se considera en cierta forma trivial, pero que se vuelve extremadamente relevante bajo ciertas circunstancias: nos referimos a los servicios de respaldo de archivos empresariales.
Es común escuchar historias donde alguna empresa u organización en apariencia tenía servicios de respaldo en marcha, pero cuando ocurre un evento de pérdida de información, se descubre que, o no estaban funcionando adecuadamente o no son útiles del todo.
El establecimiento de procesos adecuados de métrica, monitoreo y alerta, junto con la definición de procedimientos específicos para atender alertas y anomalías en las métricas permite dar confiabilidad a este tipo de procesos.
Contenido
Marco Teórico
Proceso automatizado
En general un proceso automatizado es aquel que, basado en una configuración previamente establecida, (1) toma datos de entrada, (2) realiza algún trabajo sobre esos datos y (3) genera un resultado. Usualmente estos procesos se realizan ya sea mediante intervalos de tiempo programados o como reacción a algún evento.
Estos procesos automatizados usualmente pertenencen a una cadena de procesos donde el resultado de uno afecta la entrada de otro.
En nuestro ejemplo, el proceso de respaldos automatizado tiene como principal entrada los archivos de trabajo del personal de la organización y como principal salida la copia de estos archivos en un lugar seguro. A su vez, esta salida sirve de entrada a un posterior proceso de recuperación que es usualmente el proceso que se rompe cuando los respaldos no funcionan.
Monitoreo, Métricas y Alertas (MMA)
Cada proceso automatizado debe tener facilidades de monitoreo de forma que se pueda observar el resultado de la ejecución. Esto usualmente se realiza mediante el uso de bitácoras de ejecución que son utilizadas para determinar la salud del proceso automatizado y generar alertas en caso de que la salud del proceso se vea comprometida.
El monitoreo se puede acompañar por la medición de parámetros específicos de salud. Estas métricas se pueden calcular con base en las bitácoras de ejecución o mediante el uso de pruebas activas que midan el rendimiento del proceso.
Finalmente, se definen alertas que son comunicaciones enviadas a los equipos de soporte cuando una métrica o una secuencia en la bitácora de ejecución revelen que la salud del proceso automatizado está comprometida.
Un ejemplo de esto se describe en la siguiente imagen. Las bitácoras son monitoreadas para detectar la presencia de errores. De la misma forma se toman métricas que también son monitoreadas para la generación de alertas en caso necesario.
Mecanismos de Control del MMA
En ocasiones puede ser conveniente contar con mecanismos que permitan evidenciar el correcto funcionamiento del sistema MMA. Para esto el personal de soporte puede contar con sistemas de consulta que prueben la validez y la edad de los datos generados por el MMA. Un ejemplo de esto pueden ser mensajes de correo que indiquen el resultado del monitoreo y de las métricas. La ausencia de estos mensajes sería un indicativo de que el sistema MMA no está en funcionamiento.
Siendo el MMA también un proceso automatizado en raras ocasiones puede ser útil que exista un segundo sistema MMA para controlar el primero.
MMA de Ejemplo
Para el caso de estudio de nuestro ejemplo – el sistema de respaldos empresarial – la siguiente imagen describe una implementación relativamente rudimentaria de un sistema MMA basado en bitácoras y mensajes de email.
El sistema automatizado de respaldos genera bitácoras de ejecución que son enviadas por email a dos cuentas: (1) Una cuenta de monitoreo automatizado y (2) una cuenta del personal de soporte. La cuenta de correo de monitoreo es inspeccionada por un proceso de monitoreo de correo de bitácoras. Este determinará si en las bitácoras hay mensajes que indiquen algún mal funcionamiento del sistema automatizado de respaldos. A su vez, almacenará algunas métricas de ejecución que pueden inferirse de las bitácoras, tales como tiempo de ejecución, tamaño de los respaldos, etc. El proceso de monitoreo puede decidir generar alertas con base en el contenido de las bitácoras o en el comportamiento de las métricas en el tiempo.
Cuando se generan alertas, estas son enviadas a la cuenta de correo del personal de soporte quienes ya tienen una copia de las bitácoras de ejecución, lo cual les facilitará inspeccionar dichas bitácoras y atender el problema. A su vez, se puede incluir una alerta de control que permita saber que el proceso de monitoreo se ejecutó y que no encontró problemas.
A partir de la base de datos de métricas se pueden realizar análisis proactivos recurrentes por parte del personal de soporte para determinar las tendencias de salud del proceso automatizado.
Conclusión
Los sistemas MMA (Monitoreo, Métricas y Alertas) son una pieza fundamental en el adecuado soporte y operación de procesos automatizados.
Comentarios