Ponente
Dr.
Julio Lozano Bahilo
(Instituto de Física Corpuscular (CSIC-UV))
Descripción
Los servidores Frontier forman un sistema distribuido para regular el acceso
de trabajos a los datos almacenados en las bases de datos de condiciones.
Ocasionalmente se hallan sobrecargados debido a las características de las
consultas realizadas por ciertos tipos de tareas de producción. Por ello se ha
desarrollado un nuevo sistema de monitorizacion basado en los paquetes Beats+Logstash+Elasticsearch+Kibana (ELK) para extraer informacion exhaustiva
de la operación de dichos servidores, almacenarla y visualizarla.
El servicio filebeat incluido en el paquete Beats corre en cada servidor
Frontier leyendo los ficheros ‘log’ que contienen toda la información relevante
y los envia linea a linea a otra maquina para su procesado. En esta otra maquina
se ejecutan las instancias de logstash que recogen esas lineas y combinan todas
las variables relacionadas con cada consulta para enviar la recopilación a una
base de datos de Elasticsearch donde son almacenadas para su posterior
visualización mediante las herramientas de Kibana.
Con objeto de efectuar la monitorizacion en tiempo real, disponemos de un Dashboard con histogramas y otros gráficos que permiten una inmediata detección
de comportamientos anómalos. Ademas, hemos establecido un sistema de prevención
basado en alertas enviadas por correo electronico.
Summary
El contenido de esta presentacion detalla como se ha implementado un sistema de
monitorizacion en tiempo real de los servidores Frontier de ATLAS basado en las
herramientas englobadas en ELK (Elasticsearch, Logstash y Kibana).
Autores primarios
Alvaro Fernandez
(IFIC)
Sr.
Carlos García Montoro
(IFIC)
ESTEBAN FULLANA TORREGROSA
(IFIC)
Sr.
Fco. Javier Sanchez Martinez
(IFIC)
Dr.
JOSE SALT
(IFIC)
Sr.
Javier Aparisi Pozo
(IFIC)
Dr.
Julio Lozano Bahilo
(Instituto de Física Corpuscular (CSIC-UV))
Dr.
Santiago Gonzalez de la Hoz
(IFIC)