Jornadas Tecnológicas del IFIC

14-15 octubre 2020

Universe

Europe/Madrid timezone

Desarrollos y herramientas para el almacenamiento y procesado de grandes cantidades de datos aplicado en ATLAS Tier2 y EventIndex EI3

14 oct. 2020 12:05

10m

Universe

Informática y procesado de datos

Alvaro Fernandez Casani (IFIC)

En esta presentación hablaré de los desarrollos realizados y herramientas utilizadas para el almacenamiento y procesado de grandes cantidades de datos, y aplicado en particular en el EventIndex EI3 dentro del experimento ATLAS.

Usamos un Object Store basado en CEPH para el almacenamiento temporal de información sobre los eventos producidos a nivel mundial en el GRID y el Tier0, que se consolidan finalmente en HADOOP.
Los nuevos desarrollos para el próximo run3 se centran en mejorar la usabilidad, y satisfacer los rendimientos necesarios. En el nuevo prototipo usamos HBase y una estrategia columnar para el almacenamiento de los datos, así como una capa unificada para el acceso basada en Apache Phoenix.
Se utilizan herramientas como InfluxDB y Grafana para la monitorizacion de datos basados en series temporales, así como GitLab para el versionado y control de código.
El procesamiento de los datos consolidados se realiza con entornos como MapReduce y Spark, que proveen grandes capacidades de análisis en paralelo.

Alvaro Fernandez Casani (IFIC)

EI-AlvaroFernandez-JT_IFIC-14Oct2020.pdf

Jornadas Tecnológicas del IFIC

Desarrollos y herramientas para el almacenamiento y procesado de grandes cantidades de datos aplicado en ATLAS Tier2 y EventIndex EI3

Universe

Ponente

Descripción

Autor primario

Materiales de la presentación

Your browser is out of date!