Volver a proyectos

ETL Serverless Low Cost con Glue, Athena y S3 – Arquitectura Cloud

Este proyecto implementa una arquitectura ETL 100% serverless y de bajo coste sobre AWS, diseñada para procesar y transformar datos sin necesidad de mantener servidores activos. Su estructura en tres capas (Bronze, Silver y Gold) garantiza eficiencia, trazabilidad y escalabilidad, utilizando servicios totalmente gestionados como AWS Glue, Athena y S3. La arquitectura se ha optimizado para minimizar costes, eliminando el uso de Glue Spark y apoyándose en transformaciones SQL mediante Athena.

AWS Glue Athena Amazon S3 AWS Lambda QuickSight / Power BI
Arquitectura ETL serverless en AWS con Glue, Athena y S3

Arquitectura técnica

El flujo está compuesto por un conjunto de servicios completamente gestionados por AWS, que operan bajo demanda para reducir costes y simplificar el mantenimiento:

  1. Ingesta: Backups SQL de RDS se almacenan automáticamente en un bucket S3 mediante una función Lambda.
  2. Catalogación: Un Glue Crawler detecta la estructura de los datos en Bronze y actualiza el Data Catalog.
  3. Transformación: Las consultas CTAS de Athena convierten los datos a formato Parquet, generando las capas Silver y Gold sin necesidad de Spark.
  4. Orquestación: AWS Lambda y EventBridge automatizan todo el flujo diario, de copia, transformación y limpieza.
  5. Visualización: QuickSight o Power BI se conectan a la capa Gold para análisis interactivo y dashboards.

Capas del modelo

Beneficios clave

Aplicación y propósito

Este modelo fue diseñado como un pipeline ETL serverless de bajo coste para proyectos de analítica cloud donde la simplicidad y la eficiencia económica son clave. Su estructura modular permite implementarlo en entornos multi-tenant, startups o pequeñas empresas que deseen aprovechar el ecosistema AWS sin costes elevados.

Además, el proyecto sirve como base educativa y de demostración de buenas prácticas en la nube: arquitectura por capas, automatización con Lambda y optimización mediante Parquet y Athena.

¿Quieres implementar un pipeline ETL serverless como este?

Puedo ayudarte a diseñar, desplegar y optimizar tu arquitectura de datos en AWS, reduciendo costes y mejorando la eficiencia de tus procesos analíticos.

Implementar pipeline ETL en AWS → Ver mas proyectos