Data Engineer (BigQuery/GCP & GenAI) en Madrid

BlinkLearning

Lugar de trabajo
En sede
Horas
Full-Time
Prácticas
false
Comparte la oferta

Descripción de la oferta

¿Te gustaría contribuir a la educación, formando parte de una de las compañías más punteras y de mayor crecimiento en Europa, dentro del sector de EdTech?

Blinklearning es una empresa de tecnología educativa con más de 4 millones de usuarios activos y presente en más de 50 países. Nuestro objetivo es contribuir a mejorar la sociedad digital a través de la educación en el uso eficaz y responsable de la tecnología y la innovación. La tecnología ya está revolucionando el mundo y también la educación, y lo hará aún más en los próximos años. Preparar a los alumnos para los retos del futuro en un entorno en constante cambio, requiere del uso de nuevas estrategias y herramientas al alcance de los profesores.

¿Qué buscamos?

Buscamos un/a Data Engineer (BigQuery/GCP & GenAI) dinámico/a y con experiencia para diseñar, desarrollar y mantener soluciones innovadoras que maximicen el potencial de los datos en Google Cloud Platform, con un enfoque particular en BigQuery. Esta persona será clave en la gestión experta de pipelines de datos, la construcción de aplicaciones backend inteligentes que se nutren de estos datos y la creación de visualizaciones en Looker Studio para derivar insights estratégicos.

Además, aprovechará esta sólida base de datos para explorar y desarrollar soluciones innovadoras que integren Inteligencia Artificial Generativa (GenAI), contribuyendo así a la vanguardia de la tecnología educativa. Si te motiva la excelencia en la gestión de datos, la creación de pipelines eficientes, la visualización de información y tienes un marcado interés en aplicar GenAI para potenciar estas capacidades, este es tu rol.

Funciones y responsabilidades:

Ingeniería de Datos y Gestión de BigQuery:
  • Diseñar, implementar y mantener procesos ETL/ELT eficientes para consolidar datos de diversas fuentes en Google BigQuery.
  • Utilizar SQL avanzado y herramientas como Dataform (o scripts de Python) para la transformación, limpieza, modelado y optimización de datos dentro de BigQuery.
  • Asegurar la calidad, integridad, disponibilidad y rendimiento de los datos y consultas en BigQuery.
Visualización de Datos y Reporting:
  • Crear, mantener y mejorar dashboards e informes interactivos en Looker Studio para visualizar datos clave.
  • Colaborar con stakeholders para traducir requisitos de negocio en visualizaciones claras y accionables.
Desarrollo de aplicaciones backend con GenAI (Python):
  • Diseñar y desarrollar aplicaciones backend utilizando Python que integren modelos de GenAI a través de APIs (OpenAI, Google Gemini, etc.).
  • Implementar lógica de orquestación utilizando librerías propias o externas para crear flujos de trabajo complejos con LLMs, a menudo informados por datos de BigQuery.
Ciclo de Vida Completo del Software y Datos:
  • Participar en todo el ciclo de vida del desarrollo, desde la concepción y el diseño hasta el despliegue, monitorización y mantenimiento tanto de las aplicaciones de IA como de los pipelines de datos.
  • Implementar estrategias de testing y asegurar la calidad del software y los datos.
Utilización y Optimización en Google Cloud Platform (GCP):
  • Trabajar extensivamente con servicios clave de GCP, principalmente BigQuery, Cloud Storage, Cloud Run, Pub/Sub y Datastream.
  • Optimizar el uso de los servicios de GCP para rendimiento y coste.
Colaboración Interfuncional y Documentación:
  • Colaborar estrechamente con product managers, analistas de datos, desarrolladores frontend/backend y otros equipos.
  • Mantener una documentación clara y actualizada de arquitecturas, procesos y aplicaciones

Requisitos técnicos esenciales:
  • Profunda experiencia práctica con Google BigQuery, incluyendo modelado de datos, optimización de consultas y administración.
  • Experiencia demostrable en el diseño e implementación de pipelines ETL/ELT.
  • Experiencia con herramientas de transformación de datos como Dataform.
  • Dominio de SQL avanzado para manipulación y análisis de datos complejos.
  • Experiencia demostrable creando dashboards y reportes en Looker Studio.
  • Sólida experiencia en Python.
  • Experiencia práctica usando APIs de modelos GenAI (OpenAI, Google Gemini, etc.) con SDKs de Python.
  • Experiencia práctica con servicios de Google Cloud Platform como Datastream, Pub/Sub, Cloud Run y Cloud Storage
  • Dominio de Git y plataformas como GitHub/GitLab/Bitbucket.
  • Habilidad para abordar desafíos complejos en la intersección de IA, datos y desarrollo de software.
Requisitos técnicos deseables:
  • Comprensión básica o experiencia con HTML5, CSS3, y JavaScript (ES6+).
  • Experiencia con Docker.
  • Comprensión de los principios y herramientas para la operacionalización de modelos y datos.
  • Habilidad para diseñar y refinar prompts de forma efectiva.
Habilidades generales:
  • Capacidad para trabajar en equipos multidisciplinares y comunicar ideas técnicas claramente. 
  • Enfoque en entregar soluciones con buenas prácticas de ingeniería de software, robustas, de alto valor y mantenibles. 
  • Motivación para explorar y adoptar nuevas tecnologías en GenAI y el ecosistema GCP. 
  • Adaptabilidad y Proactividad. 
  • Inglés nivel B2.
 

Acerca de BlinkLearning

.

Otras ofertas de ingeniero de datos que podrían interesarte...