Ingeniero de Datos

Mergen Partners Private Limited

₱200-230K[Mensual]
RemotoExp de Yrs 5-10BaceleroTiempo completo
Compartir

Detalles remotos

Abrir paísFilipinas

Requisitos de idiomaInglés

Este trabajo remoto está abierto a candidatos en países específicos. Por favor, confirme si desea continuar a pesar de las posibles restricciones de ubicación

Descripción del trabajo

Mostrar texto original

Descripción

¿Eres el indicado?

Como Ingeniero Líder Técnico - Datos, diseñarás, implementarás y escalarás una plataforma de datos de extremo a extremo construida en AWS S3, Glue, Lake Formation y DMS. Liderarás un pequeño equipo de ingenieros mientras colaboras de manera interdisciplinaria con las partes interesadas de fraude, finanzas, producto e ingeniería para garantizar un acceso a los datos fiable, oportuno y seguro en toda la empresa.

Defenderás las mejores prácticas en diseño de datos, gobernanza y observabilidad, aprovechando herramientas de IA Generativa para mejorar la productividad de ingeniería y acelerar el tiempo de obtención de información.


Defenderás las mejores prácticas en diseño de datos, gobernanza y observabilidad, aprovechando herramientas de IA Generativa para mejorar la productividad de ingeniería y acelerar el tiempo de obtención de información.


Contribuirás a

  • Poseer el diseño y la escalabilidad de la arquitectura del lago de datos para cargas de trabajo en streaming y por lotes, aprovechando los servicios nativos de AWS.
  • Liderar el desarrollo de tuberías de ingestion, transformación y almacenamiento utilizando AWS Glue, DMS, Kinesis/Kafka y PySpark.
  • Estructurar y evolucionar datos en formatos de tabla abiertos (Apache Iceberg, Delta Lake) para soportar consultas en tiempo real y de "viaje en el tiempo" para servicios posteriores.
  • Impulsar la productización de datos, habilitando acceso API-primer y autoservicio a conjuntos de datos curados para detección de fraude, reconciliación y casos de uso de informes.
  • Definir y rastrear SLA y SLO para tuberías de datos críticas, asegurando alta disponibilidad y precisión de los datos en un entorno fintech regulado.
  • Colaborar con equipos de InfoSec, SRE y Gobernanza de Datos para hacer cumplir la seguridad de los datos, el seguimiento de linaje, control de acceso y cumplimiento (GDPR, MAS TRM).
  • Utilizar herramientas de IA Generativa para mejorar la productividad de los desarrolladores, incluyendo la generación automática de arneses de prueba, documentación de esquemas, andamios de transformación y perspectivas de rendimiento.
  • Mentorizar a ingenieros de datos, establecer dirección técnica y asegurar la entrega de tuberías de datos de alta calidad y observables.


Responsabilidades

  • Arquitectar tuberías escalables y optimizadas en costo a través de paradigmas en tiempo real y por lotes utilizando herramientas como AWS Glue, Step Functions, Airflow o EMR.
  • Gestionar la ingestión desde fuentes transaccionales utilizando AWS DMS, centrándose en el manejo de cambios de esquema y replicación de baja latencia.
  • Diseñar estrategias eficientes de particionamiento, compresión y metadatos para tablas de Iceberg o Hudi almacenadas en S3, catalogadas con Glue y Lake Formation.
  • Construir data marts, vistas de auditoría y capas analíticas para soportar procesos impulsados por máquinas (por ejemplo, motores de fraude) y interfaces legibles por humanos (por ejemplo, paneles).
  • Asegurar una robusta observabilidad de datos con métricas, alertas y seguimiento de linaje a través de OpenLineage o Great Expectations.
  • Liderar revisiones trimestrales del costo de datos, rendimiento, evolución de esquemas y diseño arquitectónico con las partes interesadas y la alta dirección.
  • Hacer cumplir el control de versiones, CI/CD y prácticas de infraestructura como código utilizando GitOps y herramientas como Terraform.

Requisito

  • Al menos 7 años de experiencia en ingeniería de datos.
  • Amplia experiencia práctica con el conjunto de datos de AWS: Glue (Trabajos y Crawlers), S3, Athena, Lake Formation, DMS y Redshift Spectrum.
  • Experiencia en el diseño de canalizaciones de datos para sistemas en tiempo real, de streaming y por lotes, incluyendo diseño de esquemas, optimización de formatos y SLAs.
  • Fuertes habilidades de programación en Python (PySpark) y SQL avanzado para procesamiento analítico y transformación.
  • Experiencia comprobada en la gestión de arquitecturas de datos utilizando formatos de tabla abiertos (Iceberg, Delta Lake, Hudi) a gran escala.
  • Comprensión del procesamiento de flujos con Kinesis/Kafka y orquestación a través de Airflow o Step Functions.
  • Experiencia en la implementación de controles de acceso a datos, políticas de cifrado y flujos de trabajo de cumplimiento en entornos regulados.
  • Capacidad para integrar herramientas de GenAI en procesos de ingeniería de datos para impulsar ganancias medibles en productividad y calidad, con un fuerte enfoque en la higiene de ingeniería.
  • Capacidad demostrada para liderar equipos, tomar decisiones arquitectónicas y colaborar con partes interesadas interfuncionales.

Puntos Extra

  • Experiencia trabajando en un entorno regulado por PCI DSS o cualquier otro banco central, con requisitos de registro de auditoría y retención de datos.
  • Experiencia en el dominio de pagos o banca, con casos de uso relacionados con conciliación, análisis de contracargos o detección de fraudes.
  • Familiaridad con contratos de datos, patrones de malla de datos y principios de datos como producto.
  • Experiencia utilizando GenAI para automatizar la documentación de datos, generar pruebas de datos o apoyar casos de uso de conciliación.
  • Exposición a estrategias de afinación de rendimiento y optimización de costos en AWS Glue, Athena y S3.
SQLPythonpysparkAWS DatastackGlueS3AthenaLake Formation
Preview

Jatin Kaushik

DirectorMergen Partners Private Limited

Activo en tres días

Publicado el 26 June 2025

Recordatorio de seguridad del jefe

Si la posición requiere que trabajes en el extranjero, por favor ten cuidado y ten cuidado con el fraude.

Si encuentras a un empleador que tiene las siguientes acciones durante tu búsqueda de empleo, por favor repórtalo inmediatamente

  • retiene tu ID,
  • requiere que usted proporcione una garantía o recoja la propiedad,
  • le obliga a invertir o recaudar fondos.
  • recauda beneficios ilícitos,
  • u otras situaciones ilegales.