Vytwo
Arquitecto de Datos en la Nube de Google y Modernización de Datos IAM
Tiempo completo • Hybrid - US
Puesto: Arquitecto de Datos en la Nube de Google – Modernización de Datos IAM
Ubicación: Dallas, TX / Charlotte, NC / Iselin, NJ, / Chandler, AZ / Ohio, Delaware (Híbrido)
*Solo debe ser ciudadano estadounidense / GC
Sobre el puesto:
Gestión de Identidad y Acceso (IAM) Modernización de Datos – migración de un almacén de datos SQL local a un Data Lake de estado objetivo en Google Cloud (GCP), habilitación de métricas e informes, análisis avanzados y casos de uso de GenAI (consulta en lenguaje natural, resumen acelerado, análisis de tendencias entre dominios) aprovechando procesamiento basado en PySpark, pipelines DevOps nativos en la nube de CI/CD y despliegues contenedores en OpenShift (OCP) ofrecer soluciones de datos escalables, seguras y de alto rendimiento.
Lo que harás:
DevOps / CI-CD
- Experiencia implementando pipelines CI/CD para cargas de trabajo de datos y analítica
- Familiaridad con el control de versiones basados en Git, automatización de compilaciones y estrategias de despliegue
Contenedores y plataforma
- Experiencia con OpenShift Container Platform (OCP) para desplegar cargas de trabajo y servicios de datos
- Comprensión de la arquitectura contenedorizada, escalado y gestión del entorno
- Capacidad probada para construir pipelines CI/CD para cargas de trabajo de datos e infraestructura
- Experiencia gestionando secretos de forma segura usando GCP Secret Manager
- Propiedad de la observabilidad, SLOs, paneles de control, alertas y libros de procedimientos
- Competencia en registro, monitorización y alertas para canalizaciones de datos y fiabilidad de la plataforma
Big Data y Procesamiento
- Experiencia práctica con PySpark para ETL/ELT, transformación de datos y optimización del rendimiento
- Sólido conocimiento de los conceptos de procesamiento de datos distribuidos
Arquitectura de Datos y Nube
- Amplia experiencia diseñando plataformas de datos en Google Cloud Platform (GCP)
- Experiencia con Data Lakes, almacenamiento de datos y programas de migración a gran escala
Arquitectura y almacenamiento de lagos de datos
- Experiencia demostrada diseñando e implementando arquitecturas de data lake (por ejemplo, modelos Bronze/Silver/Gold o en capas).
- Sólido conocimiento del diseño de almacenamiento en la nube (GCS ), incluyendo la disposición de cubos, convenciones de nombres, políticas de ciclo de vida y controles de acceso
· Experiencia con la arquitectura Hadoop/HDFS , sistemas de archivos distribuidos y principios de localidad de datos
- Experiencia práctica con formatos de datos columnares (Parquet, Avro, ORC) y técnicas de compresión
- Experiencia en estrategias de partición, rellenos y organización de datos a gran escala
- Capacidad para diseñar modelos de datos optimizados para análisis y consumo de BI
Ingesta y Orquestación de Datos
· Experiencia en la construcción de pipelines de ingestión por lotes y streaming usando servicios GCP-nativos
· Conocimiento de arquitecturas de streaming basadas en Pub/Sub, diseño de esquemas de eventos y versionado
· Sólido conocimiento de la ingestión incremental y los patrones de CDC, incluyendo idempotencia y deduplicación
· Experiencia práctica con herramientas de orquestación de flujos de trabajo (Cloud Composer / Airflow)
· Capacidad para diseñar mecanismos robustos de manejo de errores, reproducción y relleno
Procesamiento y transformación de datos
· Experiencia desarrollando pipelines escalables por lotes y streaming usando Dataflow (Apache Beam) y/o Spark (Dataproc)
· Fuerte dominio de BigQuery SQL, incluyendo optimización de consultas, particionamiento, agrupación en clústeres y control de costes.
· Experiencia práctica con Hadoop MapReduce y herramientas de ecosistemas (Hive, Pig, Sqoop)
· Habilidades avanzadas de programación en Python para ingeniería de datos, incluyendo pruebas y diseño de código mantenible
· Experiencia gestionando la evolución de esquemas minimizando el impacto posterior
Análisis y Servicio de Datos
· Experiencia en optimización del rendimiento de BigQuery y patrones de servicio de datos
· Experiencia construyendo capas semánticas y métricas gobernadas para análisis consistentes
· Familiaridad con integración BI, controles de acceso y estándares de paneles
· Comprensión de los patrones de exposición de datos a través de vistas, APIs o conjuntos de datos seleccionados
Gobernanza de Datos, Calidad y Metadatos
· Experiencia implementando catálogos de datos, gestión de metadatos y modelos de propiedad
· Comprensión de la línea de datos para la auditabilidad y la resolución de problemas
· Fuerte enfoque en los marcos de calidad de datos, incluyendo validación, comprobaciones de frescura y alertas
· Experiencia definiendo y haciendo cumplir contratos de datos, esquemas y SLA
Es bueno tenerlo
Seguridad, Privacidad y Cumplimiento
· Experiencia práctica implementando controles de acceso detallados para BigQuery y GCS
· Experiencia en planificación de Sprint y ayuda técnica al equipo.
· Sólidas habilidades en comunicación con los grupos de interés y arquitectura de soluciones
Experiencia que aportarás:
- Experiencia: [10–14]+ años en DevOps y Arquitectura de Datos, 5+ años diseñando Pyspark/GCP/OCP a gran escala; La migración previa a la → a la nube es imprescindible.
- Educación: Licenciatura/Máster en Informática, Sistemas de Información o experiencia equivalente.
- Certificaciones: Google Cloud Professional Cloud Architect/DevOps/OCP (obligatorio o en un plazo de 3 meses). Además: Ingeniero de Datos Profesional, Ingeniero de Seguridad
Opciones flexibles de teletrabajo disponibles.
Somos un empleador con igualdad de oportunidades y todos los candidatos calificados recibirán consideración por el empleo sin distinción de raza, color, religión, sexo, origen nacional, estado de discapacidad, estado de veterano protegido o cualquier otra característica protegida por la ley.
Vytwo Technologies es un líder global en integración de aplicaciones empresariales, ofreciendo servicios integrales de consultoría y negocio de TI para organizaciones de tamaño medio a grande.
Ofrecemos una suite completa de soluciones que incluyen consultoría empresarial y tecnológica, servicios de Cloud, e-business y transformación digital, integración de sistemas, desarrollo de aplicaciones personalizadas, reingeniería y soporte a largo plazo para aplicaciones.
(si ya tienes un currículum en Indeed)
O aplicar aquí.
Flexibilidad y crecimiento profesional
Descuentos para empleados