Ingeniero de IA – Sistemas Agentic y RAG Fully Remote - US

Ingeniero de IA – Sistemas Agentic y RAG

Tiempo completo • Fully Remote - US
Título del puesto: Ingeniero de IA – Sistemas Agenticos y RAG
Ubicación: Remoto
Departamento: IA y Plataformas de Datos
 
Solo ciudadanos estadounidenses o titulares de Green Card

Sobre el puesto
Como ingeniero de IA, diseñarás, construirás y operarás sistemas de IA agente de principio a fin, desde el concepto hasta la producción. Trabajarás en orquestación multiagente, Generación Aumentada por Recuperación (RAG), marcos de evaluación y barreras de IA para construir sistemas seguros, fiables y de alto rendimiento.
Colaborarás de forma transversal con equipos de producto, ML y diseño, dando vida a las ideas mediante una sólida ejecución de ingeniería, una comunicación clara y una mentalidad de bajo ego y resolución de problemas.

Responsabilidades clave
1. Desarrollo y optimización de RAG
  • Diseñar e implementar pipelines de generación aumentada por recuperación para conectar LLMs en datos empresariales o específicos de dominio.
  • Toma decisiones estratégicas sobre la estrategia de fragmentación, los modelos de incrustación y los mecanismos de recuperación para equilibrar la precisión del contexto, la recuperación y la latencia.
  • Trabaja con bases de datos vectoriales (Qdrant, Weaviate, pgvector, Pinecone) y frameworks de incrustación (OpenAI, Hugging Face, Instructor, etc.).
  • Diagnostica e itera sobre desafíos como los compromisos en el tamaño de los fragmentos, la calidad de la recuperación, los límites de las ventanas de contexto y la precisión de la base, utilizando evaluaciones estructuradas y métricas.

2. Marcos de calidad y evaluación de chatbots
  • Establecer marcos de evaluación integrales para aplicaciones LLM, combinando métodos cuantitativos (BLEU, ROUGE, tiempo de respuesta) y cualitativos (evaluación humana, LLM como juez, relevancia, coherencia, satisfacción del usuario).
  • Implementa monitorización continua y pruebas de regresión automatizadas utilizando herramientas como LangSmith, LangFuse, Arize o arneses de evaluación personalizados.
  • Identificar y prevenir la degradación de la calidad, alucinaciones o inconsistencias fácticas antes del lanzamiento en producción.
  • Colaborar con el diseño y el producto para definir métricas de éxito y bucles de retroalimentación de los usuarios para una mejora continua.

3. Límites, Seguridad e IA Responsable
  • Implementa barreras de seguridad multinivel en validación de entradas, filtrado de salida, ingeniería de prompts, reclasificación y abstención ("No lo sé").
  • Utiliza marcos como Guardrails AI, NeMo Guardrails o Llama Guard para garantizar el cumplimiento, la seguridad y la integridad de la marca.
  • Construir sistemas de seguridad basados en políticas para manejar datos sensibles, contenido de usuario y casos límite con vías claras de escalada.
  • Equilibra la seguridad, la experiencia del usuario y la ayuda, sabiendo cuándo bloquear, reformular o rechazar las respuestas con elegancia.

4. Sistemas Multiagente y Orquestación
  • Diseña y opera flujos de trabajo multiagente utilizando marcos de orquestación como LangGraph, AutoGen, CrewAI o Haystack.
  • Lógica de enrutamiento de coordenadas, delegación de tareas y ejecución de agentes paralelos vs. secuenciales para manejar razonamientos complejos o tareas de varios pasos.
  • Construir herramientas de observabilidad y depuración para rastrear las interacciones con los agentes, el rendimiento y la optimización de costes.
  • Evalúa los compromisos en torno a la latencia, fiabilidad y escalabilidad en entornos multiagente de calidad de producción.

Requisitos mínimos
  • Tener una buena competencia en Python (FastAPI, Flask, asyncio) y experiencia en GCP es bueno
  • Experiencia práctica demostrada en la implementación de RAG con herramientas, modelos y métricas de evaluación específicas.
  • Conocimiento práctico de marcos agenticos (LangGraph, LangChain) y ecosistemas de evaluación (LangFuse, LangSmith).
  • Excelentes habilidades de comunicación, demostrada capacidad para colaborar de forma transversal y un estilo de trabajo bajo ego, orientado a la propiedad .
 

Cualificaciones Preferidas / Buenas para Tener
  • Experiencia en flujos de trabajo tradicionales de IA/ML — por ejemplo, entrenamiento de modelos, ingeniería de características y despliegue de modelos de ML (scikit-learn, TensorFlow, PyTorch).
  • Familiaridad con la optimización de recuperación, ajuste de prompts y evaluación del uso de herramientas.
  • Experiencia en observabilidad y perfilado de rendimiento para sistemas de IA a gran escala.
  • Comprensión de los principios de seguridad y privacidad para sistemas de IA (redacción de PII, autenticación/autorización, RBAC)
  • Exposición a sistemas de chatbots empresariales, pipelines LLMOps y evaluación continua de modelos en producción.
 
 
 

Este es un puesto remoto.

Compensación: 130.000,00 $ al año




(si ya tienes un currículum en Indeed)

O aplicar aquí.

* campos requeridos

Ubicación
Or
Or