← All Jobs
Posted Apr 12, 2026

Ingeniero de IA — Sistemas de Voz en Producción

Apply Now
Serás responsable de la capa de IA de un agente de voz en tiempo real en producción — incluyendo el motor de conversación, el pipeline basado en eventos y los workflows del agente. Nivel: Mid–Senior Etapa: Producto en fase temprana (con clientes reales) Modalidad: Mayormente remoto Stack: OpenAI Realtime API · Python · AWS Arquitectura: Basada en eventos Idiomas: Inglés (obligatorio) · Español (comunicación interna) SOBRE EL ROL No buscamos un perfil tradicional de IA. Este rol está enfocado en construir sistemas en producción, NO en entrenar modelos, hacer experimentos o analizar datos. Trabajarás: - De forma autónoma en modalidad asíncrona, con sincronización semanal - Siendo responsable de tu servicio de IA de extremo a extremo: código, pruebas, CI/CD y despliegue - Participando en decisiones de arquitectura (alineadas con el equipo antes de implementar) - Construyendo para usuarios reales con estándares altos desde el inicio Aunque es un producto en etapa temprana, los estándares no lo son: se espera código limpio, documentación sólida y pruebas como práctica habitual. El inglés es obligatorio para código, documentación y comunicación. NO ES UN PERFIL ADECUADO SI Tu experiencia principal está en: - Ciencia de datos (modelos, estadística, experimentos) - Ingeniería de ML (pipelines de entrenamiento, despliegue de modelos) - Prompt engineering únicamente (herramientas no-code) - Investigación en IA (papers, teoría, benchmarks) REQUISITO OBLIGATORIO (NO NEGOCIABLE) Debes haber llevado a producción un producto real de IA de voz o audio en tiempo real. Debes tener experiencia directa con la OpenAI Realtime API, incluyendo: - Ciclo de vida de sesiones - Flujo de eventos - Manejo de fallos Si esto es nuevo para ti, no apliques. EL SISTEMA QUE LIDERARÁS Un agente de voz con IA en producción construido sobre OpenAI Realtime API: - Arquitectura basada en eventos (trigger pipeline respuesta) - Conversación en tiempo real + clasificación de intención + captura de datos estructurados - Orquestación de workflows con Relevance AI Serás responsable de ambas capas: - Integración de IA - Arquitectura de workflows y prompting Tú construyes, tú eres dueño, tú despliegas. No hay hand-offs. RESPONSABILIDADES 1. Integración con OpenAI Realtime API - Gestionar el ciclo completo de sesiones (creación, tokens, eventos, cierre) - Manejar fallos (sesiones caídas, errores de secuencia, timeouts, reconexión) - Optimizar continuamente: - Calidad de voz - Latencia - Naturalidad de la conversación 2. Arquitectura e Infraestructura (Event-driven) - Diseñar y mantener el pipeline basado en eventos - Garantizar confiabilidad, observabilidad y manejo robusto de errores - Ser responsable del stack completo: - CI/CD - Infraestructura - Despliegues en múltiples entornos 3. Workflows de Agentes y Prompting - Diseñar workflows multi-paso en Relevance AI: - Clasificación - Enrutamiento - Uso de herramientas - Captura de datos - Construir prompts, function calling y lógica condicional - Crear nuevos workflows desde cero - Documentar y proponer arquitecturas antes de implementar 4. Calidad, Testing y Documentación - Escribir y mantener pruebas con pytest (obligatorio) - Aplicar estándares de calidad: - Linting con ruff - Controles en CI antes de cada merge - Monitorear: - Calidad de conversaciones - Confiabilidad de eventos - Costos de API - Documentar todo en inglés - Proponer cambios relevantes y alinearlos antes de ejecutar REQUISITOS Obligatorios (no negociables) - Experiencia en producción con OpenAI Realtime API - Python sólido (async/await, arquitectura limpia, pytest) - Diseño de sistemas basados en eventos - Function calling de LLM en producción - Diseño de workflows de agentes (multi-paso, con estado) - AWS: - Lambda - API Gateway - DynamoDB - SAM - SSM - Gestión completa de CI/CD (GitHub Actions, pipelines, despliegues) - Inglés fluido (oral y escrito) - Español (comunicación interna) Deseable - Experiencia con Relevance AI o similares - Fundamentos de WebRTC (SDP, ICE, signaling) - FastAPI, Pydantic v2, httpx, Mangum - Docker, ruff, freezegun - Experiencia en startups STACK TECNOLÓGICO Core: OpenAI Realtime API · Python 3.11 · FastAPI · httpx · Pydantic v2 · Mangum Infraestructura: AWS Lambda · API Gateway · DynamoDB · SSM · SAM · S3 Herramientas: GitHub Actions · Docker · pytest · ruff · Relevance AI FORMA DE TRABAJO - Trabajo asíncrono con sincronización semanal - Alta autonomía y responsabilidad - Alineación antes de implementar - Ejecución rápida después de acordar Por favor envía tu CV con el link de tus repositorios y tu expectativa salarial al correo [email protected]  Correos sin estos datos no se tendrán en cuenta...
Interested in this role?Apply on iHire