Serás responsable de la capa de IA de un agente de voz en tiempo real en producción — incluyendo el motor de conversación, el pipeline basado en eventos y los workflows del agente.
Nivel: Mid–Senior
Etapa: Producto en fase temprana (con clientes reales)
Modalidad: Mayormente remoto
Stack: OpenAI Realtime API · Python · AWS
Arquitectura: Basada en eventos
Idiomas: Inglés (obligatorio) · Español (comunicación interna)
SOBRE EL ROL
No buscamos un perfil tradicional de IA.
Este rol está enfocado en construir sistemas en producción, NO en entrenar modelos, hacer experimentos o analizar datos.
Trabajarás:
-
De forma autónoma en modalidad asíncrona, con sincronización semanal
-
Siendo responsable de tu servicio de IA de extremo a extremo:
código, pruebas, CI/CD y despliegue
-
Participando en decisiones de arquitectura (alineadas con el equipo antes de implementar)
-
Construyendo para usuarios reales con estándares altos desde el inicio
Aunque es un producto en etapa temprana, los estándares no lo son:
se espera código limpio, documentación sólida y pruebas como práctica habitual.
El inglés es obligatorio para código, documentación y comunicación.
NO ES UN PERFIL ADECUADO SI
Tu experiencia principal está en:
-
Ciencia de datos (modelos, estadística, experimentos)
-
Ingeniería de ML (pipelines de entrenamiento, despliegue de modelos)
-
Prompt engineering únicamente (herramientas no-code)
-
Investigación en IA (papers, teoría, benchmarks)
REQUISITO OBLIGATORIO (NO NEGOCIABLE)
Debes haber llevado a producción un producto real de IA de voz o audio en tiempo real.
Debes tener experiencia directa con la OpenAI Realtime API, incluyendo:
-
Ciclo de vida de sesiones
-
Flujo de eventos
-
Manejo de fallos
Si esto es nuevo para ti, no apliques.
EL SISTEMA QUE LIDERARÁS
Un agente de voz con IA en producción construido sobre OpenAI Realtime API:
-
Arquitectura basada en eventos (trigger pipeline respuesta)
-
Conversación en tiempo real + clasificación de intención + captura de datos estructurados
-
Orquestación de workflows con Relevance AI
Serás responsable de ambas capas:
-
Integración de IA
-
Arquitectura de workflows y prompting
Tú construyes, tú eres dueño, tú despliegas. No hay hand-offs.
RESPONSABILIDADES
1. Integración con OpenAI Realtime API
-
Gestionar el ciclo completo de sesiones (creación, tokens, eventos, cierre)
-
Manejar fallos (sesiones caídas, errores de secuencia, timeouts, reconexión)
-
Optimizar continuamente:
-
Calidad de voz
-
Latencia
-
Naturalidad de la conversación
2. Arquitectura e Infraestructura (Event-driven)
-
Diseñar y mantener el pipeline basado en eventos
-
Garantizar confiabilidad, observabilidad y manejo robusto de errores
-
Ser responsable del stack completo:
-
CI/CD
-
Infraestructura
-
Despliegues en múltiples entornos
3. Workflows de Agentes y Prompting
-
Diseñar workflows multi-paso en Relevance AI:
-
Clasificación
-
Enrutamiento
-
Uso de herramientas
-
Captura de datos
-
Construir prompts, function calling y lógica condicional
-
Crear nuevos workflows desde cero
-
Documentar y proponer arquitecturas antes de implementar
4. Calidad, Testing y Documentación
-
Escribir y mantener pruebas con pytest (obligatorio)
-
Aplicar estándares de calidad:
-
Linting con ruff
-
Controles en CI antes de cada merge
-
Monitorear:
-
Calidad de conversaciones
-
Confiabilidad de eventos
-
Costos de API
-
Documentar todo en inglés
-
Proponer cambios relevantes y alinearlos antes de ejecutar
REQUISITOS
Obligatorios (no negociables)
-
Experiencia en producción con OpenAI Realtime API
-
Python sólido (async/await, arquitectura limpia, pytest)
-
Diseño de sistemas basados en eventos
-
Function calling de LLM en producción
-
Diseño de workflows de agentes (multi-paso, con estado)
-
AWS:
-
Lambda
-
API Gateway
-
DynamoDB
-
SAM
-
SSM
-
Gestión completa de CI/CD (GitHub Actions, pipelines, despliegues)
-
Inglés fluido (oral y escrito)
-
Español (comunicación interna)
Deseable
-
Experiencia con Relevance AI o similares
-
Fundamentos de WebRTC (SDP, ICE, signaling)
-
FastAPI, Pydantic v2, httpx, Mangum
-
Docker, ruff, freezegun
-
Experiencia en startups
STACK TECNOLÓGICO
Core:
OpenAI Realtime API · Python 3.11 · FastAPI · httpx · Pydantic v2 · Mangum
Infraestructura:
AWS Lambda · API Gateway · DynamoDB · SSM · SAM · S3
Herramientas:
GitHub Actions · Docker · pytest · ruff · Relevance AI
FORMA DE TRABAJO
-
Trabajo asíncrono con sincronización semanal
-
Alta autonomía y responsabilidad
-
Alineación antes de implementar
-
Ejecución rápida después de acordar
Por favor envía tu CV con el link de tus repositorios y tu expectativa salarial al correo
[email protected]
Correos sin estos datos no se tendrán en cuenta...