Full-time

Ingeniero de IA (Fine-tuning y Despliegue)

Posted by Luxen AI • June 07, 2026

📍 ciudad de mexico, ciudad de méxico, Mexico
Apply Now

Description

Ingeniero de IA (Fine-tuning y Despliegue)



Título: Senior ML Engineer (LLMOps).



Dominio: Infraestructura de Modelos de Lenguaje y GPU Computing



Experiencia: +3 años. Experto en técnicas de cuantización (GGUF/EXL2), Fine-tuning (LoRA, DLoRA, QLoRA) y alineación de modelos mediante DPO (Direct Preference Optimization).



Tareas Principales:

- Desplegar y gestionar el clúster de GPUs con vLLM y LoRAX para permitir la ejecución paralela de múltiples adaptadores DLoRA (uno por Experto Digital).

- Configurar el servidor de inferencia (TensorRT-LLM o Triton) para optimizar la latencia de respuesta del Nodo A.

- Gestionar el pipeline de entrenamiento y fine-tuning junto al Ingeniero de Algoritmos.

- Configurar y mantener los entornos de ejecución aislada (gVisor) del sandbox Python (Nodo B - Sandbox Matemático).

- Implementar CI/CD de Modelos (automatización de despliegue de nuevas versiones de DLoRA s...

Ready to Seal the Deal?

Submit your application today and take the next step in your career with Luxen AI.

Apply for this Job