Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Temario del curso
Introducción a Mistral a gran escala
- Resumen de Mistral Medium 3.
- Compensaciones entre rendimiento y coste.
- Consideraciones a escala empresarial.
Patrones de despliegue para LLM
- Topologías de servicio y opciones de diseño.
- Despliegues locales frente a despliegues en la nube.
- Estrategias híbridas y multicloud.
Técnicas de optimización de inferencia
- Estrategias de agrupación (batching) para alto rendimiento.
- Métodos de cuantización para la reducción de costes.
- Utilización de aceleradores y GPUs.
Escalabilidad y fiabilidad
- Escalado de clústeres de Kubernetes para inferencia.
- Balanceo de carga y enrutamiento de tráfico.
- Tolerancia a fallos y redundancia.
Marco de ingeniería de costes
- Medición de la eficiencia del coste de inferencia.
- Ajuste del tamaño de los recursos de cómputo y memoria.
- Monitorización y alertas para la optimización.
Seguridad y cumplimiento en producción
- Protección de despliegues y APIs.
- Consideraciones sobre la gobernanza de datos.
- Cumplimiento normativo en ingeniería de costes.
Estudios de caso y mejores prácticas
- Arquitecturas de referencia para Mistral a gran escala.
- Lecciones aprendidas de despliegues empresariales.
- Tendencias futuras en inferencia de LLM eficiente.
Resumen y próximos pasos
Requerimientos
- Conocimientos sólidos sobre el despliegue de modelos de aprendizaje automático.
- Experiencia con infraestructura en la nube y sistemas distribuidos.
- Conocimiento de estrategias de optimización de rendimiento y costes.
Público objetivo
- Ingenieros de infraestructura.
- Arquitectos de la nube.
- Líderes de MLOps.
14 Horas