Programa del Curso

Conceptos y Métricas de Rendimiento

  • Latencia, rendimiento, uso de energía, utilización de recursos
  • Bottlenecks del sistema vs nivel de modelo
  • Análisis para inferencia vs entrenamiento

Análisis en Huawei Ascend

  • Uso del CANN Profiler y MindInsight
  • Diagnóstico de núcleos e operadores
  • Patrón de transferencia y asignación de memoria

Análisis en Biren GPU

  • Características de monitoreo de rendimiento del SDK Biren
  • Fusión de núcleos, alineación de memoria e colas de ejecución
  • Análisis consciente de energía y temperatura

Análisis en Cambricon MLU

  • Herramientas de rendimiento BANGPy y Neuware
  • Visibilidad del nivel de núcleo e interpretación de registros
  • Integración del perfilador MLU con marcos de despliegue

Optimización de Gráficos y Nivel de Modelo

  • Estrategias de poda y cuantificación de gráficos
  • Fusión de operadores y reestructuración del grafo computacional
  • Estandarización del tamaño de entrada y ajuste de lote

Optimización de Memoria y Núcleo

  • Optimización del diseño y reutilización de memoria
  • Administración eficiente de búferes entre conjuntos de chips
  • Técnicas de ajuste en el nivel del núcleo por plataforma

Mejores Prácticas Multiplataforma

  • Portabilidad de rendimiento: estrategias de abstracción
  • Construcción de canales de ajuste compartidos para entornos multi-chip
  • Ejemplo: ajuste de un modelo de detección de objetos en Ascend, Biren y MLU

Resumen y Próximos Pasos

Requerimientos

  • Experiencia trabajando con pipelines de entrenamiento o implementación de modelos AI
  • Comprensión de los principios de cálculo GPU/MLU y optimización de modelos
  • Familiaridad básica con herramientas y métricas de perfilado de rendimiento

Audience

  • Ingenieros de rendimiento
  • Equipos de infraestructura de aprendizaje automático
  • Arquitectos de sistemas AI
 21 Horas

Número de participantes


Precio por Participante​

Próximos cursos

Categorías Relacionadas