La GPU multiinstancia (MIG) aumenta el rendimiento y el valor de NVIDIA Blackwell y Hopper™ GPU de generación. MIG puede dividir la GPU en hasta siete instancias totalmente aisladas con su propia memoria de ancho de banda alta, su caché y sus núcleos de procesamiento. Esto permite a los administradores admitir todas las cargas de trabajo, desde las más pequeñas hasta las más grandes, con calidad de servicio (QoS) garantizada y extendiendo el alcance de los recursos informáticos acelerados a cada usuario.
Sin MIG, los distintos trabajos que se ejecutan en la misma GPU, como diferentes solicitudes de inferencia de IA, compiten por los mismos recursos. Un trabajo que consume un ancho de banda de memoria más grande priva a otros de este, lo que provoca que varios trabajos pierdan sus objetivos de latencia. Con MIG, los trabajos se ejecutan simultáneamente en diferentes instancias, cada una con recursos dedicados para el uso de proceso, memoria y ancho de banda de memoria, lo que resulta en un rendimiento predecible con QoS y la máxima utilización de la GPU.
La arquitectura Hopper mejora aún más la MIG al admitir configuraciones multiinquilino y multiusuario en entornos virtualizados en hasta siete instancias de GPU, lo que permite aislar cada instancia de forma segura con informática confidencial en el nivel de hardware y de hipervisor. Los descodificadores de vídeo dedicados para cada instancia de MIG ofrecen un análisis inteligente de vídeo (IVA) seguro y de alto rendimiento en una infraestructura compartida. Gracias a la generación simultánea de perfiles de MIG, los administradores pueden supervisar la aceleración de GPU de un tamaño adecuado y optimizar la asignación de recursos para varios usuarios.
Por su parte, los investigadores con cargas de trabajo más pequeñas, en vez de tener que alquilar una instancia de nube entera, pueden utilizar MIG para aislar sin riesgo alguno una parte de una GPU mientras tienen la seguridad de que sus datos están protegidos en reposo, en tránsito y en uso. Esto mejora la flexibilidad para que los proveedores de servicios en la nube puedan establecer precios que capten a clientes más pequeños.
MIG permite a los equipos de TI y DevOps realizar un aprovisionamiento muy específico de GPU. Cada instancia de MIG se comporta como una GPU independiente para las aplicaciones, por lo que no hay ningún cambio en la plataforma CUDA®. MIG se puede utilizar en los principales entornos informáticos empresariales.
GB200/B200/B100 | H100 | |
---|---|---|
Informática confidencial | Sí | Sí |
Tipos de instancias | Up to 7x 23GB Up to 4x 45GB Up to 2x 95GB Up to 1x 192GB |
7x 10GB 4x 20GB 2x 40GB 1x 80GB |
Generación de perfiles y supervisión de GPU | Simultáneamente en todas las instancias | Simultáneamente en todas las instancias |
Inquilinos seguros | 7x | 7x |
Descodificadores de contenido | NVJPEG y NVDEC dedicados por instancia | NVJPEG y NVDEC dedicados por instancia |
Las especificaciones preliminares pueden estar sujetas a cambios
Más información sobre NVIDIA Blackwell.