NVIDIA L40S

Rendimiento gráfico y de IA sin precedentes para el centro de datos.

Dónde comprar

Buscar un partner de NVIDIA.

Hoja de datos | Resumen del producto | Especificaciones |
Deep Learning Performance Pages

La GPU universal más potente

Experimenta un rendimiento innovador de varias cargas de trabajo con la GPU NVIDIA L40S. La GPU L40S, que combina una potente computación de IA con los mejores gráficos y aceleración multimedia de su clase, se ha creado para impulsar la próxima generación de cargas de trabajo del centro de datos, desde la IA generativa y la formación e inferencia de modelos de lenguaje de gran tamaño (LLM) hasta gráficos 3D, renderizado y vídeo.

NVIDIA, fabricantes globales de sistemas de centros de datos para impulsar la IA generativa y la digitalización industrial

Los servidores NVIDIA OVX™ con GPU NVIDIA para acelerar el entrenamiento y la inferencia, así como cargas de trabajo con uso intensivo de gráficos, llegan próximamente de la mano de Dell, Hewlett Packard Enterprise, Lenovo, Supermicro y otros.

Leer la nota de prensa

Aspectos destacados

Rendimiento universal

Rendimiento de Tensor

1466 TFLOPS¹

Rendimiento del núcleo RT

212 TFLOPS

Rendimiento de precisión simple

91,6 TFLOPS

¹ Las velocidades máximas se basan en la frecuencia acelerada de la GPU.

Características

Con tecnología de la arquitectura NVIDIA Ada Lovelace

Tensor Cores de cuarta generación

La compatibilidad de hardware con la dispersión estructural y el formato optimizado de TF32 proporciona mejoras de rendimiento desde el primer momento para un entrenamiento más rápido de modelos de IA y ciencia de datos. Acelera las capacidades gráficas mejoradas por IA con DLSS para ampliar la resolución con un mejor rendimiento en aplicaciones seleccionadas.

Núcleos RT de tercera generación

El rendimiento mejorado y las funcionalidades de trazado de rayos y sombreado simultáneos mejoran el rendimiento del trazado de rayos, acelerando los renderizados para los flujos de trabajo de diseño y arquitectura de productos, ingeniería y construcción. Observa diseños realistas en acción con desenfoque de movimiento acelerado por hardware e impresionantes animaciones en tiempo real.

Núcleos CUDA

El rendimiento acelerado de punto flotante de precisión simple (FP32) y la eficiencia energética mejorada aumentan significativamente el rendimiento para flujos de trabajo como el desarrollo de modelos 3D y la simulación de ingeniería asistida por ordenador (CAE). Usa funcionalidades matemáticas mejoradas de 16 bits (BF16) para cargas de trabajo de precisión mixta.

Motor transformador

El Motor transformador acelera drásticamente el rendimiento de la IA y mejora la utilización de la memoria tanto para el entrenamiento como para la inferencia. Al aprovechar la potencia de los Tensor Cores de cuarta generación de Ada Lovelace, el motor transformador escanea de forma inteligente las capas de redes neuronales de arquitectura de transformador y las reestructura automáticamente entre precisiones FP8 y FP16 para ofrecer un rendimiento de IA más rápido y acelerar el entrenamiento y la inferencia.

Eficiencia y seguridad

La GPU L40S está optimizada para las operaciones de centros de datos empresariales ininterrumpidas. Se ha diseñado, desarrollado y probado exhaustivamente, además de ser compatible con NVIDIA, para garantizar el máximo rendimiento, durabilidad y tiempo de actividad. La GPU L40S cumple con los estándares de centro de datos más recientes y está preparada para los Sistemas de construcción de equipos de red (NEBS) de nivel 3. Además, cuenta con arranque seguro con tecnología raíz de confianza, lo que proporciona una capa adicional de seguridad para los centros de datos.

DLSS 3

La GPU L40S permite un renderizado ultrarrápido y velocidades de fotogramas más fluidas con NVIDIA DLSS 3. Esta innovadora tecnología de generación de fotogramas aprovecha el deep learning y las últimas innovaciones de hardware dentro de la arquitectura Ada Lovelace y la GPU L40S, incluidos los Tensor Cores de cuarta generación y un acelerador de flujo óptico, para aumentar el rendimiento de renderizado, ofrecer mayores fotogramas por segundo (FPS) y mejorar significativamente la latencia.

Más información sobre la arquitectura de la GPU NVIDIA Ada Lovelace

Workloads

Aceleración de varias cargas de trabajo

IA generativa

Desarrolla nuevos servicios, información y contenido original.

Con capacidades de aceleración de IA, gráficos y medios de próxima generación, la L40S ofrece un rendimiento de inferencia hasta 5 veces superior al de la generación anterior NVIDIA A40. ‌Con un rendimiento innovador y 48 gigabytes (GB) de capacidad de memoria, la L40S es la plataforma ideal para acelerar las cargas de trabajo de IA generativa multimodales.

Más información sobre la IA generativa

Entrenamiento de LLM e inferencia

Acelera las cargas de trabajo de entrenamiento e inferencia de IA.

Los Tensor Cores de cuarta generación compatibles con FP8 ofrecen un rendimiento computacional de IA excepcional para acelerar el entrenamiento y la inferencia de modelos LLM y de IA generativa de última generación.

Explorar las ventajas de la inferencia de IA de NVIDIA

Renderizado y gráficos 3D

Impulsa flujos de trabajo creativos de alta fidelidad con gráficos NVIDIA RTX™.

Con núcleos RT de tercera generación que ofrecen hasta el doble de rendimiento de trazado de rayos en tiempo real que la generación anterior para impulsar la creación de contenido visual impresionante y flujos de trabajo creativos de alta fidelidad, desde renderizado interactivo hasta producción virtual en tiempo real.

Obtener más información sobre la tecnología de NVIDIA RTX

NVIDIA Omniverse

Crea y opera aplicaciones del metaverso.

NVIDIA Omniverse™ permite conectar, desarrollar y operar la próxima ola de aplicaciones de digitalización industrial. Con potentes gráficos RTX y capacidades de IA, la L40S ofrece un rendimiento excepcional para flujos de trabajo 3D y simulación basados en Universal Scene Description (OpenUSD) creados en Omniverse.

Más información sobre NVIDIA Omniverse

NVIDIA OVX L40S

Infraestructura de centro de datos escalable para IA y gráficos de alto rendimiento.

En combinación con la tecnología NVIDIA Spectrum-X Ethernet y el software NVIDIA AI Enterprise, NVIDIA OVX L40S ofrece un rendimiento líder en el sector para acelerar la transformación empresarial a través de la IA generativa.

Más información

Rendimiento

Rendimiento avanzado

IA generativa de imágenes

Stable Diffusion (images per minute)

Rendimiento medido; NVIDIA L40S
Stable Diffusion v2.1, TRT 8.6.1, BS:1, FP16 | Stable Diffusion XL 1.0, TRT 8.6.1, BS:1, FP16

Inferencia del modelo lingüístico de gran tamaño

1st Token Latency (ms)

Rendimiento medido; NVIDIA L40S
Llama 2-7B/13B/70B, ISL=2048, OSL=128, BS=1;: FP8.

Especificaciones

GPU NVIDIA L40S

FP32	91,6 teraFLOPS
Tensor Core de TF32	366 teraFLOPS
FP16	733 teraFLOPS
FP8	1466 teraFLOPS*
Rendimiento del núcleo RT	212 teraFLOPS
Consumo máximo	350 W
* Con dispersión

Ver especificaciones completas Ver ficha técnica

Consulte lo último sobre rendimiento de GPU en aplicaciones HPC

Empezar

¿Lo tiene todo listo para realizar su compra?

Hable con un partner de NVIDIA.

Buscar un partner

¿Necesita ayuda para seleccionar el producto o partner adecuado?

Hable con un especialista en productos de NVIDIA sobre sus necesidades profesionales.

Contactar con nosotros

Manténgase al día sobre las últimas noticias

Regístrese para recibir las últimas noticias de NVIDIA.

Manténgase al día

Arquitectura de la GPU	Arquitectura NVIDIA Ada Lovelace
Memoria de la GPU	48 GB GDDR6 con ECC
Ancho de banda de memoria	864 GB/s
Interfaz de interconexión	PCIe Gen4 x16: 64 GB/s bidireccional
Núcleos CUDA® basados en la arquitectura NVIDIA Ada Lovelace	18 176
Núcleos RT de tercera generación de NVIDIA	142
Tensor Cores de cuarta generación de NVIDIA	568
TFLOPS de rendimiento del núcleo RT	212
FP32 TFLOPS	91,6
TFLOPS de Tensor Core de TF32	183 I 366*
TFLOPS de Tensor Core de BFLOAT16	362,05 I 733*
Tensor Core de FP16	362,05 I 733*
Tensor Core de FP8	733 I 1466*
TOPS de Tensor Core de INT8 TOPS de Tensor Core de INT4	733 I 1466* 733 I 1466*
Formato	Ranura doble, 11,17 cm (A) × 26,67 cm (L)
Puertos Display Port	4 puertos DisplayPort 1.4a
Consumo máximo	350 W
Conector de alimentación	16 patillas
Térmica	Pasiva
Soporte técnico del software de GPU virtual (vGPU)	Sí
Perfiles de vGPU admitidos	Consultar la guía de licencias de GPU virtual
NVENC I NVDEC	3x \| 3x (incluye codificación y decodificación AV1)
Arranque seguro con raíz de confianza	Sí
Preparado para NEBS	Nivel 3
Soporte de varias instancias GPU (MIG)	No
Soporte de NVIDIA® NVLink®	No
* Con dispersión