Cómo evaluar la congestión de la red AI Fabric

Keysight AI Data Center Builder
+ Keysight AI Data Center Builder

Detectar a tiempo los cuellos de botella en la cadena de suministro

Las cargas de trabajo de entrenamiento e inferencia de la inteligencia artificial (IA) ejercen una intensa presión sobre las estructuras de los centros de datos modernos, donde las comunicaciones sincronizadas, los patrones de tráfico intermitentes y los grandes flujos de datos este-oeste pueden provocar congestiones que reducen la eficiencia del ancho de banda y aumentan la latencia. A medida que aumenta el tamaño de los clústeres, los ingenieros deben comprobar cómo se comportan los conmutadores, las tarjetas de interfaz de red, las interconexiones y la configuración de transporte en condiciones de carga de trabajo realistas, con el fin de identificar los cuellos de botella antes de la implementación.

Para evaluar la congestión en las estructuras de IA se requieren métodos de prueba repetibles que emulen el comportamiento real de las cargas de trabajo en los nodos de cálculo, los conmutadores y las interconexiones, al tiempo que miden la consistencia del rendimiento, el rendimiento a nivel de flujo, la sensibilidad a la latencia y la gestión de la congestión. Los ingenieros necesitan conocer cómo las decisiones sobre la topología, la configuración de los protocolos y los patrones de tráfico afectan a la eficiencia de la red, de modo que puedan identificar los límites de rendimiento, ajustar el comportamiento de la infraestructura y reducir los riesgos en entornos de IA y aprendizaje automático a gran escala.

Solución de congestión de redes de inteligencia artificial

Para probar y validar la congestión en la infraestructura de IA es necesario emular cargas de trabajo realistas que reflejen cómo los trabajos de IA distribuidos intercambian datos entre hosts, aceleradores, conmutadores e interconexiones. Keysight AI Data Center Builder permite a los ingenieros modelar arquitecturas de red, reproducir patrones realistas de cargas de trabajo de IA y probar escenarios de rendimiento y gestión de la congestión a gran escala, lo que proporciona una visibilidad a nivel de sistema que ayuda a identificar cuellos de botella, mejorar la eficiencia y optimizar la infraestructura de IA antes de su implementación.

Descubre los productos de nuestra solución de gestión de congestión de redes basada en IA

Casos prácticos relacionados

contacto logotipo

Póngase en contacto con uno de nuestros expertos

¿Necesita ayuda para encontrar la solución adecuada para usted?