Solutions d'IA

Les moteurs de la technologie de l'IA de Keysight

Créer des centres de données d'IA à grande échelle avec des solutions d'IA

Concevez, construisez et déployez des équipements réseau pour les centres de données AI / ML. Accédez plus rapidement au marché grâce aux solutions AI de bout en bout de Keysight pour la conception, la validation et le test de conformité - couvrant tous les domaines, des cartes de circuits imprimés aux interconnexions optiques et à l'infrastructure réseau.

Explorer les cas d'utilisation des centres de données d'IA

En savoir plus sur les solutions d'IA

FAQ sur les solutions d'IA

Une solution d'IA est plus qu'un simple modèle - c'est un système orchestré impliquant des données, des calculs et des opérations, optimisé pour des tâches telles que l'inférence, la prédiction et l'automatisation. Dans les contextes à forte infrastructure tels que les centres de données, les solutions d'IA doivent s'intégrer de manière transparente à la pile de calcul (mémoire DDR/HBM, voies PCIe/CXL), aux interconnexions (400G, 800G, 1,6T) et aux protocoles de mise en réseau (RoCEv2, RDMA). L'évolutivité dépend de la capacité de ces couches à prendre en charge un mouvement de données sans gigue, une faible latence et une intégrité de signal élevée sous l'effet de la charge de travail.

Pour fonctionner de manière fiable à grande échelle, une solution d'IA doit combiner :

  • Calcul : Mémoire à grande largeur de bande (HBM/DDR), accélérée par des interconnexions PCIe/CXL
  • Interconnexion : backbones 800G/1.6T et SerDes 224G validés pour la qualité du signal et la modulation
  • Réseau : Communication à faible latence avec optimisation collective de la bande passante
  • Alimentation : outils de conception et d'intégrité de l'alimentation tenant compte des aspects thermiques pour gérer la consommation et éviter les points chauds.

Les indicateurs clés de performance tels que la gigue, la diaphonie, le temps de récupération, la bande passante de l'algorithme, la bande passante du bus et les mesures d'achèvement des tâches sont suivis afin de garantir des performances durables dans tous les environnements.

Les solutions d'IA diffèrent considérablement d'un secteur à l'autre en fonction de la tolérance à la latence, de l'intensité de calcul et de la localisation des données. Par exemple :

  • Les services financiers exigent une latence ultra-faible et une intégrité d'interconnexion élevée (PCIe Gen5 / CXL).
  • Le secteur de la santé s'appuie sur une bande passante mémoire robuste pour les charges de travail d'imagerie (performances DDR / HBM).
  • Les opérateurs de cloud / hyperscale donnent la priorité à l'efficacité thermique et au temps d'exécution des tâches dans le cadre de déploiements à l'échelle du rack.

Ces compromis doivent être modélisés et évalués à l'aide d'outils tels que l'émulation et la simulation de la charge de travail.

Les avantages liés à l'IA comprennent l'automatisation de la charge de travail, la réduction des coûts d'exploitation et une gestion plus intelligente des systèmes. Les solutions d'IA tenant compte de l'infrastructure peuvent allouer dynamiquement les ressources informatiques, acheminer efficacement les données et anticiper les défaillances sur la base de la télémétrie.

Ces défis sont notamment les suivants :

  • Validation de la conception dans les domaines de la mémoire, de l'interconnexion et de l'alimentation électrique
  • Maintien de la qualité de la modulation à des vitesses de signalisation élevées (224 Gbps, 1,6T)
  • Contrôle de l'intégrité thermique et électrique dans des conditions de charge d'IA

Sans une émulation et une analyse comparative approfondies, les déploiements d'IA risquent d'échouer en raison de gigue, de latence ou de goulots d'étranglement inattendus au niveau de la bande passante.

Les pipelines de données d'IA doivent être conçus en tenant compte des contraintes d'infrastructure. Dans les environnements à haute performance :

  • Les données sont prétraitées à proximité de la mémoire (par exemple, traitement proche de la mémoire HBM).
  • PCIe / CXL permet la mise en commun de la mémoire et un accès efficace
  • Les configurations de réseau permettent un transfert à faible latence entre les nœuds de calcul.

En outre, la télémétrie recueillie au cours de la validation initiale (par exemple, lors des tests d'intégrité du signal ou de l'émulation de la charge de travail) permet d'affiner les performances du modèle et les stratégies de formation.

Résolvons le problème de l'avenir.

Réservez une réunion ou une démonstration avec l'un de nos experts