O que você está procurando?
Centros de dados de IA
Liberte a próxima geração de inovação em IA
Desbloqueie o potencial da IA
Um data center de IA é tão confiável quanto seu elo mais fraco. Na vanguarda do desempenho, cada chip, cabo, interconexão, switch, servidor e GPU representa tanto potencial quanto risco. Além de os componentes individuais funcionarem de forma independente, eles também precisam trabalhar de forma coesa como um sistema sob demanda incessante.
Criar redes capazes de lidar com as demandas das cargas de trabalho de IA significa validar cada componente, conexão e configuração. Com os riscos e a escala tão altos, até mesmo o menor ganho de eficiência, melhoria operacional ou aprimoramento de desempenho pode gerar retornos significativos, reduzindo as interrupções e evitando falhas em cascata.
Centros de dados de IA: Um ponto de inflexão técnica
Ethernet
As velocidades do data center aumentarão de 400/800G para 1,6/3,2T Ethernet de alta velocidade.
Memória
A DDR5 está dando lugar à DDR6 e à HBM3, com velocidades de até 12,8 GT/s.
Óptica
As velocidades de transferência de 112 Gb/s darão lugar aos padrões de 224 e 448 Gb/s.
PCIe® / CXL
O PCIe® 7 atualizará o PCIe® 5 e o PCIe® 6, à medida que as transferências aumentam de 32 para 128 GT/s.
Teste de data centers de IA: Um desafio de várias camadas
Aceleração do design digital de alta velocidade na era da IA
Os data centers de IA exigem semicondutores, chipsets e designs digitais de alta velocidade (HSD) prontos para IA. Mas o desempenho de ponta tem um custo. As velocidades e os padrões estão sempre evoluindo, e manter-se atualizado às vezes significa pensar uma ou duas gerações à frente. Estar em conformidade com os requisitos de design avançado significa ir além da depuração. Atender - ou exceder - os mais recentes padrões PCIe®, DDR e CXL exige ferramentas de simulação avançadas que possam analisar projetos e prever possíveis problemas antes que eles ocorram.
Reimaginando a infraestrutura de IA para 1,6T e além
Com os data centers de IA adotando velocidades Ethernet de 1,6T, os fabricantes de equipamentos de rede estão criando novos transceptores ópticos para suportá-los. A conectividade de alta velocidade, no entanto, também requer validação de alta velocidade em relação às demandas do mundo real das redes de IA. Dimensionar a P&D e os testes de produção significa ir além dos instrumentos de baixo ruído que medem a camada física - significa também empregar testes de Ethernet na camada de protocolo para validar o desempenho no mundo real.
Otimização do desempenho e da eficiência do data center de IA
As redes de IA exigem mais do que a validação em nível de componente. O teste da camada física não é suficiente. A interoperabilidade, o desempenho e a eficiência só podem ser medidos no nível do sistema, em condições reais de rede. A validação dos componentes do cluster de IA, a otimização da eficiência e o dimensionamento da capacidade exigem insights avançados obtidos com a emulação de carga de trabalho de IA de pilha completa. O rastreamento de métricas, como o tempo de conclusão do trabalho e a largura de banda de comunicação coletiva, ajuda a detectar gargalos, otimizar a distribuição da carga de trabalho de IA e identificar problemas em nível de componente que, de outra forma, permaneceriam ocultos.
Maximizando a eficiência energética para dimensionar cargas de trabalho de IA
Nos data centers de IA, o gerenciamento de energia é tão importante quanto o desempenho. No entanto, embora os servidores de ponta e os switches de rack utilizem os melhores chips e interconexões, a diafonia e a interferência eletromagnética podem causar problemas de gerenciamento de energia que, em última análise, podem impedir a capacidade de dimensionamento de um data center de IA. Sem ferramentas versáteis de automação e medição de projeto, é extremamente difícil simular redes de fornecimento de energia, identificar as causas principais dos problemas de energia e, por fim, garantir a eficiência energética.
Aumente o nível de seu conhecimento em data centers de IA
5 estratégias para otimizar e dimensionar os data centers de IA
A IA está transformando os setores e impulsionando a inovação. No entanto, padrões de tráfego exclusivos, cargas de trabalho dinâmicas e pressões implacáveis de desempenho podem transformar até mesmo as menores questões em problemas críticos.
Leia este eBook para descobrir cinco soluções práticas para otimizar o desempenho do data center de IA para aplicativos modernos.
Bootcamp de rede de IA
Junte-se aos engenheiros da Keysight para um mergulho profundo no mundo dos testes de redes de IA e validação de implantações de data center de IA. Ao final deste curso, você obterá os insights - e a confiança - necessários para assumir o controle desse novo paradigma de rede inovador e em rápida mudança.
Melhorando a escalabilidade em clusters de data center de IA
Sua infraestrutura de rede pode ser dimensionada para lidar com as cargas de trabalho de treinamento de IA complexas e de alto tráfego? Este white paper se aprofunda no dimensionamento de clusters de data center de IA, identifica os desafios críticos da rede e explica como garantir redes escaláveis e confiáveis para as ambições de IA da sua organização.
Benchmarking de operações coletivas
A medição ou o benchmarking do desempenho da rede em um cluster de IA pode ajudar as organizações a identificar oportunidades para otimizar e melhorar o rendimento geral sem custos adicionais de hardware. Este white paper explica a operação dos coletivos de IA, define a terminologia e analisa as métricas mais comuns associadas ao benchmarking de redes de IA.
Como a Keysight ajuda a aprimorar os data centers de IA
Eliminar os elos fracos
Garanta o desempenho em nível de componente com testes de camada física e emulações de rede em nível de sistema.
Otimize cada camada
Modele projetos de data center, valide equipamentos de rede em escala de IA e faça o ajuste fino do desempenho em nível de sistema.
Dimensionar a capacidade da IA
Maximize o desempenho do data center com emulações de protocolos, aplicativos e redes do mundo real.
Explore nossas mais novas soluções de data center com IA
Otimize a infraestrutura de IA com o KAI Data Center Builder
Avalie o desempenho do data center de IA com fidelidade inigualável. O KAI Data Center Builder emula a combinação de comunicações coletivas e algoritmos usados para criar um grande modelo de aprendizado (LLM), facilitando a validação da infraestrutura de rede e dos fabrics de IA por meio de testes em todo o sistema.
Maximize a confiabilidade da Ethernet com testadores de bancada de alta velocidade
Teste a mais nova geração de redes e interconexões otimizadas para IA. Com cobertura completa de teste de camada 1-3 e suporte para até 40W por porta, o Keysight Interconnect and Network Performance Tester 1.6T oferece recursos de teste de Ethernet de ponta para fabricantes de switches e hiperescaladores.
Valide as interconexões de IA com osciloscópios de amostragem DCA-M
Maximize a confiabilidade da rede com osciloscópios de amostragem de 224 Gb/s que oferecem precisão óptica e eficiência de teste de transceptor incomparáveis. Teste equipamentos de rede 800G / 1,6T prontos para IA com software de teste óptico que agiliza os testes de fabricação de transceptores ópticos de alto volume.
Participe de nosso evento de demonstração de IA
Saiba como projetar, validar e dimensionar data centers de IA sem recursos caros de GPU. Descubra novas maneiras de maximizar o desempenho com ferramentas que funcionam desde a camada física até a camada de aplicativos - tudo isso enquanto participa de perguntas e respostas ao vivo com os principais engenheiros da Keysight que trabalham na vanguarda da inovação em IA.
Explore as configurações de teste prontas para IA
Teste as redes de data center de IA
Emule cargas de trabalho de IA para fazer benchmark de equipamentos de rede e validar telas de IA/ML.
Validação de interconexões Ethernet
Garanta a transmissão de dados de alta qualidade e a correção de erros testando a confiabilidade e o desempenho.
Otimize os testes de transceptores ópticos de 1,6T
Produção em escala de transceptores ópticos de 1,6T com medições rápidas e eficientes de dispersão do transmissor e TDECQ.
Emular cargas de trabalho do data center de IA
Otimize a infraestrutura para o desempenho do treinamento em IA com uma metodologia de teste consistente e dimensionável.
Analisar sinais do receptor PAM4
Use a análise de erros para obter informações sobre os sinais do receptor PAM4.
Analisar a integridade do sinal da placa de circuito impresso
Reduza os riscos de integridade do sinal em uma PCB digital de alta velocidade por meio da detecção e do diagnóstico de cross talk, jitter, ruído vertical e ruído de fase.
Realizar a validação do protocolo PCle® 6.0
Obter validação de protocolo nas camadas física, de link de dados e de transação.
Avaliar o desempenho do FEC
Teste os links Ethernet de alta velocidade avaliando o mecanismo de correção de erros.
Saiba mais sobre o teste de data centers de IA
Perguntas frequentes: Centros de dados de IA
Um data center de IA é um tipo exclusivo de instalação de computação, criado especificamente para dar suporte a aplicativos de inteligência artificial (IA). Os data centers de IA utilizam ferramentas robustas, incluindo GPUs (Graphics Processing Units, unidades de processamento gráfico) e TPUs (Tensor Processing Units, unidades de processamento de tensores), que lhes permitem processar grandes volumes de tráfego, treinar modelos de aprendizagem de grande porte (LLMs) e executar consultas de usuários - um termo comumente conhecido como "inferência".
Os data centers de IA estão sendo construídos em todo o mundo para atender à crescente demanda. No entanto, a maioria dos data centers de IA está localizada nos Estados Unidos, especificamente no Texas, na Califórnia e na Virgínia.
Os data centers prontos para IA têm vários recursos distintos:
- Hardware: GPUs e TPUs de alto desempenho que aceleram a computação de IA.
- Armazenamento: Sistemas de armazenamento de alta velocidade e grande capacidade que gerenciam as enormes quantidades de dados necessários para o treinamento e a inferência de IA.
- Resfriamento: A infraestrutura de IA gera muito calor, portanto, os data centers prontos para IA precisam de tecnologias avançadas de resfriamento, como resfriamento líquido e resfriamento de precisão, para evitar o superaquecimento.
- Dimensionamento: Os data centers de IA devem dimensionar os recursos de forma eficiente com base nas demandas flutuantes das tarefas de IA.
- Rede: conexões de alta largura de banda e baixa latência são essenciais para o processamento e a comunicação de dados em tempo real.
- Segurança: Medidas de segurança robustas e infraestrutura confiável garantem proteção e disponibilidade contra uma série de ataques cibernéticos específicos de IA.
Enquanto os data centers tradicionais lidam com uma ampla gama de tarefas gerais de computação, os data centers de IA são otimizados para processar grandes volumes de dados, treinar grandes modelos de aprendizagem e fazer inferências em relação a consultas de usuários. Os data centers tradicionais usam CPUs para tarefas gerais de computação e arquiteturas de rede padrão para transferências de dados entre armazenamento, servidores e ambientes de nuvem, enquanto os data centers de IA contam com GPUs, TPUs e redes de alta velocidade/baixa latência para lidar com a rápida movimentação de dados entre os processadores.
Os data centers de IA lidam com uma variedade de cargas de trabalho, cada uma com requisitos exclusivos de computação e armazenamento. Alguns dos tipos mais comuns de cargas de trabalho são os seguintes:
- Cargas de trabalho de processamento de dados
- Cargas de trabalho de aprendizado de máquina
- Cargas de trabalho de aprendizagem profunda
- Cargas de trabalho de processamento de linguagem natural (NLP)
- Cargas de trabalho de IA generativa
- Cargas de trabalho de visão computacional
Os data centers de IA utilizam várias estratégias para o gerenciamento eficiente de dados, incluindo sistemas de armazenamento de alto desempenho, como SSDs NVMe (para garantir acesso e recuperação rápidos de dados), classificação de dados por níveis que movem os dados entre diferentes níveis de armazenamento (com base nos padrões de uso) e técnicas de compactação e deduplicação de dados que economizam espaço de armazenamento e aumentam a eficiência.
Os data centers otimizados para IA empregam hardware especializado para acelerar o treinamento e a inferência. Aqui estão alguns dos componentes mais comuns:
- Unidades de processamento gráfico (GPUs): Equipamento essencial para tarefas de processamento paralelo, que geralmente são necessárias para aplicativos de IA.
- Unidades de processamento de tensor (TPUs): Projetadas para tarefas de aprendizado de máquina, oferecendo treinamento e inferência de alto desempenho para modelos de IA.
- Armazenamento otimizado para IA: As soluções de armazenamento de alto desempenho, como os SSDs NVMe, ajudam a gerenciar grandes conjuntos de dados com recuperação eficiente.
- Infraestrutura de rede: Infiniband, Ethernet e NVIDIA Spectrum-X fornecem comunicações de alta velocidade, reduzem gargalos e aumentam a taxa de transferência.
- Sistemas de resfriamento: Tecnologias avançadas de resfriamento, como o resfriamento líquido, ajudam a gerenciar a eficiência térmica em toda a infraestrutura e nos equipamentos de rede.
As GPUs e TPUs aceleram o desempenho nos data centers de IA, processando com eficiência as demandas computacionais intensivas das cargas de trabalho de IA. Aqui estão alguns dos principais benefícios que elas oferecem:
- Redução do tempo de treinamento: As GPUs e TPUs reduzem o tempo de treinamento dos modelos de IA, facilitando o desenvolvimento e a implantação de aplicativos de IA com velocidade e eficiência.
- Eficiência energética: As GPUs e TPUs são eficientes em termos de energia, ajudando os hiperescaladores a gerenciar os custos operacionais e o impacto ambiental.
- Recursos aprimorados: As GPUs e TPUs ajudam os data centers de IA a suportar modelos de IA mais complexos e avançados, impulsionando a inovação em vários setores.
Os ciclos de computação de IA geram grandes quantidades de calor. É por isso que os data centers de IA exigem soluções avançadas de resfriamento para gerenciar e compensar o calor. Aqui estão algumas das técnicas mais comuns que os data centers de IA usam para resfriamento:
- Resfriamento líquido: O líquido de arrefecimento é circulado diretamente nas fontes de calor, como GPUs e TPUs.
- Resfriamento por imersão: Os componentes de TI são submersos em um fluido dielétrico, que absorve o calor com mais eficiência do que o ar.
- Trocadores de calor na porta traseira: Sistemas de resfriamento que são fixados na parte traseira dos racks de servidores, usando resfriamento líquido para remover o calor diretamente do ar de exaustão do rack.
Os data centers de IA normalmente empregam várias estratégias para garantir a escalabilidade:
- Modularidade: Os data centers de IA usam componentes modulares que podem ser expandidos à medida que a demanda cresce, permitindo o dimensionamento incremental sem tempo de inatividade significativo.
- Resfriamento: O resfriamento eficiente é essencial para que os data centers de IA mantenham o desempenho e a confiabilidade. O resfriamento líquido e o gerenciamento orientado por IA podem ajudar a otimizar o uso de energia e dar suporte ao dimensionamento adicional.
- Gerenciamento de IA: A IA pode ajudar a prever e gerenciar cargas de trabalho, otimizar recursos e aumentar a eficiência do data center. Essa abordagem proativa ajuda os hiperescaladores a se adaptarem às demandas flutuantes e a manterem o desempenho ideal.
A computação de borda pode melhorar o desempenho, reduzir a latência e otimizar o uso de recursos nos data centers de IA. A computação de borda oferece processamento de dados em tempo real, pois a inferência pode ocorrer mais perto da fonte, o que minimiza a distância que os dados precisam percorrer, otimizando a largura de banda e reduzindo a latência geral.
Os hiperescaladores empregam várias estratégias inovadoras para garantir o consumo eficiente de energia nos data centers de IA:
- Energias renováveis: Os hiperescaladores estão buscando cada vez mais fontes de energia renováveis, inclusive solar e eólica. Essas fontes sustentáveis reduzem as pegadas de carbono e garantem um fornecimento sustentável de energia.
- Resfriamento: O gerenciamento térmico é crucial para reduzir o consumo de energia nos data centers de IA. É por isso que os hiperescaladores estão investindo em resfriamento líquido e gerenciamento de resfriamento orientado por IA para garantir o uso eficiente de energia.
- Infraestrutura: O layout e o design dos data centers de IA desempenham um papel fundamental no consumo e na eficiência de energia. Estratégias como contenção de corredores quentes e frios, posicionamento ideal do servidor e fluxo de ar adequado podem melhorar a eficiência energética.
Os data centers de IA exigem uma abordagem de segurança especializada para proteger contra determinadas vulnerabilidades. Por exemplo, grandes modelos de aprendizagem são particularmente suscetíveis à injeção imediata e a ataques adversários, em que entradas mal-intencionadas podem enganar os modelos de IA. É por isso que estratégias de segurança como testes contínuos (com um aplicativo e uma ferramenta de teste de segurança), controle de acesso (incluindo autenticação multifator e controle de acesso baseado em função) e auditorias de segurança de rotina são essenciais.
Os data centers de IA são criados especificamente para dar suporte aos requisitos exigentes da aprendizagem profunda e da aprendizagem automática:
- O hardware de rede de alto desempenho, como GPUs, TPUs e aceleradores de IA, lida com os cálculos complexos envolvidos no treinamento de modelos para aprendizagem automática e aprendizagem profunda.
- As interconexões de alta largura de banda garantem trocas de dados eficientes e de alta velocidade entre o armazenamento e os nós de computação.
- A infraestrutura dimensionável acomoda as demandas crescentes de potência de computação e armazenamento, o que é essencial para modelos complexos de IA e conjuntos de dados cada vez maiores.
Há vários hiperescaladores e provedores de IA construindo e mantendo data centers de IA em todo o mundo. Alguns dos maiores provedores incluem Amazon Web Services, Google, OpenAI, Apple e Meta.
Deseja ajuda ou tem dúvidas?