Otimize a integridade e a eficiência de energia do data center de IA

Nos data centers de IA, o gerenciamento de energia é tão importante quanto o desempenho. No entanto, embora os servidores de ponta e os switches de rack utilizem os melhores chips e interconexões, a diafonia e a interferência eletromagnética podem causar problemas de gerenciamento de energia que, em última análise, podem impedir a capacidade de dimensionamento de um data center de IA. Sem ferramentas versáteis de automação e medição de projeto, é extremamente difícil simular redes de fornecimento de energia, identificar as causas principais dos problemas de energia e, por fim, garantir a eficiência energética. 

Evite que problemas de integridade de energia coloquem em risco os data centers de IA

Simplifique a análise de redes de fornecimento de energia, preveja a confiabilidade e otimize o desempenho térmico no início dos projetos - simplificando os fluxos de trabalho de integridade de energia.

Analise ruído, ondulação e diafonia com precisão inigualável

Identifique e elimine as causas básicas de seus problemas mais difíceis de integridade de energia com ferramentas de teste e medição versáteis, compactas e de alto desempenho.

Dimensione a capacidade da carga de trabalho de IA reduzindo o consumo de energia

Otimize a eficiência energética do data center de IA, melhorando a integridade, o gerenciamento e o fornecimento de energia em equipamentos e infraestrutura de rede.

Webinar: Validação da integridade de energia com osciloscópios

Descubra os fluxos de trabalho básicos para a medição da integridade da energia enquanto aprende sobre a evolução dos semicondutores e das fontes de alimentação de modo comutado. Descubra os tipos de sondas de medição e software de osciloscópio necessários para depurar problemas de ruído em trilhos de alimentação de alta corrente e baixa tensão.

Ícone de rede distribuída

Perguntas frequentes: Energia do data center de IA

Os data centers de IA estão experimentando um crescimento exponencial na demanda de energia. De acordo com a Wells Fargo, o uso de energia de IA pode chegar a 652 terawatts-hora (TWh) até 2030, representando um aumento de 8.050% em relação aos níveis de 2024. Esse aumento é impulsionado por cargas de trabalho de computação intensiva, como treinamento e inferência de modelos, que são executadas em racks densos de GPUs e TPUs. Diferentemente dos data centers tradicionais, as cargas de trabalho de IA exigem fornecimento contínuo de energia em altas densidades de corrente, muitas vezes ultrapassando os limites da integridade da energia e do design térmico.

Os principais consumidores de energia incluem:

  • Aceleradores como GPUs e TPUs (para treinamento e inferência)
  • Subsistemas de memória (por exemplo, módulos HBM / DDR)
  • Equipamento de rede para movimentação de dados em alta largura de banda
  • Sistemas de resfriamento para dissipar o calor gerado por cargas de trabalho densas de IA

Cada watt fornecido deve ser estável e sem ondulações, e é por isso que ferramentas como osciloscópios de conformidade em tempo real com sondas de trilho de alimentação e software trifásico são usadas para validar a integridade da alimentação em todos os níveis, desde os reguladores de tensão no nível da placa até a distribuição em escala de rack.

As cargas de trabalho de IA não são apenas pesadas em termos de computação - elas são explosivas, paralelas e termicamente intensas. O treinamento de modelos grandes geralmente resulta em picos de carga que estressam os sistemas de fornecimento e de resfriamento. Isso exige monitoramento e análise em tempo real das margens de tensão, picos de corrente e ondulação. O software de análise de energia da Keysight, as ferramentas de EMI conduzidas e o SIPro ajudam os engenheiros a detectar anomalias de energia e a refinar os layouts de placas para garantir energia estável sob estresse. Esses esforços são essenciais para otimizar as operações, evitar falhas de hardware e reduzir o uso ineficiente de energia durante o treinamento de IA ou ciclos de inferência em tempo real.

Os principais data centers implementam estratégias em nível de hardware e de software, incluindo:

Além disso, as plataformas de gerenciamento de dados de projeto e de dados de IP da Keysight permitem que as equipes analisem, versionem e otimizem os dados de energia nas equipes de chip e sistema. Esses insights apoiam a iteração do projeto e a conformidade com as metas de eficiência energética.

Os principais desafios para dimensionar a infraestrutura de energia de IA incluem:

  • Carga térmica de racks de computação de alta densidade
  • Degradação da integridade de energia devido a componentes de comutação mais rápidos e margens mais finas
  • Picos de demanda imprevisíveis de modelos de IA com alocação dinâmica de recursos
  • Restrições da rede à medida que a demanda ultrapassa a infraestrutura tradicional

Para enfrentar esses desafios, é necessário validação (por exemplo, análise de ondulação e EMI conduzida) e inovação arquitetônica, como fornecimento de energia desagregada, controle térmico com reconhecimento de IA e integração de telemetria de energia em tempo real em painéis operacionais.

Deseja ajuda ou tem dúvidas?