Apresentamos o KAI Inference Builder

Transforme a inferência em uma vantagem competitiva por meio da emulação, validação e benchmarking de cargas de trabalho reais.

Prepare-se para a era da inferência da IA

Durante anos, a estratégia de infraestrutura de IA foi definida pelo treinamento. Agora, o setor está mudando o foco para a forma como os modelos de IA respondem às solicitações e consultas dos usuários. Esse processo é conhecido como inferência e está ganhando destaque.

O Keysight AI (KAI) Inference Builder foi desenvolvido para esta nova era. Uma solução de emulação e análise orientada para a inferência, o KAI Inference Builder replica o comportamento do cliente de IA e das respostas para testar e otimizar a infraestrutura de IA em condições realistas de carga de trabalho. Com a validação completa da pilha baseada na carga de trabalho, não há necessidade de se contentar com benchmarks genéricos ou testes de carga.

KAI Inference Builder: Principais recursos

Comprovar o desempenho da inferência de ponta a ponta

Valide todo o caminho de solicitação-resposta utilizando prompts reais, simultaneidade e streaming de tokens. O KAI Inference Builder ajuda as equipes a identificar gargalos no balanceamento de carga, na rede e na computação — antes que eles apareçam em produção.

Descubra o que dá errado primeiro

Identifique gargalos nas camadas de computação por GPU, memória, cache KV, armazenamento, PCIe, RDMA e orquestração. No modo “one-arm”, o KAI Inference Builder atua como um cliente de inferência em grande escala, direcionando cargas de trabalho em formato de prompt diretamente para as pilhas de inferência, permitindo que as equipes de rede identifiquem problemas mais rapidamente e ajustem o desempenho com precisão. 

Faça a pilha de inferência funcionar

Insira formas de prompt reais na pilha e correlacione a telemetria resultante para identificar as necessidades do seu sistema: seja mais memória, melhor agendamento, caminhos de recuperação mais robustos ou maior aproveitamento da GPU. Ao medir fluxos de trabalho de inferência de ponta a ponta, o KAI Inference Builder transforma o comportamento complexo do sistema em insights claros e práticos.

Faça comparações mais precisas com personas reais

Nem todas as cargas de trabalho de inferência se comportam da mesma forma. É por isso que o KAI Inference Builder modela formatos de prompts e respostas de modelos específicos para cada setor. Com suporte para os setores jurídico, financeiro e outros, o KAI Inference Builder ajuda as equipes a gerar evidências específicas para cada carga de trabalho, comparar arquiteturas e detectar regressões à medida que os modelos e os padrões de prompts evoluem.

Simule centros de dados de IA com o NVIDIA DSX Air e a Keysight

Reduzir os prazos de implantação e os riscos

Os prazos para a implantação de infraestruturas de IA são frequentemente limitados pela disponibilidade de hardware. É por isso que o KAI Inference Builder oferece integração pronta para uso com os ambientes de gêmeos digitais NVIDIA DSX Air. O KAI Inference Builder emula solicitações e respostas de inferência do mundo real dentro do ambiente modelado do data center, permitindo que as equipes de rede comecem a validar e otimizar as implantações antes que a infraestrutura física esteja totalmente instalada.

Saiba mais

Explore nossas últimas pesquisas, relatórios e insights sobre IA