Resfriamento líquido em data centers: o novo gargalo térmico da IA
English ภาษาไทย Español 한국어 简体中文 繁體中文 日本語 Tiếng Việt Bahasa Indonesia Монгол ئۇيغۇر تىلى العربية Русский हिन्दी

Resfriamento líquido em data centers: o novo gargalo térmico da IA

Publicado em: 2026-05-28

Se você já dedicou algum tempo a analisar seriamente a infraestrutura de IA, já conhece a história da computação. Mais GPUs, clusters maiores, chips mais rápidos, mais capital. Mas a parte que não recebe a atenção necessária, e francamente a parte que tira o sono dos operadores de data centers, é o calor.


Calor bruto, implacável, que desafia as leis da física. Porque é o seguinte: você pode investir um trilhão de dólares na expansão da IA, mas se não conseguir resfriar o hardware, nada funciona. O resfriamento líquido em data centers tornou-se, discretamente, o gargalo que determina se todo esse superciclo de infraestrutura realmente dará certo.


E em 2026, após anos de hesitação e indecisão por parte da indústria, a direção é clara. O resfriamento líquido não é mais uma opção premium para cargas de trabalho especializadas . Para os clusters de IA mais densos, ele está se tornando parte dos requisitos básicos de infraestrutura.

Data Centre Liquid Cooling

Principais conclusões

  • O resfriamento líquido em data centers está se tornando crucial porque a densidade de racks de IA está ultrapassando a capacidade de resfriamento a ar.

  • Os sistemas de rack GB200 e GB300 mostram como a infraestrutura de IA está migrando para cargas térmicas acima de 100 kW.

  • O resfriamento líquido melhora a remoção de calor ao aproximar o fluido refrigerante do chip, reduzindo a carga sobre os sistemas de refrigeração a ar.

  • A transição não é isenta de atritos: os operadores ainda precisam de unidades de distribuição de fluido refrigerante, detecção de vazamentos, adaptações e projetos térmicos híbridos.

  • A verdadeira questão não é apenas a eficiência. É se os centros de dados conseguem operar hardware de IA de alta densidade em plena capacidade.


O resfriamento a ar atingiu um limite, e esse limite não se move.

Para entender o porquê, observe o que as gerações mais recentes de chips realmente exigem do ponto de vista térmico. O sistema NVIDIA GB200 NVL72 mostra o quanto a densidade de energia em nível de rack evoluiu.


As configurações publicadas indicam aproximadamente 132 kW por rack, com a maior parte dessa carga térmica sendo dissipada por resfriamento líquido em vez de ar. Um único sistema em escala de rack pode combinar 72 GPUs Blackwell e 36 CPUs Grace, criando uma densidade de calor que seria considerada extrema pelos padrões convencionais de data centers há apenas alguns anos.


O desafio não é abstrato. Nessas densidades, os operadores lidam com diversas restrições rígidas simultaneamente:


  • A demanda por fluxo de ar aumenta drasticamente: os ventiladores precisam movimentar muito mais ar em servidores com layouts mais compactos, elevando o consumo de energia e o estresse mecânico.

  • Temperaturas de entrada mais baixas tornam-se impraticáveis: resfriar o ar de forma suficientemente agressiva para refrigerar racks com potência superior a 100 kW gera seu próprio consumo de energia e sobrecarga nas instalações.

  • Os pontos quentes tornam-se mais difíceis de controlar: clusters densos de GPUs concentram o calor em torno de processadores, memória, rede e componentes de energia.

  • O espaço físico torna-se menos tolerante: espalhar o hardware para otimizar o resfriamento a ar reduz a densidade computacional e prejudica a viabilidade econômica da implementação de IA.


Por isso, resfriar um rack com essa densidade usando ar não é uma solução realista a longo prazo em grande escala. E a demanda só aumenta daqui para frente. O GB300 NVL72, a próxima geração da Blackwell, suporta até 142 kW por rack em projetos de referência desenvolvidos em conjunto para infraestrutura de IA de alta densidade.


Os aceleradores de IA de ponta estão se aproximando do limite de consumo de energia de 1.000 W por chip, e o resfriamento a ar simplesmente atingiu seu limite para as implementações de IA mais densas em termos de energia. Densidades de racks que ultrapassam 100 kW estão tornando o resfriamento por imersão e o resfriamento direto no chip a arquitetura prática para clusters de IA de alta densidade. Isso não é uma projeção distante. Já é a realidade operacional para qualquer pessoa que implemente infraestrutura de IA robusta hoje.


Muitas transições tecnológicas são apresentadas como "o futuro está chegando". Esta é diferente. Os operadores de data centers que adiam as atualizações da infraestrutura de refrigeração líquida não estão apenas ficando para trás em termos de eficiência, como também assumindo riscos de capacidade. Não é possível operar o hardware em seu potencial máximo sem refrigeração. É uma questão simples.


Os aspectos econômicos são realmente convincentes, não apenas os de engenharia.

É aqui que a coisa fica interessante do ponto de vista de investimento e operacional, porque o argumento da eficiência é mais forte do que a maioria das pessoas imagina.


Em termos de transferência de calor, os líquidos são aproximadamente 3.000 vezes mais eficazes do que o ar. Essa não é uma melhoria marginal. Trata-se de uma categoria de solução completamente diferente.


Historicamente, o resfriamento tem representado uma grande parcela do consumo de eletricidade em data centers, frequentemente chegando a 40% em ambientes convencionais. Isso torna a eficiência térmica uma das áreas mais importantes onde os operadores podem reduzir tanto as despesas operacionais quanto a demanda de energia.

Alavanca econômica Por que o resfriamento líquido altera a equação
Energia de resfriamento O resfriamento líquido pode reduzir significativamente a energia necessária para remover o calor, embora a economia dependa da densidade, do clima, do projeto do chiller e da estratégia de uso da água.
Densidade de racks A remoção do calor para mais perto do chip permite que os operadores coloquem mais poder computacional na mesma área física.
Utilização de hardware Um melhor controle térmico reduz o risco de os chips ficarem mais lentos sob cargas de trabalho prolongadas.
Economia das instalações Uma densidade populacional maior pode melhorar o retorno sobre o investimento em terrenos escassos, capacidade energética e conectividade de fibra ótica.
Resiliência operacional Temperaturas mais estáveis podem reduzir o estresse térmico, embora o benefício dependa da qualidade do projeto e da manutenção.


Em escala hiperescalável, onde as contas de energia chegam a bilhões anualmente, essa diferença de eficiência não é um detalhe insignificante. É um fator essencial para a economia de escala.


O sistema de refrigeração líquida em rack NVIDIA GB200 NVL72 reflete essa mesma ideia. Quando o líquido refrigerante é direcionado diretamente para o chip, em vez de depender do ar para dissipar o calor com rapidez suficiente, os operadores param de lutar contra as leis da física e começam a trabalhar a seu favor. Uma densidade maior se torna possível porque o calor é removido mais próximo da fonte.

Microsoft Azure, NVIDIA GB300 NVL72

Existe também o problema da limitação térmica, que é subestimado. Em ambientes refrigerados a ar, operando próximos aos limites térmicos, os chips reduzem automaticamente suas frequências de clock para evitar o superaquecimento. Isso representa um entrave silencioso e crônico para as cargas de trabalho essenciais para a execução desses data centers.


Os sistemas de refrigeração líquida proporcionam um controle térmico mais preciso do que os sistemas refrigerados a ar, permitindo que chips de alto desempenho suportem cargas de trabalho mais intensas com menor volatilidade de temperatura. Para tarefas de treinamento de IA, em que o tempo de conclusão afeta diretamente os custos de infraestrutura, a diferença entre manter um pico de desempenho constante e um ciclo de pico e recuperação é significativa.


O Caso Operacional da Composição

Além da economia na conta de energia, há argumentos a favor da confiabilidade e da densidade que se acumulam rapidamente. Temperaturas mais estáveis podem reduzir o estresse causado pelos ciclos térmicos, o que pode diminuir o risco de falhas e prolongar a vida útil dos componentes, embora o benefício real dependa da intensidade da carga de trabalho, do projeto do sistema de refrigeração e da disciplina de manutenção.


Quando um cluster de GPUs representa centenas de milhões em capital, essa melhoria na confiabilidade não é trivial. Ela altera as premissas de depreciação, os orçamentos de manutenção e o planejamento do ciclo de atualização.


Sobre densidade: como os sistemas de refrigeração líquida são muito mais compactos do que a infraestrutura de climatização necessária para resfriar cargas equivalentes, alguns operadores já estão observando aumentos substanciais na densidade computacional por rack após a transição. Em um mercado onde terreno, capacidade de energia e conectividade de fibra óptica são cada vez mais escassos e caros, acomodar mais poder computacional na mesma área é uma vantagem estrutural que se multiplica com o tempo.


O resfriamento direto no chip continua sendo a arquitetura mais madura e amplamente implementada para muitos projetos de racks de IA. O resfriamento por imersão está sendo escalado em paralelo para as implementações de densidade mais extrema.


Tanto os sistemas de fluido dielétrico monofásicos quanto os bifásicos estão em franca expansão, com os sistemas bifásicos alcançando preços mais altos para construções de densidade extrema. Não se tratam de projetos de pesquisa de nicho. São infraestruturas de produção nas quais as maiores operadoras do mundo estão investindo capital real.


A Microsoft já implementou seus sistemas de resfriamento líquido "Sidekick" com placas frias integradas diretamente aos chips para seus aceleradores de IA Azure Maia e, simultaneamente, está explorando a microfluídica para aumentar ainda mais a eficiência. Quando grandes operadoras de nuvem estão modernizando data centers existentes em vez de esperar apenas por novas construções, isso demonstra a urgência dessa transição.


A transição não é isenta de atrito.

O resfriamento líquido não é uma solução mágica. Ele traz consigo seus próprios custos operacionais.


Os operadores precisam de unidades de distribuição de fluido refrigerante, detecção de vazamentos, gerenciamento de pressão, controle de qualidade do fluido, protocolos de manutenção, treinamento de pessoal e uma coordenação mais estreita entre a infraestrutura de TI e as instalações. Os data centers existentes podem não ter o roteamento de tubulações, a distribuição de carga no piso, os sistemas de dissipação de calor ou a distribuição de energia necessários para suportar os racks de IA mais densos sem grandes reformas.


É por isso que os sistemas híbridos continuarão sendo comuns. O resfriamento a ar não vai desaparecer. Ele continuará resfriando racks de baixa densidade, sistemas de armazenamento, equipamentos de rede e componentes secundários dentro de sistemas de alta densidade. A mudança não é repentina, do ar para o líquido. É uma transição de um modelo de resfriamento predominantemente a ar para uma arquitetura térmica com foco em refrigeração líquida.


Os operadores mais experientes não se limitarão a comprar equipamentos de refrigeração líquida. Eles redesenharão as instalações em torno do conceito de calor, energia e computação como um sistema integrado.


Siga a Capital

Os dados de mercado, neste momento, falam por si. Uma estimativa de mercado projeta que o mercado de refrigeração líquida para data centers crescerá de aproximadamente US$ 5,1 bilhões em 2025 para US$ 6,41 bilhões em 2026, com o mercado a caminho de atingir mais de US$ 16 bilhões até 2030. Trata-se de uma história genuína de crescimento estrutural, não um ciclo de hype com demanda imprecisa.

Data Centre Liquid Cooling Market by 2030

As carteiras de pedidos dos fornecedores são um dos sinais mais claros de que o resfriamento líquido deixou de ser um projeto piloto. A demanda agora se reflete nos pedidos, nos prazos de entrega e no planejamento da capacidade produtiva.


Os atrasos nesta parte da cadeia de suprimentos sugerem que a demanda está se tornando estrutural, e não meramente experimental. Eles indicam uma oferta limitada atendendo a uma demanda estrutural que continua a se acelerar.


Prevê-se que os principais provedores de nuvem invistam centenas de bilhões de dólares em infraestrutura em 2026, com uma grande parcela destinada a ativos físicos de IA. Cada dólar investido em GPUs gera demanda subsequente por sistemas de refrigeração que mantêm essas GPUs funcionando e com bom desempenho. Em densidades de rack acima de 100 kW, a infraestrutura de refrigeração deixa de ser um item secundário e passa a fazer parte do orçamento de computação de IA.


A pressão regulatória está acelerando ainda mais a adoção, principalmente na Europa e no Japão, onde os governos estão endurecendo as condições para a operação de grandes centros de dados. As exigências de sustentabilidade deixaram de ser compromissos futuros vagos e estão remodelando os cronogramas de aquisição neste momento.


Considerações finais: a janela de transição está se fechando

Em 2026, a capacidade de implantar e dimensionar infraestrutura de resfriamento avançada será uma vantagem competitiva decisiva. O resfriamento líquido não poderá mais ser considerado uma tecnologia emergente ou um complemento opcional para IA de alta densidade.


Os operadores que ainda estão se protegendo em relação à transição não estão tomando uma decisão conservadora de alocação de capital. Eles estão assumindo um tipo diferente de risco: gargalos térmicos que limitam a densidade de computação, custos de energia estruturalmente mais altos do que os de seus concorrentes, menor utilização dos racks e um teto na capacidade de expansão de IA justamente quando a demanda está mais agressiva. A diferença entre as instalações que fizeram a transição e as que não fizeram já é mensurável, e cada nova geração de GPUs a amplia.


A revolução da IA funciona com chips. Os chips funcionam com refrigeração líquida. E, neste momento, as empresas que entenderam isso primeiro não estão apenas à frente em infraestrutura. Elas estão à frente em tudo o que a infraestrutura possibilita.


Fontes

  1. Página oficial do produto NVIDIA GB200 NVL72

  2. Ficha técnica do NVIDIA GB200 NVL72 da HPE

  3. Refrigeração líquida oficial da Microsoft

  4. Projeto de referência oficial GB300 NVL72 da Schneider Electric

  5. O relatório da Business Research Company sobre o mercado de refrigeração líquida para data centers

Aviso Legal: Este material destina-se apenas a fins informativos gerais e não deve ser interpretado como (nem considerado como) aconselhamento financeiro, de investimento ou qualquer outro tipo de orientação na qual se deva basear decisões. Nenhuma opinião expressa neste material constitui recomendação da EBC ou do autor de que qualquer investimento, título, transação ou estratégia de investimento específica seja adequada para qualquer pessoa em particular.