👨‍💻 Tech Story/Security & Infrastructure

[기술리포트] AI 시대 데이터센터의 게임체인저, 액침냉각 기술의 모든 것 - kt cloud의 PoC 결과까지

kt cloud 테크블로그 2025. 2. 6. 17:21

 

 [ kt cloud DC동부운용센터 박지현 님 ] 

데이터센터에 새로운 냉각 방식이 필요한 이유

2022년 11월 출시된 미국의 인공지능 연구소 오픈AI(OpenAI)의 챗GPT(ChatGPT)로부터 촉발된 인공지능(AI) 혁명은 전 산업 분야로 확산되며 디지털 전환을 가속화하고 있습니다. AI의 학습과 추론을 위해서는 AI 가속기(AI accelerator)와 같은 스펙이 높은 하드웨어가 필요하게 되는데 하드웨어의 성능 향상에 따라 전력 요구 사항 또한 증가하고 있습니다. 장치에서 사용되는 전기 에너지는 열에너지로 변환되기 때문에 AI 인프라가 설치된 데이터센터에서는 열이 많이 발생하게 됩니다. AI 서비스 환경에 특화된 데이터센터(Data Center)에서는 기존의 냉각 방식인 공기 냉각 방식(Air Cooling System)으로는 효율적인 열 관리가 어려워지므로, 열을 효과적으로 제어할 수 있는 새로운 냉각 방식이 필요하게 됩니다.

[기술리포트] AI 시대 데이터센터의 게임체인저, 액침냉각 기술의 모든 것 - kt cloud의 PoC 결과까지
NVIDIA GB200 NVL72(출처:엔비디아)


데이터센터 냉각 방식의 종류

데이터센터의 냉각 기술은 냉각 방법에 따라 공기 냉각(Air Cooling), 액체 냉각(Liquid Cooling), 액침 냉각(Immersion Cooling)으로 구분할 수 있습니다. 공기 냉각 방식은 가장 많이 사용되는 방식으로 비교적 간단하고 설치 비용이 낮지만, 열전달 효율이 낮아 고성능 컴퓨팅 시스템의 열 관리에는 한계가 있습니다. 이에 따라 액체 냉각 방식이 대안으로 주목받고 있는데 그중에서도 하드웨어를 액체에 완전히 담그는 방식을 사용하는 ‘액침 냉각’이 높은 열전달 효율과 넓은 냉각 면적을 확보할 수 있어 차세대 냉각 기술로 부상하고 있습니다.

[기술리포트] AI 시대 데이터센터의 게임체인저, 액침냉각 기술의 모든 것 - kt cloud의 PoC 결과까지
공기와 물의 열 특성 비교(출처: deep gadget)


액침냉각의 원리

액침냉각은 냉각유의 끓는점(Boiling Point)과 상변화 특성에 따라 단상(Single Phase)과 2상(Two Phase) 냉각 방식으로 구분할 수 있습니다. 단상 냉각 방식에서는 액침 냉각유(Immersion Cooling Fluid)를 순환시키면서 별도의 열교환기(Heat Exchanger)를 통해 냉각유 온도를 유지하게 됩니다. 2상 냉각 방식은 기기에서 열을 받아 기화된 액침 냉각유의 증기를 상부의 응축기(Condenser)에서 응축시켜 재사용하는 방식으로 물질의 상변화 현상을 이용해 단상 냉각 방식에 비해 열전달 효율이 높습니다.

[기술리포트] AI 시대 데이터센터의 게임체인저, 액침냉각 기술의 모든 것 - kt cloud의 PoC 결과까지
Single Phase, Two Phase 방식 비교(출처: Submer)

 

<단상 액침냉각 작동 원리>

  1. 침수: 서버나 전자 장비를 전기가 통하지 않는 비전도성 액체로 채워진 용기에 완전히 담급니다.
  2. 열 흡수: 장비가 작동하면서 발생하는 열을 주변의 액체가 직접 흡수합니다.
  3. 열 전달: 열을 흡수한 액체를 순환하여 열을 이동시킵니다.
  4. 열 교환: 가열된 액체는 순환 장치로 이동하여 열교환기를 통해 열을 방출합니다.
  5. 재순환: 냉각된 액체는 다시 장비가 있는 용기로 돌아와 열 흡수 과정을 반복합니다.

 

<2상 액침냉각 작동 원리>

  1. 침수: 서버나 전자 장비를 끓는점이 낮은 비전도성 액체로 채워진 밀폐 용기에 완전히 담급니다.
  2. 열 흡수 및 상변화: 장비가 작동하면서 발생하는 열을 주변의 액체가 흡수합니다. 이 과정에서 액체가 기화되며, 이 상변화 과정에서 잠열을 활용해 효율적으로 열을 제거합니다.
  3. 증기 상승: 기화된 냉매는 증기 형태로 상승합니다.
  4. 응축: 용기 상부의 응축기에서 증기가 다시 액체로 응축됩니다.
  5. 재순환: 응축된 액체는 중력에 의해 다시 용기 내부로 떨어져 재순환하게 됩니다.

 

kt cloud는 데이터센터의 에너지 효율화를 위해 액침냉각의 기술검증(PoC)을 완료하였습니다. 기술검증을 통해 ▽ 서버실 유틸리티 전력량 58% 이상 절감, ▽ 서버실 전력량 15% 이상 절감, ▽ 서버실 면적 70% 이상 감소, ▽ 팬 소음 없는 환경 조성, ▽ 열 교환 상승으로 서버 수명 연장 등 긍정적인 결과를 입증하였습니다.


데이터센터 액침냉각 시스템 설계 시 고려할 점

  1. 전용 서버
    액침냉각 시에는 서버가 직접 냉각유에 노출되므로 방수 성능 및 내부식성을 갖춰야 합니다. 모든 부품은 장기간 냉각유에 노출되더라도 성능을 유지하여야 합니다.

  2. 액침 냉각유
    액침냉각 시스템에 사용되는 액침 냉각유는 전자부품과 직접 접촉하기 때문에 전기 비전도성과 높은 열전도성을 가져야 하며 오염물질의 생성과 축적이 없어야 합니다.

  3. 밀폐 방식
    액침냉각 시스템에서는 냉각액의 증발 및 누출 방지, 외부 오염물질 유입 차단을 위한 완벽한 밀폐시스템을 구축하여야 합니다.

  4. 열교환기
    액침냉각 시 사용되는 열교환기는 고성능 컴퓨팅 시스템의 효율적인 열 관리가 가능한 수준의 충분한 냉각 용량을 제공하여야 합니다.

  5. 모니터링
    액침냉각 시스템은 실시간으로 온도, 유량, 압력 등 성능 모니터링이 가능하여야 하며 실시간 누출 감지 및 경보 시스템이 구축되어야 합니다.

  6. 유지보수 및 확장성
    액침냉각 시스템은 냉각액 등 소모품의 주기적인 교체와 점검이 용이하여야 하며 증가하는 서버 용량에 대응할 수 있도록 쉽게 확장 가능한 구조를 가져야 합니다.

마무리

AI 기술의 급속한 발전과 디지털 전환의 가속화에 따른 IT 하드웨어 스펙 증가로 인해 데이터센터의 열 관리는 더욱 중요해지고 있습니다. 액침냉각 기술은 뛰어난 냉각 성능과 에너지 효율성을 통해 차세대 데이터센터 냉각 솔루션으로 부상하고 있습니다. 액침 냉각 기술의 특성을 잘 이해하고 데이터센터 설계 시 고려하여 적용한다면 더욱 효율적이고 지속 가능한 데이터센터를 만들어나갈 수 있을 것이라 기대됩니다.


[관련/출처]

kt cloud, 데이터센터 운용 효율 높이자... 액침냉각 기술 검증 완료
[신년 기획] 안정적인 데어터센터 운영

GB200 NVL72 | NVIDIA
AI 인프라 발열과의 전쟁: 액침냉각보다 더 효율적인 방법? (feat. DLC) - deep gadget
Single-Phase .vs. Two-phase Immersion Cooling | Immersion Cooling
미래를 냉각하다: 차세대 데이터센터 열관리의 핵심, 액침 냉각
[KixxPedia] 탄소중립 시대를 위한 차세대 열관리 방식, ‘액침냉각’이란?