엔비디아, 슈퍼컴퓨팅 데이터센터의 다운타임 최소화하는 AI 플랫폼 발표

엔비디아(CEO 젠슨 황)가 엔비디아 멜라녹스 UFM 사이버-AI(NVIDIA Mellanox UFM Cyber-AI) 플랫폼을 공개했다. 이 플랫폼은 인공지능(AI) 기반 애널리틱스를 활용해 보안 위협과 운영 문제를 탐지하고, 네트워크 장애를 예측함으로써 인피니밴드(InfiniBand) 데이터센터의 다운타임을 최소화하는 것이 특징이다.

 

UFM 사이버-AI 플랫폼은 약 10 여년 간 인피니밴드 시스템을 관리해온 UFM 플랫폼 제품 포트폴리오가 확대된 것으로, AI를 적용해 데이터센터의 운영상태와 네트워크 워크로드 패턴을 학습함으로써 실시간 데이터는 물론 과거의 텔레메트리(telemetry) 및 워크로드 데이터까지 모두 활용하며, 이에 따라 시스템 상태와 네트워크 수정을 추적하고, 성능저하, 사용, 프로파일 변경을 감지한다.

UFM 사이버-AI 플랫폼은 비정상적 시스템, 애플리케이션 동작, 잠재적 시스템 장애 및 위협에 대한 경고를 제공할 뿐 아니라, 시정 조치를 수행한다. 또한, 가상화폐 마이닝과 같이 잘못되거나 원하지 않은 애플리케이션을 호스팅하기 위해 시스템 해킹 시도가 있는 경우 보안 경고를 제공하도록 설계됐다. 이는 결과적으로 데이터센터의 다운타임을 감소시킨다. ITIC의 연구에 따르면, 다운타임 발생 시 일반적으로 시간 당 30만 달러 이상의 비용이 발생한다.

 

오랜 기간 자사 데이터센터에 UFM 플랫폼을 적용해 활용하고 있는 많은 기업들이 UFM 사이버-AI 플랫폼에 지지를 표하고 있다.

UFM 사이버-AI 플랫폼은 네트워크 모니터링, 관리, 성능 최적화, 구성 확인 및 안전한 케이블 관리 등을 제공하는 UFM 엔터프라이즈 플랫폼을 보완한다.

엔비디아는 또한 UFM 제품군의 세 번째 제품인 UFM 텔레메트리(Telemetry) 플랫폼도 추가로 공개했다. 이 툴은 온프레미스 혹은 클라우드 기반 데이터베이스로 스트리밍 되는 실시간 네트워크 텔레메트리 데이터를 캡처하여 네트워크 성능을 모니터링하고 네트워크 구성을 검증한다.


케이벤치 많이 본 뉴스