KAYTUS, AI EXPO 2026서 1만 GPU 클러스터 지원하는 All-QLC 플래시 스토리지 솔루션 공개
KAYTUS가 AI EXPO KOREA 2026에서 1만 GPU 클러스터를 위한 고성능•대규모 확장성•비용 효율성을 갖춘 'All-QLC 플래시 스토리지 솔루션'을 공식 출시했다. 해당 솔루션은 초대규모 AI 학습 환경에서 발생하는 데이터 전송 병목을 해소하고, GPU 자원 활용률을 극대화한다.
KR2280 및 KR1180 서버 플랫폼을 기반으로 하는 이 솔루션은 업계 최고 수준의 AI 네이티브 병렬 파일 시스템과 긴밀하게 통합돼 기존 계층형 스토리지의 데이터 사일로(Silo) 문제를 해소한다. 읽기 중심 AI 워크로드에 최적화돼 대규모 클러스터의 수평 확장 한계를 극복하며, 검증된 테스트 데이터에 따르면, 이 솔루션은 엑사바이트(EB)급 규모로 구축될 경우 10TB/s의 총 대역폭과 1억 IOPS의 성능을 구현한다. 또한 기존 TLC 기반 제품 대비 5년 총소유비용(TCO)을 70% 절감해 AI 클라우드 사업자와 AI 컴퓨팅 센터의 모델 혁신을 가속한다.
국내에서도 AI 학습 인프라 고도화 수요가 빠르게 증가하는 가운데, 국가 AI 컴퓨팅센터 구축 사업 등 초대규모 GPU 클러스터 운영이 본격화되고 있다. KAYTUS의 All-QLC 플래시 스토리지 솔루션은 이러한 환경에서 스토리지 병목 없이 GPU 자원을 안정적으로 활용할 수 있는 경쟁력을 갖추고 있다.
기존 AI 스토리지 아키텍처의 한계
AI의 폭발적 성장은 기업의 컴퓨팅 및 스토리지 요구사항을 근본적으로 변화시키고 있다. 대규모 AI 모델 학습은 수만 개의 GPU가 엑사바이트 규모 데이터셋에 밀리초 미만 지연으로 동시 접근해야 하는 읽기 중심 워크로드를 요구한다. 이에 따라 기존 스토리지 아키텍처는 다음과 같은 세 가지 주요 도전 과제에 직면하고 있다:
• 데이터 사일로(분산•단절) 문제: 기존 ETL 방식에서는 학습 전 오브젝트 스토리지에서 병렬 파일 시스템으로 데이터를 이동해야 하며, 이 과정에서 물리적 데이터 마이그레이션에 상당한 시간이 소요된다. IDC 조사에 따르면 데이터 팀은 업무 시간의 81%를 데이터 준비에 사용하는 것으로 나타났다.
• 워크로드와 스토리지 미디어 간 불일치: AI 학습의 90% 이상이 고빈도 동시 읽기 작업임에도 기존 TLC 플래시 솔루션은 불필요한 쓰기 내구성을 제공해 엑사바이트급 클러스터 구축 시 도입 비용과 공간, 전력 소모를 증가시키며 자원 활용의 비효율을 초래한다.
• 확장성 병목: 기존 파일 시스템은 1만 GPU 규모 클러스터에서 발생하는 순간적 I/O 집중 부하를 처리하도록 설계되지 않았다. 클러스터 규모가 커질수록 메타데이터 락 경합과 통신 오버헤드가 증가해 지연 급증과 전체 성능 저하로 이어진다.
KAYTUS 솔루션: 고성능•확장성•비용 효율을 동시에 구현
차세대 KAYTUS All-QLC 플래시 스토리지 서버 솔루션은 읽기 중심 AI 학습 워크로드의 성능을 극대화하도록 설계됐다. 플래그십 컴퓨팅 노드와 업계 최고 수준의 AI 네이티브 병렬 파일 시스템을 긴밀하게 통합해 하드웨어와 소프트웨어의 공동 설계를 기반으로 혁신적인 성능과 원활한 확장성, 우수한 비용 효율성을 초대규모 AI 컴퓨팅 환경에서 구현한다.
• 아키텍처 혁신: 파일, 오브젝트, 블록 스토리지를 아우르는 네이티브 멀티 프로토콜 기반을 지원하는 통합 네임스페이스를 구축했다. 대용량 QLC 플래시 풀과 NVMe-oF 기반 완전 공유 인터커넥트를 통해 AI 스토리지 데이터 처리 구조를 단순화하고, 크로스 시스템 마이그레이션 없이 데이터가 GPU 노드로 직접 전달돼 밀리초 미만 접근과 AI 학습 데이터 처리 효율을 크게 향상시킨다.
• 하드웨어 최적화: 읽기 중심 워크로드에 특화된 PCIe 5.0 직접 연결 아키텍처를 통해 이전 세대 대비 단일 노드 I/O 대역폭을 2배 향상시켰다. NUMA 균형 최적화를 적용해 내부 처리 병목을 효과적으로 해소한다.
• 소프트웨어 시너지: NFS over RDMA 및 네이티브 GPU Direct Storage 기술을 통합해 QLC 플래시에서 GPU 메모리까지 직접 데이터 경로를 구현한다. 프로토콜 처리와 스토리지 상태를 분리한 분산 아키텍처를 기반으로 노드 간 내부 트래픽을 최소화하고, 페타바이트에서 엑사바이트 규모까지 선형적으로 확장 가능한 대역폭과 처리량을 제공한다.
1만 GPU 클러스터 벤치마크: 고성능•확장성•비용 효율 입증
1만 GPU 규모 데이터센터의 엑사바이트급 스토리지 환경 벤치마크에서, KR2280 및 KR1180 노드와 AI 환경에 최적화된 병렬 파일 시스템으로 구성된 해당 솔루션은 1만 GPU 규모 컴퓨팅 클러스터를 안정적으로 지원하는 확장성을 입증했다.
• 고성능•확장성: 10TB/s의 지속적인 집계 읽기 대역폭과 1억 랜덤 읽기 IOPS를 제공해 수만 개 GPU의 동시 접근을 지원한다. 노드 추가에 따라 성능이 선형적으로 확장되며, GPU 활용률은 95% 이상을 안정적으로 유지한다. 스토리지 측 락 경합이나 대기열 없이 GPU 데이터 공급 지연 문제를 효과적으로 해소한다.
• 탁월한 비용 효율: 기존 TLC 올플래시 솔루션 대비 설비 투자 비용(CAPEX)을 65%, 전력 비용(Power Cost)을 75%, 5년 총소유비용(TCO)을 70% 절감해 기업들이 불필요한 쓰기 내구성에 과도한 비용을 지출하지 않고도 최적의 인프라를 구축할 수 있도록 지원한다.
KAYTUS 올플래시 스토리지 포트폴리오: 고밀도부터 대용량까지
KAYTUS는 단일 드라이브 최대 122.88TB 용량을 지원하는 포괄적인 QLC 스토리지 포트폴리오를 제공한다.
• KR1180 (1U10) — 고밀도 특화형: 1U 섀시에서 최대 1PB 용량과 140GB/s 대역폭을 제공하며, 최적화된 공랭 설계를 통해 GPU 워크로드 환경에서 지연 시간을 18% 개선한다.
• KR2280 (2U24) — 범용 플래그십 모델: QLC 드라이브 24개와 PCIe 5.0 슬롯 7개를 지원하며, 인텔 및 AMD 플랫폼과 호환된다. 또한 고효율 데이터센터를 위한 액체 냉각 옵션도 제공한다.
• KR4266 (4U60) — 빅데이터 처리 특화형: 시스템당 최대 7PB의 업계 최고 수준의 물리적 밀도를 제공하며, 260GB/s 순차 읽기 대역폭과 2천만 IOPS 성능을 구현한다.
KAYTUS 코리아 나한돌 기술 총괄 이사는 "AI EXPO KOREA 2026에서 선보인 All-QLC 플래시 스토리지 솔루션은 국내AI 학습 환경이 직면한 스토리지 병목과 비용 효율 문제를 동시에 해결할 핵심 인프라"라며, "국내 시장에서 대규모 GPU 클러스터 구축이 가속화됨에 따라, KAYTUS의 엔드투엔드 AI 인프라 역량을 지속적으로 강화해 나갈 것"이라고 밝혔다.
케이벤치 많이 본 뉴스
삼성 첫 와이드 폴더블폰 '갤럭시Z 폴드8 와이드' 케이스, 中 알리바바에서 포착
삼성 첫 와이드 폴더블폰 ‘갤럭시Z 폴드8 와이드’ 카메라 사양 유출
삼성, 7월 갤럭시 언팩에서 어떤 신제품 공개하나