Broadcom, ‘VMware Cloud Foundation 9.1’ 발표

반도체 및 인프라 소프트웨어 솔루션을 설계, 개발 및 공급하는 글로벌 기술 선도 기업 Broadcom(NASDAQ: AVGO)이 프로덕션 AI 워크로드를 위한 안전하고 비용 효율적인 인프라 플랫폼 VMware Cloud Foundation(VCF) 9.1을 발표했다. 이번 버전은 AI 및 쿠버네티스 네이티브 프라이빗 클라우드 플랫폼으로, 통합 보안 기능과 함께 AMD, 인텔(Intel) 및 엔비디아(NVIDIA) 기반의 혼합 컴퓨팅 인프라를 지원하는 것이 특징이다. 이를 통해 기업은 대폭 낮아진 비용으로 추론(inference) 및 에이전틱 AI(agentic AI) 애플리케이션을 보다 안전하게 배포하고, 선도적인 GPU 및 CPU 하드웨어를 유연하게 선택할 수 있다.

Broadcom이 공개한 ‘프라이빗 클라우드 전망 2026(Private Cloud Outlook 2026)’ 보고서에 따르면, 프라이빗 클라우드는 여전히 프로덕션 AI를 위한 선호 플랫폼으로 자리 잡고 있다. 조사 대상 조직의 56%가 프라이빗 클라우드에서 프로덕션 추론을 이미 실행 중이거나 도입을 계획 중이라고 답했다. 더욱 주목할 점은 퍼블릭 클라우드에서 프로덕션 추론을 운영하는 비율이 41%로, 전년 대비 15%포인트 감소했다는 점이다. 뿐만 아니라, IT 리더의 62%는 생성형 AI 인프라 비용에 대해 ‘매우’ 또는 ‘극도로’ 우려하고 있으며, 36%는 AI로 인해 데이터 보호, 프라이버시, 보안 통제 및 리스크 관리 관련 새로운 요구사항들이 늘어나고 있다고 응답했다.

VCF는 기존 서버 자원의 효율을 높이는 지능형 소프트웨어를 기반으로, 프로덕션 워크로드 환경에서 퍼블릭 클라우드의 효과적인 대안으로 작용하는 프라이빗 클라우드 플랫폼을 구현한다. 이를 통해 기업은 프로덕션 AI 배포에 필수적인 아키텍처 통제 및 규제 준수 역량을 확보할 수 있다. VCF 9.1은 기업이 추론과 에이전틱 AI를 포함한 프로덕션 워크로드를 배포할 수 있도록, 다음과 같은 기능을 제공할 예정이다.

AI 및 비-AI 워크로드가 혼합된 클러스터 환경에서 지능형 메모리 티어링를 통해 서버 비용을 최대 40% 절감1
AI 데이터 파이프라인을 위한 압축 및 중복제거 기능 강화를 통해 스토리지 총소유비용(TCO) 최대 39% 절감1
대규모 AI 워크로드 운영 시 쿠버네티스(Kubernetes) 운영 비용 최대 46% 절감1
클러스터 업그레이드 속도 4배 향상, 플릿(fleet) 용량 2배 확대로 AI 인프라 신속한 확장 지원1

Broadcom의 VCF 부문 수석 부사장 겸 총괄 책임자인 크리쉬 프라사드(Krish Prasad, senior vice president and general manager, VMware Cloud Foundation Division, Broadcom)는 “더 많은 기업들이 경쟁력 강화를 위해 AI를 도입하면서, 데이터와 지식재산(IP) 프라이버시에 대한 우려, 급증하는 인프라 비용, 그리고 에이전틱 AI 시대에 대한 대비라는 세 가지 핵심 과제에 직면하고 있다”며, “VCF 9.1은 이 세 가지 과제를 모두 해결하는 단일 통합 플랫폼으로, 프라이빗 AI를 위한 가장 진화된 인프라를 제공한다. AI를 위한 제로 트러스트(zero-trust) 보안을 지원하는 동시에, 지능형 인프라 최적화와 하드웨어 선택권을 통해 비용을 절감하고, 동일한 플랫폼에서 에이전틱 워크플로우와 가속화된 추론을 모두 실행할 수 있는 유연성을 제공한다.”고 밝혔다.

AI 워크로드를 위한 대규모 고효율 인프라
VCF 9.1은 기존 인프라 환경에서 VM 및 컨테이너 기반 AI 워크로드의 집적도를 향상시키는 동시에, 운영 복잡성을 획기적으로 줄인다. 지능형 리소스 관리와 자동화된 운영 기능을 통해 기업은 현재의 서버 자원만으로도 더 많은 프로덕션 워크로드를 배포할 수 있으며, 분산된 환경 전반에서 효율적으로 확장할 수 있다. 이는 하드웨어 공급 부족과 비용 상승 현상이 지속되는 상황에서도 고가의 증설 없이 AI 인프라 확장을 가능하게 한다. 주요 기능은 다음과 같다.

지능형 리소스 최적화: 고급 메모리 티어링과 차세대 스토리지 압축 기술을 기반으로 인프라 활용도를 극대화하고, AI 데이터 파이프라인을 최적화함으로써 성능 저하 또는 비용 부담이 큰 하드웨어 교체 없이도 AI 워크로드 집적도를 높인다.
대규모 플릿 운영 자동화: 분산된 환경과 에어갭(air-gapped) 환경 전반에서 관리 가능한 호스트 수를 5천대까지 2배 확장하고, 클러스터 업그레이드는 최대 4배 빠르게 수행해 수동 패치 작업 부담을 없애고 AI 인프라의 신속한 확장을 지원한다.
AI 워크로드 간 완전한 분리를 지원하는 멀티테넌트 인프라: 엔터프라이즈 및 서비스 제공 기업이 공유 인프라 상에서 강력한 보안 경계를 유지한 채 여러 AI 프로젝트와 고객 환경을 운영할 수 있어 고가의 GPU•CPU 자원 활용률을 높이면서도 민감한 모델의 데이터 주권을 지원한다.
개방형 생태계 통합: AMD와 엔비디아(NVIDIA) 기반의 멀티 가속기 GPU 선택권, 업계 선도적인 AMD 및 인텔(Intel) CPU 플랫폼 지원 및 아리스타 유니버설 클라우드 네트워크(Arista Universal Cloud Network)와의 표준 기반 EVPN•VXLAN 상호운용성을 제공한다. 이는 프로덕션 AI가 요구하는 고성능 네트워크 연결과 유연한 컴퓨팅 환경을 구현하려는 VCF의 확고한 의지를 보여준다.
AI 워크로드를 위한 고속 네트워크 환경 제공: VCF가 엔비디아 커넥트X-7(NVIDIA ConnectX-7 NICs)와 엔비디아 블루필드-3(NVIDIA BlueField-3)을 Enhanced DirectPath I/O와 함께 지원하면서 AI 워크로드에 필요한 고속 네트워크 환경을 제공한다. 이번 개선으로 여러 호스트가 함께 수행하는 AI 모델 학습과 대용량 데이터 전송을 고속으로 처리할 수 있게 됐으며, 고성능 생성형 AI 워크로드에 필수적인 기반을 마련했다.
가상화된 로드 밸런싱 및 보안: VMware Avi Load Balancer2와 VMware vDefend2를 통해 AI 추론 엔드포인트와 에이전틱 애플리케이션에 필요한 로드 밸런싱 및 보안을 소프트웨어로 제공함으로써, 별도의 하드웨어 어플라이언스 없이 자본 지출(CAPEX)을 절감하고, 엔터프라이즈급 복원과 자동화된 라이프사이클 관리가 가능하다.

고속 애플리케이션 제공: AI•컨테이너•VM을 위한 모던 워크로드 플랫폼
VCF 9.1은 추론 워크로드, 에이전틱 애플리케이션, 컨테이너 기반 서비스 및 기존 VM을 단일 인프라 계층에서 실행할 수 있는 통합 플랫폼을 제공해 AI 애플리케이션 배포를 가속한다. 이를 통해 서로 다른 스택을 별도로 운영함으로써 발생하는 운영 분산과 비용 부담을 해소하는 동시에, 프로덕션 AI에 요구되는 개발자 생산성과 플랫폼 거버넌스를 함께 제공한다. 주요 기능은 다음과 같다.

AI를 위한 쿠버네티스 확장성과 성능: 기존 대비2.6배 향상된 클러스터 확장성, 70% 더 빠른 배포 속도, 75% 단축된 업그레이드 소요 시간1, 원활한 확장을 통해 끊김없는 프로덕션 AI 서비스를 지원한다.
혼합 컴퓨팅 관리: CPU 집약적인 에이전틱 AI 워크플로우와 GPU 가속 기반 추론을 하나의 통합 플랫폼에서 효율적으로 관리한다. 이는 에이전틱 워크로드가 워크플로우 실행과 의사결정 오케스트레이션 과정에서 GPU보다 훨씬 많은 CPU 용량을 필요로 한다는 현실을 반영한 기능이다.
AI 가시성 및 거버넌스: 첫 토큰 응답 시간(Time to First Token), 토큰 처리량 및 GPU 활용률 등 세부 지표를 다양한 가속기 유형 전반에 걸쳐 제공해 정밀한 하드웨어 활용 모니터링을 지원한다. 이를 통해 인프라 투자 대비 효과(ROI)를 향상시킬 수 있다. 또한 중앙 집중식 정책 적용과 데이터 주권 통제를 통해 AI 규제 준수 조치 집행과 안전한 모델 접근을 돕는다.
라이브 애플리케이션 스택 블루프린트: 다수의 VM으로 구성된 애플리케이션을 재배포 가능한 템플릿으로 정의해 개발•테스트•프로덕션 환경에 빠르게 배포하며, 수동 설정 오류와 구성 편차를 방지하고, 인프라 제공 속도를 높인다.

AI 데이터 주권과 거버넌스를 위한 제로 트러스트 아키텍처
VCF 9.1은 인프라 계층 전반에 보안을 통합해 하이퍼바이저부터 애플리케이션까지 AI 워크로드, 독자적 모델 및 학습 데이터를 보호한다. 별도의 보안 도구를 추가하지 않고도 제로 트러스터 기반 네트워크 분리, 소버린 리커버리 및 지속적인 패치를 제공함으로써, 퍼블릭 클라우드 환경에서는 구현하기 어려운 수준의 보안 태세를 확보해 프로덕션 AI 배포에 요구되는 핵심 보안을 강화한다. 주요 기능은 다음과 같다.

자체 구축 인프라(온프레미스) 기반 랜섬웨어 복구: 새로운 크라우드스트라이크 팔콘 엔드포인트 보안(CrowdStrike Falcon® Endpoint Security) 지원 등 격리된 복구 환경과 통합 검증 도구를 제공해 AI 모델과 학습 데이터와 같은 중대한 지식재산(IP)을 보호한다. 이를 통해 위기 상황에서 복구 수행 시에도 데이터의 국외 이동을 방지하고, 과도한 네트워크 대역폭 비용을 줄일 수 있다.
지속적 규제 준수 시행2: 중앙 집중식 모니터링과 자동화된 목표 상태 복원(remediation)을 통해 워크로드와 VCF 스택 전반에서 규제 준수 상태를 지속적으로 유지한다. 또한 별도의 규제 준수용 도구 또는 수작업 없이도 프로덕션 AI 배포에 필요한 감사 대응 역량을 입증할 수 있다.
무중단 라이브 패칭: 호스트 비우기(evacuation) 또는 유지보수 윈도우 없이도 전체 사용 사례의 최대 80%를 지원하는 무중단 라이브 패칭 기능으로, 서비스 수준 협약 충족을 위해 지속적인 가용성이 요구되는 프로덕션 AI 추론 서비스와 에이전틱 애플리케이션의 중단을 없앤다.1
제로 트러스트 기반의 횡적 보안(lateral security)2: 분산형 침입 탐지/방지 시스템(IDS/IPS) 보호 기능을 쿠버네티스 기반 AI 워크로드로까지 확대 적용해 분산 추론 환경에서 9Tbps급의 위협 검사 성능을 제공하며, 프라이빗 클라우드 및 인터넷 애플리케이션에 대한 애플리케이션 식별 능력을 5배 향상시킨다.1
자동화 기반 셀프서비스 보안2: 중앙 관리형 태깅, 사전 정의된 보안 프로파일, 위임형 방화벽 설정 및 외부에서 웹 애플리케이션 내부로 유입되는 트래픽의 보안을 제공한다. 이를 통해 엔터프라이즈와 서비스 제공 기업이 운영 복잡성 또는 단절된 보안 도구 없이도 AI 배포 환경을 손쉽게 보호할 수 있다.