AMD ZEN4 아키텍처의 비밀, 득과 실은 무엇인가?

AMD의 라이젠 7000 시리즈가 오늘 이 시점부터 정식 판매에 들어간다. 라이젠 7000 시리즈와 관련된 모든 정보도 지금 이 시점부터 공개하는 것이 가능해 졌다.

케이벤치에서는 라이젠 7000 시리즈와 관련된 벤치마크와 관련 기사를 준비 중이었다. 라이젠 9 7900X와 라이젠 5 7600X 그리고 X670E 보드와 DDR5 메모리도 입수해 기사 작성에 필요한 모든 자료를 준비 했는데 그 첫번째 기사인 ZEN4 아키텍처를 지금부터 소개해 볼까 한다.

이미 발표 됐듯이 ZEN4 아키텍처는 라이젠 7000 시리즈의 핵심이며 라이젠 7000 시리즈의 성능을 가늠하고 이해하기 위해 꼭 알아야 하는 부분이다.

 

■ AMD 'Zen 4' 아키텍처, 고속도로에 휴게소를 넓힌 것

AMD의 아키텍처 전략은 코어 확장에 있다. 더 많은 코어가 더 높은 성능이라는 단순한 계산이 시장에 먹혀 들었고 지금도 그 전략은 변함이 없다. 하지만, 쿼드 코어가 주류였던 예전 CPU 시장과 달리 양사 모두 8코어가 메인인 상황이라 이런 경쟁은 사실 상 무의미 하다.

최상위 HEDT 모델이야 칩렛 구조인 AMD가 유리할 수 밖에 없지만 전체 시장의 80% 이상을 차지하고 있는 8코어 이하 모델에선 칩렛 구조는 장점이 될 수가 없다. 그래서 AMD도 CPU 코어 성능을 높이기 위한 노력을 계속해 왔으며 이번에 출시된 라이젠 7000 시리즈에도 그런 노력을 결과물이 반영된 것으로 소개된 바 있다.

그 결과물이 바로, 라이젠 7000 시리즈의 핵심인 Zen4 아키텍처다.

AMD가 개발한 Zen4 아키텍처의 핵심은 IPC 개선에 있다. AMD가 제시한 수치로는 13%가 개선 됐다고 한다. IPC가 13% 개선 됐다는 것은 같은 클럭으로 이전 세대 보다 13% 더 높은 성능을 제공한다는 의미나 마찬가지다. 여기에 더해 클럭까지 높아졌으니 실제 성능은 13% 보다 월등히 높을 수도 있다.

과연 AMD가 세대 교체라 부를 만큼 인상적인 아키텍처고 필자 뿐만 아니라 AMD의 발표 자료를 본 사람이라면 같은 생각을 하게 될 것이다. 필자도 처음엔 이런 생각였다. 하지만, AMD가 공개한 세부 자료를 확인하면서 13%의 의미를 다시 생각하게 됐는데 AMD가 만들어낸 IPC 13%는 우리가 흔히 알고 있는 깡 성능과 차이가 있다.

AMD가 제시한 IPC 13%는 순수 계산 능력을 업그레이드 한 것이 아니다.

계산하기 까지 걸리는 모든 단계를 최적화해서 얻어낸 수치다. 여기서 말하는 최적화는 계산에 필요한 데이터를 가져오고 중단된 계산을 다시 시작하기까지 필요한 작업에 걸리는 시간을 최소화 한 것을 의미한다.

그래서 Zen3와 Zen4의 구조적인 특징들을 비교하면 레지스터나 버퍼 같은 임시저장소 크기가 확장된 것이 눈에 띄는데 L2 캐쉬가 512K에서 1M로 확장된 것 또한 같은 의미라 이해하면 된다. 실제, 계산 단계에서는 Zen3와 다를 바 없어 AMD도 13%의 IPC 개선 중 익스큐션 엔진이 차지하는 비중은 가장 작은 것으로 표현하고 있다.

결국 실제 계산 능력은 Zen3와 다를 바 없어 순수 계산 능력에 좌우되는 랜더링이나 연산 작업의 결과물 자체는 13% 만큼의 이득을 기대하기 힘든 것이 Zen4의 현실이다.

하지만, 100% 계산만 필요하지 않은 일반적인 컴퓨팅 사용 환경에선 작업 전환에 따른 지연 시간이 줄게 되고 그로 인한 성능 향상도 기대할 수 있게 됐다. 직접적으로 체감할 수 있는 부분이 아마 게임이 되지 않을까 하는데 요즘 게임들은 워낙 다양한 작업을 동시에 연산하는데다 플레이어의 움직임에 맞춰 모든 조건을 계속해서 변화시켜야 하니 Zen4의 개선 방향이 크게 도움이 될 수 있다.

물론, CPU가 놀아도 될 만큼 GPU 자원을 100% 끌어다 쓰는 고해상도, 고 퀄리티 조건만 아니면 말이다.

 

■ IPC 13%, 어떻게 계산했나?

AMD는 Zen4의 IPC 개선을 13%로 소개한 근거를 제시하고 있다.

8코어 CCD 하나를 모두 사용하는 라이젠 7 7700X와 5800X를 4GHz로 고정한 후 22가지 작업들을 테스트 한 후 그 결과 차이를 종합해 평균을 낸 것이 13%라고 말이다.

결국, 13%는 절대값이 아닌 다양한 테스트의 평균 값이라서 작업 환경이나 종류에 따라 그 이하나 그 이상이 될 수도 있고 아니면 아예 성능이 오르지 않을 수도 있다고 이해해야 한다.

AMD가 제시한 자료에는 CPU-Z 싱글스레드 테스트가 1%로 사실 상 성능 차이가 없었던 것으로 나와 있는데 게임 같은 경우 최대 24%까지도 성능 향상이 있다고 하니 기대해 볼만하다.

여기서 24%는 오픈월드가 구현된 와치독스 리전을 말하며 비슷한 컨셉의 게임이나 비교적 최신 게임일 수록 그 차이가 뚜렷할 것으로 판단된다.

요즘 게임들은 CPU로 처리하는 작업들이 워낙 많고 다양하니 Zen4 아키텍처가 좋을 수 밖에 없다.

 

■ 진정한 성능 향상은 AVX-512로 경험

Zen4 아키텍처의 변화가 효율 개선만 있는 것은 아니다. Zen4에는 AVX-512가 적용 됐으며 이를 지원하는 작업과 어플리케이션에서 훨씬 높은 성능을 경험할 수 있다.

AVX-512는 이미 보편화 된 AVX2 보다 2배 확장된 레지스터를 활용하며 클럭당 처리할 수 있는 FP 연산 능력을 크게 높일 수 있는 확장 명령어 집합이다. 이 기술은 인텔이 먼저 구현해 이미 서버 시장에 구현해 놨으며 일부 데스크탑 프로세서에도 적용한 바 있다.

AMD는 Zen4 아키텍처부터 AVX-512를 지원함으로써 이를 지원하는 작업 환경에서 더 나은 성능을 제시할 수 있게 만들어 놨다. AMD가 제시한 자료만 봐도 1.31배에서 2.47배까지.. 조건에 따라 엄청난 결과를 경험할 수도 있다.

하지만, 이런 결과는 AVX-512를 지원해야만 가능한 것이다. AVX-512를 지원하지 않는 대다수 작업에선 전혀 의미가 없다.

그래서 AVX-512로 테스트 된 결과가 Zen4의 실질 성능이라고 말하긴 어려운 것이 현실이다. 이것이 꼭 필요하고 가능한 환경이라면 굳이 설명하지 않아도 환영 받을 제품이지만 그렇지 않은 일반 소비자에겐 있어도 그만 없어도 그만인 것이 AVX-512의 현실이다.

 

■ 현실 비교, Zen4 vs Zen3 vs Alder Lake

필자도 Zen4 아키텍처의 실제 성능을 확인하기 위해 라이젠 7000 시리즈와 5000 시리즈를 준비했다. 다만, 8코어 모델을 입수하지 못한 탓에 6코어 모델인 라이젠 5 7600X와 5600X를 사용할 수 밖에 없었다.

테스트 시스템은 사용하는 메모리가 다른 탓에 클럭도 다르게 셋팅할 수 밖에 없었는데 라이젠 5 7600X에는 DDR5 5200이 5600X에는 DDR4 3600이 조합됐다. 원래, 7600X에는 DDR5 6000을 조합해야 했지만 필자가 입수한 샘플 수율 문제인지 6000이 불가능해 5200 메모리를 조합할 수 밖에 없었다.

메인보드는 ASUS ROG 크로스헤어 Z670E 익스트림과 ROG 크로스헤어 VIII 히어로가 사용됐다.

참고로, 인텔 시스템과의 비교도 궁금하신 분들을 위해 12세대 코어 프로세서인 i5-12600KF와 ASUS ROG STRIX Z690-i GAMING WiFi를 준비했으며 메모리는 7600X에 사용한 DDR5 5200 메모리를 그대로 사용했다.

사실, 이 메모리는 인텔 플래폼에 맞춘 XMP 메모리라서 이번에 AMD가 준비한 EXPO는 아니다. 어차피 ASUS가 XMP를 그대로 활용할 수 있도록 DOCP를 제공하고 있어 별다른 문제나 호환성 이슈는 발생하지 않았다.

테스트에 사용한 클럭은 AMD와 인텔 모두 4GHz 고정이며 인텔의 i5-12600KF는 P코어와 E코어로 구분된 구조여서 선택적인 테스트가 가능한 조건에서만 개별 테스트를 진행했다.

CPU 코어의 순수 성능을 확인하기 위한 테스트라서 1T 기준으로만 진행하려 했으나 실사용 환경도 무시할 순 없어 몇 가지 테스트는 MT 환경도 테스트 했다. 

 

테스트 결과 중 가장 먼저 확인할 것이 SiSoftware Sandra다. Sandra Lite 최신 버전으로 테스트 한 결과는 CPU의 깡성능과 AVX-512를 포함한 분야별 성능을 확인할 수 있다.

여기서 말하는 깡성능은 Arithmetic 결과인데 보면 알겠지만 ZEN3 보다 ZEN4가 10% 가까이 개선된 것을 알 수 있다. AMD가 제시한 평균값인 13% 보다는 적지만 그래도 순수 계산 능력만 평가해서 10%라는 결과를 얻어냈으니 칭찬할만 하다.

AVX-512가 적용된 테스트 결과들은 예상대로다. 이미지 프로세싱의 경우 무려 2배라는 엄청난 결과가 나오기도 했다. AVX-512를 사용하지 않고도 77.25 MPix/s를 기록한 Alder Lake의 P 코어도 상당히 인상적이지만 AVX-512로 뻥튀기된 ZEN4에 비할바는 아니었다.

이번엔 좀더 실사용 환경에 가까운 결과들이다. 둘 다 작업 로드는 100%라서 ZEN4의 장점이 잘 반영된 결과들은 아니겠지만 그래도 ZEN3 보다 나아졌다는 것은 확인할 수 있었다.

특히, 단일 코어가 아닌 다중 코어로 작업하는 MT 환경일 수록 개선 효과가 뚜렸했는데 이는 다음 기사에서 소개할 코어간 데이터 전송율 차이가 반영된 결과라고 보면 된다.

MT 환경은 코어간 캐쉬 일관성 유지가 필수이고 그로 인한 데이터 전송에 민감하기 때문에 이 부분에 대한 개선만으로도 성능 향상을 가져올 수 있다.

하지만, Alder Lake를 따라잡기에는 여전히 부족한 부분이 남아 있는데 익스큐션 엔진을 보강하지 않는 이상 이러한 차이는 더 벌어질 수도 있다.

ZEN4의 장점이 발휘되는 게임 테스트 결과다. 게임에 따라 차이는 있지만 포르자 호라이즌5 같은 경우 177fps 였던 프레임이 192까지 상승하는 인상적인 결과를 가져다 줬다.

사이버펑크2077은 별 차이도 없어 모든 게임에서 항상 긍정적인 결과가 나오진 않는다는 것을 입증했지만 어쨌거나 마이너스는 아니니 게이머라면 ZEN4의 변신이 나쁘지만은 않을 것이다.

 

■ 인텔과의 경쟁 무기는 5GHz, 그 이상

앞서 확인했듯이 ZEN4의 깡성능은 그렇게 인상적인 수준이 아니다.

실제 계산 능력이 크게 확장된 것도 아니고 내부 구조의 효율화 덕분에 얻어낸 덤 같은 성격이라서 모든 작업에서 일관된 성능 향상을 기대할 수도 없다. 하지만, 5nm로 미세화 된 반도체 공정의 장점을 클럭 상승으로 연결시키면서 실질적인 성능은 크게 개선할 수 있게 된 것이 ZEN4로 무장한 라이젠 7000 시리즈의 장점이다.

이번 기사에 사용한 라이젠 5 7600X만 하더라도 이전 세대에서는 4.6GHz가 최고 클럭이었지만 공식 클럭 기준으로만 5.3GHz까지 작동할 수 있어 실제 성능은 이전 세대와 비교도 할 수 없을 만큼 좋아졌다.

자세한 내용은 라이젠 5 7600X 리뷰에서 다루겠지만 5GHz를 넘어선 AMD는 인텔의 12세대 코어 프로세서와 경쟁하기에 충분한 성능을 제공할 수 있게된 건 확실하다.

다만, 클럭이 5GHz를 넘어서면서 그로 인한 소비전력 증가와 발열은 AMD에게도 부담이 될 수 밖에 없는데 어차피 인텔은 AMD 보다 조건이 더 열악하니 그런 부분을 비교해도 크게 문제될 것은 없다는 입장인 것 같다. 결국 성능을 위해 소비전력과 발열을 희생한 것이 라이젠 7000 시리즈의 현실이고 이제는 AIO 수냉 쿨러를 준비해야 할 만큼 AMD도 뜨거운 CPU라는 점 알아두기 바란다.

참고로, 위 차트는 ZEN4와 라이젠 7000 시리즈의 고클럭 전략이 가져오는 온도와 소비전력 문제를 보여주기 위해 테스트한 것으로, 만약 라이젠 7000 시리즈가 예전 처럼 최대 클럭을 5GHz 이하로 제한했다면 과거의 저전력, 저발열 프로세서라는 명성을 그대로 이어갈 수 있었다는 것을 보여주고 있다.


케이벤치 많이 본 뉴스