AMD RDNA2와 엔비디아 암페어, 진검 승부는 레이트레이싱으로

라데온 RX 6000 시리즈로 투입된 빅나비는 AMD 역사상 가장 강력한 GPU다. 하드웨어 레이트레이싱과 메쉬 세이더, VRS 같은 최신 기술을 모두 지원하는 것은 기본이고 게이밍 성능이나 발열, 소비전력 모두 에서 역대급으로 인정 받기에 충분한 제품이 됐다.

결코 따라잡지 못 할 것 같던 엔비디아를 턱 밑까지 쫒아온 것만 해도 진짜 놀랄만한 일을 해낸 것이다.

그러나, AMD가 제시한 성능은 전통적인 3D 랜더링 기법으로 평가된 것들이 대부분이다. 이미 현실화 된 레이트레이싱과 이를 지원하는 게임 성능에 대한 평가는 정보가 매우 제한적이다.

소프트웨어 레이트레이싱 보다 성능이 월등한 하드웨어 방식을 채택하고도 벤치마크 자료를 공개하지 않은 이유가 궁금할 수 밖에 없을텐데 지금부터 그 궁금증을 하나씩 풀어 볼까 한다.

 

■ 하드웨어 레이트레이싱, 해법이 다르다

레이트레이싱은 매우 많은 연산을 필요로 한다. 화면을 구성하는 모든 픽셀 마다 광선을 추적하고 이를 바탕으로 빛과 그림자, 반사 효과를 구현해야 하니 일반적인 GPU 구조로는 실시간 처리가 사실상 불가능했다.

픽셀 당 사용하는 샘플을 1개로 줄여도 실시간 처리가 불가능한 건 마찬가지였다. 그래서 실시간 처리를 위해 레이트레이싱을 전담하는 하드웨어 로직이 꼭 필요 했는데 AMD도 하드웨어 로직으로 레이트레이싱 연산을 처리하게 만들었다.

AMD가 만들어낸 하드웨어 로직은 RAY ACCELERATOR(RA)다.

이 로직은 CU마다 1개씩 탑재 됐고 클럭당 4개의 RAY/BOX 교차 테스트나 1개의 RAY/Triangle 교차 테스트를 처리할 수 있다. 이 기준으로 80개의 CU로 게이밍 클럭 2015Mhz로 동작하는 빅나비 풀버전(라데온 RX 6900 XT)을 평가하면 161 G/sec ray-tri나 644 G/sec ray-box을 처리할 수 있다는 말이 된다.

엔비디아가 튜링에서 실현한 속도가 10 G/sec ray 였으니 AMD가 외계인이라도 고문한 것이 아니냐는 말이 나올 수도 있을텐데 아쉽게도 이건 다 허상이나 마찬가지다.

AMD가 만들어낸 하드웨어 레이트레이싱 로직은 교차 테스트만 처리한다. BVH(Bounding Volume Hierarchy)로 처리하는 순회(Traversal) 테스트는 전담 로직이 없어 랜더링에 사용해야 할 스트림 프로세서를 사용할 수 밖에 없다.

거기다 RA가 텍스처 프로세서 내부로 추가된 구조라서 레이트레이싱 작업을 처리하면 텍스처 작업은 처리할 수 없다. 레이트레이싱 데이터를 텍스처 데이터에 포함해 보내는 방식이니 동시 처리가 불가능한 것이다.

이러한 내용은 마이크로소프트가 핫칩스에서 공개한 XSX 관련 자료와 AMD가 출원한 특허 문서에 잘 나와 있다. XSX 관련 자료에서 RDNA2의 CU는 4개의 텍스처나 광선 추전 중 한 가지만 처리할 수 있는 것으로 나와 있는데 이는 빅나비에 적용된 RDNA2와 다르지 않다.

2019년 6월 공개된 TEXTURE PROCESSOR BASED RAY TRACING ACCELERATION METHOD AND SYSTEM 라는 문서에는 RDNA2의 레이트레이싱 처리 구조와 왜 이 방식을 선택했는가가 자세히 나와있다.

 

■ AMD RDNA2와 엔비디아 암페어의 차이

 

AMD가 선택한 하드웨어 레이트레이싱은 비용 증가를 최소화 한 방법이다. 엔비디아 처럼 레이트레이싱 전담 유닛을 설계하면 그에 맞춰 레지스터와 캐쉬 구조도 다시 설계해야 하고 다이 면적 증가는 필연적인데 이걸 텍스쳐 프로세서로 대신한 것이다.

이미 기반이 갖춰진 텍스쳐 프로세서로 교차 테스트를 수행하고 SHADER 코어로 BVH와 순회 테스트를 처리하면 설계 변경을 최소화 할 수도 있고 다이 면적도 큰 차이 없이 가져갈 수 있다.

성능도 순수 소프트웨어 방식 보다는 10배 가까이 빠른 처리가 가능하니 이런 방법을 택한 것으로 판단되는데 그렇다고 이 방법이 최선이라고 할 수는 없다. 비용적인 면에선 가장 효율적인 선택일지도 모르겠으나 성능 면에선 결코 좋은 방식이 될 수는 없다.

완전한 하드웨어 로직으로 넘어가기 위한 과도기적 방법일 뿐 모든 레이트레이싱 작업을 별개의 유닛에서 동시에 처리할 수 있는 구조가 가장 이상적인 선택이다. 그래야 기존 랜더링 파이프라인의 성능 저하 없이 레이트레이싱 성능도 최상의 조건을 유지할 수 있다. 대표적인 예가 바로, 엔비디아의 RT 코어 방식이다.

 

■ 빅나비 Vs 암페어, 결과로 판단하자 | 레이트레이싱 벤치마크

 

3DMARK의 DirectX Raytracing feature test는 GPU로 처리되는 레이트레이싱 성능만 평가하도록 설계됐다. 전통적인 랜더링 기법은 최소화 했고 픽셀 당 광선 샘플을 12개 이상으로 늘려 레이트레이싱만으로 결과물을 만들어 내는 테스트다.

이번 기사에 가장 적절한 테스트 툴이 아닐까 생각 되는데 결과를 보면 알겠지만 RDNA 2 아키텍처가 적용된 빅나비, 즉 RADEON RX 6000 시리즈의 프레임은 엔비디아 암페어와 천지 차이였다.

DirectX Raytracing feature test의 주된 효과가 반사다 보니 교차 테스트만 RA로 처리하고 BVH 기반 순회 테스트는 전담 유닛이 없는 RDNA 2 아키텍처 입장에선 어쩔 수 없는 결과다. 구조적인 차이를 떠나 RT 코어 성능이 부족했다면 AMD 입장에선 그나마 도움이 됐을 텐데 엔비디아가 암페어 부터 RT 코어 처리량을 2배로 늘려놔 그런 기대도 할 수 없게 됐다.

전통적인 랜더링 기법을 병행한 포트로열도 결과는 마찬가지였다. DirectX Raytracing feature test 만큼 차이가 크진 않았지만 5% 내외로 점수하락이 크지 않던 엔비디아 암페어 계열과 달리 25% 내외의 매우 큰 점수하락이 발생했다.

아직 발매된 게임은 아니지만 레이트레이싱에 특화한 벤치마크 버전으로 공개된 Boundary도 3DMARK의 DirectX Raytracing feature test와 거의 유사한 결과를 나타냈다. 

 

■ 빅나비 Vs 암페어, 결과로 판단하자 | 레이트레이싱 게임

 

 

 

 

레이트레이싱은 현실이다. 이미 발매된 게임 뿐만 아니라 앞으로 나올 게임에서도 레이트레이싱이 지원된다.

필자는 가장 근래에 발매된 콜 오브 듀티 : 콜드워 뿐만 아니라 와치독스:리전과 레이트레이싱으로 더 잘 알려진 컨트롤, 메트로 엑소더스 등을 통해 실질적인 성능 차이를 확인해 보고자 했다.

그렇게 테스트 해 얻어낸 결과가 위 그래프다.

RDNA 2 아키텍처로 무장한 라데온 RX 6000 시리즈는 프레임 하락이 매우 심했다. 해상도나 게임에 따라 다르기는 하지만 50% 가까이 프레임이 떨어지는 걸 어렵지 않게 볼 수 있었다. 이는 라데온 RX 6800 XT나 RX 6800을 가리지 않고 나타난 공통적인 현상인데 컨트롤 같이 심한 게임은 절반 이하로 내려간 경우도 있었다.

암페어 아키텍처가 적용된 지포스 RTX 3000 시리즈도 프레임 하락이 큰 편이었지만 라데온 RX 6000 시리즈 보다는 확실히 높았다. 라데온 RX 6000 시리즈가 50% 내외였다면 지포스 RTX 3000 시리즈는 30% 내외라 보면 될 듯하다.

어쨌거나 양쪽 모두 프레임 하락을 동반하는 건 마찬가지지만 라데온 RX 6000 시리즈는 기대를 충족시켜주지 못했다. 일부 게임에서 지포스 RTX 3070 프레임이 낮게 측정된 건 8GB 메모리 때문이다.

 

■ RDNA 2 Vs 암페어, 아키텍처 승자는?

▲ RDNA2의 RA = Minimal Architecture

AMD가 RDNA 2 아키텍처에서 구현한 하드웨어 레이트레이싱은 반쪽짜리다. RA로 처리하는 교차 테스트만 좀더 나은 결과를 기대할 수 있을 뿐 BVH와 순회 테스트가 본격화 되면 전담 하드웨어로 처리하는 방식 보다 나은 성능을 기대하기 힘들다.

AMD 입장에서는 아키텍처 효율화를 내세우겠지만 소비자가 원했던 방향과는 차이가 있기에 그리 좋은 평가를 받긴 힘들어 보인다. 다이 면적이 부족했다면 인피니티 캐쉬를 좀 줄이던가 처음부터 모든 것을 감안해 새롭게 설계했어야 했다. 어쨌거나 이번 세대에서는 제대로 된 레이트레이싱 성능은 기대하지 않는 것이 좋을 것 같다.

그래도 라데온 RX 6000 시리즈에 미련이 남는다면 AMD가 개발 중이라는 딥러닝 기반 인공지능 업스케일 기능에 기대를 걸어보기 바란다.

아직 자세한 정보가 나온 건 아니지만 엔비디아 DLSS 처럼 딥러닝 기반으로 개발된 AI 업스케일러라고 한다. 결과는 봐야 알겠지만 DLSS 처럼 원본 화질을 뛰어 넘으면서 모든 게임에도 적용된다면 RDNA 2 아키텍처의 반쪽짜리 하드웨어 레이트레이싱을 충분히 보완할 수도 있다.

하지만, 데모 조차 공개하지 못한 걸 보면 언제쯤 기술이 완성되고 제공될지는 미지수다. 학습 기간도 꽤 필요할 텐데 모든 게임에 적용할 수 있는 범용 모델을 개발 한다는게 쉬운 일이 아니니 말이다.

 

■ 라데온 RX 6000 vs 지포스 RTX 3000, 게이머의 선택은?

아키텍처가 아닌 그래픽카드를 선택해야 하는 상황에서 라데온 RX 6000 시리즈와 지포스 RTX 3000 시리즈의 차이는 ì°¸ 애매하다. 레이트레이싱 성능은 지포스 RTX 3000 시리즈가 훨씬 좋은데 메모리는 라데온 RX 6000 시리즈가  6~8GB 더 많고 일반 게이밍 성능도 비등비등하니 말이다.

특히, 지포스 RTX 3000 시리즈 중 8GB 모델 들은 와치독스:리전 처럼 메모리가 부족한 경우도 있어 라데온 RX 6000 시리즈가 더 좋은 선택일 수도 있다.

하지만, 레이트레이싱으로 표현되는 그래픽 품질이 이전 보다 업그레이드 되는 것은 분명해 사용자가 즐기는 게임에 따라 선택을 고민할 수 밖에 없을 듯 하다.

최신 게임이 아닌 오래도록 즐겨온 게임을 계속 플레이 하기 위해 선택한다면야 가격에 따라 라데온 RX 6000 시리즈가 더 좋은 선택일 수 있고 그렇지 않고 최신 게임들을 즐기려 한다면 레이트레이싱에 강한 지포스 RTX 3000 시리즈가 더 현실적인 선택이다.


케이벤치 많이 본 뉴스