DXR 지원하게 된 파스칼의 현실, 레이트레이싱은 어떻게 될까?

레이트레이싱에 대한 게이머들의 생각은 부정적인 경향이 강하다.

사실적인 그래픽이나 품질도 좋지만 이를 위해 너무 많은 프레임을 소모(?)하는 건 싫다는 이야기다. 해상도 프레임 드롭 없이 적용할 수 있어야 만 레이트레이싱 기술을 인정하겠다는 반응들도 있다.

하지만 그런 이상적인 레이트레이싱은 불가능에 가까운 것이 현실이다.광선 추적에 특화된 전담 프로세서로도 심각한 프레임 손실이 동반되는 상황에 범용 코어에 올인 하자는 주장은 결코 답이 될 수 없다.

그 한계를 보여준 것이 최근 엔비디아가 공개한 지포스 1000 시리즈용 DXR 지원 드라이버인데 오늘은 전담 프로세서가 없는 레이트레이싱 기법의 현실과 앞으로의 방향에 대해 이야기해 보도록 하겠다.

 

■ 레이트레이싱, 파스칼과 튜링의 차이

음영에 대한 기본적인 표현이면서 가장 중요한 요소라는 점에서 현실 세계를 그대로 투영할 수 있는 레이트레이싱은 지금까지 개발된 그 어떤 그래픽 기법보다 사실적이고 품질이 뛰어날 수 밖에 없다.

문제는 그 많은 광선을 추적하는 것이 결코 쉽지 않기 때문에 이 작업을 보다 효율적으로 처리할 수 있는 알고리즘과 이를 가속화 할 수 있는 전담 프로세서가 있어야만 게임에서 필요한 실시간 처리가 가능하다는 것이다.

고화질 동영상을 CPU나 GPU로 처리하지 않고 이런 것만 처리하게 만든 전담 프로세서(HW 인코더, 디코더)를 사용하는 것도 같은 이치다.

그래서 전담 프로세서를 최초로 내장한 것이 엔비디아 튜링 아키텍처와 지포스 RTX 시리즈다.

▲ 범용 프로세서로 레이트레이싱을 60fps로 처리하려 1324mm2 면적의 몬스터 파스칼이 필요하지만 전담 프로세서를 내장한 튜링은 절반도 훨씬 안 되는 크기로 61fps를 실현할 수 있다.

튜링은 광선 추적을 처리하는 전담 프로세서를 내장한데다 범용 프로세서로 처리하는 일반 작업과 병행할 수 있어 모든 것을 범용 프로세서에 의존하고 순차적으로 처리할 수 밖에 없는 파스칼 아키텍처 보다 작업 시간이 짧을 수 밖에 없다.

파스칼 아키텍처도 레이트레이싱 작업은 처리할 수 있지만 워낙 느릴 수 밖에 없어 레이트레이싱 처리에 필요한 DXR API 지원이 막혀 있었다.

하지만, 크라이엔진 같이 전담 프로세서 없는 구조를 활용한 레이트레이싱 기법들이 발표되면서 기존 하드웨어에 대한 지원 요구가 커져 갔고 생태계 확장을 원하는 엔비디아 입장과 맞아 떨어지면서 지포스 1000 시리즈에 대한 DXR API 지원이 결정 됐다.

GTC 2019를 통해 공식화 된 이 결정으로 11일자로 배포된 지포스 게임 레디 드라이버 425.31을 설치한 지포스 1000 시리즈 사용자들은 RTX 시리즈와 동일한 레이트레이싱 기법을 게임에 활용할 수 있게 됐다. 

 

■ 파스칼 끝판왕도 부담되는 레이트레이싱

지포스 게임 레디 드라이버 425.31만 설치하면 지포스 1000 시리즈도 레이트레이싱 기법을 사용할 수 있다. 하지만, 전담 프로세서 없는 구조적인 한계는 어쩔 수 없어 지포스 RTX 시리즈 보다 프레임이 참담하다.

지포스 RTX 시리즈는 DLSS로 처리하면 30% 내외의 프레임 보상이라도 가능한데 텐서 코어가 없는 파스칼은 오직 쿠다 코어로 처리된 결과를 받아들일 수 밖에 없다.

그 결과는 위에 나온 그대로다.

4K도 아닌 2560x1440에서 Ultra 옵션으론 30프레임 중반도 힘든 것이 지포스 GTX 1080 Ti의 레이트레이싱 프레임이다. 그나마 평균 값이라 이 정도지 프레임 드롭이 심한 구간에 들어가면 사실 상 게임 플레이는 포기할 수 밖에 없다.

지포스 RTX 2080도 레이트레이싱이 없는 것과 비교하면 프레임 드롭이 심한 것은 사실이지만 그럼에도 게임 플레이는 가능한 수준이다. DLSS까지 활용하면 프레임 보상도 가능해 지포스 GTX 1080 Ti로는 꿈도 못 꿀 프레임을 경험할 수 있다. 

 

■ RT코어 빠진 튜링도 답이 없다

지포스 1000 시리즈에는 튜링 아키텍처가 적용된 제품들이 있다. 레이트레이싱을 처리하는 RT코어와 딥러닝을 처리하는 텐서 코어가 빠진 지포스 GTX 1600 시리즈가 그것이다.

이 제품들은 RT코어나 텐서 코어는 없지만 FP연산과 INT 연산을 동시에 처리할 수 있는 SM 구조는 그대로라서 동일한 작업을 처리해도 FP와 INT 연산을 분리해 처리하는 파스칼 보다 작업 시간이 짧을 수 밖에 없다.

레이트레이싱 처리도 마찬가지라서 지포스 GTX 1600 시리즈는 동급 1000 시리즈 보다 좀더 높은 프레임을 재현할 수 있다는 것이 엔비디아 설명이다.

하지만, 이러한 차이도 게임 플레이에 영향을 주진 못했다.

그래프를 보면 알겠지만 FP와 INT 연산을 동시에 처리하는 지포스 GTX 1660 6GB도 레이트레이싱을 활성화 시킨 메트로 엑소더스를 감당하지 못했다.

프레임만 보면 파스칼 기반인 지포스 GTX 1060 GB 보다 조금 낫지만 그 차이는 1fps 내외로 극히 제한적이었다.

전담 프로세서를 탑재한 RTX 2060도 DLSS 도움 없이 60fps는 꿈도 꿀 수 없는 것이 현실이니 어찌보면 당연한 결과인데 엔비디아 주장 만큼 효과적인 결과는 아니어서 아쉬움이 많이 남을 수 밖에 없을 것 같다.

그래도 광선 추적 부하가 상대적으로 덜한 쉐도우 오브 더 툼레이더는 프레임 차이가 큰 편인 걸 보면 레이트레이싱 효과나 부하 수준에 따라 지포스 GTX 1600 시리즈가 제 몫을 하는 경우도 있지 않을까 생각된다.

 

■ 파스칼 끝판 왕, 지포스 GTX 1080 Ti의 현실

범용 프로세서로 레이트레이싱을 처리한 지포스 GTX 1080 Ti의 현실은 처참했다. 4K 60fps도 무리 없던 지포스 GTX 1080 Ti가 2560x1440도 소화할 수 없다니 충격이 클 수 밖에 없다.

하지만 그런 충격 속에서도 레이트레이싱을 포기할 수 없는 게이머는 있는 법, 지포스 GTX 1080 Ti 사용자에게 적합한 셋팅을 찾아봤다.

위 영상은 배틀필드5를 1920x1080 해상도에 품질 옵션을 Ultra에 두고 DXR 옵션을 변경해 가며 플레이 한 것이다.

보면 알겠지만 Ultra에서 30fps 중후반까지 떨어졌던 프레임이 High를 거쳐 Normal로 변경되면서 적게는 50fps 후반, 많게는 90fps 초반까지 상승했다. 품질을 생각하면 High 옵션이 마지노선이지만 프레임이 우선이라면 Normal을 권장하고 싶다.

지포스 GTX 1080 Ti로 1920x1080을 추천한다는 것이 충격적이겠지만 그렇게 라도 레이트레이싱을 경험할 수 있다는 것 자체가 누군가에게는 부러움의 대상이 될 수도 있다.

 

■ 현실로 다가온 레이트레이싱, 앞으로 어떻게 될까?

레이트레이싱에 대한 게이머들의 불만과 달리 생태계는 점차 확대되는 분위기다.

자체 엔진을 사용 중인 메이저 스튜디오들의 적극적인 도입 움직임에 이어 언리얼과 유니티 같은 대표적인 상용 엔진까지 DXR을 기반으로 한 레이트레이싱 지원을 약속함에 따라 더 많은 개발사들이 레이트레이싱 지원에 나설 가능성이 높아졌다.

상반기 중 레이트레이싱 지원 버전이 배포되면 하반기 부터 신규 게임 개발 소식이 전해질 것으로 전망 된다.

하지만 전담 프로세서를 필요로 하는 기술적 한계를 극복하지 않고서는 레이트레이싱의 대중화는 어렵다는 분석도 있다. 그래서 크라이엔진 처럼 범용 프로세서로 처리하는 레이트레이싱 기법 개발도 활발해 질 전망이다.

전담 프로세서가 없는 AMD도 이런 쪽이 무게를 두는 분위기지만 DXR 지원은 가능하다는 입장인 만큼 생태계 확장에 힘을 싣은 엔비디아와 뜻을 달리 하지는 않을 것으로 판단된다.

결국 전담 프로세서를 위한 고급형 레이트레이싱 기법과 범용 프로세서를 위한 저부하 레이트레이싱 기법이 혼재 되면서 한 동안 혼란한 시간을 겪지 않을까 생각되는데 오늘 기사가 그런 혼란에 조금이나마 도움이 되길 기대한다.


케이벤치 많이 본 뉴스