세대 교체는 계속 된다. 엔비디아 지포스 RTX 4060 Ti

모든 하드웨어가 그렇지만 세대 교체에는 그에 맞는 명분이 있어야 한다.

해가 바뀌고 시간이 지나서 이름만 바꾼 그런 세대 교체는 정당화 될 수 없고 더 나은 성능을 제공하고 전성비를 개선해야만 진정한 세대 교체라 할 수 있는 것이 그래픽카드 시장이다.

오늘 소개할 그래픽카드도 그런 세대 교체의 흐름을 이어갈 중요한 제품인데 엔비디아 지포스 RTX 40 시리즈의 허리를 담당하게 될 지포스 RTX 4060 Ti가 바로 그 제품이다.

참고로, 지포스 RTX 4060 Ti는 앞으로 등장할 4060 시리즈의 첫 번째 모델이며 이후 4060 Ti 16GB와 4060이 출시를 앞두고 있다.

 

지포스 RTX 4060 Ti, 엔비디아가 설정한 목표는?

그래픽카드의 세대 교체는 새로운 GPU 아키텍처를 설계하는 것 부터 시작한다. GPU 아키텍처의 설계가 마무리 되면 이를 기반으로 생산할 그래픽카드 라인업을 구성하게 되고 각각의 모델에 맞는 세부 사양을 정하게 된다.

그 사양에 맞춰 GPU 구조를 조절하고 칩을 생산하게 되면 사실 상 필요한 작업들은 마무리가 된다.

오늘 소개하는 지포스 RTX 4060 Ti도 이런 단계를 거쳐 세부 사양과 사용할 칩이 결정된 것이다. 그리고 모든 세대가 그러하듯 지포스 RTX 4060 Ti도 이전 세대 보다 더 높을 성능을 제공하면서 상위 모델과는 어느 정도 거리를 둔 사양을 적용하게 됐다.

위 자료는 엔비디아가 준비한 세대 별 스펙 비교 차트다. 보면 알겠지만 기본적인 Shader 연산 성능과 레이 트레이싱 계산에 필요한 RT 코어 성능, Ai 연산에 사용되는 텐서 코어 성능 모두 이전 두 세대 보다 크게 향상된 것을 알 수 있다.

거기다 프레임 생성 기술이 더해진 DLSS3도 지원하고 AV1 인코딩까지 지원하는데다 TGP는 RTX 2060 Super 보다 낮아져 마치 세대 교체의 모범 답안을 보는 듯하다.

하지만, 메모리 서브 시스템의 물리적인 대역폭이 이전 두 세대 보다 크게 낮아지면서 사양 자체에 대한 불만이 나올 수 밖에 없게 됐다. 차트에는 표기되지 않았지만 PCI Express Lane도 x16이 아닌 x8을 사용하면서 이런 지적을 피할 수 없는 상황이다.

이에 대해 엔비디아는 메모리 대역폭과 관련해 다음과 같은 설명을 추가했다.

 

메모리 대역폭, 왜 줄였나?

엔비디아의 에이다 러브레이스 GPU 아키텍처는 이전 세대와 다른 메모리 서브 시스템을 사용한다. 이 구조는 L1과 L2에 이어 VRAM으로 이어지는 단계 자체는 그대로 두지만 L2 캐시 용량을 크게 높여 L2 캐시와 VRAM 사이에 요구되는 물리적인 대역폭을 낮출 수 있게 만든 것이다.

AMD가 L2와 VRAM 사이에 96MB 용량의 인피니티 캐시를 추가해 효과를 본 것처럼 캐시 용량을 키워 물리적인 대역폭 의존도를 낮추려 한 것이 엔비디아의 에이다 러브레이스 GPU 아키텍처다.

실제, 엔비디아가 제시한 자료를 보면 2MB 용량의 L2 캐시를 사용했을때 보다 프레임 당 대역폭이 평균 50~60% 감소했고 성능은 17~34% 향상된 것으로 나타났다. L2 캐시 용량이 8배 커지면서 캐시 히트율을 높아졌고 그로 인해 메모리 버스의 트래픽이 감소했으니 당연한 결과다.

하지만, 이런 변화는 캐시 용량을 벗어난 데이터가 필요한 상황이거나 미스된 데이터를 VRAM에서 가져와야 하는 상황에는 전혀 도움이 되지 않는다. 그래서 소비자 입장에선 기존 세대의 메모리 대역폭이 그대로 제공하길 원했지만 엔비디아는 그런 선택을 하지 않았다.

사실, 이런 선택은 AMD도 마찬가지다. 인피니티 캐시를 처음 도입한 RX 6000 시리즈 부터 메모리 버스를 낮췄고 이번에 나올 RX 7600도 128bit 버스를 사용하는 것으로 알고 있다.

그런 면에서 엔비디아의 선택이 아쉬운 결정인 것은 분명하지만 그렇다고 비난할 정도는 아니라는게 필자의 생각이다.

 

지포스 RTX 4060 Ti 파운더스 에디션

RTX 30 시리즈 이후 국내 시장에는 파운더스 에디션이 판매되지 않고 있다.

MSRP 가격 그대로 판매되는 파운더스 에디션은 품질이나 쿨링 성능 모두 AIC 파트너 제품의 프리미엄 모델과 경쟁하기에 충분하지만 레퍼런스 라는 이미지 때문인지 국내에선 인기가 많지는 않다.

아쉽지만 RTX 40 시리즈 파운더스 에디션도 국내 시장에 공급되기를 기대해 보고 지포스 RTX 4060 Ti 파운더스 에디션은 어떻게 만들어 졌는지 소개해 볼까 한다.

일단, 지포스 RTX 4060 Ti 파운더스 에디션은 RTX 3070 파운더스 에디션과 거의 동일한 크기로 만들어졌다. 두께만 살짝 두꺼운 정도고 길이나 높이는 거의 차이가 없다.

전반적인 디자인 자체는 RTX 40 시리즈의 X자 라인을 그대로 살렸고 팬 구조는 RTX 3070 Ti와 같은 방식을 채택했다. 모두 같은 방향에서 바람을 불어 넣는 RTX 3060 Ti 파운더스 에디션 보다 한 단계 발전한 구조를 채택했다고 보면 된다.

쿨러 내부는 구리 플레이트에 히트파이프를 연결한 구조다. 이전 세대와 큰 차이는 없지만 AIC 파트너의 MSRP 모델 보다는 소재도 좋고 성능도 더 나은 쿨러인 건 사실이다. 다만, 구리 플레이트의 샌딩 처리가 거울 처럼 매끄럽진 못해 좀 아쉬웠다.

PCB는 우측 팬의 위치 때문에 한쪽이 반원 형태로 설계됐다. 어차피 TGP도 높은 제품이 아니라서 이 정도 면적으로도 회로를 구성하는 것이 어렵진 않은데 그래도 문제될 부분은 미리 차단하고자 이전 세대에는 없던 PCB 접지용 SMD 메탈 핑거 가스켓을 두 군데 설치했다. 이 가스켓이 PCB와 히트싱크 사이를 연결하고 전기적 노이즈를 개선하게 된다.

지포스 RTX 4060 Ti에 사용된 AD106 GPU는 다이 면적이 이전 세대 보다 크게 작아졌다. 엔비디아가 정확한 수치를 소개하진 않았지만 위키 등에 등록된 자료로는 절반 이하라고 한다. 실제 사진 상으로도 눈에 띄게 다이 면적이 작아진 것을 볼 수 있다.

메모리는 마이크론이 아닌 SK하이닉스의 GDDR6가 사용됐다. 세부 파트 넘버는 확인하지 않았지만 엔비디아가 공개한 사양대로라면 유효 대역폭이 18Gbps니 DDR 9GHz 모델일 수 밖에 없다. 메모리 용량은 8GB라서 16Gb 칩 4개가 장착됐고 칩당 32비트씩 총 128bit가 메모리 버스로 구성됐다.

전원부는 비교적 고급 부품이 사용됐다. 코일도 RTX 3060 Ti 보다는 한등급 높은 소재가 사용됐다. 캐퍼시터는 이미 대만 APAQ사의 캐퍼시터로 교체된 상황이라 지포스 RTX 4060 Ti도 다른 선택은 없었다. 용량이나 모델도 상위 모델인 4070과 동일했다.

각각의 페이즈 구성에는 최대 50A까지 출력이 허용되는 OnSemi NCP302150 DrMOS가 사용됐다. 메모리 전원부에도 같은 소자가 사용됐다. 전체 페이즈 구성은 RTX 4070의 6+2 보다는 낮아졌는데 4+2나 5+1일 가능성도 없지 않다.

앞서 말했듯이 PCI Express는 x16이 아닌 x8로 구성 됐기 때문에 실제 PCB 회로에도 신호선은 절반만 연결된 상태다.

 

테스트 시스템 간단 소개

지포스 RTX 4060 Ti 성능 테스트에는 AMD 라이젠 7 7700X 프로세서와 ASUS 크로스헤어 X670E 익스트림 메인보드, 지스킬 DDR5 6000MHz 16GB x 2 그리고 커세어 AX1600i PSU를 장착한 시스템에서 진행되었다.

사용된 운영체제는 윈도우11 최신 버전이며 GPU 드라이버도 엔비디아가 제공한 531.93 버전이 사용됐다. RTX 4060 Ti를 제외한 나머지 그래픽카드는 엔비디아가 배포한 가장 최신 버전인 531.79 버전을 사용했다.

 

3DMARK & 1080p 게임 프레임 테스트

 

레이 트레이싱 & 패스 트레이싱 게임 프레임 테스트

DLSS3 & DLSS2 게임 프레임 테스트

소비전력 및 GPU 온도 테스트

 

지포스 RTX 4060 Ti, 매력적인 제품인가?

지포스 RTX 4060 Ti가 진짜 괜찮은 제품인가에 대한 답은 지금까지 정리한 그래프와 이를 종합해서 정리한 위 테이블에 있다.

보면 알겠지만 지포스 RTX 4060 Ti는 RTX 3070에 근접한 성능을 갖췄고 레이 트레이싱이나 패스 트레이싱 같은 조건에선 조금 더 나은 프레임을 기대할 수 있는 그래픽카드다. DLSS가 적용된 게임에선 프레임 생성 기술 덕분에 RTX 3070은 비교 자체가 어려울 만큼 높은 프레임을 재현할 수도 있다.

그러면서도 소비전력은 훨씬 적게 먹으면서 가격은 RTX 3060 Ti와 동일하니 매우 모범적인 세대 교체라 할 수도 있다.

하지만, 지포스 RTX 4060 Ti의 깡성능을 RTX 3060 Ti와 비교하면 그 차이는 겨우 7~10% 내외가 전부다. 같은 가격 기준으로 15% 가까이 성능을 높였던 상위 모델 보다도 개선폭이 낮다. DLSS3라는 무기에 TGP가 낮아졌다는 장점도 있다지만 상위 모델에서 경험했던 그런 희열을 느끼기엔 아쉬운 결과다.

이런 상황에서 메모리 버스에 대한 아쉬움까지 있으니 여러 모로 당분한 시끄러울 수 밖에 없을 텐데 그럼에도 불구하고 그래픽카드 교체나 PC를 새로 구입할 계획이라면 필자는 지포스 RTX 4060 Ti를 추천할 수 밖에 없다.

그 이유는 지포스 RTX 4060 Ti가 지원하는 DLSS3 때문이다.

보다 정확하게는 DLSS3에서 제공하는 프레임 생성 기술이 CPU 리밋에 걸린 조건에서도 프레임 증가를 이끌어 내기 때문인데 지금 당장은 지원 게임이 많지 않겠지만 이미 현실이 된 패스 트레이싱 시대를 대비하기 위해서라도 DLSS3는 선택이 아닌 필수가 되어야 한다.