물 들어온다, 노 저어라! 엘더레이크와 인텔 12세대 코어 i9-12900KF의 모든 것

CPU 성능을 높이는 방법은 아주 간단하다.

CPU 코어 내부에 더 많은 계산기를 투입하고 계산기를 실행할 명령을 아주 빠르게 가져오고 그 명령을 더 많이 풀어내면 된다. 그것을 얼마나 규모 있게 실현하느냐에 따라 세대 교체가 되거나 마이너 업그레이드 수준에 그치게 된다.

인텔이 이번에 발표한 12세대 코어 프로세서, 코드명 엘더레이크는 진정한 세대 교체로 평가 될 만큼 많은 변화를 가져 온 것으로 소개 됐다. 개별 코어의 성능 향상과 더불어 빅리틀 구조의 적용으로 멀티 스레드 작업 시 더 나은 성능을 제공하게 됐다는 것이다.

하지만, 인텔의 주장을 그대로 받아들이기엔 검증할 데이터도 부족했고 x86 계열에는 처음 시도된 구조라서 큰 이슈는 되지 못했는데 드디어 엘더레이크의 본 모습을 공개할 날이 됐다.

지금부터 엘더레이크의 모든 것과 그 대표 제품이라 할 수 있는 12세대 코어 프로세서, i9-12900KF의 실제 성능에 대해 이야기해 볼까 한다.

 

10nm로 숨통 트인 인텔, 이번엔 제대로다

누구나 알고 있듯이 인텔의 문제는 언제나 제조 공정였다. 사골에 사골까지 우려버린 14nm에 발이 묶여 11세대 까지도 이 공정을 그대로 쓸 수 밖에 없었다. 모바일 쪽은 이미 10nm 공정으로 넘어갔지만 데스크탑은 필요한 속도가 나오지 않는 다는 루머만 무성할 뿐 11세대가 백포팅 된 정확한 이유도 확인되지 않았다.

어쨌거나 10nm 공정에 대한 우려 속에서 코드명 엘더레이크가 예정대로 신 공정을 사용하게 됨에 따라 인텔은 숨통을 트이게 됐고 사실 상 밀려버린 성능 경쟁에서 다시 한번 우위를 가져갈 수 있는 길을 찾게 됐다.

인텔이 10nm 공정을 엘더레이크에 적용할 수 있게 됐다는 건 상당한 의미를 가진다. 엘더레이크에 적용된 빅코어, 코드명 골든 코브가 14nm 공정에 겨우 집어 넣은 윌로우 코브 보다 모든 면에서 확장된 역대 가장 큰 빅사이즈 코어라서 더더욱 그렇다. 만약 10nm 공정 문제를 해결하지 못했다면 사실 상 엘더레이크는 불가능했다.

이전처럼 14nm에 또 다시 백포팅을 했다면 더 거대해진 다이 사이즈는 둘째 치더라도 발열이나 소비 전력 때문에 코어 개수를 더 줄일 수 밖에 없었을 건데 이렇게 하면 코어 당 IPC는 높아져도 코어 개수와 쓰로틀에 발이 묶에 사실 상 실패나 다름 없게 된다.

그래서 엘더레이크는 10nm가 아니면 실현이 불가능했고 결국 12세대 코어 프로세서를 만들어 내면서 인텔에겐 한 숨 돌릴 약간의 여유가 생기게 됐다.

인텔은 10nm 공정 개선에 성공하면서 이에 대한 네이밍 변경을 발표했다. 10nm 공정을 10nm 공정이라 부르지 않고 개선된 정도를 숫자로 환산해 인텔 7이라고 부른다는 것이다. 이 인텔 7이 엘더레이크에 적용된 10nm 공정이다. 추후 사용된 공정과 그에 대한 특징 네이밍도 모두 발표 됐으며 다음 단계인 인텔 4는 내년 Q2에 양산에 들어갈 계획이다.

 

진짜 빅 코어, P 코어로 만들어진 골든 코브

10nm 공정이 없었으면 실현하지 못했을 만큼 엘더레이크는 역대급 사이즈를 자랑한다.

여기서 말하는 사이즈란 실제 다이 크기를 말하는 것이 아니라 코어 내부의 구성 규모를 말하는데 골든 코브로 명명된 빅 코어는 프론트 엔드 부터 메모리 서브 시스템까지 모든 단계를 확장해 CPU 코어의 계산 능력을 확장시켰다.

핵심적인 부분 몇 가지만 설명하면, 일단 명령을 가져와 내부 코드로 변환하는 작업과 이를 실제 연산 유닛으로 넘기는 단계가 크게 확장됐다. 동시에 처리 가능한 uOP 디코더도 기존 4개에서 6개로 1.5배 확장 됐으며 디코딩 된 uOP을 담아두는 캐쉬가 2.25K에서 4K로 크게 확장됐다. 여기서 더해 uOP캐쉬에서 가져오는 사이클 당 개수도 6개에서 8개로 늘어 났으며 쓰레드 당 할당 가능한 uOP 큐가 72개씩 2배 확장되어 총 144개의 uOP 큐를 한번에 제어할 수 있게 됐다.

분기 예측 유닛은 스마트 코드 프리패치 메카니즘의 도움으로 더 정교해 졌으며 브랜치 타겟 엔트리가 2.5배나 증가한 12K로 확장되어 새롭게 도입된 메카니즘을 뒷받침할 수 있게 됐다.

실제 작업을 배분하고 처리하는 유닛들도 프론트 앤드 단에 걸맞게 확장 설계 됐는데 5개 였던 동시 할당 가능 개수도 프론트 앤드 단의 디코딩 단계에 맞춰 6개로 확장 됐고 실제 실행 유닛을 배치한 포트도 10개에서 12개로 증걸해 더 많은 유닛을 동시에 사용할 수 있게 만들었다.

이 파트의 핵심인 리오더 버퍼도 종전 윌로우 코브 대비 1.5배나 많은 512개의 엔트리로 설계 했는데 한때 인텔의 핵심 프로세서였던 스카이레이크가 224개 였던 것과 비교하면 얼마나 많은 명령을 수용하고 재배치해 최적의 작업 결과를 가져올 수 있을지 짐작할 수 있을 것이다.

실제 명령을 실행하는 유닛들은 앞서 언급한 스케줄러 속 12개의 포트마다 배치되어 있으며 그 중 한개를 5번째 INT 유닛으로 배치 했고 나머지 한 개를 메모리 서브 시스템의 AGU와 Load 유닛으로 추가하여 2개의 512b 로드를 동시에 처리하면서도 3개의 256b 로드를 처리할 수 있도록 확장했다.

이와 함께 더 많은 메모리의 병렬 처리가 가능하게 하기 위해 로드와 저장 버퍼도 확장했으며 데이터 TLB의 경우 1.5배 증가한 96 엔트리가 적용됐다.

L2 캐쉬와 메모리 시스템은 적용되는 시스템에 맞춰 용량을 달리 했는데 L2 캐쉬의 경우 데스크탑 프로세서 같은 클라이언트 시스템에는 지연 시간에 최적화 된 1.25MB 가 적용 됐지만 서버나 데이터 센터의 경우 2MB의 대용량 버전을 적용한다고 한다.

메모리 시스템은 이미 발표된 바와 같이 기존 DDR4 뿐만 아니라 DDR5 메모리도 사용이 가능하도록 개발 됐는데 이는 데이터 처리량이 증가한 프로세서 성능을 완벽하게 보조하기 위한 결정이며 이와 함께 DDR5의 현실적인 부분까지 고려해 DDR4를 병행할 수 있게 한 것이다.

엘더레이크와 완벽한 성능을 제공 받으려면 DDR5와 조합하는 것이 최적이지만 출시 초기에는 DDR5 메모리의 수급 문제나 가격 부분이 안정화 되기 어렵다는 현실적인 문제를 고려할 수 밖에 없기에 합리적인 선택으로 판단된다.

지원 가능한 DDR4와 DDR5의 공식 스펙은 JEDEC 기준 DDR4 3200과 DDR5 4800이다. 물론, 공식 스펙과 오버클럭은 다르며 이번에도 공식 스펙을 벗어난 더 빠른 오버클럭 메모리를 지원한다. 사용자 편의성을 개선한 XMP 프로파일도 DDR5에 맞춰 3.0v으로 업데이트 됐다.

 

IPC는 스카이레이크 이상, 그레이스몬트 E 코어 

E 코어로 명명된 리틀 코어는 코드명 그레이스몬트라는 아톰 계열 CPU 코어가 적용됐다. 이 CPU 코어는 아톰 계열 중에서는 가장 업그레이드 된 버전으로, 빅 코어인 골든 코브와 방향성은 약간 다른 코어다.

이러한 변화는 2019년 공개된 트레몬트 마이크로아키텍처에 처음 도입 됐고 이것을 업그레이드 한 것이 엘더레이크에 적용된 그레이스몬트다.

그레이스몬트가 기존 x86 프로세와 다른 점은 프론트 앤드 단이 듀얼로 구성됐다는 점이다. 명령을 가져와서 uOP로 변환하고 스케줄러로 보내는 단계와 유닛이 개별로 구성 됐고 이것을 통합해 실행 유닛에서 처리하는 방식이다.

이런 방식을 도입한 이유는 연산 성능과 전력 효율의 극대화를 이뤄내기 위한 것으로, 오직 효율 극대화에 초점을 맞춘 탓에 빅 코어 만큼 고성능을 보장할 순 없지만 전력이나 투입되는 트랜지스터 카운트 대비 효율을 최고 수준이라는 것이 인텔의 설명이다.

구체적인 자료는 없지만 인텔 측 주장으로는 코어 프로세서의 대표적인 마이크로아키텍처인 스카이레이크 보다 IPC가 더 높다고도 한다. 물론, 저전력 프로세서로 투입하기 위해 만든 탓에 최종 성능은 스카이레이크 보다 좋을 순 없겠지만 순수 IPC 만큼은 그 이상이라는 주장이 틀리진 않을 것으로 생각된다.

내부 구조를 봐도 최대 6개의 디코더를 사용하는 것이나 마찬가지고 그에 준하는 큐와 캐쉬 앤트리를 가졌고 스케줄러 내부의 ROB 사이즈만 하더라도 스카이레이크의 224개 보다 많은 256개가 적용 됐으니 말이다.

 

지겨웠던 쓰로틀, 이제 벗어나자

CPU의 TDP는 현실을 대변하지 않는다. TDP로 표기된 소비전력은 베이스 클럭으로 동작할때나 가능한 것일 뿐 거의 모든 작업에서 터보 부스트가 작동하기에 실제 소비전력은 TDP를 한참 벗어날 수 밖에 없는 것이 지금의 CPU 들이다.

특히, 인텔은 14nm라는 한계 속에서 성능을 높이려다 보니 TDP 이상으로 속도를 높일 수 밖에 없었고 이를 터보 부스트라는 이름에 걸맞게 셋팅하려다 보니 부스팅 된 속도를 일정 시간으로 제한 하거나 전력 기준에 맞춰 제한하는 형식을 써 왔다.

TDP가 원래 소비전력이고 터보 부스트는 말 그대로 잠시만 사용할 수 있는 부스트 개념이라는 의미다. 하지만, 이러한 제한을 사용자들이 풀 수 있고 그렇게 TDP를 넘어선 소비전력과 발열을 감당하며 최고의 성능을 추구하는 소비자들이 늘어남에 따라 인텔도 변화를 받아들이기로 했다.

어차피 TDP에 맞춰 최상의 성능을 제공하는 것은 현실적으로 불가능하니 TDP를 넘어선 소비전력을 공식화 하고 이에 맞춰 성능 제약을 없애겠다는 것이다.

물론, 모든 프로세서가 이에 해당 되는 것은 아니고 오버클럭이 허용되는 K나 KF 모델 들만 이러한 선택이 가능한데 어차피 메인보드 자체에서 이런 제약을 쉽게 풀수 있어 실질적인 변화는 거의 없으나 굳이 그런 셋팅 없이 각종 쓰로틀에서 벗어날 수 있어 이런 기능에 익숙치 않은 초보자들에게는 환영 받을 만한 선택이다.

각각의 프로세서마다 정해진 PL2 셋팅이 따로 있어 완벽하게 제한이 해제 된 것은 아니지만 장시간 100% 로드율을 필요로 하는 작업이 아닌 이상 사실 상 쓰로틀 해제나 다름 없는 결과를 제공 받을 수 있다.

참고로, 엘더레이크의 TDP는 모든 K 모델이 125W로 셋팅 됐지만 최대 터보 전력은 12900K와 12900KF가 241W, 12700K와 12700KF가 190W, 12600K와 12600KF가 150W로 셋팅 됐다. 각 모델 별 최고 클럭은 유지시간도 정해져 있지만 파워 리밋을 제외하면 사실 상 쓰로틀은 없다고 봐도 무방하다.

 

빅리틀 구조의 핵심, 스레드 디렉터로 해결되나?

P 코어와 E 코어로 구분된 구조는 각각의 코어에 적합한 작업을 얼마나 잘 배치할 수 있는가가 핵심이다. E 코어를 추가한 것이 P 코어에 할당된 캐주얼 작업을 분산시켜 P 코어를 활용하는 작업 속도를 개선하기 위한 것이기에 이런 작업들을 얼마나 잘 효과적으로 배당하느냐가 핵심일 수 밖에 없는 것이다.

인텔은 이런 작업을 기존 방식대로 OS의 스케줄러에만 의존하면 제대로된 결과를 도출할 수 없다는 판단에 따라 OS 단에서 스케줄러가 최적의 작업 배치를 할 수 있게 만들기 위해 스레드 디렉터라는 인텔리전스 기능을 각각의 코어에 내장했다.

이 기능은 코어의 다양한 상태 정보를 OS 스케줄러에 전달하고 작업의 배치와 재배치 결정에 도움이 되게 만드는 것인데 자체적으로 수집된 수백만 시간의 데이터를 기반으로 사전 트레이닝된 알고리즘을 적용, 주어진 워크로드에 맞는 IPC를 식별하고 이를 클래스로 구분해 정보를 전달한다.

클래스는 크게 4가지로, E 코어는 병목 현상이 없는 컴퓨팅 연산 등이 우선 배당되고 AVX/AVX2와 AVX-VNNI를 사용하는 워크 로드는 클래스1과 클래스2로 구분되어 P 코어에 배치된다. 이외 모든 작업도 P 코어를 우선하지만 OS가 모든 클래스의 워크로드를 코어에 강제할 수 있다.

모든 작업은 P 코어와 E 코어 모두에 할당할 수도 있으며 CPU의 모든 성능을 필요로 하는 멀티 스레드 작업의 경우 이런 형태로 처리하게 된다.

그리고 이러한 작업은 모두 윈도우11에서만 최적의 결과를 가져올 수 있게 만들어 졌으며 이는 인텔과 마이크로소프트의 협업에 따른 것이다. 향후 윈도우10에 대한 결과도 비교가 되겠지만 스레드 디렉터의 정보를 활용할 수 없는 윈도우10으로는 최적화든 성능을 경험하기 어려울 수도 있다.

 

12세대 코어 i9-12900KF, 얼마나 빨라졌나?

엘더레이크로 만들어진 12세대 코어 프로세서는 로켓레이크 보다 장점이 많다. P 코어로 명명된 빅 코어 자체도 IPC가 높을 수 밖에 없는데다 터보 부스트라는 틀에 가둬버린 쓰로틀에서도 자유로울 수 있으니 말이다.

그래서 양쪽 모두 기본 설정만 사용하면 엘더레이크인 12세대 코어 프로세서가 성능 상 유리할 수 밖에 없다. 하지만, 인텔이 소개한 엘더레이크의 본 모습은 터보 부스트와 쓰로틀로 가둬버린 한계를 벗어난 그 이상의 것이기에 일단은 기본 설정 상태로 양쪽 세대의 성능을 확인해 보기로 했다.

테스트는 12세대 코어 프로세서의 대표 모델인 코어 i9-12900KF와 11세대 최상위 프로세서인 코어 i9-11900KF를 사용했으며 각각의 플래폼에 맞는 메인보드와 메모리를 사용했다.

코어 i9-12900KF에 사용한 메인보드와 메모리만 잠깐 소개하면 ASUS를 대표하는 ROG 라인업 중 최상급 모델인 ROG 막시무스 Z690 포물라가 사용 됐으며 메모리는 SK하이닉스의 DDR5 4800 16GB 메모리가 듀얼 채널로 구성됐다. 그래픽카드는 엔비디아의 지포스 RTX 3080 Ti FE다.

엘더레이크와 로켓레이크의 성능 차이는 이 테이블만 봐도 쉽게 정리가 가능하다.

위 결과는 작업 분야별 성능을 검증하고 그 차이를 높은 신뢰도 수준으로 보여주는 산드라 벤치마크 최신 버전과 100% 워크로드 상황이 아닌 실제 작업 환경을 시물레이션 해 그 차이를 보여주는 PCMARK10을 테스트 한 것이다.

보면 알겠지만 CPU의 모든 성능을 이끌어 내는 산드라 벤치마크에선 엘더레이크인 12세대 코어 i9-12900KF가 최소 1.3배 많게는 2배 이상 성능이 높은 것으로 측정 됐는데 양쪽의 동작 속도에 100Mhz 정도의 차이가 있긴 하지만 이 결과는 그것만으로는 설명할 수 없는 엄청난 차이다.

엘더레이크에 적용된 골든 코브의 구조 확장에다 스카이레이크 수준의 IPC로 무장한 그레이스몬트가 더해진 최적의 결과이며 그 차이가 가장 잘 반영된 것으로 판단된다.

다만, 풀로드 상황이 아닌 PCMARK10의 경우 산드라 벤치마크 만큼의 드라마틱한 점수 차이는 발견되지 않아 약간 실망할 수도 있을텐데 앱 스타트 같은 사용자들이 민감한 부분에서는 상당한 차이가 있어 체감 성능 차이도 상당한 것으로 판단된다.

이번에는 좀더 현실적인 작업 결과다.

CPU 성능 검증에 주로 사용되는 3D 랜더링과 동영상 컨버팅, 파일 압축 결과인데 보디사 시피 12세대 코어 i9-12900KF가 거의 모든 작업에서 압도적으로 빨랐다. 블랜더의 작업 시간이나 시네벤치 점수 모두 역대급이라 할 만큼 12세대 코어 i9-12900KF가 압도적으로 빨랐으며 동영상 컨버팅 작업도 마찬가지였다.

7Zip을 이용한 파일 압축 해제 테스트는 스토리지와 I/O 성능에 영향을 받는 실제 작업 결과는 아니지만 순수 계산 성능 만큼은 확실히 12세대 코어 i9-12900KF에 비할바가 아니었다.

3DMARK와 실제 게임 내 FPS 결과다.

이번에도 결과 차이는 크지 않은데 3DMARK의 경우 CPU로 처리되는 작업에서 그 차이가 거의 1.9배에 달한 경우도 있었으며 DX12 기반인 타임스파이의 CPU 점수도 1.5배나 높아 12세대 코어 i9-12900KF의 연산 능력이 특정 작업에 한정된 것이 아님을 또 한번 입증했다.

GPU 스코어에 큰 차이가 없는 것은 그래픽카드 성능을 이미 다 뽑아 썼기 때문으로, 이건 어떤 시스템을 적용하던 마찬가지라서 CPU 성능 차이를 판단하는데 큰 의미는 없다.

그러나 1920x1080 해상도에서 테스트 된 게임 내 프레임들은 CPU 성능에 영향이 크기에 연산 능력이 압도적으로 높은 12세대 코어 i9-12900KF가 훨씬 높게 측정 됐고 그 차이가 최대 1.45배에 달했다.

메트로 엑소더스 같이 프레임 차이가 거의 없는 경우는 특별한 경우인데 그 이유는 글을 이어가며 설명하겠다.

앞서 언급했듯이 12세대 코어 i9-12900KF는 사실 상 쓰로틀이 걸리지 않게 만들어졌다. PL1과 PL2 같은 전력 제한 기준도 살아 있고 온도에 따라 쓰로틀이 작동되는 건 마찬가지지만 PL1과 PL2를 PL2 기준으로 맞춰 버렸기에 사실 상 쓰로틀 관련 락이 언락된 거나 마찬가지다.

그래서 11세대 코어 i9-11900KF도 이런 제한을 풀어버리면 12세대 코어 i9-12900KF와의 성능 격차를 어느 정도 따라 잡을 수 있을지도 모른다는 생각이 있을텐데 보면 알겠지만 답이 없다.

12세대 코어 i9-12900KF는 11900KF의 PL2 제한을 해제해 봤자 절대 따라 잡을 수 없는 경지에 올라섰고 그 차이는 진짜 어마어마하다.

 

다중 작업에서 빛난 12세대 코어 i9-12900KF

인텔이 P 코어와 E 코어로 구성된 하이브리드 구조를 채택한 이유는 더 나은 성능과 전력 효율 때문이다. 모든 코어를 P 코어로 구성하는 것이 성능에는 도움이 될지 모르지만 E 코어로 작업을 분산해 P 코어로 원하는 작업에 더 집중하면 훨씬 나은 결과를 도출해 낼 수 있다는 것이 인텔측 주장이다.

그래서 이러한 주장이 현실에서도 도움이 되는지 알아보기 위해 일반적인 게이머가 경험할 수 있는 환경을 설정하고 그런 환경하에서 어떤 결과가 나타나는지 확인해 봤다.

위 결과는 게임을 플레이하며 유투브 영상을 시청하면서 웹 서핑이나 쇼핑 창을 그대로 띄워 두고 음악을 듣고 그 상태로 워드나 엑셀 작업을 했을 경우를 가정한 것이다.

PCMARK10으로 측정되기 전까지 모든 결과는 게임에 우선을 둔 것이며 얼마나 높은 프레임을 보여주느냐를 비교하였다. 마지막인 PCMARK10 결과는 앞서 실행한 작업은 그대로 두고 잠시 워드나 엑셀로 작업 했을때 단독으로 작업한 결과 보다 성능 하락이 얼마나 최소화 됐는가를 비교한 것이다.

결과는 테이블에 나온 그대로다. 모든 단계에서 12세대 코어 i9-12900KF의 게임 내 Fps가 훨씬 높았으며 마지막 PCMARK10 결과도 12세대 코어 i9-12900KF의 점수 하락율이 가장 적었다.

12세대 코어 i9-12900KF는 사실 상 단독으로 실행한 결과나 마찬가지일 만큼 점수하락이 적었는데 확실히 E 코어가 다중 작업 환경에 도움이 되는 건 분명해 보인다.

다만, 각각의 단계 별 게임내 Fps가 상대적으로 높았을 뿐 하락율 그 자체는 큰 차이가 없어 다중 작업 시 프레임 방어는 12세대 코어 i9-12900KF도 어쩔 수 없어 보인다.

사실, 이 부분은 스레드 할당만 제대로 됐어도 지금 결과 보다 훨씬 나았을 것이다. 아니면 사용자가 특정 앱이나 작업을 지정할 수 있게 만들어 주고 그 조건이 발생할 경우 P 코어를 모두 우선 할당하게 만들어 주는 식으로 말이다.

 

실제 성능에서 E 코어가 차지하는 비중은?

그레이스몬트의 IPC가 스카이레이크 급이라는 설명을 그대로 믿을 사람은 많지 않다. 아무리 아톰 프로세서가 좋아져도 빅 코어인 스카이레이크와 동급이라는 설명을 아무런 근거 없이 믿는 것은 쉽지 않은 일이다.

그래서 E 코어인 그레이스몬트가 엘더레이크의 전체 성능에서 얼마나 기여를 하는지 확인해 보기 위해 E 코어를 모두 꺼버렸다. P 코어는 그대로 두고 테스트를 반복해 E 코어가 빠진 상태의 결과와 E 코어까지 더한 상태의 결과를 비교한 것이다.

원래 계획은 순수 E 코어만 성능을 확인하려 했지만 이런 하이브리드 구조는 P 코어가 살아 있어야 하는 것이 일반적이고 엘더레이크도 P 코어를 완전히 끌 수는 없어 E 코어가 빠진 상태의 결과 값을 비교해 보기로 했다.

결과는 보이는 그대로다. CPU의 계산 성능을 정확히 측정하는 산드라 벤치마크를 보면 E 코어가 꺼진 12세대 코어 i9-12900KF는 모든 코어가 켜진 상태 보다 점수가 20~30% 하락했다. E 코어가 작동하지 않는 특정 분야만 제외하면 사실 상 엘더레이크 성능의 25% 이상은 E 코어에 좌우 된다고 봐도 무방하다.

그리고 이번 테스트를 통해 확인된 것이 또 하나 있다.

1920x1080 해상도에서 테스트 한 게임 내 Fps가 E 코어를 끈 상태에서 더 높았다는 것이다. 이는 인텔이 주장한 스레드 디렉터의 필요성과 최적화 된 OS 스케줄러의 조합에 정면으로 배치되는 것으로, 인텔 주장이 사실이라면 P 코어만 켜둔 상태가 12세대 코어 i9-12900KF의 기본 결과였어야 한다.

이번 결과처럼 E 코어는 끄고 P 코어만 켜둔 상태에서 더 많은 Fps가 기록된다는 것은 스케줄링에 문제가 있다는 의미로 받아들일 수 밖에 없고 이에 대한 개선을 요구할 수 밖에 없는 상황이다.

 

바이오스 업데이트는 성능 개선? 추후 더 개선될지도..

필자는 E 코어를 끈 상태에서 더 나은 결과가 나타나는 조건을 특정해 봤다. 보면 알겠지만 거의 다 로드가 크지 않은 작업들이다.

이 작업들은 CPU 자원을 100% 활용하지 않지만 그래도 P 코어에 할당되야 더 나은 결과를 얻을 수 있다. 인텔도 이점을 모르지 않을 텐데 어쨌거나 결과는 예상 밖이었다.

그래서 스레드 디렉터의 클래스 할당 알고리즘이 개선 됐을수도 있다는 판단에 따라 가장 최신 버전의 메인보드 바이오스를 제공 받고 이를 적용한 결과를 비교해 봤다.

보면 알겠지만 최신 버전의 바이오스는 풀로드 작업이 아닌 조건에서도 기존 데이터 보다 나은 결과들을 보여줬다. PCMARK10의 경우 P 코어만 사용한 결과를 뛰어 넘어 상당히 인상적인 결과를 보여줬다.

그러나, 게이머들에게 중요한 Fps는 P 코어 단독 사용과의 차이를 완벽하게 좁히지는 못해 이에 대한 추가적인 바이오스나 마이크로소프트의 기능 개선 업데이트가 이뤄져야 할 것으로 판단된다.

 

12세대 코어 프로세서, 물 들어왔으니 노 젓자!

완전 물건이다. 지금까지 경험했던 그 어떤 CPU와 비교가 불가 할 만큼 역대급 세대 교체고 CPU에서 이런 전율을 느껴보긴 처음이다. 한때 통수라고 욕 먹었던 엔비디아 그래픽카드가 생각 날 만큼 이번 엘더레이크의 성능은 진짜 최고라고 생각한다.

일부 로드가 적은 작업에선 스레드 디렉터가 제대로 작동하는지가 의심스럽지만 그런 결과도 이전 세대를 충분히 압도할 정도니 진짜 오랫만에 강력히 추천하고 싶은 CPU의 등장이다. 그 동안 AMD에 빼앗겨 왔던 점유율도 어렵지 않게 회복하리라 생각되는데 진짜 제 정신 차린 인텔에게 박수를 보내고 싶다.

다만, 요즘 같이 시장 수요를 감당하기 어려운 상황에서 12세대 코어 프로세서가 제대로 공급될지 의문이다. 특히, 이번에 발표된 모델 중 12세대 코어 i9-12900K나 KF의 수요가 상당할 듯 한데 실제 구매할 사람들은 가급적이면 초기 물량을 노리는 것이 좋을 것 같다.

'물 들어올 때 노 저어라' 라는 말을 알고 있다면 그런 일은 없겠지만 말이다.


케이벤치 많이 본 뉴스