GTX480 비교. NVIDIA GTX480 검토 및 테스트. 테스트 구성, 도구 및 테스트 방법론

엔비디아 지포스 GTX 480:

비디오 카드 설명 및 합성 테스트 결과

카드에는 추가 전원과 두 개의 커넥터가 필요하며 그 중 하나는 8핀이고 다른 하나는 6핀입니다. 후자에 문제가 없다면 모든 최신 전원 공급 장치에는 이미 이러한 "꼬리"가 있으므로 8핀 커넥터를 통한 전원 공급 장치의 경우 직렬 비디오 카드와 함께 제공되는 특수 어댑터가 필요합니다.

올해 넷째 주, 즉 1월 말에 칩이 도착했습니다.

냉각 시스템에 대해.

엔비디아 지포스 GTX 480 1536MB PCI-E

기본적으로 쿨러는 GTX 제품군의 이전 솔루션과 다르지 않습니다. 원통형 팬이 라디에이터를 통해 공기를 구동하고 시스템 장치 외부의 열을 제거합니다. 하지만 신제품의 과도한 전력 소모로 인한 발열로 인해 CO는 히트파이프를 활용해 방열성을 높이는 측면에서 개선됐다. 보시다시피 튜브가 있는 중앙 라디에이터는 코어만 냉각합니다. 메모리 칩은 케이스 아래에 있는 판에 의해 냉각됩니다.

아마도 이 유형의 CO를 검색할 수 있는 가능성은 이미 소진되어 소음 없이 매우 뜨거운 코어에 대처할 수 있습니다. 따라서 CO가 시끄러운 것으로 판명되었다고 말해야합니다. 2D 모드에서도 쿨러는 최대치의 44%로 작동합니다. 이전에는 이 수치가 약 20~25% 정도였습니다. 50% 이후부터 소음이 발생합니다. 따라서 쿨러는 소음 직전에 작동하며 이는 유휴 시간입니다! CO가 터빈의 회전 속도를 점진적으로 증가시키기 시작하여 카드가 3차원 모드에서 작동할 때 평균 70-80%에 도달할 때 부하에 대해 무엇을 말할 수 있습니까?

우리는 EVGA Precision 유틸리티(저자 A. Nikolaychuk AKA Unwinder)를 사용하여 온도 연구를 수행했으며 다음과 같은 결과를 얻었습니다.

엔비디아 지포스 GTX 480 1536MB PCI-E

그리고 코어의 가열이 95도에 도달하고 CO의 매우 시끄러운 작동 비용으로 이러한 높은 수치가 달성되기 때문에 이는 놀라운 일이 아닙니다. 따라서 가장 발전되고 빠른 3차원 게임 그래픽을 좋아하는 사람들은 게임을 실행하거나 테스트할 때 침묵이 무엇인지 잊어야 합니다. 2D에서도 카드에 온갖 종류의 복잡한 콘텐츠(예: 플래시나 비디오)가 로드되면 쿨러 소리가 이미 꽤 들립니다.

장비.

본 제품은 참고용 제품이므로 키트나 포장은 없습니다.

이제 테스트로 넘어 갑시다. 먼저 테스트벤치 구성을 보여드리겠습니다.

설치 및 드라이버

테스트 벤치 구성:

  • 컴퓨터 기반 인텔 코어 I7 CPU 920(소켓 1366 LGA)
    • 프로세서 Intel Core I7 CPU 920(2667MHz);
    • Intel X58 칩셋 기반 Asus P6T Deluxe 마더보드;
    • RAM 3GB DDR3 SDRAM Corsair 1066MHz;
    • 하드 드라이브 WD Caviar SE WD1600JD 160GB SATA;
    • 전원 공급 장치 Tagan TG900-BZ 900W.
  • 운영 체제 Windows 7 32비트; 다이렉트X 11;
  • Dell 3007WFP 모니터(30");
  • ATI 드라이버 버전 CATALYST 10.3; 엔비디아 버전 197.17.

VSync가 비활성화되었습니다.

합성 테스트

우리가 사용하는 합성 테스트 패키지는 여기에서 다운로드할 수 있습니다.

  • D3D RightMark 베타 4(1050)웹사이트 http://3d.rightmark.org에 대한 설명과 함께.
  • D3D RightMark 픽셀 셰이딩 2 및 D3D RightMark 픽셀 셰이딩 3픽셀 셰이더 버전 2.0 및 3.0 링크 테스트.
  • 라이트마크3D 2.0간단한 설명 포함: , .

자체적인 합성 DirectX 11 테스트가 없기 때문에 다양한 SDK 패키지와 데모 프로그램의 예제를 사용해야 했습니다. 먼저 DirectX SDK(2010년 2월)의 HDRToneMappingCS11.exe 및 NBodyGravityCS11.exe가 있습니다.

우리는 또한 두 제조업체인 Nvidia와 AMD의 두 가지 예를 취하여 어느 누구도 편견에 대한 주장을 하지 않도록 했습니다. DetailTesselation11.exe 및 PNTriangles11.exe 예제는 ATI Radeon SDK에서 가져왔습니다(DX SDK에도 있습니다). Nvidia는 두 가지 데모 프로그램, 즉 사실적인 캐릭터 머리카락과 사실적인 물 지형을 선보였습니다. 이 프로그램은 곧 회사 웹사이트에서 다운로드할 수 있게 될 것입니다.

다음 비디오 카드에서 합성 테스트가 수행되었습니다.

  • 지포스 GTX 480 GTX480)
  • 지포스 GTX 295표준 매개변수 사용(추가 GTX 295)
  • 지포스 GTX 285표준 매개변수 사용(추가 GTX 285)
  • 라데온 HD 5970표준 매개변수 사용(추가 HD 5970)
  • 라데온 HD 5870표준 매개변수 사용(추가 HD 5870)

새로운 Geforce GTX 480 모델의 결과를 비교하기 위해 이러한 특정 비디오 카드는 다음과 같은 이유로 선택되었습니다. Radeon HD 5870 및 HD 5970은 경쟁사인 AMD의 가장 생산적인 단일 칩 및 듀얼 칩 모델이며 가격이 가장 가깝습니다. GTX480으로. Nvidia의 솔루션을 사용하면 모든 것이 훨씬 더 간단해집니다. Geforce GTX 285는 아키텍처 변경 사항을 판단하는 마지막 세대 GPU의 가장 강력한 단일 칩 카드이며, GTX 295는 Nvidia에서 2018년까지 가장 강력한 듀얼 칩 카드입니다. 새로운 솔루션 출시.

Direct3D 9: 픽셀 채우기 테스트

이 테스트에서는 한 픽셀에 적용되는 다양한 텍스처 수에 대해 FFP 모드에서 최대 텍스처 샘플링 성능(텍셀 속도)을 결정합니다.

우리의 테스트는 약간 구식이며 그 안에 있는 비디오 카드는 이론적으로 가능한 값에 도달하지 않지만 여전히 비디오 카드의 최대 텍스처링 속도를 서로 상대적으로 정확하게 보여줍니다. 평소와 같이 합성 결과는 최고 값에 도달하지 못했습니다. 이 테스트에서 GTX 480은 이중선형 필터링을 사용하여 32비트 텍스처에서 클록 주기당 최대 40텍셀을 선택하는 것으로 나타났습니다. 이는 GTX 480보다 1.5배 낮은 수치입니다. 이론적 수치는 필터링된 텍셀 60개입니다.

이는 텍스처 데이터를 5~7% 더 빠르게 선택하는 최소한 GTX 285에 도달하기에는 충분하지 않습니다. DX9 합성으로 판단하면 거의 모든 모드에서 성능이 1.5배 이상 향상된 경쟁 HD 5870을 따라잡는 것은 말할 것도 없습니다. 듀얼 칩 Nvidia 카드는 분명히 소프트웨어 문제의 희생양이 되었지만 HD 5970은 HD 5870보다 훨씬 강력합니다.

GTX 480과 GTX 285의 차이점은 대역폭 제한이 더 큰 영향을 미치는 텍스처 수가 적은 경우를 제외하면 거의 항상 동일합니다. 그리고 HD 5870은 이 테스트에서 그다지 앞서지 않습니다. 그러나 4-8개의 텍스처를 사용하면 차이가 더 커집니다. 이는 레거시 게임 응용 프로그램에서 항상 경쟁사보다 앞서기 위해 GF100의 텍스처링 속도가 부족하다는 것을 암시합니다. 유효노출률 테스트에서 동일한 결과를 살펴보겠습니다.

두 번째 합성 테스트는 채우기 속도를 보여 주며 동일한 상황을 볼 수 있지만 프레임 버퍼에 기록된 픽셀 수를 고려합니다. TMU 수가 더 많고 합성 테스트에서 높은 효율성을 달성하는 데 더 효율적인 AMD 솔루션을 사용하면 최대 결과가 유지됩니다. 0-3 오버레이 텍스처의 경우 솔루션 간의 차이가 훨씬 작습니다. 이러한 모드에서는 우선 대역폭에 따라 성능이 제한됩니다.

Direct3D 9: 픽셀 셰이더 테스트

우리가 고려하고 있는 첫 번째 픽셀 셰이더 그룹은 최신 비디오 칩에 대해 매우 간단하며, 여기에는 기존 게임에서 볼 수 있는 1.1, 1.4 및 2.0과 같이 상대적으로 복잡도가 낮은 다양한 버전의 픽셀 프로그램이 포함되어 있습니다.

테스트는 최신 아키텍처에 대해 매우 간단하며 최신 GPU의 모든 기능을 보여주지는 않지만, 특히 이번에 Nvidia에서 발생한 아키텍처를 변경할 때 텍스처 샘플과 수학적 계산 간의 균형을 평가하는 데는 흥미로울 것입니다.

이 테스트에서 성능은 주로 텍스처 모듈의 속도에 의해 제한되지만 실제 작업에서 블록의 효율성과 텍스처 데이터 캐싱을 고려합니다. GT200과 비교하여 아키텍처의 변화가 우리에게 어떤 영향을 미쳤는지 살펴보겠습니다. 아키텍처가 변경되었음을 명확하게 알 수 있으며 새로운 GTX 카드 480은 이전 아키텍처를 기반으로 한 단일 칩 카드보다 성능이 뛰어납니다. 게다가 대부분의 테스트에서 GTX 480은 듀얼 칩 GTX 295를 따라잡았는데, 그 자체로는 나쁘지 않습니다.

이 테스트에서 메모리 대역폭은 새로운 솔루션을 약간만 제한하며 속도는 텍스처링에 따라 달라집니다. 이로 인해 AMD의 듀얼 칩 솔루션은 물론이고 Radeon HD 5870 수준에서도 GF100 기반 카드의 성능이 저하됩니다. Nvidia 칩 기반 비디오 카드는 이 테스트 세트에서 확실히 뒤처져 있습니다. 이는 텍스처링 속도가 중요한 다른 테스트에 대한 경각심을 불러일으키는 것입니다. 좀 더 복잡한 중간 픽셀 프로그램의 결과를 살펴보겠습니다.

픽셀 셰이더 버전 2.a 테스트에서 경쟁사의 속도와 비교할 때 모든 것이 훨씬 더 나빴습니다. 텍스처링 속도에 따라 달라지는 절차적 물 렌더링 테스트 "Water"는 고도로 중첩된 텍스처의 종속 샘플링을 사용하며 맵은 항상 텍스처링 속도에 따라 순위가 지정되지만 다양한 TMU 효율성에 맞게 조정됩니다.

RV870 칩 기반 카드는 최대의 결과를 보여주지만 GTX 480의 속도는 이전 아키텍처의 GPU에서 단일 칩과 듀얼 칩 모델 사이 어딘가에 있었습니다. 물론 조금 약하긴 하지만 적어도 GTX 285보다는 빠르며, 이는 사용 가능한 TMU를 더욱 효율적으로 활용한다는 것을 의미합니다.

두 번째 테스트의 결과는 거의 동일하지만 계산 집약적이며 항상 더 많은 계산 단위가 있는 AMD 아키텍처에 더 적합했습니다. 최신 AMD 솔루션, 특히 듀얼 칩 버전이 훨씬 앞서 있습니다.

GTX 480은 GTX 285보다 성능이 25%만 뛰어나고 듀얼 칩 모델보다 성능이 거의 같은 수준으로 뒤떨어집니다. 이는 차세대 아키텍처에 비해 TMU 수가 적기 때문에 GTX 480의 성능 한계를 분명히 나타냅니다. 우리의 우려는 GF100 아키텍처의 주요 단점으로 확인되었습니다.

Direct3D 9: 픽셀 셰이더는 Pixel Shaders 2.0을 테스트합니다.

이러한 DirectX 9 픽셀 셰이더 테스트는 이전 테스트보다 더 복잡하며 현재 다중 플랫폼 게임에서 볼 수 있는 것과 유사하며 두 가지 범주로 나뉩니다. 더 간단한 버전 2.0 셰이더부터 시작해 보겠습니다.

  • 시차 매핑기사에 자세히 설명되어 있는 대부분의 현대 게임에 익숙한 텍스처 매핑 방법입니다.
  • 냉동 유리제어된 매개변수를 사용하는 복잡한 절차적 동결 유리 텍스처.

이러한 셰이더에는 두 가지 변형이 있습니다. 수학적 계산에 초점을 맞춘 것과 텍스처에서 값을 샘플링하는 것을 선호하는 것입니다. 미래 애플리케이션의 관점에서 더욱 유망한 수학적으로 집약적인 옵션을 고려해 보겠습니다.

이는 ALU 장치의 속도와 텍스처링 속도에 따라 달라지는 범용 테스트로, 칩의 전체적인 균형이 중요합니다. "Frozen Glass" 테스트에서 비디오 카드의 성능은 수학뿐만 아니라 텍스처 샘플 속도에 의해서도 제한된다는 것을 알 수 있습니다. 그 안의 상황은 "Cook-Torrance"에서 조금 더 높게 보았던 것과 유사하지만, 이번에 새로운 GTX 480은 이전 Nvidia 아키텍처의 GPU를 기반으로 한 듀얼 칩 GTX 295에 훨씬 더 가깝습니다. 반면 단일 칩 HD 5870조차도 여전히 앞서 있습니다.

두 번째 테스트 "시차 매핑"에서 결과는 다시 이전 결과와 매우 유사합니다. 그러나 이번에는 HD 5870이 첫 번째 테스트에서처럼 Nvidia 카드보다 크게 앞서지 못했습니다. 다음에 무슨 일이 일어나는지 지켜보겠지만, 게임은 일반적으로 합성 게임보다 더 다면적이며 텍스처링에만 크게 의존하지 않습니다. 그러나 여전히 이러한 오래된 작업을 수행하기에는 GF100의 텍스처 모듈 수가 확실히 부족합니다. 중간 결론을 완전히 확신하기 위해 수학적 계산보다 텍스처 샘플을 선호하도록 수정된 동일한 테스트를 고려해 보겠습니다.

그림은 다소 비슷하지만 AMD 카드는 확실히 텍스처 샘플에 더 잘 대처합니다. 특히 듀얼 칩 HD 5970이 여기에서 좋습니다! GTX 480 형태의 오늘의 영웅은 GTX 285와 GTX 295 사이의 평균 결과를 다시 보여줍니다. 여기서는 텍스처 단위의 속도에 대한 성능 강조가 훨씬 더 명확하게 보이고 GF100의 숫자는 여전히 남아 있기 때문입니다. 새롭고 강력한 그래픽 아키텍처에는 확실히 부족합니다.

그러나 이는 텍스처링에 중점을 둔 구식 작업이었고 특별히 복잡하지 않았습니다. 이제 Direct3D 9에 대한 픽셀 셰이더 테스트 중 가장 복잡한 두 가지 픽셀 셰이더 테스트 버전 3.0의 결과를 더 살펴보겠습니다. 이는 PC의 최신 독점 게임을 훨씬 더 잘 나타냅니다. 테스트는 ALU와 텍스처 모듈 모두에 더 큰 로드를 배치한다는 점에서 다릅니다. 두 셰이더 프로그램은 모두 복잡하고 길며 많은 수의 분기를 포함합니다.

  • 가파른 시차 매핑시차 매핑 기술의 훨씬 더 "무거운" 버전이며 기사에도 설명되어 있습니다.
  • 모피를 렌더링하는 절차적 셰이더.

마지막으로! 이것은 완전히 다른 문제입니다. 두 PS 3.0 테스트는 모두 매우 복잡하고 메모리 대역폭과 텍스처링에 전혀 의존하지 않으며 순전히 수학적이지만 새로운 GF100 아키텍처가 매우 잘 대처하는 것으로 보이는 많은 전환과 분기가 있습니다.

이 테스트에서 GTX 480은 진정한 강점을 보여주며 경쟁사의 새로운 듀얼 칩 솔루션을 제외한 모든 솔루션보다 성능이 뛰어납니다. 더욱이 GTX 295는 가장 복잡한 테스트에서 거의 두 배 더 느리고 GTX 285는 심지어 세 배 더 느립니다! 결과는 컴퓨팅 효율성을 향상시키기 위한 새로운 GPU의 아키텍처 변경에 의해 분명히 영향을 받았습니다.

따라서 새로운 GF100 아키텍처를 사용하면 가장 복잡한 PS 3.0 테스트에서 성능이 크게 향상되었음을 알 수 있습니다. 여기서 가장 중요한 것은 AMD 솔루션이 가지고 있는 최고의 수학적 능력이 아니라 전환과 분기가 포함된 복잡한 셰이더 프로그램을 실행하는 효율성입니다. 글쎄요, GT200에 비해 두 배로 늘어난 수학적 능력도 영향을 미쳤습니다. ALU 실행 유닛 수가 더 많은 AMD 아키텍처 솔루션을 추월하는 것은 큰 가치가 있기 때문에 매우 좋은 결과입니다.

Direct3D 10: PS 4.0 픽셀 셰이더 테스트(텍스처링, 루프)

RightMark3D의 두 번째 버전에는 DirectX 10용으로 재작성된 Direct3D 9용 친숙한 PS 3.0 테스트 두 개와 새로운 테스트 두 개가 더 포함되어 있습니다. 첫 번째 쌍에는 셀프 섀도잉 및 셰이더 슈퍼샘플링을 활성화하는 기능이 추가되어 비디오 칩의 부하가 더욱 증가합니다.

이러한 테스트는 많은 수의 텍스처 샘플(가장 무거운 모드에서 픽셀당 최대 수백 샘플)과 상대적으로 작은 ALU 로드를 사용하여 주기적으로 실행되는 픽셀 셰이더의 성능을 측정합니다. 즉, 텍스처 샘플의 속도와 픽셀 셰이더의 분기 효율성을 측정합니다.

픽셀 셰이더의 첫 번째 테스트는 Fur입니다. 기껏해야 낮은 설정높이 맵의 15~30개 텍스처 샘플과 기본 텍스처의 2개 샘플을 사용합니다. 효과 세부 모드 "높음"은 샘플 수를 40-80으로 늘리고 "셰이더" 슈퍼샘플링을 최대 60-120개 샘플까지 포함하며 SSAA와 함께 "높음" 모드는 160에서 160까지의 최대 "무거움"이 특징입니다. 높이 맵의 320개 샘플.

먼저 슈퍼샘플링을 활성화하지 않은 모드를 확인해 보겠습니다. 모드는 상대적으로 간단하며 "낮음" 모드와 "높음" 모드의 결과 비율은 대략 동일해야 합니다.

이 테스트의 성능은 TMU 블록의 수와 효율성, 대역폭에 따른 채우기 속도에 따라 달라집니다. 이론에 따르면 "높음"의 결과는 "낮음"보다 약 1.5배 낮습니다. 다수의 텍스처 샘플을 사용한 절차적 모피 렌더링에 대한 Direct3D 10 테스트에서 Nvidia 솔루션은 전통적으로 강력했지만 최신 AMD 아키텍처는 이미 이에 가까워졌습니다.

GTX 480은 GTX 285보다 거의 3분의 1 정도 빠르지만, DX9 테스트에서도 본 GTX 295보다는 부족합니다. 이는 새로운 Nvidia 솔루션이 이전 시리즈의 단일 칩 카드에 비해 이점이 있는 채우기 속도 및 메모리 대역폭의 영향에 대해 더 많이 나타냅니다. GF100의 속도는 RV870을 기반으로 하는 두 카드에 비해 거의 동일합니다. 동일한 테스트의 결과를 살펴보겠습니다. 단, 셰이더 슈퍼샘플링을 활성화하면 작업량이 4배 증가합니다. 아마도 이 상황에서는 뭔가가 바뀌고 채우기 속도가 포함된 메모리 대역폭의 효과가 줄어들 것입니다.

슈퍼샘플링을 활성화하면 이론적으로 로드가 4배 ​​증가하는데, 이번에는 이상하게도 GeForce GTX 480이 입지를 잃습니다. 그리고 두 Radeon 모두 조금 더 강해지고 있습니다. GTX 480과 GTX 285의 차이는 매우 작으며 이는 텍스처링에 중점을 두었음을 나타냅니다. 또는 GTX 285에 비해 GTX 480의 대역폭이 크게 증가하지 않은 경우도 있습니다. ALU 성능과 효율적인 분기 실행의 영향은 이 테스트에서 명확하게 표시되지 않습니다.

많은 수의 텍스처 샘플이 포함된 루프를 사용하여 복잡한 픽셀 셰이더의 성능을 측정하는 두 번째 테스트를 Steep Parallax Mapping이라고 합니다. 낮은 설정에서는 높이 맵의 텍스처 샘플 10~50개와 기본 텍스처의 샘플 3개를 사용합니다. 셀프 섀도잉이 포함된 헤비 모드를 활성화하면 샘플 수가 두 배로 늘어나고 슈퍼샘플링은 이 숫자를 네 배로 늘립니다. 슈퍼샘플링과 셀프 섀도잉이 포함된 가장 복잡한 테스트 모드는 80~400개의 텍스처 값을 선택합니다. 즉, 단순 모드보다 8배 더 많은 것입니다. 먼저 슈퍼샘플링 없이 간단한 옵션을 확인해 보겠습니다.

이 테스트는 실용적인 관점에서 볼 때 더 흥미롭습니다. 다양한 시차 매핑이 게임에서 오랫동안 사용되어 왔고 가파른 시차 매핑과 같은 무거운 변형이 Crysis 및 Lost와 같은 많은 프로젝트에서 사용되기 때문입니다. 행성. 또한 테스트에서는 슈퍼샘플링 외에도 비디오 칩의 로드를 약 두 배로 늘리는 셀프 섀도잉을 활성화할 수 있는데, 이 모드를 "높음"이라고 합니다.

다이어그램은 이전 다이어그램을 거의 완전히 반복하여 절대 수치에서도 유사한 결과를 보여줍니다. 슈퍼샘플링 없이 업데이트된 D3D10 버전의 테스트에서 GTX 480은 이전 세대의 단일 칩 상위보다 조금 더 나은 작업을 처리하지만 듀얼 칩 GTX 295 카드보다 뒤떨어집니다. 또한 새로운 GF100 비디오 카드 경쟁사인 HD 5870보다 약간 앞서 있으며, 이중 칩 버전이 절대적인 측면에서 승자가 됩니다.

슈퍼샘플링을 켜면 어떤 차이가 생기는지 살펴보겠습니다. 슈퍼샘플링을 사용하면 Nvidia 카드에서 항상 약간 더 큰 속도 저하가 발생합니다.

슈퍼샘플링과 셀프 섀도잉을 활성화하면 작업이 더욱 어려워집니다. 두 옵션을 함께 활성화하면 카드 로드가 거의 8배 증가하여 성능이 크게 저하됩니다. 여러 비디오 카드의 속도 표시기 간의 차이가 변경되었으며, 슈퍼샘플링을 포함하면 이전 사례와 동일한 효과가 있습니다. AMD 카드는 Nvidia 솔루션에 비해 성능이 확실히 향상되었습니다.

두 듀얼 칩 카드 모두 GTX 480보다 앞서 있지만 이번에는 새로운 솔루션이 직접적인 경쟁사인 HD 5870보다 약간 뒤처져 있습니다. 게임 테스트에서도 그럴 것으로 보입니다. 일부 지역에서는 GTX 480이 훨씬 앞서 있을 것입니다. 그리고 다른 것에서는 조금 뒤쳐질 것입니다. 그러나 GF100의 카드는 적어도 이전 카드보다 쉬움 모드에서는 눈에 띄게, 헤비 모드에서는 약간의 성능을 발휘합니다. 불행하게도 Nvidia의 새로운 GPU의 아키텍처 변경은 이러한 테스트에서 큰 이점을 제공하지 못했습니다.

Direct3D 10: PS 4.0 픽셀 셰이더 테스트(컴퓨팅)

다음 몇 가지 픽셀 셰이더 테스트에는 TMU 장치의 성능 영향을 줄이기 위해 최소 텍스처 가져오기 수가 포함되어 있습니다. 그들은 수많은 산술 연산을 사용하며 비디오 칩의 수학적 성능, 픽셀 셰이더의 산술 명령 실행 속도를 정확하게 측정합니다.

첫 번째 수학 시험 미네랄. 이는 텍스처 데이터 샘플 2개와 사인 및 코사인 명령어 65개만 사용하는 복잡한 절차적 텍스처링 테스트입니다.

그러나 수학 테스트에서는 GF100 GPU가 GT200의 ALU 성능의 두 배를 제공하므로 큰 변화를 볼 수 있습니다. 그러나 이론적으로 AMD 솔루션은 합성 테스트에서 훨씬 더 빨라야 합니다. 왜냐하면 계산적으로 복잡한 작업에서 최신 AMD 아키텍처는 Nvidia의 경쟁사에 비해 확실한 이점을 갖고 있기 때문입니다. 이번에도 상황이 확인되는데, 신형 GTX 480 보드가 엔비디아와 AMD 카드 간 격차를 좁혔지만 여전히 1.5배 이상 차이가 난다.

하지만 GTX 285 및 GTX 295와의 비교는 흥미로운 것으로 나타났습니다. 이번에 Nvidia는 이전 단일 칩 카드와 2배의 차이를 달성하거나 이전 세대의 기존 듀얼 칩 카드를 추월하는 데 실패했습니다. 결론적으로 이 테스트는 ALU의 속도에 완전히 의존하지는 않으나 대역폭의 차이에 따른 결과라고는 할 수 없음이 확인되었습니다. GF100은 GTX 285에 비해 38% 증가에 그쳤는데, 이는 우리가 보기에는 매우 이상하고 매우 작습니다.

Fire라고 불리는 두 번째 셰이더 계산 테스트를 살펴보겠습니다. ALU의 경우 더 무겁고 텍스처 가져오기가 한 번만 있으며 sin 및 cos 명령어 수가 두 배인 130개로 늘어났습니다. 로드가 증가함에 따라 무엇이 변경되었는지 살펴보겠습니다.

두 번째 테스트에서 렌더링 속도는 셰이더 장치의 성능에 의해 거의 독점적으로 제한되지만 여전히 GTX 285와 GTX 480의 차이는 너무 작습니다. 이론적으로는 2배의 차이에 가까워야 하지만 58%에 불과합니다. 그러나 새로운 솔루션은 이전 테스트와 달리 적어도 듀얼 칩 GTX 295를 따라잡았습니다. 그러나 Radeon HD 5870 및 HD 5970과 같은 경쟁업체는 이 테스트에서 훨씬 더 빠른 속도를 보여줍니다.

수학 D3D10 테스트를 요약해 보겠습니다. 모든 Nvidia 비디오 카드는 훨씬 뒤처져 있으며, 심지어 새로운 GF100도 최대 합성 작업에서 경쟁사보다 거의 두 배나 느립니다! 그리고 GTX 480이 이론적으로 GTX 285의 단일 칩 버전보다 거의 두 배 빠르다는 사실에도 불구하고 이 모든 것이 있습니다. 현실은 훨씬 낮은 수치를 보여주고 있으며 Nvidia의 간단한 수학적 테스트로는 AMD 카드에 접근조차 불가능했습니다.

일반적으로, 이번에도 극단적인 수학적 계산의 결과는 변함이 없다. GTX 400 라인의 출력을 바꾸지 않은 AMD 솔루션의 분명하고 부인할 수 없는 장점이 있다. 솔루션은 다른 어떤 것보다 강력해야 합니다.

Direct3D 10: 기하학 셰이더 테스트

RightMark3D 2.0 패키지에는 두 가지 지오메트리 셰이더 속도 테스트가 있습니다. 첫 번째 옵션은 이전 Direct3D 버전의 "포인트 스프라이트"와 유사한 기술인 "Galaxy"입니다. GPU의 파티클 시스템에 애니메이션을 적용하고, 각 점의 지오메트리 셰이더가 파티클을 형성하는 4개의 정점을 생성합니다. 유사한 알고리즘이 향후 DirectX 10 게임에서도 널리 사용되어야 합니다.

지오메트리 셰이더 테스트에서 균형을 변경해도 최종 렌더링 결과에는 영향을 미치지 않으며 최종 이미지는 항상 정확히 동일하며 장면 처리 방법만 변경됩니다. "GS 로드" 매개변수는 계산이 수행되는 셰이더(정점 또는 형상)를 결정합니다. 계산 횟수는 항상 동일합니다.

기하학적 복잡성의 세 가지 수준에 대해 정점 셰이더에서 계산을 수행한 Galaxy 테스트의 첫 번째 버전을 살펴보겠습니다.

장면의 다양한 기하학적 복잡성에 대한 속도 비율은 모든 솔루션에서 거의 동일하며 성능은 포인트 수에 해당하며 각 단계에서 FPS는 약 2배씩 떨어집니다. 최신 비디오 카드의 작업은 특별히 어렵지 않으며 일반적으로 성능은 기하학적 처리 속도에 의해 제한되며 메모리 대역폭에 의해 제한되지 않습니다.

이것이 바로 새로운 GPU가 진정한 강점을 보여주는 부분입니다. 모든 모드에서 Geforce GTX 480은 경쟁사의 듀얼 칩 솔루션에 가까운 결과를 보여주며, HD 5870과 GT200 기반 듀얼 칩 카드보다 1.5배 빠릅니다. 훌륭한 결과! 예상한 대로 GF100의 지오메트리 셰이더 실행은 GT200보다 약 2.5배 더 빠르고 매우 효율적입니다. 계산의 일부를 지오메트리 셰이더로 전송할 때 상황이 바뀌는지 살펴보겠습니다.

아니요, 이 테스트에서 부하가 변경되었을 때 숫자는 많이 변하지 않았습니다. 이 테스트의 모든 카드는 계산의 일부를 지오메트리 셰이더로 전송하는 GS 로드 매개변수의 변경 사항을 인식하지 못하며 이전 다이어그램과 유사한 결과를 보여줍니다. 지오메트리 셰이더에 큰 부하가 걸린다고 가정하는 다음 테스트에서 무엇이 변경되는지 살펴보겠습니다.

"Hyperlight"는 지오메트리 셰이더의 두 번째 테스트로, 인스턴스화, 스트림 출력, 버퍼 로드 등 여러 기술을 동시에 사용하는 방법을 보여줍니다. 그것은 사용한다 동적 생성두 개의 버퍼에 그려서 기하학을 새로운 기회 Direct3D 10 스트림 출력. 첫 번째 셰이더는 광선의 방향, 속도 및 성장 방향을 생성하며, 이 데이터는 두 번째 셰이더에서 그리기에 사용되는 버퍼에 배치됩니다. 광선의 각 지점에 대해 14개의 정점이 원 안에 만들어지며 총 출력 지점은 최대 100만 개에 이릅니다.

새로운 유형의 셰이더 프로그램을 사용하여 "광선"을 생성하고 "GS 로드" 매개변수를 "무거움"으로 설정하여 광선을 그립니다. 즉, "Balanced" 모드에서는 지오메트리 셰이더가 광선을 생성하고 "성장"하는 데에만 사용되며 출력은 "인스턴싱"을 사용하여 수행되며 "Heavy" 모드에서는 지오메트리 셰이더도 출력에 포함됩니다. 먼저 쉬운 모드를 살펴보겠습니다.

이번 테스트에서는 듀얼 칩 구성 모두 GeForce GTX 295와 Radeon HD 5970이 평소대로 수행되었습니다. 분명히 이 테스트는 AFR 멀티 칩 렌더링 방법과 전혀 호환되지 않습니다. 그렇지 않으면 다양한 모드의 상대적 결과가 로드에 해당합니다. 모든 경우에 성능이 잘 확장되고 이론적인 매개변수에 가깝습니다. 이에 따라 "다각형 개수"의 각 후속 수준은 두 배 미만으로 느려져야 합니다.

이 테스트에서 새로운 GeForce GTX 480의 성능은 하드 모드에서 Radeon HD 5870보다 약간 빠르지만, easy 모드에서는 그 차이가 더 두드러집니다. GTX 480과 이전 세대 GPU를 기반으로 한 GTX 285를 비교하는 것은 일반적으로 터무니없는 일입니다. 새로운 비디오 칩은 약 2배 빠른 것으로 나타났습니다.

숫자는 지오메트리 셰이더를 보다 적극적으로 사용하는 테스트에서 다음 다이어그램에서 변경되어야 합니다. "균형" 모드와 "무거운" 모드에서 얻은 결과를 서로 비교하는 것도 흥미로울 것입니다.

GF100의 지오메트리 처리 능력과 지오메트리 쉐이더의 실행 속도에 다시 한 번 놀라게 될 때입니다. 이것이 바로 GF100 그래픽 파이프라인이 전체적으로 변경된 결과입니다. GT200과 RV870 모두에서 지오메트리 셰이더의 성능이 크게 향상되었지만 GF100은 이 작업에서 이를 조각조각 찢었습니다.

새로운 GTX 480은 이 테스트에서 Radeon HD 5870보다 거의 2배 빠르며 단일 칩 이전인 GTX 285보다 최대 2.75배 빠릅니다. Nvidia 엔지니어들은 이전 지오메트리 처리 아키텍처의 효율성을 향상시키려고 노력했으며, 분명히 성공했습니다. 이전의 모든 솔루션은 지오메트리 셰이더를 효율적으로 수행할 수 없습니다. 이론상으로 더 큰 차이를 보여야 할 테셀레이션 테스트에서는 어떤 일이 일어날까요? 하지만 너무 멀리 앞을 내다보지는 말자.

Direct3D 10: 정점 셰이더에서 텍스처를 가져오는 속도

Vertex Texture Fetch 테스트는 정점 셰이더에서 많은 수의 텍스처를 가져오는 속도를 측정합니다. 테스트는 본질적으로 유사하며 "지구"와 "파도" 테스트에서 카드 결과 간의 비율은 거의 동일해야 합니다. 두 테스트 모두 텍스처 샘플링 데이터를 기반으로 하며 유일한 중요한 차이점은 Waves 테스트에서는 조건부 분기를 사용하는 반면 Earth 테스트에서는 사용하지 않는다는 것입니다.

먼저 "효과 세부 사항 낮음" 모드에서 첫 번째 "지구" 테스트를 살펴보겠습니다.

이전 연구에서는 이 테스트 결과가 텍스처링 속도와 메모리 대역폭 모두에 영향을 받는 것으로 나타났습니다. 그러나 솔루션 간의 차이는 매우 작습니다. GTX 480은 듀얼 칩 GTX 295와 유사한 결과를 보여 HD 5870보다 약간 앞서지만 이번 테스트에서 가장 강력한 카드인 Radeon HD 5970에 비해 모든 모드에서 상당히 열등합니다. 결과는 분명히 이상합니다. ... 동일한 테스트에서 텍스처 샘플 수를 늘려 성능을 살펴보겠습니다.

다이어그램에서 카드의 상대적 위치가 약간 변경되었습니다. 이는 거의 모든 카드의 약간 더 나쁜 표시에서 볼 수 있습니다. 오늘 우리가 고려하고 있는 GTX 480을 제외하면, 빛 조건에서 동일한 테스트를 한 것과 비교해 성능 저하가 거의 없었다. 이것이 의미하는 바는 텍스처 모듈, 특히 캐싱 하위 시스템의 효율성이 향상된다는 것입니다. 이제 새로운 GF100 카드는 중간 및 높은 폴리곤 수에서 가장 빠르며 가장 간단한 모드에서는 듀얼 칩 카드와 동등합니다.

정점 셰이더에서 텍스처를 가져오는 두 번째 테스트 결과를 살펴보겠습니다. Waves 테스트는 샘플 수가 적지만 조건부 점프를 사용합니다. 이 경우 이중선형 텍스처 샘플 수는 정점당 최대 14개("효과 디테일 낮음") 또는 최대 24개("효과 디테일 높음")입니다. 형상의 복잡성은 이전 테스트와 유사하게 변경됩니다.

흥미롭게도 Waves 테스트의 결과는 이전 차트에서 본 결과와 유사하지 않습니다. AMD 제품의 장점이 다소 커졌는데, 이제 GTX 480은 HD 5870, GeForce GTX 295와 비슷한 성능을 보여주며 헤비 모드에서는 경쟁사에 살짝 뒤처진다. 단일 칩의 이전 최고급 Nvidia 솔루션은 뒤쳐져 있으며, GeForce GTX 400 제품군의 새 모델이 크게 앞서지는 않지만 앞서 있습니다. 동일한 테스트의 두 번째 버전을 고려해 보겠습니다.

다시 말하지만, 조건이 복잡해짐에 따라 두 번째 정점 샘플 테스트에서 최신 Nvidia GPU의 결과가 AMD 비디오 카드의 속도에 비해 약간 더 좋아졌지만 거의 변화가 없습니다. 비록 작지만 HD 5870에 비해 장점이 있으며, 새로운 단일 칩 카드는 가장 쉬운 모드를 제외하고 GeForce GTX 295에 대처했습니다.

3DMark Vantage: 기능 테스트

안에 이 리뷰우리는 3DMark Vantage 제품군의 합성 벤치마크를 포함하기로 다시 결정했습니다. 패키지는 더 이상 새로운 것이 아니지만 기능 테스트는 D3D10을 지원하며 우리 패키지와 다르기 때문에 흥미롭습니다. 이 패키지에 포함된 새로운 Nvidia 솔루션의 결과를 분석할 때 RightMark 테스트 제품군에서 찾을 수 없었던 몇 가지 새롭고 유용한 결론을 도출할 수 있습니다.

기능 테스트 2: 색상 채우기

충전율 테스트. 성능을 제한하지 않는 매우 간단한 픽셀 셰이더를 사용합니다. 보간된 색상 값은 알파 블렌딩을 사용하여 오프스크린 버퍼(렌더링 대상)에 기록됩니다. HDR 렌더링을 사용하는 게임에서 가장 자주 사용되는 FP16 형식의 16비트 오프스크린 버퍼가 사용되므로 이 테스트는 매우 시의적절합니다.

이 테스트의 성능 수치는 다른 형식을 고려하더라도 유사한 테스트에서 본 것과 일치하지 않습니다. 우리는 구성 요소당 8비트 정수 버퍼를 사용하는 반면 Vantage 테스트는 16비트 부동 소수점을 사용합니다. Vantage의 수치는 ROP 장치의 성능을 표시하는 것이 아니라 메모리 대역폭의 대략적인 값을 표시합니다. 듀얼 칩 카드의 경우 모든 것이 다소 복잡하며 GTX 295는 예상보다 낮은 수치를 보여줍니다.

테스트 결과는 대략 이론적인 수치와 일치하며 메모리 버스 폭, 유형 및 주파수에 따라 달라집니다. GTX 285는 512비트 메모리를 사용해서 좋은 결과를 보이고 있고, GTX 480은 GDDR5 메모리가 특별히 높은 주파수에서 동작하지 않는 점과 메모리 버스 폭이 그에 상응하는 점 때문에 크게 앞서지 않습니다. 384비트로. 음, Radeon HD 5870도 근처 어딘가에 있습니다. 비록 256비트 메모리 버스만 있지만 GDDR5는 상당히 빠릅니다.

더 높은 대역폭의 GDDR5 메모리를 사용함에도 불구하고 HD 5870과 함께 새로운 Nvidia 솔루션은 512비트 버스와 GDDR3 메모리를 갖춘 GTX 285보다 약간 높은 결과를 보여줍니다. 이는 최신 게임에서 널리 볼 수 있는 FP16 형식의 렌더링 버퍼를 사용할 때 잠재적인 성능 제한으로 작용할 수 있습니다.

기능 테스트 3: 시차 폐색 매핑

비슷한 기술이 이미 게임에 사용되고 있기 때문에 가장 흥미로운 기능 테스트 중 하나입니다. 복잡한 기하학을 시뮬레이션하는 특별한 시차 폐색 매핑 기술을 사용하여 하나의 사변형(보다 정확하게는 두 개의 삼각형)을 그립니다. 상당히 리소스 집약적인 레이 트레이싱 작업과 고해상도 깊이 맵이 사용됩니다. 이 표면은 또한 강력한 Strauss 알고리즘을 사용하여 음영처리됩니다. 이것은 Strauss에 따른 광선 추적, 동적 분기 및 복잡한 조명 계산 중에 수많은 텍스처 샘플을 포함하는 비디오 칩에 대한 매우 복잡하고 무거운 픽셀 셰이더에 대한 테스트입니다.

이 테스트는 셰이더 성능, 분기 실행 효율성 및 텍스처 가져오기 속도에 개별적으로 의존할 뿐만 아니라 모든 것에 조금씩 의존한다는 점에서 다른 테스트와 다릅니다. 그리고 빠른 속도를 달성하려면 GPU와 비디오 메모리 블록의 적절한 균형이 중요합니다. 이는 셰이더의 분기 효율성과 테스트에 큰 영향을 미칩니다.

불행하게도 GTX 480은 이번 테스트에서 평범한 결과를 보여 이전 단일 칩 솔루션인 GTX 285보다 23%만 빠르다. 오늘 소개된 Nvidia 비디오 카드는 듀얼 칩 GTX 295와 주요 경쟁사인 Radeon HD 5870에 비해 뒤쳐진다. 듀얼 칩 HD 5970은 완전히 손이 닿지 않는 곳에 남아 있었습니다.

이 테스트 결과에 무엇이 그렇게 부정적인 영향을 미쳤는지는 명확하지 않습니다. 어쩌면 내 잘못일지도 몰라 느린 속도 GF100의 분기 효율이 상당히 높기 때문에 테스트에 적극적으로 사용되는 텍스처 샘플은 세 번째 버전의 픽셀 셰이더 테스트에서 입증되었습니다. Nvidia 솔루션은 이 테스트에서 항상 효과적이었지만 HD 5870은 새로운 GTX 480보다 성능이 뛰어납니다. 어쩌면 GF100이 물리 시뮬레이션 테스트에서 가장 좋은 면을 보여줄 수도 있을까요?

기능 테스트 4: GPU 천

이 테스트는 비디오 칩을 이용해 물리적 상호작용(천 모방)을 계산한다는 점에서 흥미롭다. 여러 패스를 통해 정점 셰이더와 형상 셰이더의 결합 작업을 사용하여 정점 시뮬레이션이 사용됩니다. 한 시뮬레이션 패스에서 다른 시뮬레이션 패스로 정점을 전송하려면 스트림 아웃을 사용합니다. 따라서 정점 및 기하학 셰이더의 실행 성능과 스트림 아웃 속도를 테스트합니다.

듀얼 칩 카드의 성능은 즉시 폐기할 수 있으며, 이는 단일 칩 카드의 속도와 명확하게 일치합니다(HD 5970 및 GTX 295의 각 칩은 HD 5870 및 GTX 285보다 낮은 주파수에서 작동함). 여기서 렌더링 속도는 지오메트리 처리 성능과 지오메트리 셰이더 실행에 따라 달라집니다. 이 테스트에서는 GTX 285도 HD 5870보다 약간 뒤처지는 수준으로 좋은 성능을 보였고, 새로운 GTX 480 카드는 다시 한번 그 강점을 보여주었습니다.

이 테스트에서 GF100은 이전 솔루션보다 거의 두 배 더 생산적이며, 이는 새 칩의 두 배의 셰이더 성능과 잘 일치합니다. 경쟁사인 Radeon HD 5870에 비해 장점도 인상적입니다. 일반적으로 오늘날의 영웅은 이론에 따라 지오메트리 쉐이더 구현 및 일반적인 지오메트리 처리 속도에서 리더의 지위를 부여받을 수 있습니다.

기능 테스트 5: GPU 입자

비디오 칩을 사용하여 계산된 파티클 시스템 기반 효과의 물리적 시뮬레이션 테스트입니다. 정점 시뮬레이션도 사용되며 각 정점은 단일 입자를 나타냅니다. Stream out은 이전 테스트와 동일한 목적으로 사용됩니다. 수십만 개의 입자가 계산되고 모두 별도로 애니메이션되며 높이 맵과의 충돌도 계산됩니다. RightMark3D 2.0 테스트 중 하나와 유사하게 입자는 각 점에서 4개의 정점을 생성하여 입자를 형성하는 기하학 셰이더를 사용하여 렌더링됩니다. 그러나 대부분의 테스트에서는 정점 계산이 포함된 셰이더 장치를 로드하며 스트림 아웃도 테스트됩니다.

더욱 강력한 결과가 있습니다. 기하학 셰이더를 사용하는 Vantage의 합성 직물 및 입자 시뮬레이션 테스트에서 새로운 GF100 칩은 모든 경쟁 제품을 간단히 제압했습니다. 이번에는 이전 Nvidia GPU보다 거의 3배 빠른 반면, 경쟁사인 Radeon HD 5870은 입자 시뮬레이션 테스트에서 약 절반 정도의 성능을 발휘합니다.

멀티칩 결과는 AMD와 Nvidia 카드 모두에서 동일합니다. 멀티칩 렌더링 방법은 분명히 작동하지 않습니다. 현재 프레임의 계산 결과가 다음 프레임에 사용되어 프레임이 시작되는 것을 방지하기 때문입니다. 현재 렌더링이 완료되기 전에 계산됩니다. 이는 듀얼 칩 카드의 명백한 약점으로, 프레임에서 이전 칩의 데이터를 사용할 때 효율적으로 작동할 수 없습니다.

기능 테스트 6: Perlin 노이즈

Vantage 패키지의 마지막 기능 테스트는 비디오 칩에 대한 수학적으로 집중적인 테스트로, 픽셀 셰이더에서 Perlin 노이즈 알고리즘의 여러 옥타브를 계산합니다. 각 색상 채널은 자체 노이즈 기능을 사용하여 비디오 칩에 더 많은 스트레스를 가합니다. Perlin 노이즈는 절차적 텍스처링에 자주 사용되는 표준 알고리즘이며 많은 수학을 사용합니다.

Futuremark 테스트 패키지의 수학적 기능 테스트는 극한 작업에서 비디오 칩의 순수한 성능을 보여줍니다. 여기에 표시된 성능은 이론에 따라 획득해야 하는 것과 잘 일치하며 부분적으로는 RightMark 2.0의 자체 수학적 테스트에서 본 것과 부분적으로 일치합니다. 하지만 이 테스트에서는 솔루션 간의 차이가 훨씬 더 커졌습니다.

따라서 이번 수학적 테스트에서 신형 GF100을 기반으로 한 GTX 480은 마침내 GTX 285보다 정확히 절반 정도 성능이 향상되었으며 이는 이론과 일치합니다. 그러나 새로운 솔루션과 HD 5870 사이의 격차는 1.7배로 너무 컸습니다. 우리는 아직 듀얼 칩 HD 5970을 고려하고 있지 않습니다.

일반적으로 AMD 비디오 카드는 당연히 이 테스트에서 Nvidia 경쟁사보다 성능이 뛰어났지만 Nvidia GF100 그래픽 프로세서를 기반으로 한 새로운 솔루션은 여전히 ​​이에 근접할 수 있었습니다. 참고로 이 수학 테스트는 매우 간단하며 이론적 최고점에 가까운 성능을 보여주도록 설계되었습니다. 물리적 계산과 같은 보다 복잡한 계산 테스트에서는 약간 다른 그림이 나타납니다. 그러나 단순하지만 집중적인 수학은 AMD 카드에서 훨씬 빠르게 수행됩니다.

Direct3D 11: 컴퓨팅 및 기하학 셰이더

DirectX 11의 기능을 사용하는 작업에서 Nvidia 및 AMD의 새로운 솔루션을 테스트하기 위해 Microsoft, AMD 및 Nvidia의 개발 키트(SDK) 샘플과 이들 회사의 일부 데모 프로그램을 사용했습니다.

먼저 새로운 유형의 셰이더인 Compute를 사용하는 테스트를 살펴보겠습니다. 이들의 외관은 최신 버전의 DX API에서 가장 중요한 혁신 중 하나이며 후처리, 시뮬레이션 등 다양한 작업에 사용됩니다. 첫 번째 테스트에서는 픽셀 또는 컴퓨팅 셰이더를 사용한 후처리를 통해 DirectX SDK의 톤 매핑을 사용한 HDR 렌더링의 예를 보여줍니다.

우리는 이번 테스트에서 새로운 Nvidia Geforce GTX 480 비디오 카드에 대한 AMD의 단일 칩 솔루션의 확실한 승리를 인정해야 합니다. 오늘 발표된 새로운 GF100 칩 보드는 픽셀 및 컴퓨팅 셰이더 모드 모두에서 경쟁사인 Radeon HD 5870보다 뒤떨어져 있습니다. 게다가 지연은 최대 1.5배까지 상당히 눈에 띕니다. 듀얼 칩 HD 5970은 이번 테스트에서 GPU가 1개만 실행되므로 결과가 HD 5870보다 훨씬 낮습니다.

두 번째 컴퓨팅 셰이더 테스트도 Microsoft의 DirectX SDK에서 가져온 것이며 중력과 같은 물리적 힘의 영향을 받는 동적 입자 시스템을 시뮬레이션하는 계산적 N체 중력 문제를 보여줍니다.

그리고 이번 컴퓨팅 테스트에서 Nvidia의 새로운 솔루션은 또 다시 가장 가까운 경쟁자인 Radeon HD 5870에게 패했습니다. 이 경우에도 약 25% 차이로 이는 상당한 수치입니다. 듀얼 칩 HD 5970은 다시 한 번 그 기능을 보여줄 수 없으며 보드에 설치된 두 개의 GPU 중 하나의 작동으로 제한됩니다.

다음 테스트는 Realistic Character Hair라는 Nvidia의 데모 프로그램입니다. 이는 계산 또는 기하학 셰이더에 순수 합성 코드를 사용하지 않고 복잡한 기하학 및 계산 셰이더와 테셀레이션을 사용하므로 처음 두 테스트의 순수 합성보다 실제 문제에 다소 더 가깝습니다.

하지만 이번 테스트에서 새로운 Nvidia GPU는 단일 칩 Radeon HD 5870과 두 번째 GPU가 다시 실패한 듀얼 칩 HD 5970보다 훨씬 앞서는 뛰어난 결과를 보여줍니다. 동시에 단일 칩 카드 간의 성능 차이가 최대 1.5~1.8배일 뿐만 아니라 하드웨어 테셀레이션이 활성화되었을 때의 동작 차이도 흥미롭습니다.

이 경우, GF100 칩을 기반으로 한 새로운 Geforce GTX 480 비디오 카드는 테셀레이션이 활성화되면 15% 가속되는 반면, RV870 기반 AMD 솔루션은 거의 5% 느려집니다. 즉, 이 경우 테셀레이션은 Nvidia의 솔루션에는 유리하지만 AMD에는 그렇지 않습니다. 분명히 기하학적 컨베이어의 다양한 구성은 이제 우리가 넘어갈 성능에 영향을 미칩니다.

Direct3D 11: 테셀레이션 성능

Direct3D 11의 가장 중요한 혁신은 하드웨어 테셀레이션으로 간주됩니다. 우리는 Nvidia GF100에 대한 이론적인 기사에서 이에 대해 자세히 살펴보았습니다. 그래픽 프리미티브(테셀레이션)를 분할하는 데에는 여러 가지 다른 방식이 있습니다. 예를 들어 퐁 테셀레이션, PN 삼각형, Catmull-Clark 세분화 등이 있습니다.

테셀레이션은 이미 STALKER: Call of Pripyat, DiRT 2, Aliens vs Predator, Metro 2033과 같은 최초의 DirectX 11 게임에서 사용되기 시작했습니다. 그 중 일부에서는 캐릭터 모델에 테셀레이션이 사용되었습니다(목록에 있는 모든 FPS 게임). 기타 - 현실적인 수면 시뮬레이션용(DiRT 2). PN 삼각형 구성표는 Metro 2033 Phong 테셀레이션의 STALKER: Call of Pripyat에서 사용됩니다. 이러한 방법은 게임 개발 프로세스와 기존 엔진에 비교적 빠르고 쉽게 구현되어 왔습니다.

첫 번째 테셀레이션 테스트는 ATI Radeon SDK의 세부 테셀레이션 예제입니다. 실제로 이는 테셀레이션뿐만 아니라 일반 노멀 맵 오버레이와 시차 폐색 매핑이라는 두 가지 범프 매핑 기술도 보여줍니다. 그럼, 서로 다른 조건에서 Nvidia와 AMD의 DirectX 11 솔루션을 비교해 보겠습니다.

첫 번째 결론은 다음과 같습니다. GeForce GTX 480 및 RADEIN HD 5870 모두의 픽셀별 시차 폐색 매핑 기술(다이어그램의 중간 막대)은 테셀레이션(하단 막대)보다 덜 효율적으로 수행됩니다. 즉, 픽셀 계산을 사용하여 형상을 시뮬레이션하면 테셀레이션을 사용하여 렌더링된 실제 형상보다 성능이 낮습니다. 현재 시차 매핑이 사용되고 있는 테셀레이션의 전망에 관한 것입니다.

다음으로 GTX 480과 AMD 카드의 성능을 비교하겠습니다. 듀얼 칩 HD 5970은 단일 칩 옵션보다 앞서 있으며 이는 이해할 수 있습니다. 하지만 GTX 480은 HD 5870보다 5~15% 앞서 있습니다. 테셀레이션을 활성화하면 더 많은 정보를 얻을 수 있고, 픽셀당 계산을 적용하면 더 적은 정보를 얻을 수 있습니다. 우리가 기대하는 것은 DX9 또는 DX10만 지원하는 게임에서는 GTX 480과 HD 5870의 차이도 테셀레이션이 적용된 DX11 게임보다 작아야 한다는 것입니다.

우리가 보게 될 두 번째 테셀레이션 성능 테스트는 ATI Radeon SDK PN Triangles의 3D 개발자를 위한 또 다른 예입니다. 실제로 두 예제 모두 DX SDK에도 포함되어 있으므로 많은 게임 개발자가 이를 기반으로 코드를 작성하게 됩니다. 우리는 변화가 전체 성능에 얼마나 많은 영향을 미치는지 이해하기 위해 다양한 테셀레이션 요소를 사용하여 이 예를 테스트했습니다.

이 예는 아마도 GF100 그래픽 아키텍처의 진정한 기하학적 힘을 본 최초의 사례일 것입니다. 예, 이것은 단지 합성 테스트일 뿐이며 이러한 극단적인 분할 요소는 처음에는 사용되지 않을 것입니다. 그러나 이것이 미래 문제에 대한 해결책의 전망을 평가하는 데 도움이 되는 합성 물질이 필요한 이유입니다.

Geforce GTX 480은 테셀레이션 작업에서 GF100의 능력을 완벽하게 보여줍니다. 단일 칩은 경쟁사의 듀얼 칩 카드보다 몇 배 더 빠릅니다. HD 5970에 비해 우위가 4배에 이르며, 이번 테스트에서 단일 칩 HD 5870이 압도적인 점수로 패배했습니다. 기본적으로 GF100은 RV870보다 몇 스톱 더 많은 테셀레이션을 허용합니다. 이것이 바로 새로운 테셀레이션 API의 기능을 고려하도록 특별히 설계된 아키텍처를 갖는다는 의미입니다.

하지만 또 다른 테스트 데모를 살펴보겠습니다. 엔비디아 프로그램섬이라고도 알려진 현실적인 수역. 그런데 이 프로그램의 저자는 3D 매니아들에게 알려진 Timofey Cheblokov(일명 Smalltim)입니다. 그의 Island 데모에서는 테셀레이션과 변위 매핑을 사용하여 사실적으로 보이는 바다 표면과 지형을 렌더링합니다. 그녀는 정말 좋아 보인다:

일반적으로 Island는 테셀레이션을 위한 순수한 합성 테스트가 아니며 다소 복잡한 픽셀 및 컴퓨팅 셰이더를 포함하므로 성능 차이는 이전 사례보다 적을 수 있지만 이 위치는 현실에 더 가깝습니다.

이 경우에는 네 가지 서로 다른 테셀레이션 비율로 데모를 테스트했습니다. 여기서는 이 설정을 동적 테셀레이션 LOD라고 합니다. 가장 낮은 분할 요소에서 GF100 카드가 AMD의 단일 칩 버전보다 약간 앞서고 심지어 HD 5970보다 열등한 경우 분할 요소가 증가하고 그에 따른 장면 복잡성으로 인해 GTX 480의 성능이 저하됩니다. 경쟁 솔루션의 렌더링 속도만큼 감소하지 않습니다.

결과적으로 새로운 Nvidia 그래픽 아키텍처의 GF100 칩이 장면 복잡성이 크게 다른 RV870과 유사한 테셀레이션 성능을 제공하는 상황이 다시 발생합니다. 따라서 이 프로그램에서 최대 LOD 계수가 100이면 GTX 480은 Radeon HD 5870과 동일한 성능을 나타내지만 계수는 25에 불과합니다. 삼각형(이 경우 2,800만 대 400만). 그것은 단지 큰 차이입니다!

합성 테스트에 대한 결론

GF100 그래픽 프로세서를 기반으로 한 새로운 Nvidia Geforce GTX 480 모델의 종합 테스트 결과와 주요 비디오 칩 제조업체의 다른 비디오 카드 모델 결과를 바탕으로 우리는 이것이 매우 강력한 Nvidia 그래픽이라는 결론을 내릴 수 있습니다. 성능과 가능성이 크게 향상된 아키텍처입니다. GF100을 기반으로 한 새로운 비디오 카드 모델은 모든 단일 칩 카드 중에서 가장 빠른 카드 중 하나가 되었습니다.

기하 처리 장치의 수가 증가하고 병렬 작업이 수행되면서 테셀레이션 및 기하 셰이더의 성능이 크게 향상되었습니다. 합성 테셀레이션 작업에서 Nvidia의 새로운 솔루션은 비교할 수 없습니다. 듀얼 칩 솔루션도 경쟁업체에 도움이 되지 않으며, 비디오 카드를 단일 GPU와 비교할 때 GF100 기반 솔루션은 이러한 테스트에서 최고의 RV870 기반 카드보다 최대 4~6배 더 뛰어난 성능을 보입니다. 효율적인 형상 처리를 위해 특별히 향상된 경쟁사의 아키텍처가 출시될 때까지 상황은 변하지 않을 것입니다.

테셀레이션 없이 3D 응용 프로그램의 성능을 판단하면 게임 테스트에서 합성 응용 프로그램과 동일할 것이라고 가정할 수 있습니다. 어떤 곳에서는 GeForce GTX 480이 경쟁사보다 앞서고 다른 곳에서는 조금 뒤에. 게다가 GF100 아키텍처에 대해 몇 가지 질문이 있는 유일한 매개변수인 수학적 계산이나 텍스처 가져오기 성능에 의해 완전히 제한되는 게임이 없기 때문에 너무 큰 손실이 있어서는 안 됩니다.

테셀레이션, 지오메트리 셰이더 및 물리 계산(지오메트리 셰이더를 사용하는 Vantage 패키지의 직물 및 입자 시뮬레이션)에 대한 합성 테스트에서 새로운 Nvidia GF100 칩은 다른 칩보다 훨씬 강력합니다. 복잡한 프로그램을 사용한 다른 컴퓨팅 테스트와 마찬가지로. 그러나 예상대로 RightMark 또는 Vantage의 순수 계산 테스트와 같은 간단한 수학은 AMD 솔루션에 손실되었으며 Nvidia는 여전히 상당한 격차를 가지고 있습니다. GF100은 기능 면에서 CPU에 더 가까워졌고 훨씬 더 보편적이 되었지만(C++ 및 CPU처럼 캐싱을 기억하세요) RV870에 비해 항상 구별되는 "숫자 분쇄" 능력이 약간 덜한 것으로 나타났습니다. CPU의 GPU.

우리 기사에서 언급한 상대적으로 낮은 최대 계산 및 텍스처 성능은 일부 인공 테스트에서 경쟁사보다 뒤처지는 결과를 가져왔지만 전반적으로 GTX 480은 매우 괜찮은 결과를 보여 주었으며 이는 우리 자료의 다음 부분에서 확인되어야 합니다. 이를 통해 가장 현대적인 게임 애플리케이션에서 새로운 GPU를 기반으로 한 Nvidia의 최신 솔루션 테스트에 대해 알게 될 것입니다.

우리는 게임 결과가 합성 테스트 결과를 분석할 때 내린 결론과 대략적으로 일치할 것이라고 가정합니다. 큰 차이는 없지만 게임의 렌더링 속도는 비디오 카드의 여러 특성에 동시에 좌우되는 경우가 많으며 합성보다 채우기 속도와 메모리 대역폭에 훨씬 더 많이 의존하기 때문입니다. 우리는 GeForce GTX 480이 테셀레이션이 없는 게임에서 단일 칩 경쟁사인 Radeon HD 5870보다 약간 앞서야 하며 이를 사용한 테스트에서도 확실히 앞서 있을 것이라고 생각합니다.

RV870 "Cypress" 그래픽 프로세서와 이를 기반으로 한 ATI Radeon HD 5800 비디오 카드 제품군이 출시된 지 6개월 후, NVIDIA는 마침내 새로운 "Fermi" 아키텍처와 처음 두 비디오의 출시로 팬들을 기쁘게 할 수 있었습니다. 카드 - 지포스 GTX 480 및 GTX 470은 Radeon HD 5800에 대한 답변으로 설계되었습니다. 많은 사람들에게 지루한 기다림은 끝났으며 이제 다양한 기사와 리뷰를 바탕으로 지원을 통해 최신 게임에 무엇을 얻을지 결정할 수 있습니다. DirectX 11용? 다행스럽게도 비디오 카드가 무료로 판매되기까지는 아직 시간이 남아 있습니다. 첫 번째 배치가 4월 12일 이전에 소매 체인에 도착할 것이기 때문입니다. 공식 발표 며칠 전에 카드를 받았음에도 불구하고 우리는 기사 게시를 서두르지 않고 가능한 가장 상세하고 철저한 테스트를 수행하는 것을 선호했습니다. 이것이 바로 며칠 만에 기사를 여러분의 관심에 보여줄 수 있는 이유입니다. 새로운 비디오 카드 발표 이후에 자료가 완성되었기 때문에 약간의 지연이 발생하는 점 양해해 주시기 바랍니다.

그럼, 환영합니다 - GeForce GTX 480!

경쟁사 대비 NVIDIA GeForce GTX 480 사양

NVIDIA GeForce GTX 480의 기술적 특성은 현재 가격 경쟁업체 및 이전 GeForce GTX 285 비디오 카드와 비교하여 표에 나와 있습니다.

이제 인터넷에는 페르미 아키텍처에 대한 정보가 너무 많아졌습니다. 또한 다음 사항에 익숙해질 수 있습니다. 공식 문서(2.74MB). 따라서 즉시 비디오 카드 검토로 넘어갑니다.

NVIDIA GeForce GTX 480 1.5GB 비디오 카드 검토

참조 NVIDIA GeForce GTX 480 비디오 카드는 OEM 구성, 즉 포장 및 액세서리 없이 테스트하기 위해 우리에게 제공되었습니다. 잘 아시는 분들을 위해 모습 GeForce GTX 260-285, 신제품은 독창적인 것처럼 보이지 않습니다.


아마도 GPU에서 위쪽으로 뻗어 있는 5개의 니켈 도금 구리 히트 파이프가 주목을 받을 수 있습니다.


그렇지 않으면 참조 GeForce GTX 480이 외부적으로 눈에 띄지 않습니다. 인쇄 회로 기판의 길이는 267mm로 길이가 282mm이고 모든 시스템 장치 케이스에 맞지 않는 ATI Radeon HD 5870 형태의 경쟁사 제품과 구별됩니다.

비디오 카드에는 케이스 외부 GPU에 의해 가열된 공기를 부분적으로 배출하기 위한 그릴 옆에 PCI-E 인터페이스 버전 2.0, 듀얼 링크 DVI-I 출력 2개, HDMI 커넥터 1개가 장착되어 있습니다.


보드의 다른 쪽 끝에서는 가정할 수 있는 것처럼 터빈으로의 공기 흐름 경로를 열지 않는 개구부를 볼 수 있습니다. 비디오 카드 상단에는 전원 연결을 위한 6핀 및 8핀 커넥터와 SLI 모드에서 2개의 GeForce GTX 480 또는 3-Way SLI에서 3개의 작동을 구성하기 위한 2개의 MIO 커넥터가 있습니다.


이 커넥터 옆에는 뜨거운 공기의 일부가 냉각 시스템에서 빠져나가 시스템 장치 케이스 내부에 남아 있는 또 다른 그릴이 있습니다. GeForce GTX 480(250W로 명시)의 매우 높은 소비량과 그에 따른 열 방출을 고려하면 이는 불쾌한 사실입니다. 그러나 분명히 이 냉각 시스템을 설계한 엔지니어에게는 다른 선택의 여지가 없었습니다.

비디오 카드 냉각 시스템의 플라스틱 케이스는 쉽게 풀 수 있는 래치로 고정되어 있습니다.


냉각 전력 요소용 표준 플레이트와 함께 GeForce GTX 480의 대체 쿨러를 사용하는 것은 불가능합니다. 그래픽 프로세서 근처의 장착 구멍에는 냉각 시스템 베이스가 놓이는 부싱이 있어 3-4mm 간격을 형성하기 때문입니다. 쿨러 베이스와 GPU 열 분산기 사이.

그래픽 카드 인쇄 회로 기판 요소의 냉각판을 사용하면 라디에이터의 나사를 쉽게 풀 수 있으므로 후자에 대해 완전히 익힐 수 있습니다.


모든 비디오 카드 메모리 칩은 인쇄 회로 기판의 전면에 있습니다. GeForce GTX 480의 전원 경로는 CHL8266 컨트롤러를 기반으로 하는 GPU용 6단계 전원 공급 회로와 메모리 칩용 2단계 전원 공급 회로입니다.


32억 개의 놀라운 트랜지스터로 구성된 GPU 크리스털은 다음과 같은 표시가 있는 방열판 커버로 덮여 있습니다.


표시로 판단하면 GPU는 세 번째 개정판(GF100-375-A3)에 속하며 2010년 4주차에 출시되었습니다. GPU에는 480개의 범용 셰이더 프로세서, 60개의 텍스처 유닛 및 48개의 ROP(래스터 작업 단위)가 포함되어 있습니다. GPU 지오메트리 블록의 공칭 주파수는 700MHz이고 셰이더 도메인은 1401MHz로 두 배 높습니다. 2D 모드에서는 GPU 주파수가 51/101MHz로 감소됩니다. 위의 사양 표에서 다른 특성을 이미 볼 수 있습니다.

레퍼런스 NVIDIA GeForce GTX 480에는 인쇄 회로 기판 전면에 총 1.5GB 용량의 12개의 GDDR5 비디오 메모리 칩이 장착되어 있습니다. 이 칩은 삼성에서 출시했으며 K4G10325FE-HC04라는 라벨이 붙어 있습니다.


메모리 사양에 따르면 공칭 액세스 시간은 0.4ns이고 이론적 유효 주파수는 5000MHz입니다. 이러한 사실에도 불구하고 GeForce GTX 480 메모리 주파수는 3696MHz에 불과하므로 성공적인 오버클럭을 기대할 수 있습니다. 발열을 줄이고 에너지를 절약하기 위해 비디오 카드가 2D 모드로 전환되면 유효 메모리 주파수가 270MHz로 감소됩니다. 비디오 카드 메모리 버스의 너비는 384비트이므로 177.4GB/초라는 놀라운 처리량을 달성할 수 있습니다.

GPU-Z 유틸리티의 새 버전은 GeForce GTX 480의 특성을 거의 정확하게 보여줄 수 있습니다.


비디오 카드 냉각 시스템을 연구하고 효율성을 확인해 보겠습니다. 기본 GeForce GTX 480 쿨러의 핵심 요소는 GPU 방열판입니다.


베이스의 일부인 직경 6mm의 구리 히트파이프 5개로 구성됩니다(직접 접촉 기술). 튜브는 두께가 약 0.35mm이고 핀 사이 간격이 1.5mm를 조금 넘는 알루미늄 핀을 관통합니다. 쿨러의 라디에이터 영역은 매우 적습니다. 베이스의 튜브 사이의 거리도 1.5mm입니다. 전체 라디에이터 구조는 니켈 도금 처리되어 있습니다.

GPU와 쿨러 라디에이터의 HDT 베이스 사이에는 두꺼운 회색 열 인터페이스가 과도하게 적용되어 있습니다.


직접 접촉 기술이 적용된 냉각기의 경우 열 인터페이스의 양과 품질은 기존 기반의 냉각기보다 최대 효율성을 달성하는 데 더 중요합니다. 앞으로 표준 방열 페이스트를 제거하고 가능한 최소한의 Arctic Cooling MX-3 레이어로 교체하면 GPU의 최고 온도를 3 ° C 낮출 수 있다는 점에 주목합니다. 2D 모드에서는 온도가 변하지 않았습니다.

GeForce GTX 480 냉각 시스템의 두 번째 구성 요소는 터빈이 설치된 금속판입니다.


열 패드를 통해 플레이트는 비디오 메모리 칩 및 인쇄 회로 기판의 전원 요소와 접촉됩니다. 터빈의 회전 속도(최대 전력 21와트)는 온도에 따라 비디오 카드에 의해 자동으로 조정됩니다. 흥미로운 특징은 속도 증가가 원활하게 발생하지만 부하가 제거된 후 속도 감소가 매우 급격하다는 것입니다. GeForce GTX 480 쿨러가 최대에 가까운 속도에서 발생하는 소음은 터빈이 꺼지는 듯한 느낌을 주지만 실제로는 그렇지 않습니다. 2D 모드에서 비디오 카드 주파수가 크게 감소하면 터빈은 출력의 44-46%로 작동합니다. 오늘 자료의 다음 섹션 중 하나에서 소음 수준에 대해 설명하겠지만 지금은 표준 GeForce GTX 480 쿨러가 얼마나 효과적인지 확인하겠습니다.

로드를 생성하고 비디오 카드를 워밍업하기 위해 우리는 16x 레벨의 이방성 필터링과 함께 2560x1600 해상도의 반합성 3DMark 2006 패키지에서 매우 리소스 집약적인 Firefly Forest 테스트를 사용했습니다. 비디오 카드의 GPU 온도와 터빈 전력(%)은 아직 GeForce GTX 480을 완전히 지원하지 않는 MSI Afterburner 버전 1.5.1을 사용하여 모니터링되었습니다. 테스트 중 실내 온도는 25°C였습니다. 테스트는 폐쇄형 시스템 장치 케이스에서 수행되었으며, 해당 구성은 테스트 방법 섹션에서 확인할 수 있습니다. 표준 열 인터페이스를 사용하여 비디오 카드를 분해하기 전에 테스트를 수행했습니다.

이제 자동 터빈 모드와 최대 전력에서 GeForce GTX 480의 온도를 살펴보겠습니다.


최대 속도 자동 조정


분명히 비디오 카드는 매우 뜨거웠습니다. 3DMark 2006의 테스트 형태의 부하에도 GPU 온도는 빠르게 95°C에 도달했지만, 이후 터빈 속도를 70~78%(~3600rpm)로 증가한 덕분에 91°C까지 떨어졌습니다. 92°C였으며 테스트 내내 더 이상 변하지 않았습니다. 터빈을 최대 출력(~4780rpm)으로 수동으로 설정하면 GPU 온도는 68°C를 초과하지 않습니다. 터빈 회전 속도에 대한 라디에이터 효율의 의존도가 매우 높으며, 이는 우선 분산 영역이 부족함을 나타냅니다.

또한 GeForce 드라이버에서 16x 레벨 이방성 필터링이 활성화된 2560x1600 해상도의 전체 화면 모드에서 출시된 FurMark 버전 1.8.0(exe 이름이 변경됨)을 사용하여 레퍼런스 GeForce GTX 480 쿨러의 효율성을 확인했습니다. 자동 모드에서는 3DMark 2006에서 테스트할 때와 동일한 그림을 관찰할 수 있었지만 유일한 차이점은 최고 온도가 처음에 98°C에 도달했고 자동으로 터빈 속도를 4150rpm으로 증가시킨 후 동일한 91~92°C로 떨어졌다는 것입니다. °C. 최대 터빈 회전 속도에서 다음과 같은 결과가 얻어졌습니다.


그 결과 GPU 온도가 86°C에 도달했습니다. 보시다시피 새 비디오 카드는 매우 뜨거웠고 3D 모드에서 냉각 시스템에 소음이 발생했습니다. 그러나 NVIDIA 및 ATI의 최고 제품은 낮은 온도와 소음 수준을 특징으로 한 적이 없기 때문에 GeForce GTX 480의 잠재적 소유자는 이에 대해 화를 내서는 안됩니다. 또한 표준 냉각기를 최대 30°C까지 "가져오는" 동시에 비교할 수 없을 정도로 더 조용하게 작동하는 대체 냉각기가 곧 나타날 것입니다. Arctic Cooling Accelero Xtreme GTX 280또는 Thermalright 제품). 오히려 질문은 다릅니다. 표준 냉각 시스템을 교체해야 하고 보증이 상실될 가능성이 높은 제품을 500달러에 구입하는 것이 얼마나 정당합니까? 음, 또 다른 옵션은 대체 쿨러가 탑재된 GeForce GTX 480이 나타날 때까지 기다리는 것입니다.

GeForce GTX 480의 오버클럭 가능성을 확인하기 위해 EVGA Precision v1.9.2 유틸리티를 사용했습니다.



여전히 "원시" 그래픽 프로세서에서 이러한 온도 체계를 사용하면 오버클러킹에서 인상적인 결과를 기대할 수 없다는 것이 분명합니다. 그래서 안정성 손실이나 화질 저하 없이 그래픽 프로세서의 주파수가 최종 745MHz(+6.4%)로 45MHz만 높아졌습니다. 그러나 0.4ns 메모리 칩은 효과적인 4780MHz(+29.3%)에서 안정적으로 작동할 수 있어 솔직히 만족스러웠습니다.


최신 버전의 OCCT의 메모리 테스트가 GeForce GTX 480에서 올바르게 작동하는지 100% 확신할 수는 없지만 비디오 카드에서 사용할 수 있는 거의 모든 1.5GB 메모리를 테스트합니다.



비디오 메모리 오버클러킹은 비디오 카드 및 그래픽 프로세서의 인쇄 회로 기판 온도 조건에 영향을 미치지 않았으며 이는 매우 논리적입니다.

새 비디오 카드 검토를 마친 후 NVIDIA GeForce GTX 480의 권장 가격이 499달러임을 알려드립니다. 비디오 카드 판매는 4월 12일부터 전 세계적으로 시작됩니다.

테스트 구성, 도구 및 테스트 방법론

모든 테스트는 다음 구성 요소로 구성된 폐쇄형 시스템 장치 케이스 내부에서 수행되었습니다.

마더보드: ASUS P6T Deluxe(Intel X58 Express, LGA 1366, BIOS 2101);
중앙 프로세서: Intel Core i7-920, 2.67GHz(Bloomfield, C0, 1.2V, 4x256KB L2, 8MB L3);
냉각 시스템: Хigmatek Balder SD1283(1100rpm에서 2개의 Thermalright TR-FDB 포함);
열 인터페이스: Arctic Cooling MX-2;
RAM: DDR3 3x2GB Wintec AMPX 3AXH1600C8WS6GT(1600MHz / 8-8-8-24 / 1.65V);
시스템 디스크: SSD OCZ Agility EX(SATA-II, 60GB, SLC, Indillinx, 펌웨어 v1.31);
게임 및 테스트용 디스크: 서부 디지털 Scythe Quiet Drive 3.5" 상자에 VelociRaptor(SATA-II, 300GB, 10000rpm, 16MB, NCQ);
아카이브 디스크: Western Digital Caviar Green WD10EADS(SATA-II, 1000GB, 5400rpm, 32MB, NCQ);
케이스: Antec Twelve Hundred(전면 벽 - 900rpm에서 3개의 Noiseblocker NB-Multiframe S-Series MF12-S1, 후면 - 900rpm에서 2개의 Scythe SlipStream 120, 상단 - 400rpm에서 표준 200mm 팬);
제어 및 모니터링 패널: Zalman ZM-MFC2;
전원 공급 장치: Zalman ZM1000-HP 1000W, 140mm 팬.
모니터: 30인치 삼성 305T 플러스.

테스트에 포함된 개별 게임의 일부 모드에서 비디오 카드의 프로세서 의존성을 줄이기 위해 45nm 쿼드 코어 프로세서는 배수 21로 오버클럭되었으며 로드 라인 보정 기능은 증가된 4.0GHz로 활성화되었습니다. 전압 마더보드 BIOS최대 1.3725V의 보드



RAM은 1.64V 전압에서 7-7-7-14-1T의 타이밍으로 작동했습니다. 프로세서 또는 메모리 오버클러킹과 관련된 마더보드 BIOS의 다른 모든 매개변수는 변경되지 않았습니다("자동" 위치로 유지).

NVIDIA GeForce GTX 480, Leadtek WinFast GTX 285 및 XFX 지포스 GTX 295 2x896MB:




ATI GPU의 비디오 카드 중에서 테스트에는 Radeon HD 5870 1GB 및 듀얼 프로세서 Radeon HD 5970 2x1GB가 포함되었습니다.




이제 소프트웨어 부분과 도구로 넘어 갑시다. 2010년 3월 23일에 시작된 테스트는 다음의 지시에 따라 진행되었습니다. 운영 체제지정된 날짜의 모든 중요 업데이트와 다음 드라이버가 포함된 Microsoft Windows 7 Ultimate x64:

칩셋 마더보드 인텔 보드칩셋 드라이버 - 9.1.1.1025 WHQL;
DirectX 최종 사용자 런타임 라이브러리, 출시일 - 2010년 2월;
ATI Catalyst 10.3 GPU용 비디오 카드 드라이버;
NVIDIA GPU용 비디오 카드 드라이버: GeForce/ION 드라이버 197.17 베타 GeForce GTX 480 및 GeForce/ION 드라이버 197.25 베타다른 NVIDIA 비디오 카드의 경우;
물리 가속 드라이버 - NVIDIA PhysX 시스템 소프트웨어 9.10.0129.

게임의 비디오 카드 테스트는 1920x1080 및 2560x1600의 두 가지 해상도로 수행되었습니다. 우리의 의견으로는 낮은 해상도에서 이러한 강력한 비디오 카드를 테스트하는 것은 실질적인 이점이 없으며 테스트 양이 증가하고 플랫폼 속도에 따라 비디오 카드의 성능이 제한될 뿐입니다.

테스트에는 두 가지 그래픽 품질 모드가 사용되었습니다. "고품질 + AF16x" - 16x 레벨 이방성 필터링이 활성화된 드라이버의 최대 텍스처 품질 및 16x 레벨 이방성 필터링이 활성화된 "고품질 + AF16x + AA 4(8)x" 평균 프레임 속도가 편안한 게임을 위해 충분히 높게 유지되는 경우 활성화되고 전체 화면 앤티앨리어싱(MSAA) 수준이 4배 또는 8배가 됩니다. 이방성 필터링과 전체 화면 안티앨리어싱은 게임 설정이나 해당 앱에서 직접 활성화되었습니다. 구성 파일. 게임에서 이러한 설정이 누락된 경우 Catalyst 및 GeForce 드라이버의 제어판에서 매개변수가 변경되었습니다. 드라이버 제어판에서 수직동기화가 강제로 비활성화되었습니다.

이 글을 준비하기 시작하면서 모든 게임은 최신 패치로 업데이트되었습니다. 궁극적으로 테스트 목록은 두 개의 반합성 패키지, 하나의 테크노 데모 및 21개의 게임으로 구성되었습니다. 최근 뉴스. 기술에 대한 간략한 설명이 포함된 테스트 목록은 다음과 같습니다(게임은 출시 순서대로 정렬되어 있습니다).

3DMark 2006(DirectX 9/10) - 빌드 1.2.0, 기본 설정 및 AF16x 및 AA8x 사용 시 2560x1600;
3DMark Vantage(DirectX 10) - 버전 1.0.2.1, "성능" 설정 프로필(기본 테스트만 수행됨)
Unigine Heaven 데모(DirectX 11) - 버전 2.0, 최대 품질 설정, "극단적인" 테셀레이션;
World In Contribute(DirectX 10) - 버전 1.0.1.0(b34), 그래픽 품질 프로필 "매우 높음", "물 반사 구름" - 켜짐, 게임에 내장된 테스트;
Crysis(DirectX 10) - 버전 1.2.1, "Very High" 설정 프로필, Crysis Benchmark Tool 버전 ​​1.0.0.5의 "Assault Harbor" 데모 녹화 이중 주기;
Unreal Tournament 3(DirectX 9) - 버전 2.1, 게임 내 최대 그래픽 설정(레벨 5), 모션 블러 및 하드웨어 물리학 활성화, FlyBy 장면은 "vCTF-Corruption" 레벨(2회 연속 주기)에서 테스트되었으며, HardwareOC UT3는 벤치 v1.5.0.0을 사용했습니다.
Lost Planet Extreme Condition: Colonies Edition(DirectX 10) - 버전 1.0, 그래픽 수준 "최대 품질", HDR 렌더링 DX10, 게임에 내장된 테스트, 첫 번째 장면(ARENA1)에 대한 결과가 표시됩니다.
Far Cry 2(DirectX 10) - 버전 1.03, 설정 프로필 "Ultra High", Far Cry 2 벤치마크 도구 v1.0.0.1의 이중 테스트 주기 "Ranch Small";
Call of Duty 5: World at War(DirectX 9) - 게임 버전 1.6, 그래픽 및 텍스처 설정이 "Extra" 수준으로 설정, "Breach" 데모 녹화가 같은 이름 수준으로 설정됨
BattleForge: Lost Souls(DirectX 11) - 버전 1.2(2010년 3월 19일), 최대 그래픽 품질 설정, 그림자 활성화, SSAO 기술 활성화, 게임에 내장된 이중 테스트 실행;
Stormrise(DirectX 10.1) - 버전 1.0.0.0, 효과 및 그림자에 대한 최대 품질 설정, "Ambient occlusion" 비활성화, "$mn_sp05" 미션에서 데모 장면 이중 실행;
Tom Clancy's H.A.W.X.(DirectX 10) - 버전 1.03, 최대 그래픽 품질 설정, HDR, DOF 및 주변 폐색 기술 활성화, 내장 테스트(이중 실행)
Call of Juarez: Bound in Blood(DirectX 10.1) - 버전 1.0.1.0, 최대 그래픽 품질 설정, 그림자 맵 크기 = 1024, "Miners Massacre" 레벨 시작 부분의 110초 데모 녹음;
Wolfenstein MP(OpenGL 2.0) - 버전 1.3, 최대 그래픽 설정, "Manor" 수준에서 자체 데모 녹음 "d2"
Batman: Arkham Asylum(Direct3D 9) - 버전 1.1, 최대 디테일, 최대 "물리학", 게임에 내장된 이중 테스트 실행;
레지던트 이블 5(DirectX 10.1) - 버전 1.0, 모션 블러 없이 최대 그래픽 설정으로 변수 테스트를 테스트한 결과, 결과는 가장 리소스 집약적인 테스트 세 번째 장면의 평균 값으로 간주되었습니다.
S.T.A.L.K.E.R.: Call of Pripyat(DirectX 11) - 버전 1.6.02, 모든 매개변수를 최대로 수동으로 추가로 설정하는 "향상된 동적 조명 DX11" 설정 프로필, "Backwater" 수준에서 자체 데모 녹음 "cop03"을 테스트했습니다.
Borderlands(DirectX 9) - 게임 버전 1.2.1, 최대 품질 설정으로 "timedemo1_p" 테스트
Left 4 Dead 2(DirectX 9) - 게임 버전 2.0.1.1, 최대 품질, 데모 녹음 "d333"이 "Swamp Fever" 맵, 스테이지 "Swamp"에서 테스트되었습니다(2패스).
Colin McRae: DiRT 2(DirectX 9/11) - 게임 버전 1.1, 최대 그래픽 품질 설정으로 런던 서킷을 따라 두 바퀴를 도는 내장 테스트입니다.
Wings Of Prey(DirectX 9) - 게임 버전 1.0.2.1, 텍스처 품질 "Ultra Ultra High" 및 기타 최대 그래픽 품질 설정, "Battle of Britain" 캠페인의 "Escort" 수준에서 2분짜리 데모 녹화를 테스트했습니다.
Warhammer 40,000: Dawn of War II - Chaos Rising(DirectX 10.1) - 버전 2.1.0.4679, 게임 메뉴의 그래픽 설정이 "Ultra" 수준으로 설정되어 있으며 게임에 3~4번의 테스트 실행이 내장되어 있습니다.
Metro 2033(DirectX 10/11) - 버전 1.0, 최대 품질 설정, 160초 동안 지속되는 스크립트 장면이 테스트에 사용되었습니다. 체이서 레벨에서는 이중 순차 패스;
Just Cause 2(DirectX 11) - 버전 1.0.0.1, 최대 품질 설정, 배경 흐림 및 GPU 워터 시뮬레이션 기술 비활성화, Dark Tower 데모의 이중 순차 전달.

상세 설명나열된 일부 게임의 비디오 카드 및 그래픽 설정을 테스트하는 방법을 특별히 제작된 웹 사이트에서 찾을 수 있습니다. 우리 회의의 스레드, 이러한 기술에 대한 토론과 개선에 참여합니다.

게임이 초당 최소 프레임 수를 기록하는 기능을 구현한 경우 이는 다이어그램에도 반영되었습니다. 각 테스트는 두 번 수행되었으며, 얻은 두 값 중 가장 좋은 값을 최종 결과로 사용했지만 그 차이가 1%를 초과하지 않는 경우에만 적용되었습니다. 테스트 실행 간 차이가 1%를 초과하면 올바른 결과를 얻기 위해 테스트를 한 번 이상 반복했습니다.

비디오카드 성능 테스트 결과 및 분석

다이어그램에서 ATI Radeon HD 5970 및 Radeon HD 5870 비디오 카드의 테스트 결과는 빨간색으로 강조 표시되어 있으며 오늘 기사의 주인공인 GeForce GTX 480은 기존 NVIDIA 녹색 색상이며 GeForce GTX 295 및 GTX는 285 비디오 카드는 청록색으로 표시되어 있습니다. 오버클럭된 비디오 카드 테스트는 별도의 기사가 필요하므로 오늘 기사의 일부로 수행되지 않았습니다.

테스트 결과를 보고 분석해보자.

3D마크 2006



첫 번째 반합성 테스트에서 GeForce GTX 480은 주요 경쟁사인 Radeon HD 5870보다 약간 앞서지만 두 비디오 카드 모두 듀얼 프로세서 GeForce GTX 295보다 빠릅니다. 고품질 모드의 Radeon HD 5970 2560x1600의 해상도는 GeForce GTX 480을 포함한 다른 모든 테스트 참가자보다 훨씬 앞서 있습니다.

3D마크 밴티지



3DMark Vantage에서는 상황이 약간 다르지만 GeForce GTX 480이 Radeon HD 5870보다 거의 2000 3D "앵무새" 빠른 "성능" 설정 프로필에서만 가능합니다. 로드가 증가하면 비디오 카드는 동일한 성능을 보여줍니다. .

Unigine 천국 데모 2.0

GeForce GTX 285 및 GTX 295 비디오 카드는 DirectX 11을 지원하지 않으므로 GeForce GTX 480과의 정확한 비교를 위해 이러한 모든 카드는 이전에 테셀레이션을 비활성화한 DirectX 10 모드에서 테스트되었습니다.



Heaven 데모의 GeForce GTX 480 결과는 이 비디오 카드의 잠재적 구매자의 영혼을 위한 향유와 같습니다. 실제로 신제품은 탁월한 성능을 보여주며 가장 어려운 모드에서 자체 캠프의 두 경쟁사보다 훨씬 뛰어난 성능을 발휘합니다.

이제 테셀레이션이 활성화된 DirectX 11 모드에서 GeForce GTX 480이 얼마나 좋은지 확인해 보겠습니다. DirectX 10의 비디오 카드 결과는 이탤릭체로 표시되어 있습니다.


보시다시피 GeForce GTX 480은 듀얼 프로세서 Radeon HD 5970과 쉽게 경쟁하며 직접적인 경쟁자인 Radeon HD 5870보다 훨씬 뒤처집니다. 가까운 시일 내에 게임에서 테셀레이션이 우세할 경우 GeForce GTX 480을 구입하는 것이 훨씬 더 좋아 보입니다. ATI보다 매력적입니다. 하지만 이는 '찻잎 추측'에 가깝기 때문에 이 문제는 광신자들에게 맡기고 게임 테스트로 넘어가겠습니다.

갈등의 세계


World in Contribute 게임에서 GeForce GTX 480은 Radeon HD 5870보다 빠른 것으로 나타났으며 듀얼 프로세서 GeForce GTX 295와도 성공적으로 경쟁하여 초당 최소 프레임 수에서 후자를 능가했습니다. 듀얼 칩 Radeon HD 5970 비디오 카드의 성능은 오늘 테스트에서 다른 모든 참가자의 손이 닿지 않는 수준이지만, 이 비디오 카드는 초당 최소 프레임 수에서 우월하지 않으므로 편안함을 위해 매우 중요합니다. 노름.

크라이시스


많은 사람들은 "Fermi"의 출시로 Crysis 게임이 마침내 단일 프로세서 비디오 카드에 의해 정복될 것이라고 예상했지만 이는 사실과 거리가 멀었습니다. 더욱이 GeForce GTX 480은 Radeon HD 5870에 비해 아주 약간의 이점을 보여주며, 이는 이 신제품을 기대했던 많은 사람들에게도 놀라운 일입니다. 그러나 가장 어려운 품질 모드의 GTX 480은 더 높은 수준의 초당 최소 프레임 수를 제공하고 또한 GeForce GTX 295를 쉽게 처리합니다.

언리얼 토너먼트 3


Unreal Tournament 3는 비용에 따라 위치를 지정하는 것과 거의 같은 방식으로 성능에 따라 비디오 카드의 순위를 매기는 "유화"를 계속해서 그립니다. GeForce GTX 480은 Radeon HD 5870보다 빠르지만 두 듀얼 프로세서 비디오 카드보다 느립니다.

잃어버린 행성 극한 조건: 식민지 에디션


Lost Planet 게임에서 GeForce GTX 480이 할 수 있는 최대 성능은 4가지 테스트 모드 중 3가지에서 Radeon HD 5870을 능가하고 GeForce GTX 295와 대등한 위치에서 경쟁하는 것입니다. 듀얼 프로세서 Radeon HD 5970 비디오 카드는 아직도 가장 빠릅니다.

파 크라이 2


GeForce GTX 480이 모든 곳에서 Radeon HD 5870을 뒤쫓을 뿐만 아니라 "항공기"와 동등한 입장에서 경쟁하는 Far Cry 2 게임에서 새 비디오 카드의 다소 자신감 있는 성능을 언급하지 않는 것은 불가능합니다. 캐리어” Radeon HD 5970은 전체 화면 앤티앨리어싱을 사용하는 고품질 그래픽 모드입니다.

콜 오브 듀티 5: 월드 앳 워(World at War)


현대 표준에 전혀 요구되지 않는 Call of Duty 5: World at War를 플레이하려면 2560x1600 및 MSAA8x의 해상도를 포함하여 오늘 테스트한 모든 비디오 카드로 충분합니다. 하지만 GeForce GTX 480과 Radeon HD 5870을 서로 비교하면 이 게임에서 비디오 카드의 성능이 동일하다고 말할 수 있습니다.

BattleForge: 잃어버린 영혼


BattleForge: Lost Souls가 프로 ATI 게임이라는 사실에도 불구하고 NVIDIA GF100 GPU의 비디오 카드는 그래픽 품질 향상 기술이 없는 모드에서만 Radeon HD 5870에 패합니다. 앤티앨리어싱을 켜면 GeForce GTX 480이 약간 앞서 나갑니다.

폭풍우


그러나 ATI의 긴밀한 지도 하에 출시된 또 다른 게임에서는 GeForce GTX 비디오 카드가 승산이 없기 때문에 서로만 경쟁합니다.

톰 클랜시의 H.A.W.X.


반대로 비행 시뮬레이터 Tom Clancy의 H.A.W.X.에서 GeForce GTX 480은 Radeon HD 5870뿐만 아니라 듀얼 프로세서 플래그십 Radeon HD 5970도 압도합니다. 고품질 그래픽 모드에서는 GTX 480의 장점이 GTX 285 이상은 2배를 초과합니다.

콜 오브 후아레스: 바운드 인 블러드



BattleForge 및 Stormrise와 같은 Call of Juarez: Bound in Blood는 ATI GPU 기반 비디오 카드에 더 적합합니다. 그러나 이것이 GeForce GTX 480이 Radeon HD 5870보다 앞서는 것을 막지는 못했습니다. 최대 해상도에서도 하나의 GeForce GTX 285 또는 일부 Radeon HD 4870이 있기 때문에 Call of Juarez는 리소스 집약적 게임으로 분류될 수 없다는 점에 유의해야 합니다. HD 5770이면 충분합니다.

울펜슈타인 MP


Wolfenstein에서 ATI 비디오 카드의 승리는 NVIDIA가 항상 OpenGL과 더 잘 작동하고 일반적으로 그러한 게임의 리더였기 때문에 매우 놀랍습니다. 하지만 이 게임에서 GeForce GTX 480은 Radeon HD 5870과 상대가 되지 않습니다.

배트맨: 아캄 수용소


그러나 Batman: Arkham Asylum 게임에서는 반대되는 것이 있습니다. 즉, 물리적 효과 PhysX를 가속화하기 위한 하드웨어 지원입니다. ATI GPU 기반 비디오 카드가 이 게임에서 성공적으로 작동하려면 GeForce를 두 번째 비디오 카드로 설치하거나 이러한 효과를 모두 비활성화해야 합니다. 사실, 게임은 그래픽 측면에서 매우 결함이 있기 때문에 Catalyst와 GeForce 드라이버의 협력을 구성하는 데 재정 및 시간 측면에서 더 비싸지만 첫 번째 옵션이 훨씬 더 흥미롭습니다. 또한, GeForce GTX 480은 배트맨: 아캄 어사일럼(Batman: Arkham Asylum)에서 듀얼 프로세서 GeForce GTX 295를 능가하는 뛰어난 성능을 보여줍니다.

레지던트 이블 5


GeForce GTX 480은 Resident Evil 5 게임에서 경쟁사에게 기회를 주지 않습니다. 또한 우리가 볼 수 있듯이 새로운 GF100 그래픽 프로세서 기반 비디오 카드는 GeForce GTX 형태의 두 듀얼 프로세서 거대 프로세서에 성공적으로 저항할 수 있습니다. 295 및 라데온 HD 5970.

S.T.A.L.K.E.R.: 프리피야티의 부름

다시 한번 말씀드리지만 GeForce GTX 285 및 GTX 295 비디오 카드는 DirectX 11을 지원하지 않으므로 메인 다이어그램을 보기 전에 GeForce GTX 480과의 정확한 비교를 위해 후자는 이전에 DirectX 10에서 테스트되었습니다. 방법:



S.T.A.L.K.E.R.: Call of Pripyat 게임에서 GeForce GTX 480의 성능이 높은 수준이라고 말할 수는 없습니다. GTX 285에 비해 큰 이점도 없고 GTX 295에 비해 최소한 어느 정도 발전한 것도 없습니다. 그리고 DirectX 11에서 새 비디오 카드는 자랑할 것이 없습니다.




보더랜드


Borderlands 게임에서는 Radeon HD 5870과 GeForce GTX 480 간의 전투가 다양한 수준의 성공을 거두며 진행됩니다. 앤티앨리어싱이 없는 모드에서는 NVIDIA GPU 기반 비디오 카드가 더 빠르며 MSAA8x가 활성화되면 Radeon이 앞서 나가지만 해상도는 1920x1080입니다.

레프트 4 데드 2


Left 4 Dead 2 게임에서 끝없이 좀비를 물리치고 싶다면 ATI GPU가 탑재된 비디오 카드를 선택하는 것이 좋습니다. ATI GPU는 NVIDIA 카드보다 더 높은 성능을 보여주기 때문입니다. 이 게임은 리소스를 많이 사용하지 않으므로 오늘 테스트한 모든 비디오 카드로 충분합니다.

콜린 맥레이: DiRT 2

DirectX 11은 GeForce GTX 2xx 비디오 카드에서 지원되지 않으므로 먼저 GeForce GTX 480을 공정한 DirectX 9 모드에서 비교해 보겠습니다.



다음으로 Radeon 비디오 카드가 이미 참여하고 있는 DirectX 11의 결과를 살펴보겠습니다(GTX 2xx에 대한 DX9 결과도 있지만 이탤릭체로 표시됨).


비록 큰 차이는 아니지만 이 게임에서 GeForce GTX 480은 Radeon HD 5870보다 여전히 빠릅니다.

날개의 먹이


CrossFireX 기술은 아직 새로운 비행 시뮬레이터 Wings Of Prey에서는 작동하지 않으므로 Radeon HD 5970은 테스트에서 가장 느린 비디오 카드로 판명되었습니다. 동시에 SLI 기술은 훌륭하게 작동하여 GeForce GTX 295를 다른 비디오 카드의 범위 이상으로 만듭니다. 음, GeForce GTX 480은 모든 모드의 테스트 합계 측면에서 Radeon HD 5870보다 약간 앞서 있습니다.

워해머 40,000: Dawn of War II - 카오스 라이징


Warhammer 40,000: Dawn of War II는 프로세서 의존도가 가장 높은 게임 중 하나이므로 결과는 최대 품질 모드와 2560x1600 해상도에서만 비교할 수 있습니다. 여기서 GeForce GTX 480은 Radeon HD 5870보다 약간 빠릅니다. 초당 평균 프레임 수는 있지만 최소값에서는 더 느립니다. 일반적으로 이 지표에 따르면 GeForce GTX 480은 Warhammer 40,000: Dawn of War II에서 최악의 비디오 카드로 판명되었으며 이는 오히려 최적화가 부족함을 나타냅니다. 지포스 드라이버이므로 곧 수정될 수도 있습니다.

메트로 2033

새로운 게임 Metro 2033의 비디오 카드 테스트는 영웅과 두 명의 보조자가 트롤리를 타고 움직일 수 없는 스크립트 장면에서 "Chaser" 레벨의 맨 처음에 수행되었습니다. 매우 높은 수준의 반복성을 갖는 결과를 얻습니다. 테스트는 레벨 로딩 후 160초 이내에 FRAPS를 사용하여 수행되었습니다. DirectX 11 Metro 2033의 최대 그래픽 품질 설정에서는 기사에 참여한 5개의 비디오 카드 중 1개의 비디오 카드에서만 테스트가 가능했기 때문에 테스트에는 DirectX10 렌더링이 사용되었습니다.



GeForce GTX 480은 Radeon HD 5870보다 약간 빠르며 이 두 비디오 카드는 모두 듀얼 프로세서 Radeon HD 5970보다 훨씬 열등합니다. Metro 2033에서는 CrossFireX 기술이 Wings Of Prey에서 작동하지 않았다는 점을 추가해 보겠습니다. SLI 기술의 성능 저하로 인해 다음 게임인 Just Cause 2에서는 완전히 작동하지 않는 것으로 나타났습니다.

모든 테스트가 완료된 후 Metro 2033 게임과 DirectX 11 모드에서 GeForce GTX 480의 성능을 추가 테스트했는데 안타깝게도 그 당시 이미 Radeon HD 5870 및 HD 5970 비디오 카드를 반환했기 때문에 ATI는 Radeon HD 5850 비디오 카드는 공칭 725/4000MHz에서 오버클럭된 1GB의 경쟁자 역할을 했습니다. 비교를 위해 동일한 "Chaser" 데모 장면을 최대 품질 설정으로 사용했습니다. 결과는 매우 흥미로웠습니다.



1920x1080의 해상도에서 오버클럭된 Radeon HD 5850은 GeForce GTX 480보다 크게 뒤지지 않지만 2560x1600에서는 Radeon에서 실제 "슬라이드쇼"가 시작되는 반면 GeForce GTX 480은 3배 더 높은 결과를 보여줍니다. 그러나 이는 여전히 새 비디오 카드가 이 게임에서 플레이어에게 편안한 초당 프레임 수를 제공하는 것을 허용하지 않습니다. 더욱이, 테스트 장면을 실행할 때에도 GeForce에서 사진이 약간 "흐릿하게" 나타나는 것을 발견하고 스크린샷으로 확인하기로 결정했습니다(비록 "Chaser"에서는 동일한 스크린샷을 찍을 수 없기 때문에 레벨은 다르지만). 화질의 차이를 직접 평가할 수 있습니다(해상도 1920x1080).

ATI 라데온 HD 5850NVIDIA 지포스 GTX 480







Radeon 비디오 카드의 이미지 품질이 확실히 더 높다는 것을 쉽게 알 수 있습니다. 모든 텍스처는 번짐이나 흐릿함 없이 매우 명확하게 그려집니다. 게임의 그래픽 품질 설정은 두 비디오 카드 모두에서 동일했습니다. DirectX 11, "Very High", AF16x, AAA, "Advanced DOF" 및 "Tesselation"이 활성화되었습니다. 또한 Catalyst 및 GeForce/ION 드라이버에서는 텍스처 필터링의 최대 품질 모드가 "고품질"로 설정되었습니다(기본값은 "품질"). 그렇다면 GeForce GTX 480이 Metro 2033에서 더 높은 성능을 달성한 것은 바로 이러한 품질 저하 때문일까요? Metro 2033 게임 개발자는 이 질문에 하루도 채 안 되어 신속하게 응답했습니다. 답변은 다음과 같습니다.

“아니요. 디스플레이의 눈에 띄는 차이는 비디오 카드의 성능과는 아무런 관련이 없습니다. 실제로 일부 앤티앨리어싱 모드에서는 NVIDIA 및 ATI 비디오 카드가 이미지를 다르게 렌더링합니다. 이제 우리는 이 문제가 얼마나 빨리 해결될 수 있는지 이해하려고 노력하고 있습니다. 다시 한 번 말씀드리지만 이는 생산성과는 아무런 관련이 없습니다.”

Oles Shishkovtsov, 4A Games, 최고 기술 책임자

글쎄, 기다려 보자.

저스트 코즈 2


새 게임 Just Cause 2에서 GeForce GTX 480은 Metro 2033에서 승리한 것과 동일한 수준으로 Radeon HD 5870보다 열등합니다.

다음으로, 게임 테스트로만 작성된 요약 차트에서 결과를 분석해 보겠습니다.

성능 비교 요약 차트

요약 다이어그램의 첫 번째 쌍에서는 이전 세대 NVIDIA GPU의 가장 빠른 단일 프로세서 비디오 카드인 GeForce GTX 285와 비교하여 GeForce GTX 480의 성능 향상을 평가해 보시기 바랍니다. 다이어그램의 성능은 다음과 같습니다. 100%로 간주하고 GeForce GTX 480의 결과는 백분율 증가로 표시됩니다(S.T.A.L.K.E.R.: Call of Pripyat 및 Colin McRae: DiRT 2 게임에서 결과는 각각 DX10 및 DX9 렌더링에서 비교되었습니다).



글쎄, 여기에서는 일반적으로 모든 것이 명확하고 이해 가능합니다. 앤티앨리어싱이 없는 모드에서 GeForce GTX 480은 게임 테스트에서 이전 세대 GeForce GTX 285의 최고급 비디오 카드보다 해상도에 따라 평균 30~37% 더 빠르며 앤티앨리어싱이 있는 모드에서는 평균적으로 더 빠릅니다. 46-48%의 앨리어싱. 여기서 주목할 점은 Radeon 비디오 카드 5시리즈가 출시되면서 이전 세대 ATI 비디오 카드에 비해 성능 향상이 더 높아졌다는 점입니다. 가장 눈에 띄는 성능 향상은 Tom Clancy의 H.A.W.X., Far Cry 2 및 Metro 2033과 같은 게임에서 기록되었습니다. 그리고 이 두 비디오 카드의 성능에서 가장 눈에 띄는 차이는 Call of Duty 5와 같이 리소스 집약적이지 않은 게임에서입니다. 월드 앳 워(World at War) 또는 울펜슈타인(Wolfenstein).

다음 다이어그램은 듀얼 프로세서 GeForce GTX 295와 새로운 단일 프로세서 플래그십 GeForce GTX 480 간의 전투에 전념합니다. GeForce GTX 295의 결과는 0축으로 간주됩니다(게임 S.T.A.L.K.E.R.: Call of Pripyat 및 Colin McRae: DiRT 2, DX10 및 DX9 렌더 결과를 각각 다시 비교했습니다.



GeForce GTX 480은 다양한 수준의 성공을 거두며 이전 세대 듀얼 프로세서 비디오 카드인 GeForce GTX 295와 경쟁하고 있습니다. 일부 게임에서는 듀얼 칩 비디오 카드가 더 빠르고 다른 게임에서는 GeForce GTX 480이 더 빠릅니다. 여기서 우리는 또한 Radeon HD 5870과 Radeon HD 4870 X2 간의 이전 대결을 기억할 수밖에 없습니다. 새로운 그래픽 프로세서는 이전 세대의 듀얼 칩 플래그십보다 거의 항상 더 빨랐습니다. 그러나 최신 게임 Metro 2033 및 Just Cause 2에서는 이러한 신제품에서 SLI 기술이 아직 작동하지 않기 때문에 GeForce GTX 480의 우월성이 상당히 큽니다.

이제 게이밍 테스트의 합산을 바탕으로 새로운 GeForce GTX 480과 Radeon HD 5870의 대결을 평가해 보겠습니다. 결과는 Radeon HD 5870의 성능을 0축으로 한 다음 다이어그램 쌍에 표시됩니다. , GeForce GTX 480의 결과는 그로부터의 편차 형태로 반영됩니다.



그리고 여기서는 생산성 증가 또는 감소 비율이 크게 변경되면서 어느 방향으로든 기울어집니다. 따라서 12개 게임에는 World in Contribute, Crysis, Unreal Tournament 3, Lost Planet: Colonies, Far Cry 2, Tom Clancy's H.A.W.X., Call of Juarez: Bound in Blood(!), Batman: Arkham Asylum(Radeon에 대한 "도핑" 없음)이 포함됩니다. ), Resident Evil 5, Borderlands, Colin McRae: DiRT 2 및 Metro 2033, GeForce GTX 480이 앞서 있으며 BattleForge, Stormrise, S.T.A.L.K.E.R.: Call of Pripyat, Left 4 Dead 2 및 Just Cause 2의 5개 게임에서 그렇습니다. 이미 더 빠른 Radeon HD 5870입니다. 나머지 4개 게임에는 비디오 카드 중 하나의 패리티 또는 약간의 이점이 있습니다. 모두가 기다리던 GeForce GTX 480이 Radeon을 능가하는 압도적인 우위라고 말할 수 있습니다. HD 5870은 현재 존재하지 않습니다.

마지막으로 GeForce GTX 480과 우리 시대의 가장 빠른 비디오 카드인 Radeon HD 5970 사이의 격차를 확인할 수 있는 마지막 몇 가지 다이어그램은 다음과 같습니다.



Wings Of Prey 게임에서는 CrossFireX 기술이 작동하지 않고 Batman: Arkham Asylum 게임에서는 PhysX 지원이 부족하여 GeForce GTX 480이 듀얼 프로세서 Radeon HD 5970보다 성능이 뛰어납니다. Tom Clancy's H.A.W.X. 및 Resident Evil 5 게임에서는 비디오 카드의 속도는 거의 동일하며 다른 모든 경우에는 Radeon HD 5970이 GeForce GTX 480보다 빠릅니다.

전력 소비, 비디오 카드 발열 및 소음 수준

다양한 비디오 카드를 사용하는 시스템의 에너지 소비는 다음을 사용하여 수행되었습니다. 특별히 개조된이러한 목적을 위해 전원 공급 장치. 최대 부하는 안정성 테스트 모드에서 2560x1600 해상도(AF16x 포함)의 FurMark 1.8.0 하나와 FurMark를 Linpack x64(LinX 0.6.4, 4096MB, 7개 스레드)와 함께 실행하여 생성되었습니다. 둘 다라는 점을 고려하면 지정된 프로그램비디오 시스템과 중앙 프로세서에 각각 최대 부하를 생성하므로 전체 시스템의 최대 전력 소비를 파악하고 이에 필요한 전원 공급 장치를 결정할 수 있습니다(효율성을 고려).

얻은 결과는 다이어그램에 표시됩니다.






최대 부하 시 GeForce GTX 480을 탑재한 시스템은 FurMark를 탑재한 경우와 FurMark 및 Linpack x64와 결합한 경우 모두 Radeon HD 5870을 탑재한 시스템보다 약 130와트 더 많은 전력을 소비한다는 것을 쉽게 알 수 있습니다. 더욱이, GeForce GTX 480을 탑재한 시스템은 듀얼 프로세서 Radeon HD 5970을 탑재한 시스템보다 더 많은 전력을 소비합니다! 이것은 진정으로 "탐욕스러운"비디오 카드입니다. 그럼에도 불구하고 GeForce GTX 295는 여전히 전력 소비 분야의 선두주자입니다. 2D 모드에서 GeForce GTX 480과 Radeon HD 5870 비디오 카드가 장착된 시스템의 소비 차이는 26W로 Radeon에 유리합니다. 그건 그렇고, 이점에 대해.

당신이 "게임 매니아"이고 한 달 동안 매일 8시간씩 게임을 한다고 가정해 보겠습니다. 그리고 이 시간 동안 비디오 하위 시스템의 로드가 항상 최대라고 가정해 보겠습니다. 즉, NVIDIA GeForce GTX 480 및 ATI Radeon HD 5870이 설치된 시스템의 전력 소비 차이가 지속적으로 시간당 130와트와 같다고 가정해 보겠습니다. 따라서 한 달 안에 새로운 NVIDIA 비디오 카드가 장착된 시스템은 경쟁사인 32.2kW ATI 비디오 카드가 장착된 시스템보다 더 많은 전력을 "먹게" 됩니다! 러시아 연방에서 킬로와트시의 평균 현재 비용을 찾을 수 없으므로(러시아 연방의 구성 기관에서 승인함) 킬로와트시는 다음을 기반으로 하는 모스크바를 예로 들어 보겠습니다. 단일 관세 미터 비용 2 루블 42 코펙. 따라서 Radeon HD 5870이 설치된 시스템 소유자에 비해 GeForce GTX 480이 설치된 시스템 소유자는 한 달에 최대 78루블의 "과잉 지출"을 하게 됩니다! 귀하가 이해하는 바와 같이 이 금액을 수령한 조건은 비현실적입니다. 실제로 그 금액은 최소한 4배 이하여야 합니다. 그러나 이것이 사실이고 한 달에 78 루블이 사실로 판명 되더라도 스스로 대답하십시오. 이것이 실제로 18,000 루블이 넘는 비디오 카드를 비교할 때 논쟁으로 사용할 수있는 돈입니까?

이제 테스트된 모든 비디오 카드의 온도 조건을 자동 터빈 작동과 비교해 보겠습니다. 부하는 16x 수준의 이방성 필터링을 사용하여 2560x1600 해상도의 반합성 3DMark 2006 패키지에서 15주기의 Firefly Forest 테스트를 통해 생성되었습니다. 테스트는 실온 25°C의 폐쇄된 시스템 유닛 케이스에서 수행되었습니다. 결과를 살펴보겠습니다.



유휴 모드와 부하 상태 모두에서 GPU 온도 측면에서 Radeon HD 5870은 GeForce GTX 480보다 훨씬 우수합니다.

결론을 내리기 전에 마지막으로 해야 할 일은 비디오 카드의 소음 수준을 평가하는 것입니다. 레퍼런스 비디오 카드의 표준 냉각 시스템의 소음 수준은 약 20㎡의 완전 밀폐된 공간에서 오전 1시 이후 전자 소음 측정기 CENTER-321을 사용하여 측정되었습니다. m 이중창이 있습니다. 각 냉각기의 소음 수준은 시스템 장치 케이스 외부에서 측정되었으며, 실내 소음의 유일한 원인은 냉각기 자체와 터빈이었습니다. 삼각대에 고정된 소음 측정기는 항상 냉각기 팬 로터에서 정확히 150mm 떨어진 한 지점에 엄격하게 위치했습니다. 냉각 시스템이 설치된 비디오 카드가 삽입된 마더보드는 폴리우레탄 폼 지지대 위에 테이블 맨 구석에 배치되었습니다.


소음 측정기의 측정 하한은 29.8dBA이며, 그러한 거리에서 측정했을 때 쿨러의 주관적으로 편안한(낮은 것과 혼동하지 말 것) 소음 수준은 약 37dBA입니다. 표준 냉각기 터빈의 회전 속도는 공급 전압을 0.5V 단위로 변경하여 컨트롤러를 사용하여 전체 작동 범위에 걸쳐 변경되었습니다.

Radeon HD 5970 및 HD 5870의 소음 수준에 대해 얻은 데이터는 측정 지점마다 0.1dBA 이내의 차이가 있는 것으로 나타나 그래프에 통합되었습니다. 이 비디오 카드를 터빈 커넥터에 연결하려면 완전히 분해해야 하기 때문에 스탠드에서 GeForce GTX 295의 소음 수준을 측정하는 것은 불가능한 것으로 나타났습니다. 측정 결과는 다음 그래프에 나와 있습니다(점선은 터빈 속도의 전체 범위를 나타내고 실선은 바로 위에서 설명한 3DMark 2006에서 테스트했을 때 실제 속도 범위를 나타냅니다).



측정 결과에서 가장 먼저 알아야 할 것은 레퍼런스 비디오 카드의 표준 냉각 시스템 중 어느 것도 조용하지 않다는 사실입니다. 두 번째로 주목해야 할 점은 GeForce GTX 480 쿨러의 소음 수준 곡선이 경쟁사인 Radeon HD 5870의 소음 수준 곡선을 통과한다는 것입니다. GeForce GTX 480 쿨러가 표준 Radeon보다 조용하다고 결론을 내릴 수 있습니까? HD 5870 쿨러요? 그러나 이는 동일한 터빈 회전 속도에서 이러한 냉각기를 비교하는 경우에만 해당되지만 실제로는 GeForce GTX 480 터빈이 자동으로 작동할 때 회전 속도가 2100~3600rpm 범위에서 다양하기 때문에 발생하지 않습니다. Radeon HD 5870의 속도 범위는 1270-2040rpm에 불과합니다(위의 온도 차트 참조). GF100 GPU의 매우 높은 열 방출로 인해 NVIDIA 엔지니어는 비디오 카드 BIOS의 온도 제한을 높이고 더 높은 터빈 속도로 설정해야 했습니다. 그 결과 더 높은 온도에서 높은 소음 수준이 발생합니다. 아쉽게도 이 매개변수에서도 새롭고 덜 핫한 그래픽 프로세서 개정판이 나타날 때까지 GeForce GTX 480은 Radeon HD 5870에 패하고 있습니다.

결론

그렇다면 Radeon HD 5870이 출시된 지 6개월 후에 우리는 무엇을 얻었습니까? 모든 테스트를 종합해보면(틀렸을 가능성이 높음) 새로운 GeForce GTX 480 비디오 카드는 테스트, 품질 모드 및 해상도에 따라 Radeon HD 5870보다 평균 5-15% 더 빠릅니다. 그러나 개별 테스트에서는 더 인상적인 승리와 패배가 모두 있습니다. 따라서 우리의 의견으로는 위의 비디오 카드 성능 테스트 결과 섹션에서 수행한 개별 게임을 고려하는 것이 더 정확하다고 생각합니다. 대체로 GeForce GTX 480이 가장 빠른 단일 프로세서 비디오 카드라는 점을 인정해야 합니다.

반면에, 이 승리는 NVIDIA에게는 너무 큰 대가를 치렀습니다. 우선, 우리는 높은 전력 소비, 과도한 소음 수준 또는 허용할 수 없는 열 발생을 의미하는 것이 아니라 시간을 의미합니다. Radeon HD 5870이 출시된 이후 지나간 시간은 돌이킬 수 없이 사라졌습니다. 오늘날 새로운 상위 ATI/AMD 비디오 카드는 대량으로 판매될 뿐만 아니라 이미 6개의 공식 드라이버 버전이 있는 반면 NVIDIA GeForce GTX 480에는 단일(!) 공식 버전이 없으며 하나만 베타 버전입니다. 테스트. 이러한 새로운 비디오 카드의 늦은 출시는 경쟁사에 비해 성능이 총체적이고 압도적인 우월(+50% 이상)에 의해서만 정당화될 수 있지만 NVIDIA는 현재까지 이를 달성하지 못했습니다.

높은 에너지 소비량, 즉 전력 킬로와트당 가격을 고려할 때 모든 제품(ATI 또는 NVIDIA)을 선호하는 주장은 우스꽝스럽고 심지어 재미있어 보입니다. 높은 소음 수준과 발열 문제는 이미 유명 브랜드에서 발표하기 시작한 대체 냉각 시스템을 설치하여 해결됩니다. NVIDIA는 또한 PhysX 및 CUDA와 같은 일부 에이스를 보유하고 있으며 테셀레이션을 사용하여 DirectX 11을 지원하는 게임에서 경쟁사보다 우월할 것으로 예상됩니다. GeForce 드라이버의 추가 최적화 가능성을 부정하는 사람은 거의 없습니다. 따라서 우리는 새로운 비디오 카드에 대해 알아가는 데에만 국한되지 않고 곧 모든 기능을 계속 연구할 것이라고 확신합니다.

그리고 우리 모두가 잊지 말아야 할 마지막 사실은 건전한 경쟁만이 비디오 카드 및 기타 첨단 제품의 가격을 낮추는 데 도움이 될 수 있다는 것입니다. 따라서 한 제조업체의 부인할 수 없는 리더십은 그 중 한 개에만 이익이 되고, 만약 그렇다면 여러 개에 이익이 됩니다. 예, 음모이지만 확실히 당신과 나는 아닙니다 :-)

감사합니다:
NVIDIA의 러시아 대표 사무소와 개인적으로 Irina Shekhovtsova는
AMD 러시아 대표 사무소 및 개인적으로 Kirill Kochetkov
테스트용으로 제공된 비디오 카드용.

이 주제에 관한 기타 자료


비디오 카드의 전력 소비: 2010년 봄
PhysX가 필요한가요? EVGA GeForce GTX 275 CO-OP PhysX Edition 테스트
Metro 2033 및 최신 비디오 카드

최근에는 공식 NVIDIA 샘플 테스트를 기반으로 한 NVIDIA 및 GTX 470 기반 비디오 카드 시리즈의 첫 번째 프레젠테이션이 큰 호응을 얻었지만 이제 이러한 그래픽 가속기가 매장 진열대에 등장하기 시작했습니다. 물론 샘플과 연속 샘플의 동등성에 대한 음모가 남아 있습니다. 이는 특히 라인의 주력 제품인 NVIDIA 모델에서도 GF100 칩(Fermi 디자인 기반 GPU)의 약간 축소된 버전을 사용하기로 한 제조업체의 결정에 의해 더욱 강화됩니다. 그러나 우리는 모든 것에 대해 순서대로 이야기하려고 노력할 것입니다.

NVIDIA 및 GTX470 GPU(비디오 카드)에 사용되는 Fermi 아키텍처 자체는 2009년 9월에 발표되었으며 불과 6개월 후에 사용자가 그 이점을 활용할 수 있었습니다. GF100 아키텍처 비디오 카드의 공시 가격은 GTX 470의 경우 500달러, AMD의 단일 칩 플래그십보다 약간 높지만 우리 시장에서는 이러한 비디오 카드가 훨씬 더 비쌀 것입니다. TSMC 40nm 공정 기술을 사용하여 GPU를 생산할 때 AMD가 관찰한 문제로 인해 DirectX 11을 지원하는 필요한 수의 고성능 제품을 시장에 제공할 수 없다는 점은 주목할 가치가 있습니다. NVIDIA가 비활성화할 가능성을 고려하면 전체 라인에 대한 GPU의 문제가 있는 부분, "상위" 칩조차도 GF100의 잠재력을 최대한 활용하지 못하므로 GTX470 기반 비디오 카드를 시장에 보다 완벽하게 공급할 수 있기를 바랍니다.

NVIDIA는 Fermi 아키텍처를 핵심 컴퓨팅으로 정의하여 게임에서 3D 그래픽을 가속화하는 GPU의 전통적인 역할을 배경으로 넘겼습니다. Fermi 아키텍처는 성능이 요구되는 시스템에 사용되는 Tesla 컴퓨팅 카드 제품군의 일관된 개발입니다. 이 사실은 오류 수정 메모리(ECC) 지원과 향상된 배정밀도 컴퓨팅 성능으로 확인됩니다. 일부 기술 작업을 병렬로 실행함으로써 얻을 수 있는 잠재적 이익은 엄청나며 NVIDIA는 개발에 투자합니다. 소프트웨어이 성장하는 시장에서 AMD와 Intel에 비해 상당한 우위를 차지했습니다.

엔비디아 페르미(GF100)

새로운 비디오 카드의 계획된 기능은 성능 잠재력을 두 배로 늘릴 것으로 예상되었습니다. 플래그십 모델 GF100의 경우 GTX285와 같은 GT200 기반 그래픽 카드와 비교됩니다. 그러나 이론이 항상 실제 결과로 이어지는 것은 아닙니다.

GF100 칩 자체에는 512개의 CUDA 코어(각각 4개의 스트리밍 멀티프로세서를 포함하고 각각 32개의 CUDA 코어를 포함하는 4개의 그래픽 처리 클러스터)가 있습니다. 그러나 480개의 CUDA 코어만 남았으며 이는 원래 GF100 아키텍처보다 32개 코어가 적은 것입니다. 이러한 단순화는 GF100에서 하나의 SM 멀티프로세서를 비활성화함으로써 이루어졌는데, 이는 충분한 양의 본격적인 그래픽 프로세서를 얻을 수 없기 때문인 것 같습니다.

또한 각 SM 멀티프로세서에는 자체 텍스처 유닛과 PolyMorph 엔진(기하학적 계산에 향상된 성능을 제공하는 고정 기능 논리)도 포함되어 있습니다. 결과적으로 저는 64개의 텍스처 유닛 중 60개와 15개의 PolyMorph 엔진을 얻었습니다.

GPC 클러스터와 독립적인 GF100 파이프라인 부분에서는 NVIDIA에 대한 블록 종료가 없었습니다. 6개의 ROP 섹션은 모두 여기에 남아 있습니다. 각 파티션은 8개의 32비트 정수 픽셀을 동시에 출력할 수 있습니다. 즉, 클럭 사이클당 48개의 픽셀을 얻을 수 있습니다. 모든 ROP 파티션이 포함된 전체 GF100은 384비트 GDDR5 메모리 인터페이스(즉, 파티션당 64비트 인터페이스)를 지원합니다. GPU는 바로 이러한 구성을 지원하며 인터페이스당 256MB의 메모리는 총 1.5GB의 GDDR5 메모리를 제공합니다(포함할 경우 대역폭은 177GB/s입니다). 클럭 주파수 924MHz).

원래 칩의 작동 전력 감소는 모두 NVIDIA에서 사용 가능한 크리스털 생산 문제로 인한 결과입니다. 그러나 하이엔드 가속기 시장에 새로운 솔루션을 도입해야 하는 필요성으로 인해 최소한 삭감을 "버릴" 수밖에 없었습니다. Fermi 아키텍처를 갖춘 GF100 그래픽 프로세서의 하위 버전. 그러나 결과가 무엇이든 간에 그것은 존재하며 테스트하고 설명할 가치가 있습니다.

이 제조업체의 매우 특징적인 상자 디자인을 갖춘 생산 비디오 카드가 우리 테스트 연구소에 도착했습니다.

비디오 카드의 포장은 검정색과 노란색으로 디자인되었습니다. 판지 상자 앞면에는 비디오 카드 모델, 메모리 양, 메모리 유형 및 메모리 버스 대역폭이 표시되어 있습니다. 독점 NVIDIA PhysX 기술 지원과 HDMI 커넥터 존재에 대한 언급도 있습니다. 오른쪽 상단에서 제조업체는 NVIDIA CUDA, NVIDIA PureVideo HD, NVIDIA SLI와 같은 독점 기술 지원에 주목합니다.

상자 뒷면에는 이 비디오 카드의 기능에 대한 간략한 개요가 있습니다. 기술 사용의 이점은 NVIDIA 3D Vision Surround 및 PhysX에 대해 설명되어 있습니다.

내부에는 비디오 카드 자체와 추가 전달 구성 요소가 있습니다. 그래픽 가속기와 함께 다음을 얻을 수 있습니다.

  • 6핀 커넥터 2개에서 8핀 PCI Express 1개로의 비디오 카드 전원 어댑터;
  • MULEX 커넥터 2개에서 6핀 PCI Express 1개로의 비디오 카드 전원 어댑터;
  • DVI에서 VGA로의 어댑터;
  • Mini-HDMI에서 HDMI로의 어댑터;
  • 사용 설명서;
  • 소프트웨어와 드라이버가 포함된 디스크
  • 이 비디오 카드의 모든 새로운 기능을 설명하는 데모 디스크입니다.

패키지에 포함된 전원 어댑터는 사용자가 비디오 카드 연결에 적합한 커넥터와 함께 상당히 강력한 전원 공급 장치를 사용하도록 강요한다는 점에 주목하고 싶습니다. 이로 인해 구성을 선택할 때 몇 가지 문제가 발생할 수 있습니다. 일반적으로 패키지는 최신 시스템 장치에 이 비디오 카드를 설치하는 데 필요한 모든 뉘앙스를 완전히 포함해야 합니다.

인쇄 회로 기판

비디오 카드 자체는 어두운 PCB로 만들어졌으며 앞면은 어두운 플라스틱 케이스가 있는 냉각 시스템으로 덮여 있습니다. 이 비디오 카드는 PCI Express 2.0 x16 버스를 지원하고 DirectX 11 Shader Model 5.0 및 OpenGL 3.2와 호환되며 엔비디아 기술 PureVideo HD 기술, NVIDIA 3D Vision Surround, NVIDIA PhysX 기술, NVIDIA CUDA 기술 및 NVIDIA SLI 기술.

비디오 카드 PCB의 뒷면은 훨씬 더 수수해 보입니다. 여기서는 GPU 전원 시스템 칩인 6단계를 사용하는 CHL8266 PWM 컨트롤러만 주목할 수 있습니다. 각 전력 위상에는 3개의 트랜지스터가 있습니다(상단 암에 1개, 하단 암에 2개). 이 접근 방식을 사용하면 전원 하위 시스템의 요소에서 더 나은 열 제거가 가능합니다. 두 번째 uP6210AG 칩은 NVIDIA GPU 기반의 다른 비디오 카드 독자들에게 이미 잘 알려져 있습니다. 이 비디오 카드의 메모리 칩에 두 단계의 전원을 공급합니다. 따라서 전체적으로 비디오 카드용 6+2페이즈 전원 공급 시스템을 얻게 됩니다.

냉각 시스템을 살펴보면 이 비디오 카드가 "참조" 버전과 완전히 동일하다는 사실을 즉시 알 수 있습니다. 비디오 카드는 Radeon HD 5870의 가속기보다 약 1cm 짧은 267mm(10.5인치) 길이의 회로 기판을 사용하므로 거의 모든 최신 케이스에 적합합니다.

추가 전원을 공급하려면(PCI Express 버스 외에) 6핀 플러그 1개와 8핀 플러그 1개가 필요합니다. NVIDIA는 이러한 카드의 TDP가 250W라고 주장하는데, 이는 PCI-SIG에서 설정한 300W 한도에 거의 맞지 않는 Radeon HD 5970보다 훨씬 적습니다. 따라서 "최고의" 솔루션을 위해 NVIDIA는 600W 이상의 전원 공급 장치를 권장합니다.

보드는 케이스 후면 패널에 있는 두 개의 슬롯을 차지합니다. 충분한 양의 냉각 시스템을 위해서는 사용자가 케이스 내부 공간을 확보해야 합니다.

인터페이스 패널에는 DVI 포트 2개와 미니 HDMI 1개가 포함되어 있습니다. 또한 두 번째 슬롯은 배기 그릴로 완전히 채워져 가열된 공기가 시스템 장치 밖으로 배출됩니다.

냉각 시스템

비디오 카드 냉각 시스템을 자세히 살펴 보겠습니다. 이는 "레퍼런스" 버전을 완전히 복제했으며 NVIDIA 엔지니어는 이를 최대한 효율적으로 만들려고 노력했지만 비디오 카드의 과잉으로 인해 구성 요소의 결과 온도는 여전히 상당히 높은 수준으로 유지됩니다.

5개의 히트 파이프, 추가 방열 케이스 및 터빈 자체의 공기역학적 설계는 전체적으로 인상적이며 최대의 정교함을 자랑합니다. 이는 지금까지 본 모든 참조 설계 중에서 가장 효율적인 냉각 설계임이 분명합니다. 측면 터빈에서 펌핑된 공기는 5개의 구리 튜브가 투과된 알루미늄 라디에이터를 통과하여 하우징 외부로 배출됩니다.

이 디자인의 독특한 특징은 라디에이터 측면 중 하나가 카드 케이스 표면에 직접 위치하여 열 방출을 확실히 향상시키지만 냉각 시스템의 가열이 좋기 때문에 이것을 잡고 있으면 화상을 입을 수 있습니다. 비디오 카드의 일부입니다.

여기서 주목할만한 혁신은 GPU 및 메모리 칩 표면에서 열을 제거하는 추가 방열판입니다. 공통 플레이트는 비디오 카드 보드의 상단 부분을 덮고 있으며 특수 열 인터페이스를 통해 메모리 칩 및 전원 시스템 트랜지스터의 열을 제거합니다.

냉각 시스템 테스트로 넘어 갑시다. 최대 부하에서 GPU 온도는 인상적인 101°C였으며 이는 이 GPU의 임계 온도로 간주되지 않습니다. 동시에 냉각 시스템은 92%로 작동하여 눈에 띄는 소음 수준을 발생시켰습니다.

그리고 유휴 모드(2D 모드)에서 쿨러는 최대 출력의 44%로 작동합니다. 이 모드에서는 일반적인 배경 소음에 대해서도 작업이 눈에 띕니다. 이 비디오 카드에 설치된 냉각 시스템은 일반적인 효율성을 제공하지만 비디오 카드의 GPU 요구 사항으로 인해 허용 가능한 온도를 보장해야 합니다. 냉각 시스템의 소음은 분명히 비디오 카드의 부하에 따라 달라지며 조용하다고 할 수 없습니다.

자, 이제 자세한 연구로 넘어 갑시다 기술적 인 특성비디오 카드. 우선, 주자 간단한 설명테이블 형식으로:

여기에 설치된 NVIDIA GPU에는 GF100-375-A3이라는 라벨이 붙어 있습니다.

비디오 카드의 주파수 다이어그램 및 기타 특성은 다음과 같습니다.

이 샘플은 NVIDIA 가속기 "참조" 버전의 모든 특성을 완전히 복제합니다. ZT-40101-10P의 GPU는 각각 701MHz에서 작동하고 셰이더 도메인은 1401MHz에서 작동합니다. 비디오 메모리는 924MHz 실제 주파수 또는 3696MHz 유효 주파수를 수신했습니다.

테스트한 비디오 카드는 총 용량 1536MB의 SAMSUNG GDDR5 메모리 칩을 사용합니다. K4G10325FE-HC04 표시는 이러한 칩이 0.4ns의 액세스 시간을 제공한다는 것을 나타냅니다. 이는 실제 주파수 1250MHz 또는 5000MHz에 해당하며 오버클럭을 위한 상당한 헤드룸을 제공합니다.

테스트

CPU Intel Core 2 Quad Q9550(LGA775, 2.83GHz, L2 12MB) @3.8GHz
마더보드 NForce 790i-Supreme(LGA775, nForce 790i Ultra SLI, DDR3, ATX)
기가바이트 GA-EP45T-DS3R(LGA775, 인텔 P45, DDR3, ATX)
쿨러 녹투아 NH-U12P(LGA775, 54.33 CFM, 12.6-19.8dB)
Thermalright SI-128(LGA775) + VIZO Starlet UVLED120(62.7 CFM, 31.1 dB)
추가 냉각 VIZO 프로펠러 PCL-201(+1 슬롯, 16.0-28.3 CFM, 20dB)
2x DDR3-1333 1024MB 킹스턴 PC3-10600(KVR1333D3N9/1G)
하드 디스크 Hitachi Deskstar HDS721616PLA380(160GB, 16MB, SATA-300)
전원 공급 장치 Seasonic M12D-850(850W, 120mm, 20dB)
Seasonic SS-650JT(650W, 120mm, 39.1dB)
액자 Spire SwordFin SP9007B(풀 타워) + Coolink SWiF 1202(120x120x25, 53 CFM, 24dB)
감시 장치 삼성 SyncMaster 757MB(DynaFlat, 2048×1536@60Hz, MPR II, TCO'99)

테스트 중에 비디오 카드가 현재까지 가장 강력한 단일 칩 그래픽 가속기로서의 지위를 확인했다는 것이 분명해졌습니다. NVIDIA의 새로운 GPU 제품은 AMD 칩의 경쟁사보다 성능이 조금 더 빠르지만 전력 소비와 작동 온도로 인해 소음이 증가하고 가격표를 보면 확실히 균형 잡힌 GPU라고 할 수는 없습니다. 해결책. 또한 Radeon HD 5970의 듀얼 칩 그래픽 가속기 성능을 능가할 수 있는 NVIDIA 기반 듀얼 칩 버전을 만들 가능성에 대한 의구심이 생깁니다.

오버클러킹

이 비디오 카드의 오버클러킹도 탁월하다고 할 수 없습니다. 칩 자체는 분명히 공칭 주파수보다 느리게 작동하지만 비디오 카드의 메모리를 오버클럭하는 것은 거의 불가능했습니다. 하지만 GPU 자체는 1.05V 전압으로 770MHz까지 오버클럭이 가능했고, 코어 온도는 87℃였다. 하지만 오버클럭 시에는 냉각 시스템 효율 테스트 시와는 비디오 카드의 상태가 다른데, 특히 케이스 측면 패널을 제거하고 비디오 카드 근처에 120mm 팬을 설치해 냉각 상태를 살짝 개선한 점과, 쿨러 자체는 지속적으로 100% 회전 속도로 작동했습니다. 공급 전압을 제어하는 ​​소프트웨어 메커니즘을 갖추고 실험을 계속했습니다. 1.075V를 공급했을 때 GPU는 784MHz까지 오버클럭이 가능했고, 온도는 91℃까지 올라갔다. GPU가 790MHz로 오버클럭되었을 때 가장 좋은 결과는 1.1V에서 달성되었지만 이제 부하 시 온도는 99°C로 증가했습니다.

수동 가속이 성능에 어떤 영향을 미치는지 살펴보겠습니다.

테스트 패키지

표준 주파수

오버클럭된 비디오 카드

생산성 향상, %

3DMark 점수
SM2.0 점수
HDR/SM3.0 점수
성능

Serious Sam 2, 최대 품질, AA4x/AF16x, fps

1600×1200
2048×1536

먹이, 최대 품질, AA4x/AF16x, fps

1600×1200
2048×1536

Call Of Juarez, 최대 품질, AA/AF 없음, fps

1280×1024
1600×1200
2048×1536

Call Of Juarez, 최대 품질, AA4x/AF16x, fps

1280×1024
1600×1200
2048×1536

Crysis, 최대 품질, AA/AF 없음, fps

1280×1024
1600×1200
2048×1536

크라이시스, 최고 품질, AA4x/AF16x, fps

1280×1024
1600×1200
2048×1536

Crysis 탄두, 최고 품질, AA/AF 없음, fps

1280×1024
1600×1200

Crysis 탄두, 최고 품질, AA4x/AF16x, fps

1280×1024
1600×1200

Far Cry 2, 최대 품질, AA/AF 없음, fps

1280×1024
1600×1200
2048×1536

Far Cry 2, 최대 품질, AA4x/AF16x, fps

1280×1024
1600×1200
2048×1536

오버클럭으로 인한 이득은 다소 약하며, 오버클러킹 없이도 비디오 카드의 최대 작동 온도를 고려할 때 GPU의 냉각 효율성을 높이기 위해 열심히 노력해야 하기 때문에 후자의 타당성이 의심스럽습니다. 그리고 공칭 주파수에서도 이 "최고의" 솔루션은 까다로운 사용자에게도 적절한 게임 성능을 쉽게 제공할 수 있습니다.

결과

테스트된 ZT-40101-10P를 포함하여 NVIDIA 그래픽 프로세서 기반 비디오 카드는 매우 생산적인 단일 칩 솔루션인 것으로 나타났습니다. 더욱이, Fermi 아키텍처가 사용된 GF100 GPU에는 처음에 512개의 스트리밍 코어가 있었지만 생산 중에 필요한 칩 수를 확보하는 데 문제가 있었기 때문에 "상위" 비디오 카드는 480개의 코어만 사용했습니다. 그러나 상당히 높은 작동 주파수로 인해 가속기는 Radeon HD 5870을 기반으로 한 경쟁사의 단일 칩 카드보다 일반적으로 더 빠른 것으로 나타났습니다. 하지만 시장 선두주자는 여전히 AMD의 듀얼 칩 솔루션인 Radeon HD 5970입니다.

그러나 NVIDIA GPU의 단일 칩 "상위" 비디오 카드 성능이 AMD 칩의 해당 솔루션보다 우수하다면 전력 소비는 분명히 NVIDIA 카드의 장점이 아닙니다. 물론 많은 매니아들에게는 이것이 선택 기준이 아니지만 어떤 경우에는 에너지 소비의 증가가 전기 요금의 약간의 증가로 이어질뿐만 아니라 이러한 측면에 대해 생각해 볼 가치가 있습니다. 실제로 그래픽 가속기가 소비하는 모든 에너지는 열의 형태로 소산되는데, 이는 첨단 부품의 과열과 고장을 피하기 위해 신속하게 제거해야 하며, 이로 인해 냉각 시스템이 더욱 복잡해지고 성능이 증가하게 됩니다. 소음.

엔비디아 지포스 GTX 480M- Fermi 아키텍처를 기반으로 구축된 최고급 비디오 카드입니다. DirectX 11을 완벽하게 지원하며 TSMC의 40nm 기술을 사용하여 제조됩니다. 352개의 코어로, GTX480M와 비교할 수 있다 GTX465데스크톱 컴퓨터의 경우 주파수가 낮습니다. 지포스 GTX 480M 2GB의 고속 GDDR5 비디오 메모리(개별)가 있으므로 성능은 ATI Mobility Radeon HD 5870 카드 수준이어야 합니다.

GF100으로도 알려진 Fermi 칩은 재설계되어 현재 30억 개의 트랜지스터(모두 512개의 셰이더 포함)를 갖추고 있습니다. 21억 3천만 개의 트랜지스터를 탑재한 데스크톱 HD 5870과 비교하면 모빌리티 라데온 HD 5870 10억 4천만 개의 트랜지스터를 갖춘 (RV870), GTX480M꽤 인상적으로 보입니다.

모바일 Fermi 칩에는 32개의 ROP(래스터화 단위)와 44개의 텍스처 단위(Texture Unit)를 갖춘 최대 352개의 셰이더 코어(1차원)가 포함되어 있습니다. 메모리 버스는 256비트이지만 빠른 GDDR5 메모리 덕분에 문제가 되지 않습니다. 전력 소비량은 MXM 보드 및 2GB GDDR5를 포함하여 100W TDP입니다. AMD는 일반적으로 칩 전력 소비를 별도로 수량화하므로 직접 비교할 수 없습니다. GTX 480M냉각 시스템이 좋은 대형 노트북에만 적합합니다. 처음에는 Clevo만이 17" D901F 및 18" X8100 베어본에 이 카드를 설치하기로 결정했습니다.

성능 엔비디아 지포스 GTX 480M ATI Mobility Radeon HD 5870보다 우수해야 하며, 모바일 시스템지포스 GTX 285M SLI 및 라데온 HD 4770데스크톱 컴퓨터용. 그것은 다음을 의미합니다 GTX480M- 2010년 1분기 단일 비디오 카드 중 가장 빠른 속도를 자랑합니다. 최신 DirectX 10 게임은 우수한 렌더링 및 앤티앨리어싱을 통해 고해상도에서 원활하게 실행되어야 합니다. Crysis Warhead와 같이 매우 까다로운 게임만이 세부 사항을 약간 줄여야 할 수도 있습니다. DirectX 11에 대한 하드웨어 지원(예: 우수한 테셀레이션)으로 인해 Fermi 아키텍처를 기반으로 구축된 비디오 카드는 DirectX 11 게임에서 제대로 작동해야 하며, 그 중 점점 더 많은 게임이 등장할 것입니다.

GeForce 300M 시리즈 비디오 카드와 마찬가지로 지포스 GTX 480M VP4 비디오 프로세서로 PureVideo HD를 지원합니다. 이는 비디오 카드가 H.254, VC-1, MPEG-2 및 MPEG-4 ASP에서 HD 비디오를 완전히 디코딩할 수 있음을 의미합니다. Flash 10.1을 사용하면 그래픽 카드가 Flash 비디오 처리 속도를 높일 수도 있습니다. 코어 엔비디아 지포스 GTX 480M CUDA 또는 DirectCompute를 사용하는 일반 컴퓨팅에 사용할 수 있습니다. 예를 들어, HD 비디오 인코딩은 최신 CPU보다 GPU의 셰이더 코어를 사용하여 훨씬 더 빠르게 수행할 수 있습니다. 모바일 Fermi에서도 지원되는 PhysX를 사용하면 관련 게임(떨어지는 빗방울, 흩어지는 안개 등)의 물리 효과를 계산할 수 있습니다.

데스크탑 그래픽카드에 비해 지포스 GTX 480M오버클럭된 카드와 일치 가능 엔비디아 지포스 GTX 465(주파수 607/1200) 및 라데온 HD 5770.

6개월여 전에 ATI Radeon 5xxx 시리즈 비디오 카드가 비디오 어댑터 시장에 출시되었습니다. 그들은 DirectX 11 및 Shader Model 5.0에 대한 하드웨어 지원, 테셀레이션 및 비디오 게임을 좋아하는 사람들을 위한 기타 다양한 기능을 제공했습니다. 불행하게도(또는 다행스럽게도...) NVIDIA라는 경쟁자가 제때 경쟁자를 제공하지 못했기 때문에 AMD(더 정확하게는 그래픽 칩을 개발하는 ATI 사업부)가 모든 성공의 열매를 거두었습니다. 말 그대로 DirectX 11을 지원하는 비디오 카드로 시장이 "범람"하고 있습니다.

자사 제품 홍보에 인색한 적이 없는 NVIDIA는 이번에도 실망시키지 않았으며, Fermi 마이크로 아키텍처를 기반으로 NVIDIA GF100 개발자의 마스터 테이블에서 부스러기를 의도적으로 공급하여 열광자들에게 음식을 제공했습니다. 우리는 6개월 조금 전에 GF100 칩의 구조에 대한 세부 사항을 처음 들었습니다. 그 이후로 NVIDIA 회사의 비밀 실험실 깊숙한 곳에서 5,000번째 ATI Radeon 비디오 카드 시리즈에 대한 경쟁자가 만들어졌는데, 이는 이전에 약속한 모든 약속을 실제로 이행해야 했습니다. 그래서 기적이 일어났습니다! 한 달 전, 분석가들의 불꽃놀이와 팡파르 속에서 GTX 480과 GTX 470 비디오 카드가 세계 시장에 자유롭게 출시되었습니다. 그들은 “오랜 기다림”에 부응했습니까?

광고하는

NVIDIA GF100의 구조 및 아키텍처

현재 DirectX 11을 지원하는 NVIDIA 비디오 어댑터는 시장에 단 두 개뿐입니다. 이는 새로운 라인의 전체 움직임에 대한 방향을 설정해야 합니다. 가장 높은 카드 이 순간 GTX480이다.

“꿈은 이루어진다...” 이것이 바로 유리 안토노프가 노래한 것 같습니다. 그러나 결과적으로 "그들은 실현되지 않았습니다." GTX 480은 원래 512개의 "고성능 CUDA 코어"를 탑재할 예정이었지만 어떤 이유로 NVIDIA는 계획을 100% 구현할 수 없었습니다. 결과적으로 GTX 480의 프로세서 수가 512개에서 480개로 감소한 것을 확인할 수 있습니다.


무료 프로그램과 유용한 팁의 세계
2024 whatsappss.ru

제조사: 엔비디아
시리즈: 지포스 GTX 400M
암호: 페르미
스트림: 352 - 통일
클록 주파수: 425*MHz
셰이더 주파수: 850*MHz
메모리 주파수: 1200*MHz
메모리 버스 폭: 256비트
메모리 유형: GDDR5
최대 메모리: 2048MB
공통 메모리: 아니요
다이렉트X: DirectX 11, 셰이더 5.0
에너지 소비: 100W
트랜지스터: 30억
기술: 40nm
노트북 크기:
출시일: 25.05.2010