เปรียบเทียบ GTX 480 ตรวจสอบและทดสอบ NVIDIA GTX480 การกำหนดค่าการทดสอบ เครื่องมือ และวิธีการทดสอบ

NVIDIA Geforce GTX 480:

คำอธิบายของการ์ดแสดงผลและผลการทดสอบสังเคราะห์

สมเหตุสมผลที่จะบอกว่าการ์ดต้องใช้พลังงานเพิ่มเติมและมีตัวเชื่อมต่อสองตัวซึ่งหนึ่งในนั้นคือ 8 พินและอีกอันคือ 6 พิน หากไม่มีปัญหากับรุ่นหลังเนื่องจากอุปกรณ์จ่ายไฟสมัยใหม่ทั้งหมดมี "ส่วนท้าย" อยู่แล้วสำหรับแหล่งจ่ายไฟผ่านตัวเชื่อมต่อ 8 พินจึงจำเป็นต้องใช้อะแดปเตอร์พิเศษซึ่งควรมาพร้อมกับการ์ดแสดงผลแบบอนุกรม

ชิปได้รับในสัปดาห์ที่สี่ของปีนี้ซึ่งก็คือปลายเดือนมกราคม

เกี่ยวกับระบบระบายความร้อน

NVIDIA GeForce GTX 480 1536MB PCI-E

โดยพื้นฐานแล้วตัวทำความเย็นไม่แตกต่างจากโซลูชันก่อนหน้าของตระกูล GTX: พัดลมทรงกระบอกจะขับอากาศผ่านหม้อน้ำและขจัดความร้อนออกไปนอกยูนิตระบบ อย่างไรก็ตาม เนื่องจากผลิตภัณฑ์ใหม่ใช้พลังงานมากเกินไป และทำให้เกิดความร้อน CO จึงมีการปรับปรุงในแง่ของการเพิ่มการกระจายความร้อนโดยใช้ท่อความร้อน ดังที่เราเห็นหม้อน้ำส่วนกลางที่มีท่อระบายความร้อนเฉพาะแกนกลางเท่านั้น เมื่อชิปหน่วยความจำถูกระบายความร้อนด้วยแผ่นกดที่อยู่ใต้เคส

อาจเป็นไปได้ว่าความเป็นไปได้ในการค้นหา CO ประเภทนี้หมดลงแล้วเพื่อให้สามารถรับมือกับแกนที่ร้อนมากโดยไม่มีเสียงรบกวน จึงต้องบอกว่า CO มีเสียงดัง แม้ในโหมด 2D ตัวทำความเย็นจะทำงานที่ 44% ของสูงสุด แม้ว่าก่อนหน้านี้ตัวเลขนี้จะอยู่ที่ประมาณ 20-25% ก็ตาม เสียงรบกวนเริ่มหลังจาก 50% ดังนั้นเครื่องทำความเย็นจึงทำงานโดยมีเสียงรบกวนและนี่คือช่วงเวลาที่ไม่ได้ใช้งาน! เราจะพูดอะไรเกี่ยวกับภาระเมื่อ CO เริ่มค่อยๆ เพิ่มความเร็วในการหมุนของกังหันถึงค่าเฉลี่ย 70-80% เมื่อการ์ดทำงานในโหมดสามมิติ

เราทำการศึกษาอุณหภูมิโดยใช้ยูทิลิตี้ EVGA Precision (ผู้เขียน A. Nikolaychuk AKA Unwinder) และได้รับผลลัพธ์ดังต่อไปนี้:

NVIDIA GeForce GTX 480 1536MB PCI-E

และนี่ก็ไม่น่าแปลกใจเพราะความร้อนของแกนถึง 95 องศาและถึงแม้จะได้ตัวเลขที่สูงขนาดนี้ก็สามารถทำได้โดยเสียค่าใช้จ่ายในการดำเนินงานที่มีเสียงดังมากของ CO ดังนั้นผู้ชื่นชอบกราฟิกเกมสามมิติที่ทันสมัยและรวดเร็วที่สุดจะต้องลืมว่าความเงียบคืออะไรเมื่อเล่นเกมหรือการทดสอบใด ๆ แม้แต่ในรูปแบบ 2D เมื่อการ์ดเต็มไปด้วยเนื้อหาที่ซับซ้อนทุกประเภท (เช่น แฟลชหรือวิดีโอ) ตัวทำความเย็นก็ค่อนข้างจะได้ยินอยู่แล้ว

อุปกรณ์.

นี่เป็นผลิตภัณฑ์อ้างอิง ดังนั้นจึงไม่มีชุดอุปกรณ์หรือบรรจุภัณฑ์

ตอนนี้เรามาดูการทดสอบกันดีกว่า ขั้นแรก เราจะแสดงการกำหนดค่าของม้านั่งทดสอบ

การติดตั้งและไดรเวอร์

การกำหนดค่าม้านั่งทดสอบ:

  • ใช้คอมพิวเตอร์เป็นหลัก อินเทลคอร์ CPU I7 920 (ซ็อกเก็ต 1366 LGA)
    • โปรเซสเซอร์ Intel Core I7 CPU 920 (2667 MHz);
    • มาเธอร์บอร์ด Asus P6T Deluxe ที่ใช้ชิปเซ็ต Intel X58;
    • RAM 3 GB DDR3 SDRAM Corsair 1066MHz;
    • ฮาร์ดไดรฟ์ WD คาเวียร์ SE WD1600JD 160GB SATA;
    • พาวเวอร์ซัพพลาย ทากัน TG900-BZ 900W.
  • ระบบปฏิบัติการ Windows 7 32 บิต; DirectX 11;
  • มอนิเตอร์ Dell 3007WFP (30");
  • ไดรเวอร์ ATI เวอร์ชัน CATALYST 10.3; NVIDIA เวอร์ชั่น 197.17.

VSync ถูกปิดใช้งาน

การทดสอบสังเคราะห์

สามารถดาวน์โหลดแพ็คเกจการทดสอบสังเคราะห์ที่เราใช้ได้ที่นี่:

  • D3D RightMark เบต้า 4 (1,050)พร้อมคำอธิบายบนเว็บไซต์ http://3d.rightmark.org
  • การแรเงาพิกเซล D3D RightMark 2 และ D3D RightMark Pixel Shading 3การทดสอบลิงก์ Pixel Shaders เวอร์ชัน 2.0 และ 3.0
  • ไรท์มาร์ค3ดี2.0พร้อมคำอธิบายสั้นๆ: , .

เนื่องจากเราไม่มีการทดสอบ DirectX 11 แบบสังเคราะห์ของเราเอง เราจึงต้องใช้ตัวอย่างจากแพ็คเกจ SDK และโปรแกรมสาธิตต่างๆ อันดับแรก มี HDRToneMappingCS11.exe และ NBodyGravityCS11.exe จาก DirectX SDK (กุมภาพันธ์ 2010)

นอกจากนี้เรายังนำตัวอย่างสองตัวอย่างจากผู้ผลิตทั้งสองราย ได้แก่ Nvidia และ AMD เพื่อไม่ให้ใครอ้างว่ามีอคติ ตัวอย่าง DetailTessellation11.exe และ PNTriangles11.exe นำมาจาก ATI Radeon SDK (โดยวิธีนี้ยังอยู่ใน DX SDK ด้วย) Nvidia นำเสนอโปรแกรมสาธิตสองโปรแกรม ได้แก่ ผมของตัวละครที่สมจริง และภูมิประเทศของน้ำที่สมจริง ซึ่งน่าจะพร้อมให้ดาวน์โหลดบนเว็บไซต์ของบริษัทเร็วๆ นี้

ทำการทดสอบสังเคราะห์กับการ์ดแสดงผลต่อไปนี้:

  • การ์ดจอ GTX480 GTX480)
  • การ์ดจอ GTX295ด้วยพารามิเตอร์มาตรฐาน (เพิ่มเติม GTX295)
  • การ์ดจอ GTX285ด้วยพารามิเตอร์มาตรฐาน (เพิ่มเติม GTX285)
  • เรดออน เอชดี 5970ด้วยพารามิเตอร์มาตรฐาน (เพิ่มเติม เอชดี 5970)
  • เรดออน เอชดี 5870ด้วยพารามิเตอร์มาตรฐาน (เพิ่มเติม เอชดี 5870)

เพื่อเปรียบเทียบผลลัพธ์ของรุ่น Geforce GTX 480 ใหม่ การ์ดแสดงผลเหล่านี้ถูกเลือกด้วยเหตุผลดังต่อไปนี้: Radeon HD 5870 และ HD 5970 เป็นรุ่นชิปเดี่ยวและชิปคู่ที่มีประสิทธิผลมากที่สุดจากบริษัทคู่แข่ง AMD โดยมีราคาใกล้เคียงที่สุด ไปจนถึง GTX 480 ด้วยโซลูชันของ Nvidia ทุกอย่างจะง่ายขึ้นไปอีก: Geforce GTX 285 เป็นการ์ดชิปเดี่ยวที่ทรงพลังที่สุดบน GPU รุ่นที่แล้ว ซึ่งเราจะตัดสินการเปลี่ยนแปลงทางสถาปัตยกรรม และ GTX 295 เป็นการ์ดดูอัลชิปที่ทรงพลังที่สุดจาก Nvidia จนถึง การเปิดตัวโซลูชั่นใหม่

Direct3D 9: การทดสอบการเติมพิกเซล

การทดสอบจะกำหนดประสิทธิภาพการสุ่มตัวอย่างพื้นผิวสูงสุด (อัตรา Texel) ในโหมด FFP สำหรับพื้นผิวจำนวนต่างๆ ที่ใช้กับหนึ่งพิกเซล:

การทดสอบของเราล้าสมัยเล็กน้อยและการ์ดแสดงผลในนั้นไม่ถึงค่าที่เป็นไปได้ในทางทฤษฎี แต่ยังคงแสดงความเร็วพื้นผิวสูงสุดของการ์ดแสดงผลที่สัมพันธ์กันอย่างถูกต้อง ตามปกติผลลัพธ์การสังเคราะห์ไม่ถึงค่าสูงสุด ปรากฎว่า GTX 480 เลือกได้ถึง 40 texels ต่อรอบสัญญาณนาฬิกาจากพื้นผิว 32 บิตพร้อมการกรองแบบไบลิเนียร์ในการทดสอบนี้ซึ่งต่ำกว่าหนึ่งเท่าครึ่งเท่า ตัวเลขทางทฤษฎีของ 60 เท็กซัสที่กรองแล้ว

นี่ไม่เพียงพอที่จะเข้าถึงอย่างน้อย GTX 285 ซึ่งเลือกข้อมูลพื้นผิวเร็วขึ้น 5-7% ไม่ต้องพูดถึงการตามทัน HD 5870 ของคู่แข่ง ซึ่งมีประสิทธิภาพมากกว่าสองเท่าครึ่งในเกือบทุกโหมด โดยตัดสินโดยวัสดุสังเคราะห์ DX9 ของเรา การ์ด Nvidia แบบดูอัลชิปตกเป็นเหยื่อของปัญหาซอฟต์แวร์อย่างชัดเจน แต่ HD 5970 นั้นมีประสิทธิภาพมากกว่า HD 5870 อีกด้วย

ความแตกต่างระหว่าง GTX 480 และ GTX 285 เกือบจะเหมือนกันเสมอ ยกเว้นในกรณีที่พื้นผิวมีจำนวนน้อย ซึ่งข้อจำกัดของแบนด์วิดท์จะมีผลมากกว่า และ HD 5870 ก็ไม่ได้เหนือกว่าในการทดสอบเหล่านี้มากนัก แต่ด้วยพื้นผิว 4-8 พื้นผิว ความแตกต่างจะมีมากขึ้น ซึ่งบ่งบอกถึงการขาดความเร็วของพื้นผิวของ GF100 เพื่อที่จะนำหน้าคู่แข่งในแอปพลิเคชันเกมรุ่นเก่าเสมอ มาดูผลลัพธ์เดียวกันในการทดสอบอัตราการส่งโฆษณา:

การทดสอบสังเคราะห์ครั้งที่สองแสดงอัตราการเติมและเราเห็นสถานการณ์เดียวกันในนั้น แต่คำนึงถึงจำนวนพิกเซลที่เขียนลงในบัฟเฟอร์เฟรม ผลลัพธ์สูงสุดยังคงอยู่กับโซลูชันของ AMD ซึ่งมี TMU จำนวนมากและมีประสิทธิภาพมากกว่าในการบรรลุประสิทธิภาพสูงในการทดสอบสังเคราะห์ของเรา ในกรณีที่มีพื้นผิวซ้อนทับ 0-3 ความแตกต่างระหว่างโซลูชันจะน้อยกว่ามาก ในโหมดดังกล่าว ประสิทธิภาพจะถูกจำกัดโดยแบนด์วิธเป็นอันดับแรก

Direct3D 9: การทดสอบ Pixel Shaders

กลุ่มเชเดอร์พิกเซลกลุ่มแรกที่เรากำลังพิจารณานั้นง่ายมากสำหรับชิปวิดีโอสมัยใหม่ ประกอบด้วยโปรแกรมพิกเซลเวอร์ชันต่างๆ ที่มีความซับซ้อนค่อนข้างต่ำ: 1.1, 1.4 และ 2.0 ซึ่งพบได้ในเกมรุ่นเก่า

การทดสอบนั้นง่ายมากสำหรับสถาปัตยกรรมสมัยใหม่และไม่ได้แสดงความสามารถทั้งหมดของ GPU สมัยใหม่ แต่น่าสนใจสำหรับการประเมินความสมดุลระหว่างตัวอย่างพื้นผิวและการคำนวณทางคณิตศาสตร์ โดยเฉพาะอย่างยิ่งเมื่อเปลี่ยนสถาปัตยกรรมซึ่งเกิดขึ้นในครั้งนี้สำหรับ Nvidia

ในการทดสอบเหล่านี้ ประสิทธิภาพจะถูกจำกัดด้วยความเร็วของโมดูลพื้นผิวเป็นหลัก แต่จะคำนึงถึงประสิทธิภาพของบล็อกและการแคชข้อมูลพื้นผิวในงานจริงด้วย มาดูกันว่าการเปลี่ยนแปลงทางสถาปัตยกรรมส่งผลต่อเราอย่างไรเมื่อเทียบกับ GT200 จะเห็นได้ชัดเจนว่าสถาปัตยกรรมมีการเปลี่ยนแปลงและใหม่ การ์ด GTX 480 ทำงานได้ดีกว่าการ์ดแบบชิปตัวเดียวตามสถาปัตยกรรมรุ่นก่อนหน้า ยิ่งไปกว่านั้น ในการทดสอบส่วนใหญ่ GTX 480 ยังไล่ตาม dual-chip GTX 295 ซึ่งก็ไม่ได้แย่ในตัวเอง

แบนด์วิดธ์หน่วยความจำในการทดสอบเหล่านี้จำกัดโซลูชันใหม่เพียงเล็กน้อยเท่านั้น และความเร็วขึ้นอยู่กับพื้นผิว ซึ่งทำให้การ์ดที่ใช้ GF100 ไม่สามารถทำงานแม้ในระดับ Radeon HD 5870 นับประสาอะไรกับโซลูชันดูอัลชิปของ AMD การ์ดแสดงผลที่ใช้ชิป Nvidia ล้าหลังอย่างเห็นได้ชัดในชุดการทดสอบนี้ ซึ่งเป็นสัญญาณเตือนสำหรับการทดสอบอื่นๆ ของเรา ซึ่งความเร็วของพื้นผิวเป็นสิ่งสำคัญ ลองดูผลลัพธ์ของโปรแกรมพิกเซลระดับกลางที่ค่อนข้างซับซ้อนกว่านี้:

ในการทดสอบ Pixel Shaders เวอร์ชัน 2.a ทุกอย่างจะแย่ลงไปอีกเมื่อเปรียบเทียบกับความเร็วของคู่แข่ง การทดสอบการเรนเดอร์น้ำตามขั้นตอนที่ขึ้นกับพื้นผิวที่ความเร็วสูง "น้ำ" ใช้การสุ่มตัวอย่างที่ขึ้นต่อกันจากพื้นผิวที่ซ้อนกันสูงและแผนที่จะได้รับการจัดอันดับตามความเร็วของพื้นผิวเสมอ แต่จะปรับตามประสิทธิภาพ TMU ที่แตกต่างกัน

การ์ดที่ใช้ชิป RV870 จะแสดงผลลัพธ์สูงสุด แต่ความเร็วของ GTX 480 นั้นอยู่ระหว่างรุ่นชิปเดี่ยวและชิปคู่บน GPU ของสถาปัตยกรรมก่อนหน้า แน่นอนว่ามันอ่อนแอเล็กน้อย แต่อย่างน้อยก็เร็วกว่า GTX 285 ซึ่งบ่งชี้ถึงการใช้ TMU ที่มีอยู่อย่างมีประสิทธิภาพมากขึ้น

ผลลัพธ์ของการทดสอบครั้งที่สองเกือบจะเหมือนกันแม้ว่าจะมีการคำนวณที่เข้มข้นกว่าและเหมาะกับสถาปัตยกรรม AMD ที่มีหน่วยประมวลผลมากกว่าเสมอ โซลูชัน AMD สมัยใหม่ล้ำหน้าไปมาก โดยเฉพาะเวอร์ชันชิปคู่

GTX 480 มีประสิทธิภาพเหนือกว่า GTX 285 เพียง 25% และล่าช้ากว่ารุ่นดูอัลชิปเกือบเท่ากัน สิ่งนี้ชี้ให้เห็นอย่างชัดเจนถึงข้อจำกัดด้านประสิทธิภาพของ GTX 480 เนื่องจากมีจำนวน TMU ต่ำเมื่อเปรียบเทียบกับสถาปัตยกรรมรุ่นต่อไป ความกลัวของเราได้รับการยืนยันในรูปแบบของข้อเสียเปรียบหลักของสถาปัตยกรรม GF100

Direct3D 9: การทดสอบ Pixel Shader Pixel Shaders 2.0

การทดสอบเชเดอร์พิกเซล DirectX 9 เหล่านี้ซับซ้อนกว่าครั้งก่อน ซึ่งใกล้เคียงกับที่เราเห็นในเกมหลายแพลตฟอร์ม และแบ่งออกเป็นสองประเภท เริ่มจากเชเดอร์เวอร์ชัน 2.0 ที่เรียบง่ายกว่า:

  • การทำแผนที่พารัลแลกซ์วิธีการแมปพื้นผิวที่คุ้นเคยกับเกมสมัยใหม่ส่วนใหญ่ ดังอธิบายโดยละเอียดในบทความ
  • แก้วแช่แข็งพื้นผิวกระจกแช่แข็งตามขั้นตอนที่ซับซ้อนพร้อมพารามิเตอร์ควบคุม

เฉดสีเหล่านี้มีสองสายพันธุ์: แบบที่เน้นการคำนวณทางคณิตศาสตร์และแบบที่ต้องการในการสุ่มตัวอย่างค่าจากพื้นผิว ลองพิจารณาตัวเลือกที่เข้มข้นทางคณิตศาสตร์ซึ่งมีแนวโน้มมากกว่าจากมุมมองของการใช้งานในอนาคต:

เป็นการทดสอบสากลที่ขึ้นอยู่กับทั้งความเร็วของหน่วย ALU และความเร็วของพื้นผิว ความสมดุลโดยรวมของชิปเป็นสิ่งสำคัญ จะเห็นได้ว่าประสิทธิภาพของการ์ดแสดงผลในการทดสอบ "Frozen Glass" นั้นไม่เพียงถูกจำกัดด้วยคณิตศาสตร์เท่านั้น แต่ยังรวมถึงความเร็วของตัวอย่างพื้นผิวด้วย สถานการณ์ในนั้นคล้ายกับที่เราเห็นสูงขึ้นเล็กน้อยใน "Cook-Torrance" แต่ GTX 480 ใหม่ในครั้งนี้ใกล้เคียงกับ dual-chip GTX 295 ที่ใช้ GPU ของสถาปัตยกรรม Nvidia เก่ามากขึ้น ในทางกลับกัน แม้แต่ชิปตัวเดียว HD 5870 ก็ยังล้ำหน้าไปมาก

ในการทดสอบครั้งที่สอง "การทำแผนที่พารัลแลกซ์" ผลลัพธ์จะคล้ายกับการทดสอบครั้งก่อนมากอีกครั้ง อย่างไรก็ตาม คราวนี้ HD 5870 ไม่ได้เหนือกว่าการ์ด Nvidia มากเท่ากับในการทดสอบครั้งแรก เราจะได้เห็นกันว่าจะเกิดอะไรขึ้นต่อไป แต่เกมมักจะมีหลายแง่มุมมากกว่าเกมสังเคราะห์ และไม่ได้พึ่งพาการสร้างพื้นผิวเพียงอย่างเดียวอย่างชัดเจน แต่สำหรับงานที่ล้าสมัย จำนวนโมดูลพื้นผิวใน GF100 ยังไม่เพียงพออย่างชัดเจน ลองพิจารณาการทดสอบเดียวกันนี้ ซึ่งมีการปรับเปลี่ยนโดยเน้นตัวอย่างจากพื้นผิวมากกว่าการคำนวณทางคณิตศาสตร์ เพื่อให้มั่นใจในข้อสรุประดับกลางของเราอย่างสมบูรณ์:

ภาพค่อนข้างคล้ายกัน แต่การ์ด AMD รับมือกับตัวอย่างพื้นผิวได้ดีกว่าโดยเฉพาะ dual-chip HD 5970 นั้นดีที่นี่! ฮีโร่ของวันนี้ในรูปแบบของ GTX 480 แสดงผลลัพธ์โดยเฉลี่ยอีกครั้งระหว่าง GTX 285 และ GTX 295 เนื่องจากที่นี่การเน้นประสิทธิภาพความเร็วของหน่วยพื้นผิวจะมองเห็นได้ชัดเจนยิ่งขึ้นและจำนวนใน GF100 ยังคงอยู่ เห็นได้ชัดว่าไม่เพียงพอสำหรับสถาปัตยกรรมกราฟิกอันทรงพลังใหม่

แต่งานเหล่านี้เป็นงานที่ล้าสมัย โดยเน้นไปที่การสร้างพื้นผิว และไม่ซับซ้อนเป็นพิเศษ ตอนนี้เราจะดูผลลัพธ์ของการทดสอบ Pixel Shader อีกสองครั้งเวอร์ชัน 3.0 ซึ่งเป็นการทดสอบ Pixel Shader ที่ซับซ้อนที่สุดของเราสำหรับ Direct3D 9 ซึ่งบ่งบอกถึงเกมพิเศษสมัยใหม่บนพีซีได้มากกว่ามาก การทดสอบแตกต่างกันตรงที่โหลดทั้ง ALU และโมดูลพื้นผิวมากกว่า โปรแกรมเชเดอร์ทั้งสองโปรแกรมมีความซับซ้อนและยาวและมีสาขาจำนวนมาก:

  • การทำแผนที่ Parallax ที่สูงชันเทคนิคการทำแผนที่พารัลแลกซ์เวอร์ชัน "หนัก" มากกว่านั้นได้อธิบายไว้ในบทความด้วย
  • ขนขั้นตอนเชเดอร์ที่ทำให้ขน

ในที่สุด! นี่เป็นเรื่องที่แตกต่างอย่างสิ้นเชิง การทดสอบ PS 3.0 ทั้งสองนั้นซับซ้อนมาก ไม่ได้ขึ้นอยู่กับแบนด์วิดท์หน่วยความจำและพื้นผิวเลย การทดสอบเหล่านี้เป็นการวัดทางคณิตศาสตร์ล้วนๆ แต่มีช่วงการเปลี่ยนภาพและสาขาจำนวนมาก ซึ่งสถาปัตยกรรม GF100 ใหม่ดูเหมือนว่าจะรับมือได้ดีมาก

ในการทดสอบเหล่านี้ GTX 480 แสดงให้เห็นถึงความแข็งแกร่งที่แท้จริงและเหนือกว่าโซลูชันทั้งหมด ยกเว้นดูอัลชิปตัวใหม่จากคู่แข่ง ยิ่งไปกว่านั้น GTX 295 ยังช้ากว่าเกือบสองเท่าในการทดสอบที่ซับซ้อนที่สุดเหล่านี้ และ GTX 285 ก็ช้ากว่าถึงสามเท่าด้วยซ้ำ! ผลลัพธ์ได้รับอิทธิพลอย่างชัดเจนจากการเปลี่ยนแปลงสถาปัตยกรรมของ GPU ใหม่เพื่อปรับปรุงประสิทธิภาพการประมวลผล

ดังนั้น ด้วยสถาปัตยกรรม GF100 ใหม่ เราสังเกตเห็นประสิทธิภาพที่เพิ่มขึ้นอย่างมากในการทดสอบ PS 3.0 ที่ซับซ้อนที่สุด ซึ่งสิ่งที่สำคัญที่สุดไม่ใช่พลังทางคณิตศาสตร์สูงสุดที่โซลูชันของ AMD มี แต่เป็นประสิทธิภาพของการดำเนินการโปรแกรมเชเดอร์ที่ซับซ้อนด้วยการเปลี่ยนภาพและสาขา พลังทางคณิตศาสตร์ที่เพิ่มขึ้นสองเท่าเมื่อเปรียบเทียบกับ GT200 ก็มีผลเช่นกัน ผลลัพธ์ที่ดีมาก เนื่องจากการแซงหน้าโซลูชันสถาปัตยกรรม AMD ซึ่งมีหน่วยประมวลผล ALU จำนวนมากนั้นคุ้มค่ามาก

Direct3D 10: การทดสอบเชเดอร์พิกเซล PS 4.0 (พื้นผิว, ลูป)

RightMark3D เวอร์ชันที่สองรวมการทดสอบ PS 3.0 ที่คุ้นเคยสองครั้งสำหรับ Direct3D 9 ซึ่งเขียนใหม่สำหรับ DirectX 10 รวมถึงการทดสอบใหม่อีกสองครั้ง คู่แรกเพิ่มความสามารถในการเปิดใช้งานการสุ่มตัวอย่างเงาด้วยตนเองและการสุ่มตัวอย่างเชเดอร์ ซึ่งจะเพิ่มภาระให้กับชิปวิดีโอเพิ่มเติม

การทดสอบเหล่านี้จะวัดประสิทธิภาพของตัวเชเดอร์พิกเซลที่ทำงานเป็นรอบ โดยมีตัวอย่างพื้นผิวจำนวนมาก (ในโหมดที่หนักที่สุด มากถึงหลายร้อยตัวอย่างต่อพิกเซล) และโหลด ALU ที่ค่อนข้างน้อย กล่าวอีกนัยหนึ่งคือวัดความเร็วของตัวอย่างพื้นผิวและประสิทธิภาพของกิ่งก้านในเฉดสีพิกเซล

การทดสอบพิกเซลเชเดอร์ครั้งแรกจะเป็น Fur อย่างมากที่สุด การตั้งค่าต่ำโดยจะใช้ตัวอย่างพื้นผิว 15 ถึง 30 ตัวอย่างจากแผนที่ความสูง และอีก 2 ตัวอย่างจากพื้นผิวหลัก โหมดรายละเอียดเอฟเฟ็กต์ "สูง" จะเพิ่มจำนวนตัวอย่างเป็น 40-80 รวมถึงการรวมการสุ่มตัวอย่างแบบ "เชเดอร์" สูงสุดถึง 60-120 ตัวอย่าง และโหมด "สูง" ร่วมกับ SSAA มีลักษณะเฉพาะคือ "ความหนักเบา" สูงสุดตั้งแต่ 160 ถึง 320 ตัวอย่างจากแผนที่ความสูง

ก่อนอื่น มาตรวจสอบโหมดที่ไม่เปิดใช้งานการสุ่มตัวอย่างขั้นสูงกันก่อน ซึ่งค่อนข้างง่ายและอัตราส่วนของผลลัพธ์ในโหมด "ต่ำ" และ "สูง" ควรใกล้เคียงกันโดยประมาณ

ประสิทธิภาพในการทดสอบนี้ขึ้นอยู่กับทั้งจำนวนและประสิทธิภาพของบล็อก TMU และอัตราการเติมพร้อมแบนด์วิดท์ในระดับที่น้อยกว่า ผลลัพธ์ใน "สูง" จะต่ำกว่า "ต่ำ" ประมาณหนึ่งเท่าครึ่งตามที่ควรจะเป็นตามทฤษฎี ในการทดสอบ Direct3D 10 ของการเรนเดอร์ขนสัตว์ตามขั้นตอนด้วยตัวอย่างพื้นผิวจำนวนมาก โซลูชันของ Nvidia นั้นแข็งแกร่งแบบดั้งเดิม แต่สถาปัตยกรรม AMD ล่าสุดนั้นใกล้เคียงกันแล้ว

GTX 480 เร็วกว่า GTX 285 เกือบหนึ่งในสาม แต่ยังขาด GTX 295 ซึ่งเราเห็นในการทดสอบ DX9 ด้วย สิ่งนี้พูดถึงอิทธิพลของอัตราการเติมและแบนด์วิดท์หน่วยความจำมากขึ้น โดยที่โซลูชัน Nvidia ใหม่มีข้อได้เปรียบเหนือการ์ดชิปตัวเดียวของซีรีย์ก่อนหน้า ความเร็วของ GF100 นั้นใกล้เคียงกับการ์ดทั้งสองใบที่ใช้ RV870 โดยประมาณ ลองดูผลลัพธ์ของการทดสอบเดียวกัน แต่เมื่อเปิดใช้งานการสุ่มตัวอย่างเชเดอร์ซุปเปอร์ซึ่งจะเพิ่มงานสี่เท่าบางทีในสถานการณ์นี้อาจมีบางอย่างเปลี่ยนแปลงและแบนด์วิดท์หน่วยความจำที่มีอัตราการเติมจะมีผลน้อยลง:

การเปิดใช้งานการสุ่มตัวอย่างแบบพิเศษจะเพิ่มภาระงานขึ้นสี่เท่าตามทฤษฎี และคราวนี้ GeForce GTX 480 สูญเสียพื้นที่ไปอย่างผิดปกติพอสมควร และ Radeon ทั้งสองก็แข็งแกร่งขึ้นเล็กน้อย ความแตกต่างระหว่าง GTX 480 และ GTX 285 นั้นน้อยมาก ซึ่งส่วนใหญ่บ่งบอกถึงการเน้นที่การสร้างพื้นผิว หรือแบนด์วิธซึ่งไม่ได้เพิ่มขึ้นมากเกินไปสำหรับ GTX 480 เมื่อเทียบกับ GTX 285 ผลกระทบของประสิทธิภาพของ ALU และการดำเนินการสาขาที่มีประสิทธิภาพไม่สามารถมองเห็นได้ชัดเจนในการทดสอบนี้

การทดสอบครั้งที่สอง ซึ่งวัดประสิทธิภาพของเชเดอร์พิกเซลที่ซับซ้อนพร้อมลูปที่มีตัวอย่างพื้นผิวจำนวนมาก เรียกว่า Steep Parallax Mapping ที่การตั้งค่าต่ำ จะใช้ตัวอย่างพื้นผิว 10 ถึง 50 ตัวอย่างจากแผนผังความสูง และตัวอย่างสามตัวอย่างจากพื้นผิวหลัก เมื่อคุณเปิดใช้งานโหมดหนักพร้อมการแชโดว์ด้วยตนเอง จำนวนตัวอย่างจะเพิ่มเป็นสองเท่า และการสุ่มตัวอย่างซ้อนจะเพิ่มเป็นสี่เท่าของจำนวนนี้ โหมดทดสอบที่ซับซ้อนที่สุดพร้อมการสุ่มตัวอย่างพิเศษและการสร้างเงาด้วยตนเองจะเลือกค่าพื้นผิวตั้งแต่ 80 ถึง 400 ค่า ซึ่งมากกว่าโหมดธรรมดาถึงแปดเท่า ขั้นแรก เรามาตรวจสอบตัวเลือกง่ายๆ ที่ไม่มีการสุ่มตัวอย่างเกิน:

การทดสอบนี้น่าสนใจกว่าจากมุมมองเชิงปฏิบัติ เนื่องจากมีการใช้การแมปพารัลแลกซ์ที่หลากหลายในเกมมาเป็นเวลานาน และเวอร์ชันที่หนักหน่วง เช่น การทำแผนที่พารัลแลกซ์ที่สูงชันของเรา ก็ถูกนำมาใช้ในหลายโปรเจ็กต์ เช่น ใน Crysis และ Lost ดาวเคราะห์. นอกจากนี้ ในการทดสอบของเรา นอกเหนือจากการสุ่มตัวอย่างพิเศษแล้ว คุณยังสามารถเปิดใช้งานการสร้างเงาด้วยตนเอง ซึ่งเพิ่มภาระบนชิปวิดีโอประมาณสองเท่า โหมดนี้เรียกว่า "สูง"

แผนภาพจะทำซ้ำแผนภาพก่อนหน้าเกือบทั้งหมด โดยแสดงผลลัพธ์ที่คล้ายคลึงกันแม้จะเป็นจำนวนสัมบูรณ์ก็ตาม ในการทดสอบเวอร์ชัน D3D10 ที่อัปเดตโดยไม่มีการสุ่มตัวอย่างพิเศษ GTX 480 สามารถรับมือกับงานได้ดีกว่าชิปตัวบนสุดของรุ่นก่อนเล็กน้อย แต่ล่าช้ากว่าการ์ดดูอัลชิป GTX 295 นอกจากนี้การ์ดวิดีโอ GF100 ใหม่ นำหน้าคู่แข่งเล็กน้อย HD 5870 ซึ่งเป็นเวอร์ชันดูอัลชิปซึ่งกลายเป็นผู้ชนะในแง่ที่แน่นอน

มาดูกันว่าการเปิด supersampling จะสร้างความแตกต่างได้อย่างไร โดยจะทำให้การ์ด Nvidia ความเร็วลดลงเล็กน้อยมากขึ้นเสมอ

เมื่อเปิดใช้งาน Supersampling และ Self-Shading งานจะยากขึ้น การเปิดใช้งานทั้งสองตัวเลือกร่วมกันจะเพิ่มภาระบนการ์ดเกือบแปดเท่า ส่งผลให้ประสิทธิภาพลดลงอย่างมาก ความแตกต่างระหว่างตัวบ่งชี้ความเร็วของการ์ดแสดงผลหลายตัวมีการเปลี่ยนแปลงการรวมการสุ่มตัวอย่างแบบพิเศษมีผลเช่นเดียวกับในกรณีก่อนหน้า - การ์ด AMD ได้ปรับปรุงประสิทธิภาพอย่างชัดเจนเมื่อเปรียบเทียบกับโซลูชัน Nvidia

การ์ดดูอัลชิปทั้งสองยังคงนำหน้า GTX 480 แต่คราวนี้โซลูชันใหม่นั้นตามหลังคู่แข่งโดยตรงอย่าง HD 5870 เล็กน้อย ดูเหมือนว่านี่จะเป็นกรณีนี้ในการทดสอบการเล่นเกม - ในบางสถานที่ GTX 480 จะอยู่ข้างหน้าไกล และในส่วนอื่นก็จะล้าหลังเล็กน้อย อย่างไรก็ตาม การ์ดใน GF100 อย่างน้อยก็มีประสิทธิภาพเหนือกว่ารุ่นก่อนอย่างเห็นได้ชัดในโหมดใช้งานง่ายและเพียงเล็กน้อยในโหมดหนัก การเปลี่ยนแปลงทางสถาปัตยกรรมใน GPU ใหม่ของ Nvidia ไม่ได้ให้ประโยชน์มากนักในการทดสอบเหล่านี้

Direct3D 10: การทดสอบ Pixel Shader ของ PS 4.0 (คำนวณ)

การทดสอบ Pixel Shader ครั้งต่อไปมีจำนวนการดึงพื้นผิวขั้นต่ำเพื่อลดผลกระทบด้านประสิทธิภาพของหน่วย TMU พวกเขาใช้การดำเนินการทางคณิตศาสตร์จำนวนมากและวัดประสิทธิภาพทางคณิตศาสตร์ของชิปวิดีโออย่างแม่นยำ ความเร็วของการดำเนินการตามคำสั่งทางคณิตศาสตร์ใน Pixel Shader

การทดสอบคณิตศาสตร์ครั้งแรกแร่ นี่คือการทดสอบพื้นผิวตามขั้นตอนที่ซับซ้อนซึ่งใช้ข้อมูลพื้นผิวเพียงสองตัวอย่างและคำสั่ง 65 sin และ cos

แต่ในการทดสอบทางคณิตศาสตร์ เราควรเห็นการเปลี่ยนแปลงครั้งใหญ่ เนื่องจาก GF100 GPU มีคุณสมบัติ ALU สองเท่าของ GT200 อย่างไรก็ตาม ตามทฤษฎีแล้ว โซลูชันของ AMD ควรเร็วกว่านี้ในการทดสอบสังเคราะห์ของเรา เนื่องจากในงานที่ซับซ้อนในการคำนวณ สถาปัตยกรรม AMD สมัยใหม่มีข้อได้เปรียบเหนือคู่แข่งจาก Nvidia อย่างชัดเจน สถานการณ์ได้รับการยืนยันในครั้งนี้เช่นกัน แม้ว่าบอร์ด GTX 480 ใหม่จะลดช่องว่างระหว่างการ์ด Nvidia และ AMD ให้แคบลง แต่ก็ยังมากกว่าหนึ่งเท่าครึ่ง

แต่การเปรียบเทียบกับ GTX 285 และ GTX 295 กลับกลายเป็นสิ่งที่น่าสนใจ คราวนี้ Nvidia ล้มเหลวในการบรรลุความแตกต่างสองเท่าจากการ์ดชิปตัวเดียวรุ่นก่อนหน้าหรือแซงหน้าการ์ดชิปคู่ตัวเก่าของรุ่นก่อนหน้า ข้อสรุปได้รับการยืนยันแล้วว่าการทดสอบนี้ไม่ได้ขึ้นอยู่กับความเร็วของ ALU อย่างสมบูรณ์ แต่ผลลัพธ์ไม่สามารถนำมาประกอบกับความแตกต่างของแบนด์วิธได้ GF100 เพิ่มขึ้นเพียง 38% เมื่อเทียบกับ GTX 285 ซึ่งแปลกมากและเล็กมากอย่างที่เราคิด

มาดูการทดสอบการคำนวณเชเดอร์ที่สองซึ่งเรียกว่าไฟ มันหนักกว่าสำหรับ ALU และมีการดึงพื้นผิวเพียงอันเดียว และจำนวนคำสั่ง sin และ cos เพิ่มขึ้นสองเท่าเป็น 130 มาดูกันว่ามีอะไรเปลี่ยนแปลงไปเมื่อโหลดเพิ่มขึ้น:

ในการทดสอบครั้งที่สอง ความเร็วในการเรนเดอร์ถูกจำกัดโดยประสิทธิภาพของหน่วยเชเดอร์เกือบทั้งหมด แต่ความแตกต่างระหว่าง GTX 285 และ GTX 480 ยังคงน้อยเกินไป - เพียง 58% แม้ว่าในทางทฤษฎีแล้วควรจะใกล้เคียงกับความแตกต่างสองเท่าก็ตาม แต่อย่างน้อยโซลูชันใหม่ก็ทันกับ dual-chip GTX 295 ซึ่งแตกต่างจากการทดสอบครั้งก่อน อย่างไรก็ตาม คู่แข่งเช่น Radeon HD 5870 และยิ่งกว่านั้น HD 5970 จะแสดงความเร็วที่สูงกว่ามากในการทดสอบนี้

มาสรุปแบบทดสอบคณิตศาสตร์ D3D10 กันดีกว่า การ์ดแสดงผล Nvidia ทั้งหมดยังตามหลังอยู่มาก แม้แต่ GF100 ใหม่ก็ยังช้ากว่าคู่แข่งเกือบสองเท่าในด้านงานสังเคราะห์ระดับสูงสุด! และทั้งหมดนี้แม้ว่าตามทฤษฎีแล้ว GTX 480 จะเร็วกว่า GTX 285 รุ่นชิปเดี่ยวเกือบสองเท่าก็ตาม ความเป็นจริงแสดงให้เห็นตัวเลขที่ต่ำกว่ามากและเป็นไปไม่ได้ที่จะเข้าใกล้การ์ด AMD โดยใช้การทดสอบทางคณิตศาสตร์อย่างง่ายจาก Nvidia

โดยทั่วไปแล้วผลลัพธ์ของการคำนวณทางคณิตศาสตร์ขั้นสูงยังคงไม่เปลี่ยนแปลงในเวลานี้เช่นกันมีข้อได้เปรียบที่ชัดเจนและปฏิเสธไม่ได้ของโซลูชันของ AMD ซึ่งไม่ได้เปลี่ยนเอาต์พุตของสาย GTX 400 ลองดูผลการทดสอบเชเดอร์เรขาคณิตซึ่งเป็นที่ที่ใหม่ วิธีแก้ปัญหาควรจะแข็งแกร่งกว่าสิ่งอื่นใด

Direct3D 10: การทดสอบเชเดอร์เรขาคณิต

แพ็คเกจ RightMark3D 2.0 มีการทดสอบความเร็วเชเดอร์เรขาคณิตสองครั้ง ตัวเลือกแรกเรียกว่า “Galaxy” ซึ่งเป็นเทคนิคที่คล้ายกับ “point sprite” จาก Direct3D เวอร์ชันก่อนหน้า มันทำให้ระบบอนุภาคบน GPU เคลื่อนไหว โดยตัวเชดเดอร์เรขาคณิตจากแต่ละจุดจะสร้างจุดยอดสี่อันที่ก่อตัวเป็นอนุภาค อัลกอริธึมที่คล้ายกันควรใช้กันอย่างแพร่หลายในเกม DirectX 10 ในอนาคต

การเปลี่ยนสมดุลในการทดสอบเชเดอร์เรขาคณิตไม่ส่งผลต่อผลลัพธ์การเรนเดอร์ขั้นสุดท้าย ภาพสุดท้ายจะเหมือนกันทุกประการ มีเพียงวิธีการประมวลผลฉากเท่านั้นที่เปลี่ยนแปลง พารามิเตอร์ "โหลด GS" จะกำหนดว่าการคำนวณจะใช้เชเดอร์ใด: จุดยอดหรือเรขาคณิต จำนวนการคำนวณจะเท่ากันเสมอ

มาดูการทดสอบ Galaxy เวอร์ชันแรก ซึ่งมีการคำนวณในจุดยอดเชเดอร์สำหรับความซับซ้อนทางเรขาคณิตสามระดับ:

อัตราส่วนของความเร็วสำหรับความซับซ้อนทางเรขาคณิตที่แตกต่างกันของฉากจะเท่ากันโดยประมาณสำหรับโซลูชันทั้งหมด ประสิทธิภาพสอดคล้องกับจำนวนคะแนน โดยแต่ละขั้นตอน FPS จะลดลงประมาณสองเท่า งานสำหรับการ์ดแสดงผลสมัยใหม่นั้นไม่ได้ยากเป็นพิเศษ และประสิทธิภาพโดยทั่วไปจะถูกจำกัดด้วยความเร็วของการประมวลผลทางเรขาคณิต และไม่ถูกจำกัดโดยแบนด์วิดท์หน่วยความจำ

นี่คือจุดที่ GPU ใหม่แสดงให้เห็นถึงความแข็งแกร่งที่แท้จริง Geforce GTX 480 ในทุกโหมดแสดงผลลัพธ์ที่ใกล้เคียงกับโซลูชันดูอัลชิปของคู่แข่ง ซึ่งเร็วกว่าทั้ง HD 5870 และการ์ดดูอัลชิปที่ใช้ GT200 ถึงหนึ่งเท่าครึ่ง ผลลัพธ์ดีเยี่ยม! ตามที่คาดไว้ การใช้เชเดอร์เรขาคณิตของ GF100 นั้นมีประสิทธิภาพมาก เร็วกว่า GT200 ประมาณ 2.5 เท่า มาดูกันว่าสถานการณ์เปลี่ยนไปหรือไม่เมื่อเราถ่ายโอนการคำนวณบางส่วนไปยังเชเดอร์เรขาคณิต:

ไม่ ตัวเลขไม่ได้เปลี่ยนแปลงมากนักเมื่อโหลดเปลี่ยนไปในการทดสอบนี้ การ์ดทั้งหมดในการทดสอบนี้ไม่สังเกตเห็นการเปลี่ยนแปลงในพารามิเตอร์โหลด GS ซึ่งมีหน้าที่ถ่ายโอนส่วนหนึ่งของการคำนวณไปยังเชเดอร์เรขาคณิต และแสดงผลลัพธ์ที่คล้ายกับแผนภาพก่อนหน้า มาดูกันว่าอะไรจะเปลี่ยนแปลงไปในการทดสอบครั้งต่อไป ซึ่งถือว่ามีภาระหนักมากในเชเดอร์เรขาคณิต

“ไฮเปอร์ไลท์” คือการทดสอบครั้งที่สองของเชเดอร์เรขาคณิต ซึ่งสาธิตการใช้เทคนิคหลายอย่างพร้อมกัน: การสร้างอินสแตนซ์ สตรีมเอาท์พุต โหลดบัฟเฟอร์ มันใช้ การสร้างแบบไดนามิกเรขาคณิตโดยการวาดลงในบัฟเฟอร์สองตัวเช่นกัน โอกาสใหม่เอาต์พุตสตรีม Direct3D 10 เชเดอร์แรกจะสร้างทิศทางของรังสี ความเร็วและทิศทางของการเจริญเติบโต ข้อมูลนี้จะถูกวางไว้ในบัฟเฟอร์ ซึ่งเชเดอร์ที่สองใช้สำหรับการวาดภาพ สำหรับแต่ละจุดของรังสี จุดยอด 14 จุดจะถูกสร้างขึ้นเป็นวงกลม รวมมากถึงหนึ่งล้านจุดเอาท์พุต

โปรแกรมเชเดอร์ประเภทใหม่ใช้เพื่อสร้าง "รังสี" และตั้งค่าพารามิเตอร์ "โหลด GS" เป็น "หนัก" เพื่อวาดรังสีด้วย นั่นคือในโหมด "สมดุล" เชเดอร์เรขาคณิตจะใช้เพื่อสร้างและ "ขยาย" รังสีเท่านั้น เอาต์พุตจะดำเนินการโดยใช้ "การสร้างอินสแตนซ์" และในโหมด "หนัก" เชเดอร์เรขาคณิตจะเกี่ยวข้องกับเอาต์พุตด้วย ก่อนอื่นเรามาดูที่โหมดง่าย:

การกำหนดค่าชิปคู่ทั้งสองดำเนินการตามปกติในการทดสอบนี้ GeForce GTX 295 และ Radeon HD 5970 เห็นได้ชัดว่าการทดสอบนี้เข้ากันไม่ได้กับวิธีการเรนเดอร์ AFR หลายชิปเลย มิฉะนั้น ผลลัพธ์สัมพัทธ์ในโหมดต่างๆ จะสอดคล้องกับโหลด ในทุกกรณี ประสิทธิภาพจะปรับขนาดได้ดีและใกล้เคียงกับพารามิเตอร์ทางทฤษฎี ซึ่ง "การนับรูปหลายเหลี่ยม" แต่ละระดับต่อมาควรจะช้ากว่าสองเท่า

ในการทดสอบนี้ ประสิทธิภาพของ GeForce GTX 480 ใหม่จะเร็วกว่า Radeon HD 5870 เพียงเล็กน้อยในโหมดฮาร์ดเท่านั้น แต่ในโหมดง่ายจะสังเกตเห็นความแตกต่างได้ชัดเจนกว่า โดยทั่วไปแล้วการเปรียบเทียบ GTX 480 กับ GTX 285 ที่ใช้ GPU รุ่นก่อนหน้านั้นไร้สาระ ชิปวิดีโอใหม่นั้นเร็วขึ้นประมาณสองเท่า

ตัวเลขควรเปลี่ยนแปลงในแผนภาพถัดไป ในการทดสอบที่มีการใช้งานเชเดอร์เรขาคณิตมากขึ้น การเปรียบเทียบผลลัพธ์ที่ได้รับในโหมด "สมดุล" และ "หนัก" ซึ่งกันและกันจะน่าสนใจเช่นกัน

ถึงเวลาที่ต้องประหลาดใจอีกครั้งกับความสามารถในการประมวลผลทางเรขาคณิตของ GF100 และความเร็วในการดำเนินการเชเดอร์เรขาคณิต นี่เป็นผลลัพธ์ที่ทำให้เกิดการเปลี่ยนแปลงทั่วโลกกับไปป์ไลน์กราฟิก GF100 แม้ว่าประสิทธิภาพของเชเดอร์เรขาคณิตจะได้รับการปรับปรุงอย่างดีทั้งใน GT200 และ RV870 แต่ GF100 ก็ฉีกออกเป็นชิ้นๆ ในงานนี้

GTX 480 ใหม่นั้นเร็วกว่าเกือบสองเท่าในการทดสอบนี้เท่ากับ Radeon HD 5870 และเร็วกว่า GTX 285 รุ่นก่อนถึง 2.75 เท่า วิศวกรของ Nvidia พยายามปรับปรุงประสิทธิภาพของสถาปัตยกรรมการประมวลผลเรขาคณิตรุ่นก่อนหน้า และพวกเขา ประสบความสำเร็จอย่างชัดเจน โซลูชันก่อนหน้านี้ทั้งหมดไม่สามารถดำเนินการเชเดอร์เรขาคณิตได้อย่างมีประสิทธิภาพ จะเกิดอะไรขึ้นในการทดสอบเทสเซลเลชัน ซึ่งน่าจะแสดงให้เห็นความแตกต่างที่ยิ่งใหญ่กว่านี้ตามทฤษฎี? แต่อย่ามองไปข้างหน้าไกลเกินไป

Direct3D 10: ความเร็วในการดึงพื้นผิวจากเชเดอร์จุดสุดยอด

การทดสอบการดึงพื้นผิวของ Vertex จะวัดความเร็วของการดึงพื้นผิวจำนวนมากจากเชเดอร์จุดสุดยอด การทดสอบมีสาระสำคัญคล้ายคลึงกัน และอัตราส่วนระหว่างผลลัพธ์ของการ์ดในการทดสอบ "Earth" และ "Waves" ควรใกล้เคียงกันโดยประมาณ การทดสอบทั้งสองขึ้นอยู่กับข้อมูลการสุ่มตัวอย่างพื้นผิว ข้อแตกต่างที่สำคัญเพียงอย่างเดียวคือการทดสอบ Waves ใช้การแยกเงื่อนไข ในขณะที่การทดสอบ Earth ไม่มี

มาดูการทดสอบ "Earth" ครั้งแรกกัน อันดับแรกในโหมด "รายละเอียดเอฟเฟกต์ต่ำ":

การวิจัยก่อนหน้านี้แสดงให้เห็นว่าผลลัพธ์ของการทดสอบนี้ได้รับผลกระทบจากทั้งความเร็วของพื้นผิวและแบนด์วิดท์หน่วยความจำ แต่ความแตกต่างระหว่างวิธีแก้ปัญหานั้นน้อยมาก GTX 480 แสดงผลลัพธ์ที่คล้ายคลึงกับ dual-chip GTX 295 ซึ่งเหนือกว่า HD 5870 เล็กน้อย แต่ค่อนข้างด้อยกว่าเล็กน้อยในทุกโหมดสำหรับการ์ดที่ทรงพลังที่สุดในการทดสอบนี้ Radeon HD 5970 ผลลัพธ์ที่ได้นั้นแปลกอย่างเห็นได้ชัด ... มาดูประสิทธิภาพในการทดสอบเดียวกันกับจำนวนตัวอย่างพื้นผิวที่เพิ่มขึ้นกัน :

ตำแหน่งสัมพัทธ์ของไพ่บนแผนภาพมีการเปลี่ยนแปลงเล็กน้อย ซึ่งเห็นได้จากตัวบ่งชี้ที่แย่กว่าเล็กน้อยของไพ่เกือบทั้งหมด ยกเว้น GTX 480 ที่เรากำลังพิจารณาในวันนี้ แทบไม่สูญเสียประสิทธิภาพเลยเมื่อเทียบกับการทดสอบเดียวกันในสภาพแสง นี่คือความหมาย: เพิ่มประสิทธิภาพของโมดูลพื้นผิวและโดยเฉพาะอย่างยิ่งระบบย่อยแคช ขณะนี้ การ์ด GF100 ใหม่เป็นการ์ดที่เร็วที่สุดในการนับรูปหลายเหลี่ยมปานกลางและสูง และเทียบเท่ากับการ์ดแบบชิปคู่ในโหมดที่ง่ายที่สุด

มาดูผลลัพธ์ของการทดสอบการดึงพื้นผิวครั้งที่สองจากเชเดอร์จุดยอด การทดสอบ Waves มีจำนวนตัวอย่างน้อยกว่า แต่ใช้การข้ามแบบมีเงื่อนไข จำนวนตัวอย่างพื้นผิวไบลิเนียร์ในกรณีนี้คือมากถึง 14 (“รายละเอียดเอฟเฟกต์ต่ำ”) หรือมากถึง 24 (“รายละเอียดเอฟเฟกต์สูง”) ต่อจุดยอด ความซับซ้อนของรูปทรงเรขาคณิตเปลี่ยนแปลงไปคล้ายกับการทดสอบครั้งก่อน

สิ่งที่น่าสนใจคือผลลัพธ์ในการทดสอบ Waves นั้นไม่เหมือนกับที่เราเห็นในแผนภูมิก่อนหน้า ข้อดีของผลิตภัณฑ์ AMD เพิ่มขึ้นบ้างและตอนนี้ GTX 480 แสดงประสิทธิภาพที่คล้ายคลึงกับ HD 5870 และ GeForce GTX 295 ซึ่งแพ้คู่แข่งเล็กน้อยในโหมดหนัก โซลูชัน Nvidia ระดับบนสุดก่อนหน้านี้บนชิปตัวเดียวถูกทิ้งไว้ข้างหลัง แต่รุ่นใหม่ของตระกูล GeForce GTX 400 นั้นเหนือกว่าแม้ว่าจะไม่มากนักก็ตาม ลองพิจารณาการทดสอบเดียวกันเวอร์ชันที่สอง:

แทบจะไม่มีการเปลี่ยนแปลงเลย แม้ว่าเงื่อนไขจะมีความซับซ้อนมากขึ้น แต่ผลลัพธ์ของ Nvidia GPU ล่าสุดในการทดสอบตัวอย่างจุดสุดยอดที่สองก็ดีขึ้นเล็กน้อยเมื่อเทียบกับความเร็วของการ์ดแสดงผล AMD มีข้อได้เปรียบเหนือ HD 5870 แม้ว่าจะมีขนาดเล็กและการ์ดชิปตัวเดียวใหม่ที่รับมือกับ GeForce GTX 295 ยกเว้นโหมดที่ง่ายที่สุด

3DMark Vantage: การทดสอบคุณสมบัติ

ใน รีวิวนี้เราได้ตัดสินใจอีกครั้งที่จะรวมการวัดประสิทธิภาพสังเคราะห์จากชุด 3DMark Vantage แม้ว่าแพ็คเกจจะไม่ใช่ของใหม่อีกต่อไป แต่การทดสอบคุณสมบัตินั้นรองรับ D3D10 และน่าสนใจเนื่องจากแตกต่างจากของเรา เมื่อวิเคราะห์ผลลัพธ์ของโซลูชัน Nvidia ใหม่ในแพ็คเกจนี้ เราจะสามารถสรุปข้อสรุปใหม่และมีประโยชน์ซึ่งซ่อนเร้นอยู่ในกลุ่มการทดสอบ RightMark

การทดสอบคุณสมบัติ 2: การเติมสี

การทดสอบอัตราการเติม ใช้ตัวเชเดอร์พิกเซลที่เรียบง่ายซึ่งไม่จำกัดประสิทธิภาพ ค่าสีที่สอดแทรกจะถูกเขียนไปยังบัฟเฟอร์นอกหน้าจอ (เป้าหมายการเรนเดอร์) โดยใช้การผสมอัลฟ่า มีการใช้บัฟเฟอร์นอกจอ 16 บิตของรูปแบบ FP16 ซึ่งส่วนใหญ่มักใช้ในเกมที่ใช้การเรนเดอร์ HDR ดังนั้นการทดสอบนี้จึงค่อนข้างทันเวลา

ตัวเลขประสิทธิภาพในการทดสอบนี้ไม่ตรงกับที่เราเห็นในการทดสอบที่คล้ายกัน แม้ว่าจะพิจารณารูปแบบที่แตกต่างกันก็ตาม: เราใช้บัฟเฟอร์จำนวนเต็ม 8 บิตต่อองค์ประกอบ ในขณะที่การทดสอบ Vantage ใช้จุดลอยตัว 16 บิต ตัวเลขของ Vantage ไม่ได้แสดงประสิทธิภาพของหน่วย ROP แต่เป็นค่าโดยประมาณของแบนด์วิธหน่วยความจำ สำหรับการ์ดดูอัลชิปทุกอย่างค่อนข้างซับซ้อนกว่า GTX 295 แสดงตัวเลขที่ต่ำกว่าที่ควรจะเป็น

ผลการทดสอบโดยประมาณสอดคล้องกับตัวเลขทางทฤษฎี และขึ้นอยู่กับความกว้างของบัสหน่วยความจำ ชนิด และความถี่ GTX 285 แสดงผลลัพธ์ที่ดีเนื่องจากการใช้หน่วยความจำ 512 บิตและ GTX 480 ก็ไม่ได้ล้ำหน้าเกินไปเนื่องจากหน่วยความจำ GDDR5 ไม่ทำงานที่ความถี่สูงเป็นพิเศษและความกว้างของบัสหน่วยความจำสอดคล้องกัน เป็น 384 บิต Radeon HD 5870 ก็อยู่ใกล้ๆ แม้ว่าจะมีบัสหน่วยความจำเพียง 256 บิต แต่ GDDR5 ก็ค่อนข้างเร็ว

แม้จะใช้หน่วยความจำ GDDR5 ที่มีแบนด์วิธสูงกว่า แต่โซลูชัน Nvidia ใหม่พร้อมกับ HD 5870 จะแสดงผลลัพธ์ที่สูงกว่า GTX 285 เพียงเล็กน้อยซึ่งมีบัส 512 บิตและหน่วยความจำ GDDR3 สิ่งนี้สามารถใช้เป็นข้อจำกัดด้านประสิทธิภาพที่อาจเกิดขึ้นเมื่อใช้บัฟเฟอร์การเรนเดอร์ในรูปแบบ FP16 ซึ่งพบเห็นได้ทั่วไปในเกมสมัยใหม่

การทดสอบคุณสมบัติ 3: การทำแผนที่การบดเคี้ยวพารัลแลกซ์

หนึ่งในการทดสอบคุณสมบัติที่น่าสนใจที่สุด เนื่องจากมีการใช้เทคนิคที่คล้ายกันในเกมแล้ว โดยจะวาดรูปสี่เหลี่ยมขนมเปียกปูนหนึ่งอัน (หรือแม่นยำกว่านั้นคือสามเหลี่ยมสองอัน) โดยใช้เทคนิคพิเศษในการทำแผนที่ Parallax Occlusion Mapping ที่จำลองรูปทรงเรขาคณิตที่ซับซ้อน มีการใช้การดำเนินการ Ray Tracing ที่ใช้ทรัพยากรค่อนข้างมากและแผนที่เชิงลึกที่มีความละเอียดสูง พื้นผิวนี้ยังถูกแรเงาโดยใช้อัลกอริธึม Strauss ที่มีน้ำหนักมาก นี่คือการทดสอบตัวเชดเดอร์พิกเซลที่ซับซ้อนและมีน้ำหนักมากสำหรับชิปวิดีโอ ซึ่งมีตัวอย่างพื้นผิวจำนวนมากในระหว่างการติดตามรังสี การแยกกิ่งแบบไดนามิก และการคำนวณแสงที่ซับซ้อนตาม Strauss

การทดสอบแตกต่างจากการทดสอบอื่นๆ ตรงที่ไม่เพียงแต่ขึ้นอยู่กับพลังของเชเดอร์ ประสิทธิภาพการประมวลผลสาขา และความเร็วในการดึงพื้นผิวแยกจากกัน แต่ยังขึ้นอยู่กับทุกสิ่งเล็กน้อยด้วย และเพื่อให้ได้ความเร็วสูง ความสมดุลที่เหมาะสมของ GPU และบล็อกหน่วยความจำวิดีโอเป็นสิ่งสำคัญ มันส่งผลกระทบอย่างมากต่อการทดสอบและประสิทธิภาพของการแยกย่อยในเชเดอร์

น่าเสียดายที่ GTX 480 แสดงผลได้ปานกลางในการทดสอบนี้เร็วกว่าโซลูชันชิปเดี่ยว GTX 285 รุ่นก่อนหน้าเพียง 23% เท่านั้น การ์ดแสดงผล Nvidia ที่เปิดตัวในวันนี้ล้าหลังทั้ง GTX 295 แบบดูอัลชิปและคู่แข่งหลักอย่าง Radeon HD 5870 และ dual-chip HD 5970 ยังคงอยู่ไกลเกินเอื้อม

ยังไม่ชัดเจนว่าสิ่งใดส่งผลเสียต่อผลการทดสอบนี้ บางทีมันอาจจะเป็นความผิดของฉัน ความเร็วต่ำตัวอย่างพื้นผิวซึ่งใช้ในการทดสอบเนื่องจากประสิทธิภาพการแตกแขนงของ GF100 ค่อนข้างสูงซึ่งได้รับการพิสูจน์โดยการทดสอบตัวเชเดอร์พิกเซลของเวอร์ชันที่สาม โซลูชันของ Nvidia มีประสิทธิภาพมาโดยตลอดในการทดสอบนี้ แต่ HD 5870 นั้นมีประสิทธิภาพเหนือกว่า GTX 480 ใหม่บางที GF100 อาจแสดงด้านที่ดีที่สุดในการทดสอบจำลองทางฟิสิกส์

การทดสอบคุณสมบัติ 4: ผ้า GPU

การทดสอบนี้น่าสนใจเนื่องจากจะคำนวณปฏิสัมพันธ์ทางกายภาพ (การเลียนแบบแฟบริค) โดยใช้ชิปวิดีโอ มีการใช้การจำลองจุดยอด โดยผสมผสานการทำงานระหว่างจุดยอดและเชเดอร์เรขาคณิต โดยผ่านหลายรอบ ใช้สตรีมเอาท์เพื่อถ่ายโอนจุดยอดจากการจำลองที่หนึ่งไปยังอีกที่หนึ่ง ดังนั้นจึงมีการทดสอบประสิทธิภาพการดำเนินการของจุดยอดและเชเดอร์เรขาคณิต และความเร็วสตรีมเอาท์

คุณสามารถละทิ้งประสิทธิภาพของการ์ดดูอัลชิปได้ทันทีซึ่งสอดคล้องกับความเร็วของชิปเดี่ยวอย่างชัดเจน (ชิปแต่ละตัวใน HD 5970 และ GTX 295 ทำงานที่ความถี่ต่ำกว่าใน HD 5870 และ GTX 285) ความเร็วในการเรนเดอร์ที่นี่ขึ้นอยู่กับประสิทธิภาพของการประมวลผลทางเรขาคณิตและการทำงานของเชเดอร์เรขาคณิต ในการทดสอบนี้ แม้แต่ GTX 285 ก็ทำงานได้ดีตามหลัง HD 5870 เพียงเล็กน้อยเท่านั้นและการ์ด GTX 480 ใหม่ก็แสดงจุดแข็งอีกครั้ง

ในการทดสอบนี้ GF100 มีประสิทธิภาพมากกว่าโซลูชันก่อนหน้าเกือบสองเท่า ซึ่งเข้ากันได้ดีกับพลังเชเดอร์ที่มากกว่าชิปตัวใหม่ถึงสองเท่า ความได้เปรียบเหนือคู่แข่ง Radeon HD 5870 นั้นน่าประทับใจไม่แพ้กัน โดยทั่วไปฮีโร่ในปัจจุบันของเราสามารถได้รับมอบหมายสถานะของผู้นำในการใช้งานเชเดอร์เรขาคณิตและความเร็วของการประมวลผลเรขาคณิตโดยทั่วไปตามที่ควรจะเป็นตามทฤษฎี

การทดสอบคุณสมบัติ 5: อนุภาค GPU

การทดสอบการจำลองผลกระทบทางกายภาพตามระบบอนุภาคที่คำนวณโดยใช้ชิปวิดีโอ นอกจากนี้ยังใช้การจำลองจุดยอด โดยแต่ละจุดยอดเป็นตัวแทนของอนุภาคเดี่ยว สตรีมเอาท์ใช้เพื่อจุดประสงค์เดียวกับในการทดสอบครั้งก่อน มีการคำนวณอนุภาคหลายแสนอนุภาค โดยทั้งหมดมีการเคลื่อนไหวแยกกัน และการชนกับแผนที่ความสูงก็ได้รับการคำนวณเช่นกัน เช่นเดียวกับหนึ่งในการทดสอบ RightMark3D 2.0 ของเรา อนุภาคจะถูกเรนเดอร์โดยใช้เชเดอร์เรขาคณิตที่สร้างจุดยอดสี่จุดจากแต่ละจุดเพื่อสร้างอนุภาค แต่การทดสอบส่วนใหญ่ของโหลดเชเดอร์หน่วยที่มีการคำนวณจุดสุดยอด สตรีมเอาท์ก็ได้รับการทดสอบเช่นกัน

ยังมีผลลัพธ์ที่แข็งแกร่งยิ่งขึ้น ในการทดสอบผ้าสังเคราะห์และการจำลองอนุภาคของ Vantage ซึ่งใช้ตัวเชเดอร์เรขาคณิต ชิป GF100 ใหม่จะทิ้งคู่แข่งทั้งหมดให้จมอยู่ในฝุ่น ครั้งนี้เร็วกว่า Nvidia GPU รุ่นก่อนหน้าเกือบสามเท่า ในขณะที่ Radeon HD 5870 ที่แข่งขันกันนั้นทำงานได้ดีประมาณครึ่งหนึ่งในการทดสอบการจำลองอนุภาค

ผลลัพธ์แบบมัลติชิปจะเหมือนกันอีกครั้งสำหรับทั้งการ์ด AMD และ Nvidia วิธีการเรนเดอร์แบบหลายชิปใช้งานไม่ได้อย่างชัดเจนเนื่องจากผลการคำนวณของเฟรมปัจจุบันจะถูกนำมาใช้ในเฟรมถัดไปซึ่งป้องกันไม่ให้เริ่มเป็น คำนวณก่อนที่การเรนเดอร์ของปัจจุบันจะเสร็จสมบูรณ์ นี่เป็นจุดอ่อนที่ชัดเจนของการ์ดดูอัลชิป ซึ่งไม่สามารถทำงานได้อย่างมีประสิทธิภาพเมื่อใช้ข้อมูลจากการ์ดก่อนหน้าในเฟรม

การทดสอบคุณสมบัติ 6: เสียงเพอร์ลิน

การทดสอบคุณสมบัติล่าสุดของแพ็คเกจ Vantage คือการทดสอบชิปวิดีโอทางคณิตศาสตร์อย่างเข้มข้น โดยจะคำนวณอ็อกเทฟหลายอ็อกเทฟของอัลกอริธึมสัญญาณรบกวน Perlin ใน Pixel Shader แต่ละช่องสีใช้ฟังก์ชันสัญญาณรบกวนของตัวเองเพื่อเพิ่มความเครียดให้กับชิปวิดีโอ เสียงเพอร์ลินเป็นอัลกอริธึมมาตรฐานที่มักใช้ในการสร้างพื้นผิวตามขั้นตอนและใช้คณิตศาสตร์จำนวนมาก

การทดสอบคุณสมบัติทางคณิตศาสตร์จากชุดทดสอบ Futuremark แสดงให้เห็นถึงประสิทธิภาพที่แท้จริงของชิปวิดีโอในงานที่หนักหน่วง ประสิทธิภาพที่แสดงในนั้นสอดคล้องกับสิ่งที่ควรได้รับตามทฤษฎีและบางส่วนสอดคล้องกับสิ่งที่เราเห็นด้านบนในการทดสอบทางคณิตศาสตร์ของเราจาก RightMark 2.0 แต่ในการทดสอบนี้ ความแตกต่างระหว่างวิธีแก้ปัญหานั้นยิ่งใหญ่กว่าอีก

ดังนั้นในการทดสอบทางคณิตศาสตร์นี้ ในที่สุด GTX 480 ที่ใช้ GF100 ใหม่ก็มีประสิทธิภาพเหนือกว่า GTX 285 ครึ่งหนึ่งอย่างแน่นอน ซึ่งสอดคล้องกับทฤษฎี แต่ช่องว่างระหว่างโซลูชันใหม่กับ HD 5870 กลับกลายเป็นว่าใหญ่เกินไป – 1.7 เท่า เรายังไม่ได้พิจารณา dual-chip HD 5970...

โดยทั่วไปแล้ว การ์ดแสดงผล AMD มีประสิทธิภาพเหนือกว่าคู่แข่งของ Nvidia ในการทดสอบนี้ แต่โซลูชันใหม่ที่ใช้โปรเซสเซอร์กราฟิก Nvidia GF100 ยังคงสามารถเข้าใกล้ได้ โปรดทราบว่าแบบทดสอบคณิตศาสตร์นี้ค่อนข้างตรงไปตรงมาและได้รับการออกแบบมาให้แสดงประสิทธิภาพที่ใกล้เคียงกับจุดสูงสุดทางทฤษฎี ในการทดสอบการคำนวณที่ซับซ้อนมากขึ้น เช่น การคำนวณทางกายภาพ จะเกิดภาพที่แตกต่างออกไปเล็กน้อย แต่คณิตศาสตร์ที่เรียบง่ายแต่เข้มข้นนั้นทำได้เร็วกว่ามากบนการ์ด AMD

Direct3D 11: การคำนวณและเรขาคณิตเชเดอร์

เพื่อทดสอบโซลูชันใหม่จาก Nvidia และ AMD ในงานที่ใช้ความสามารถของ DirectX 11 เราใช้ตัวอย่างจากชุดพัฒนา (SDK) จาก Microsoft, AMD และ Nvidia รวมถึงโปรแกรมสาธิตบางโปรแกรมจากบริษัทเหล่านี้

ก่อนอื่น มาดูการทดสอบที่ใช้เชเดอร์ประเภทใหม่ - การคำนวณ รูปลักษณ์ภายนอกเป็นหนึ่งในนวัตกรรมที่สำคัญที่สุดใน DX API เวอร์ชันล่าสุด ซึ่งใช้สำหรับงานต่างๆ เช่น หลังการประมวลผล การจำลอง ฯลฯ การทดสอบครั้งแรกแสดงตัวอย่างการเรนเดอร์ HDR ด้วยการแมปโทนสีจาก DirectX SDK พร้อมการประมวลผลภายหลังโดยใช้พิกเซลหรือเชเดอร์การคำนวณ

เราต้องยอมรับชัยชนะที่ชัดเจนของโซลูชันชิปตัวเดียวของ AMD เหนือการ์ดวิดีโอ Nvidia Geforce GTX 480 ใหม่ในการทดสอบนี้ วันนี้บอร์ดได้ประกาศเกี่ยวกับชิป GF100 ใหม่ซึ่งล้าหลัง Radeon HD 5870 ที่แข่งขันกันทั้งในโหมดพิกเซลและโหมดเชเดอร์การคำนวณ ยิ่งไปกว่านั้น ความล่าช้ายังเห็นได้ชัดเจน – มากถึงหนึ่งเท่าครึ่ง การทดสอบนี้ดูอัลชิป HD 5970 มี GPU เพียงตัวเดียว ดังนั้นผลลัพธ์จึงต่ำกว่า HD 5870 เสียอีก

การทดสอบเชเดอร์การคำนวณครั้งที่สองนั้นนำมาจาก DirectX SDK ของ Microsoft และแสดงปัญหาแรงโน้มถ่วงของ N-body ในการคำนวณ โดยจำลองระบบอนุภาคไดนามิกที่อยู่ภายใต้แรงทางกายภาพ เช่น แรงโน้มถ่วง

และในการทดสอบคอมพิวเตอร์นี้ โซลูชันใหม่ของ Nvidia พ่ายแพ้ให้กับคู่แข่งที่ใกล้เคียงที่สุดคือ Radeon HD 5870 อีกครั้ง ในกรณีนี้ ประมาณ 25% ซึ่งก็ค่อนข้างมากเช่นกัน ดูอัลชิป HD 5970 ไม่สามารถแสดงความสามารถของมันได้อีกครั้งและถูก จำกัด อยู่ที่การทำงานของหนึ่งในสอง GPU ที่ติดตั้งบนบอร์ด

การทดสอบต่อไปคือโปรแกรมสาธิตจาก Nvidia ที่เรียกว่า Real Character Hair มันไม่ได้ใช้โค้ดสังเคราะห์ล้วนๆ สำหรับการคำนวณหรือเชเดอร์เรขาคณิต แต่เป็นความซับซ้อนของเรขาคณิตและเชเดอร์การคำนวณและเทสเซลเลชัน ดังนั้นจึงค่อนข้างใกล้เคียงกับปัญหาจริงมากกว่าการสังเคราะห์แท้ของการทดสอบสองครั้งแรก

แต่ในการทดสอบนี้ Nvidia GPU ใหม่แสดงผลลัพธ์ที่ยอดเยี่ยม เหนือกว่า Radeon HD 5870 แบบชิปเดี่ยวและ HD 5970 แบบชิปคู่อย่างมาก ซึ่งเป็น GPU ตัวที่สองที่ล้มเหลวอีกครั้ง ในขณะเดียวกัน สิ่งที่น่าสนใจไม่เพียงแต่ความแตกต่างในประสิทธิภาพระหว่างการ์ดชิปตัวเดียวสูงถึง 1.5-1.8 เท่า แต่ยังรวมถึงพฤติกรรมที่แตกต่างกันเมื่อเปิดใช้งานเทสเซลเลชั่นฮาร์ดแวร์ด้วย

ในกรณีนี้ การ์ดแสดงผล Geforce GTX 480 ใหม่ที่ใช้ชิป GF100 จะเพิ่มขึ้น 15% เมื่อเปิดใช้งานเทสเซลเลชั่น ในขณะที่โซลูชัน AMD ที่ใช้ RV870 จะทำงานช้าลงเกือบ 5% กล่าวอีกนัยหนึ่ง ในกรณีนี้ tessellation มีประโยชน์ต่อโซลูชันของ Nvidia แต่ไม่ใช่สำหรับ AMD เห็นได้ชัดว่าการจัดวางที่แตกต่างกันของสายพานลำเลียงแบบเรขาคณิตส่งผลต่อประสิทธิภาพการทำงานที่เราดำเนินการต่อไป

Direct3D 11: ประสิทธิภาพเทสเซลเลชัน

นวัตกรรมที่สำคัญที่สุดใน Direct3D 11 ถือเป็นการเทสเซลเลชั่นฮาร์ดแวร์ เราได้ดูรายละเอียดในบทความเชิงทฤษฎีเกี่ยวกับ Nvidia GF100 มีรูปแบบที่แตกต่างกันหลายประการสำหรับการแบ่งพาร์ติชันกราฟิกดั้งเดิม (เทสเซลเลชัน) ตัวอย่างเช่น พงษ์เทสเซลเลชัน, สามเหลี่ยม PN, การแบ่งเขตแคทมุลล์-คลาร์ก

Tessellation ได้เริ่มใช้ในเกม DirectX 11 เกมแรกแล้ว เช่น STALKER: Call of Pripyat, DiRT 2, Aliens vs Predator, Metro 2033 ในบางเกม Tessellation ใช้สำหรับโมเดลตัวละคร (เกม FPS ทั้งหมดที่ระบุไว้) ในส่วนอื่น ๆ - สำหรับการจำลองผิวน้ำที่สมจริง (DiRT 2) รูปแบบ PN Triangles ใช้ใน STALKER: Call of Pripyat ใน Metro 2033 Phong tessellation วิธีการเหล่านี้สามารถนำไปใช้ในกระบวนการพัฒนาเกมและเอ็นจิ้นที่มีอยู่ได้อย่างรวดเร็วและง่ายดาย ซึ่งเป็นสิ่งที่ได้ทำไปแล้ว

การทดสอบเทสเซลเลชันครั้งแรกของเราจะเป็นตัวอย่าง Detail Tessellation จาก ATI Radeon SDK จริงๆ แล้ว มันไม่เพียงแต่แสดงให้เห็น tessellation เท่านั้น แต่ยังแสดงเทคนิค Bumpmapping ที่แตกต่างกันสองแบบ: การซ้อนทับแผนที่ปกติปกติ และการแมปการบดเคี้ยวพารัลแลกซ์ เรามาเปรียบเทียบโซลูชัน DirectX 11 จาก Nvidia และ AMD ในเงื่อนไขที่ต่างกัน:

ข้อสรุปแรกชี้ให้เห็นว่ามีดังต่อไปนี้: เทคนิคการทำแผนที่การบดเคี้ยวพารัลแลกซ์แบบพิกเซลต่อพิกเซล (แถบตรงกลางในแผนภาพ) บนทั้ง GeForce GTX 480 และ RADEIN HD 5870 นั้นมีประสิทธิภาพน้อยกว่าเทสเซลล์ (แถบด้านล่าง) กล่าวคือ การจำลองเรขาคณิตโดยใช้การคำนวณพิกเซลจะให้ประสิทธิภาพที่ต่ำกว่าเรขาคณิตจริงที่เรนเดอร์โดยใช้เทสเซลเลชัน นี่เป็นเรื่องเกี่ยวกับโอกาสของเทสเซลเลชันที่ปัจจุบันมีการใช้การทำแผนที่พารัลแลกซ์

ถัดไปเกี่ยวกับประสิทธิภาพของการ์ด GTX 480 และ AMD ที่สัมพันธ์กัน dual-chip HD 5970 นำหน้าตัวเลือกชิปตัวเดียวซึ่งเป็นที่เข้าใจได้ แต่ GTX 480 นั้นเหนือกว่า HD 5870 5-15% มากขึ้นเมื่อเปิดใช้งาน tessellation น้อยลงด้วยการคำนวณต่อพิกเซล สิ่งที่เราคาดหวังก็คือในเกมที่รองรับเฉพาะ DX9 หรือ DX10 ความแตกต่างระหว่าง GTX 480 และ HD 5870 ก็ควรจะเล็กกว่าในเกม DX11 ที่มีเทสเซลเลชั่นด้วย

การทดสอบประสิทธิภาพเทสเซลเลชันครั้งที่สองที่เราจะมีนั้นเป็นอีกตัวอย่างหนึ่งสำหรับนักพัฒนา 3 มิติจาก ATI Radeon SDK PN Triangles จริงๆ แล้ว ทั้งสองตัวอย่างรวมอยู่ใน DX SDK ด้วย ดังนั้นนักพัฒนาเกมจำนวนมากจึงสร้างโค้ดตามตัวอย่างเหล่านั้น เราทดสอบตัวอย่างนี้ด้วยปัจจัยเทสเซลเลชั่นที่แตกต่างกันเพื่อทำความเข้าใจว่าการเปลี่ยนแปลงมีผลกระทบต่อประสิทธิภาพโดยรวมมากน้อยเพียงใด

ตัวอย่างนี้อาจเป็นครั้งแรกที่เราได้เห็นพลังทางเรขาคณิตที่แท้จริงของสถาปัตยกรรมกราฟิกของ GF100 ใช่ นี่เป็นเพียงการทดสอบสังเคราะห์เท่านั้น และปัจจัยการแบ่งพาร์ติชันที่รุนแรงดังกล่าวไม่น่าจะถูกนำมาใช้ในตอนแรก แต่นี่คือเหตุผลว่าทำไมจึงจำเป็นต้องใช้สารสังเคราะห์เพื่อช่วยประเมินโอกาสในการแก้ไขปัญหาในอนาคต

และ Geforce GTX 480 แสดงให้เห็นอย่างสมบูรณ์แบบว่า GF100 สามารถทำอะไรได้บ้างในงานเทสเซลเลชัน ชิปตัวเดียวเร็วกว่าการ์ดดูอัลชิปของคู่แข่งหลายเท่า ความได้เปรียบเหนือ HD 5970 ถึงสี่เท่าและชิปเดี่ยว HD 5870 พ่ายแพ้ด้วยคะแนนทำลายล้างในการทดสอบนี้ โดยพื้นฐานแล้ว GF100 ช่วยให้สามารถเทสเซลเลชั่นได้มากกว่า RV870 หลายสต็อป นี่คือความหมายของการมีสถาปัตยกรรมที่ออกแบบมาโดยเฉพาะโดยคำนึงถึงความสามารถของ tessellation API ใหม่

แต่ลองดูการสาธิตการทดสอบอื่น โปรแกรม เอ็นวิเดียภูมิประเทศน้ำที่สมจริงหรือที่เรียกว่าเกาะ ผู้เขียนโปรแกรมนี้คือ Timofey Cheblokov หรือที่รู้จักในชื่อ Smalltim ซึ่งเป็นที่รู้จักของผู้ที่ชื่นชอบ 3D การสาธิตเกาะของเขาใช้การทำแผนที่แบบเทสเซลล์และการกระจัดเพื่อสร้างพื้นผิวและภูมิประเทศในมหาสมุทรที่ดูสมจริง เธอดูดีมาก:

โดยทั่วไป Island ไม่ใช่การทดสอบการสังเคราะห์ล้วนๆ สำหรับเทสเซลเลชัน แต่มีพิกเซลที่ค่อนข้างซับซ้อนและตัวเชเดอร์การคำนวณ ดังนั้นความแตกต่างในประสิทธิภาพอาจน้อยกว่าในกรณีก่อนหน้า แต่ตำแหน่งนี้จะใกล้เคียงกับความเป็นจริงมากขึ้น

ในกรณีนี้ เราได้ทดสอบการสาธิตด้วยอัตราส่วนเทสเซลเลชันที่แตกต่างกันสี่แบบ การตั้งค่านี้เรียกว่า Dynamic Tessellation LOD หากปัจจัยการแบ่งพาร์ติชันต่ำสุดการ์ด GF100 นั้นเหนือกว่ารุ่นชิปเดี่ยวจาก AMD เพียงเล็กน้อยและยังด้อยกว่า HD 5970 ด้วยซ้ำด้วยการเพิ่มปัจจัยการแบ่งพาร์ติชันและความซับซ้อนของฉากที่เกิดขึ้นประสิทธิภาพของ GTX 480 ไม่ลดลงมากเท่ากับความเร็วการเรนเดอร์ของโซลูชันที่แข่งขันกัน

เป็นผลให้เรามีสถานการณ์อีกครั้งที่ชิป GF100 ของสถาปัตยกรรมกราฟิก Nvidia ใหม่ให้ประสิทธิภาพเทสเซลเลชั่นที่คล้ายกับ RV870 ที่มีความซับซ้อนของฉากที่แตกต่างกันอย่างมีนัยสำคัญ ดังนั้นด้วยค่าสัมประสิทธิ์ LOD สูงสุด 100 ในโปรแกรมนี้ GTX 480 จะแสดงประสิทธิภาพเช่นเดียวกับ Radeon HD 5870 แต่มีค่าสัมประสิทธิ์เพียง 25 นั่นคือหลายครั้ง มากกว่ารูปสามเหลี่ยม (28 ล้านต่อ 4 ล้านในกรณีนี้) มันต่างกันมาก!

บทสรุปเกี่ยวกับการทดสอบสังเคราะห์

จากผลการทดสอบสังเคราะห์ของรุ่น Nvidia Geforce GTX 480 ใหม่ ซึ่งใช้โปรเซสเซอร์กราฟิก GF100 รวมถึงผลลัพธ์ของการ์ดแสดงผลรุ่นอื่นๆ จากผู้ผลิตชิปวิดีโอรายใหญ่ เราสามารถสรุปได้ว่านี่คือกราฟิก Nvidia ที่ทรงพลังมาก สถาปัตยกรรมซึ่งมีการปรับปรุงประสิทธิภาพและความเป็นไปได้อย่างมาก การ์ดแสดงผลรุ่นใหม่ที่ใช้ GF100 ได้กลายเป็นหนึ่งในการ์ดที่เร็วที่สุดในบรรดาการ์ดชิปเดี่ยวทั้งหมด

จำนวนหน่วยประมวลผลเรขาคณิตที่เพิ่มขึ้นและการทำงานแบบขนานได้ปรับปรุงประสิทธิภาพของเทสเซลเลชั่นและเชเดอร์เรขาคณิตอย่างมีนัยสำคัญ ในงานเทสเซลเลชันสังเคราะห์ โซลูชันใหม่ของ Nvidia นั้นไม่เท่ากัน แม้แต่โซลูชันแบบชิปคู่ก็ไม่สามารถช่วยเหลือคู่แข่งได้ และเมื่อเปรียบเทียบการ์ดวิดีโอกับ GPU ตัวเดียว โซลูชันที่ใช้ GF100 ก็มีประสิทธิภาพเหนือกว่าการ์ดที่ใช้ RV870 ที่ดีที่สุดในการทดสอบดังกล่าวถึง 4-6 เท่า และจนกว่าจะมีการเปิดตัวสถาปัตยกรรมของคู่แข่ง ซึ่งได้รับการปรับปรุงเป็นพิเศษเพื่อการประมวลผลทางเรขาคณิตที่มีประสิทธิภาพ สถานการณ์จะไม่เปลี่ยนแปลง

หากเราตัดสินประสิทธิภาพในแอปพลิเคชัน 3D ที่ไม่มีการทดสอบเราสามารถสรุปได้ว่าในการทดสอบเกมมันจะเหมือนกับในการทดสอบสังเคราะห์ของเรา - ในบางสถานที่ GeForce GTX 480 จะนำหน้าคู่แข่งและในที่อื่น ๆ จะเป็น ข้างหลังเล็กน้อย นอกจากนี้ ไม่ควรมีความสูญเสียมากเกินไป เนื่องจากไม่มีเกมใดที่ถูกจำกัดโดยสิ้นเชิงด้วยการคำนวณทางคณิตศาสตร์หรือประสิทธิภาพในการดึงพื้นผิว - เป็นเพียงพารามิเตอร์เดียวที่เรามีคำถามบางอย่างเกี่ยวกับสถาปัตยกรรม GF100

ในการทดสอบสังเคราะห์ของเทสเซลเลชัน เชเดอร์เรขาคณิต และการคำนวณทางฟิสิกส์ (การจำลองแฟบริคและอนุภาคในแพ็คเกจ Vantage ซึ่งใช้เชเดอร์เรขาคณิตด้วย) ชิป Nvidia GF100 ใหม่มีความแข็งแกร่งกว่าชิปตัวอื่นอย่างเห็นได้ชัด เช่นเดียวกับการทดสอบคอมพิวเตอร์อื่นๆ ด้วยโปรแกรมที่ซับซ้อน แต่คณิตศาสตร์ที่ตรงไปตรงมา เช่น การทดสอบทางคอมพิวเตอร์ล้วนๆ จาก RightMark หรือ Vantage ตามที่คาดไว้ กลับพ่ายแพ้ให้กับโซลูชันของ AMD และ Nvidia ยังคงมีช่องว่างที่เหมาะสม ปรากฎว่า GF100 มีคุณสมบัติใกล้เคียงกับ CPU มากขึ้นกลายเป็นสากลมากขึ้น (จำ C ++ และแคชเหมือน CPU) แต่เมื่อเปรียบเทียบกับ RV870 แล้วจะมีพลัง "การบดขยี้ตัวเลข" น้อยกว่าเล็กน้อยซึ่งมีความโดดเด่นอยู่เสมอ GPU จากซีพียู

ประสิทธิภาพการคำนวณและพื้นผิวสูงสุดที่ค่อนข้างต่ำที่เราระบุไว้ในบทความของเราทำให้ล้าหลังคู่แข่งในการทดสอบประดิษฐ์บางอย่าง แต่โดยรวมแล้ว GTX 480 แสดงผลลัพธ์ที่ดีมาก ซึ่งควรได้รับการยืนยันในส่วนถัดไปของเนื้อหาของเรา ในนั้นคุณจะได้ทำความคุ้นเคยกับการทดสอบโซลูชันล่าสุดของ Nvidia ที่ใช้ GPU ใหม่ ในแอปพลิเคชันเกมที่ทันสมัยที่สุด

เราถือว่าผลลัพธ์ของเกมจะใกล้เคียงกับข้อสรุปของเราโดยประมาณเมื่อวิเคราะห์ผลลัพธ์ของการทดสอบสังเคราะห์ แม้ว่าจะไม่มีความแตกต่างอย่างมีนัยสำคัญ เนื่องจากความเร็วในการเรนเดอร์ในเกมมักจะขึ้นอยู่กับคุณลักษณะหลายประการของการ์ดแสดงผลในคราวเดียว และขึ้นอยู่กับอัตราการเติมและแบนด์วิดท์หน่วยความจำมากกว่าการสังเคราะห์ เราคิดว่า GeForce GTX 480 ควรจะเหนือกว่าคู่แข่งชิปเดี่ยว Radeon HD 5870 เล็กน้อยในเกมที่ไม่มีการทดสอบและจะเหนือกว่าในการทดสอบการใช้งานอย่างแน่นอน

หกเดือนหลังจากการเปิดตัวโปรเซสเซอร์กราฟิก RV870“ Cypress” และการ์ดวิดีโอ ATI Radeon HD 5800 ในที่สุด NVIDIA ก็สามารถสร้างความพึงพอใจให้กับแฟน ๆ ด้วยการเปิดตัวสถาปัตยกรรม“ Fermi” ใหม่และวิดีโอสองรายการแรก การ์ด - GeForce GTX 480 และ GTX 470 ออกแบบมาเพื่อตอบโจทย์ Radeon HD 5800 สำหรับหลาย ๆ คน การรอคอยที่น่าเบื่อได้สิ้นสุดลงแล้ว และจากบทความและบทวิจารณ์มากมาย เราสามารถเริ่มตัดสินใจว่าจะซื้ออะไรสำหรับเกมยุคใหม่พร้อมการสนับสนุน สำหรับ DirectX 11? โชคดีที่ยังมีเวลาก่อนที่การ์ดแสดงผลจะพร้อมจำหน่ายฟรี เนื่องจากชุดแรกจะมาถึงเครือข่ายค้าปลีกไม่ช้ากว่าวันที่ 12 เมษายน แม้ว่าเราได้รับการ์ดสองสามวันก่อนการประกาศอย่างเป็นทางการ แต่เราไม่ต้องการรีบเร่งในการเผยแพร่บทความ แต่ควรทำการทดสอบที่ละเอียดและละเอียดถี่ถ้วนที่สุดเท่าที่จะเป็นไปได้ - นั่นคือเหตุผลที่เรานำเสนอบทความให้คุณทราบเพียงไม่กี่วัน หลังจากการประกาศการ์ดแสดงผลใหม่ แต่เราหวังว่าความสมบูรณ์ของเนื้อหาจะช่วยให้คุณให้อภัยเราในความล่าช้าเล็กน้อยนี้

ยินดีต้อนรับ - GeForce GTX 480!

ข้อมูลจำเพาะ NVIDIA GeForce GTX 480 เปรียบเทียบกับคู่แข่ง

คุณสมบัติทางเทคนิคของ NVIDIA GeForce GTX 480 แสดงอยู่ในตารางโดยเปรียบเทียบกับคู่แข่งราคาปัจจุบันและการ์ดวิดีโอ GeForce GTX 285 รุ่นก่อนหน้า:

ขณะนี้บนอินเทอร์เน็ตมีข้อมูลมากเกินพอเกี่ยวกับสถาปัตยกรรม Fermi นอกจากนี้ คุณยังทำความคุ้นเคยได้อีกด้วย เอกสารอย่างเป็นทางการ(2.74 เมกะไบต์) ดังนั้นเราจะดำเนินการตรวจสอบการ์ดแสดงผลทันที

รีวิวการ์ดแสดงผล NVIDIA GeForce GTX 480 1.5 GB

เรามอบการ์ดแสดงผล NVIDIA GeForce GTX 480 อ้างอิงสำหรับการทดสอบในการกำหนดค่า OEM นั่นคือไม่มีบรรจุภัณฑ์และอุปกรณ์เสริม สำหรับผู้ที่คุ้นเคย รูปร่าง GeForce GTX 260-285 ผลิตภัณฑ์ใหม่จะดูไม่เหมือนต้นฉบับ:


บางทีท่อความร้อนทองแดงชุบนิกเกิลห้าท่อที่ยื่นขึ้นไปจาก GPU อาจดึงดูดความสนใจ:


มิฉะนั้น GeForce GTX 480 อ้างอิงจะไม่โดดเด่นจากภายนอก ความยาวของแผงวงจรพิมพ์คือ 267 มม. ซึ่งทำให้ผลิตภัณฑ์ใหม่แตกต่างจากคู่แข่งในรูปแบบของ ATI Radeon HD 5870 ซึ่งมีความยาว 282 มม. และไม่เหมาะกับเคสยูนิตระบบทั้งหมด

การ์ดแสดงผลมาพร้อมกับอินเทอร์เฟซ PCI-E เวอร์ชัน 2.0, เอาต์พุต Dual Link DVI-I สองช่องและขั้วต่อ HDMI หนึ่งช่องซึ่งอยู่ติดกับตะแกรงเพื่อระบายอากาศบางส่วนที่ได้รับความร้อนจาก GPU นอกเคส:


จากปลายอีกด้านของกระดาน คุณจะเห็นช่องเปิดซึ่งไม่ได้เปิดทางให้อากาศไหลเข้าสู่กังหันอย่างที่ใครๆ ก็คิดได้ ด้านบนของการ์ดแสดงผลมีตัวเชื่อมต่อหกและแปดพินสำหรับเชื่อมต่อพลังงานรวมถึงตัวเชื่อมต่อ MIO สองตัวเพื่อจัดระเบียบการทำงานของ GeForce GTX 480 สองตัวในโหมด SLI หรือสามตัวใน 3-Way SLI:


โปรดทราบว่าถัดจากตัวเชื่อมต่อเหล่านี้จะมีตะแกรงอีกอันหนึ่งซึ่งอากาศร้อนบางส่วนจะออกจากระบบทำความเย็น โดยจะเหลืออยู่ภายในเคสยูนิตระบบ เมื่อพิจารณาถึงการใช้ GeForce GTX 480 ที่สูงมาก (ระบุอยู่ที่ 250 W) และผลที่ตามมาคือการกระจายความร้อน นี่เป็นข้อเท็จจริงที่ไม่พึงประสงค์ แต่เห็นได้ชัดว่าวิศวกรที่ออกแบบระบบทำความเย็นนี้ไม่มีทางเลือกอื่น

ปลอกพลาสติกของระบบระบายความร้อนของการ์ดแสดงผลนั้นถูกยึดไว้ด้วยสลักซึ่งสามารถคลายออกได้ง่าย:


การใช้ตัวระบายความร้อนทางเลือกบน GeForce GTX 480 ร่วมกับแผ่นมาตรฐานสำหรับองค์ประกอบพลังงานความเย็นนั้นเป็นไปไม่ได้เนื่องจากในรูยึดใกล้กับโปรเซสเซอร์กราฟิกจะมีบุชซึ่งฐานของระบบระบายความร้อนจะพักอยู่โดยสร้างช่องว่าง 3-4 มม. ระหว่างฐานของตัวทำความเย็นและตัวกระจายความร้อนของ GPU

ง่ายต่อการคลายเกลียวหม้อน้ำด้วยแผ่นระบายความร้อนของส่วนประกอบแผงวงจรพิมพ์ของกราฟิกการ์ดซึ่งส่งผลให้คุณสามารถทำความคุ้นเคยกับส่วนหลังได้อย่างเต็มที่:


ชิปหน่วยความจำการ์ดแสดงผลทั้งหมดอยู่ที่ด้านหน้าของแผงวงจรพิมพ์ เส้นทางพลังงานของ GeForce GTX 480 เป็นวงจรจ่ายไฟหกเฟสสำหรับ GPU ซึ่งใช้คอนโทรลเลอร์ CHL8266 และสองเฟสสำหรับชิปหน่วยความจำ:


คริสตัล GPU ซึ่งประกอบด้วยทรานซิสเตอร์ที่น่าทึ่งถึง 3.2 พันล้านตัว ถูกปกคลุมไปด้วยแผ่นกระจายความร้อนที่มีเครื่องหมาย:


เมื่อพิจารณาจากเครื่องหมาย GPU เป็นของการแก้ไขครั้งที่สาม (GF100-375-A3) และเปิดตัวในสัปดาห์ที่ 4 ของปี 2010 GPU ประกอบด้วยโปรเซสเซอร์ Universal Shader 480 ตัว หน่วยพื้นผิว 60 หน่วย และหน่วยปฏิบัติการแรสเตอร์ (ROP) 48 หน่วย ความถี่ที่กำหนดของบล็อกเรขาคณิต GPU คือ 700 MHz และโดเมนเชเดอร์นั้นสูงเป็นสองเท่า - 1401 MHz ในโหมด 2D ความถี่ GPU จะลดลงเหลือ 51/101 MHz คุณสามารถดูคุณลักษณะอื่นๆ ข้างต้นได้ในตารางข้อมูลจำเพาะแล้ว

NVIDIA GeForce GTX 480 อ้างอิงมาพร้อมกับชิปหน่วยความจำวิดีโอ GDDR5 12 ตัวที่มีความจุรวม 1.5 GB ซึ่งอยู่ที่ด้านหน้าของแผงวงจรพิมพ์ ชิปดังกล่าวเปิดตัวโดย Samsung และมีป้ายกำกับว่า K4G10325FE-HC04:


ตามข้อกำหนดของหน่วยความจำ เวลาในการเข้าถึงที่กำหนดคือ 0.4 ns และความถี่ที่มีประสิทธิภาพตามทฤษฎีคือ 5000 MHz แม้จะมีข้อเท็จจริงนี้ ความถี่หน่วยความจำ GeForce GTX 480 อยู่ที่ 3696 MHz เท่านั้น ซึ่งช่วยให้เราหวังว่าจะโอเวอร์คล็อกได้สำเร็จ เพื่อลดการสร้างความร้อนและประหยัดพลังงาน เมื่อการ์ดแสดงผลเปลี่ยนเป็นโหมด 2D ความถี่หน่วยความจำที่มีประสิทธิภาพจะลดลงเหลือ 270 MHz ความกว้างของบัสหน่วยความจำของการ์ดแสดงผลคือ 384 บิต ซึ่งช่วยให้คุณได้รับปริมาณงานที่น่าประทับใจที่ 177.4 GB/วินาที

ยูทิลิตี้ GPU-Z เวอร์ชันใหม่สามารถแสดงคุณสมบัติของ GeForce GTX 480 ได้อย่างแม่นยำเกือบ:


มาดูระบบระบายความร้อนของการ์ดแสดงผลและตรวจสอบประสิทธิภาพกันดีกว่า องค์ประกอบสำคัญของตัวทำความเย็น GeForce GTX 480 ในสต็อกคือฮีทซิงค์ GPU:


ประกอบด้วยท่อความร้อนทองแดง 5 ท่อที่มีเส้นผ่านศูนย์กลาง 6 มม. ซึ่งเป็นส่วนหนึ่งของฐาน (เทคโนโลยีการสัมผัสโดยตรง) ท่อเจาะครีบอะลูมิเนียมที่มีความหนาประมาณ 0.35 มม. และมีระยะห่างระหว่างอินเทอร์ฟินเพียง 1.5 มม. ควรสังเกตว่าบริเวณหม้อน้ำของเครื่องทำความเย็นนั้นเรียบง่ายมาก ระยะห่างระหว่างท่อที่ฐานคือ 1.5 มม. เช่นกัน โครงสร้างหม้อน้ำทั้งหมดชุบนิกเกิล

ระหว่าง GPU และฐาน HDT ของหม้อน้ำทำความเย็น มีอินเทอร์เฟซการระบายความร้อนสีเทาหนาที่ใช้เกิน:


สำหรับเครื่องทำความเย็นที่มีเทคโนโลยีการสัมผัสโดยตรง ปริมาณและคุณภาพของอินเทอร์เฟซในการระบายความร้อนมีความสำคัญสูงกว่าเพื่อให้ได้ประสิทธิภาพสูงสุดมากกว่าเครื่องทำความเย็นแบบฐานแบบคลาสสิก เมื่อมองไปข้างหน้า เราทราบว่าการถอดแผ่นระบายความร้อนมาตรฐานออกและแทนที่ด้วยชั้น Arctic Cooling MX-3 ที่น้อยที่สุดที่เป็นไปได้ ทำให้สามารถลดอุณหภูมิสูงสุดของ GPU ลงได้ 3 ° C ในโหมด 2D อุณหภูมิไม่เปลี่ยนแปลง

องค์ประกอบที่สองของระบบระบายความร้อน GeForce GTX 480 คือแผ่นโลหะที่มีกังหันติดตั้งอยู่


แผ่นผ่านแผ่นระบายความร้อนสัมผัสกับชิปหน่วยความจำวิดีโอและองค์ประกอบพลังงานของแผงวงจรพิมพ์ ความเร็วในการหมุนของกังหัน (กำลังสูงสุด 21 วัตต์) จะถูกปรับโดยอัตโนมัติโดยการ์ดแสดงผลขึ้นอยู่กับอุณหภูมิ คุณลักษณะที่น่าสนใจคือความจริงที่ว่าความเร็วที่เพิ่มขึ้นเกิดขึ้นอย่างราบรื่น แต่การลดลงหลังจากที่โหลดถูกลบออกนั้นคมชัดมาก เสียงที่ตัวทำความเย็น GeForce GTX 480 สร้างขึ้นที่ความเร็วเกือบถึงสูงสุดทำให้รู้สึกเหมือนว่ากังหันกำลังปิดอยู่ แม้ว่าจริงๆ แล้วจะไม่เป็นเช่นนั้นก็ตาม ในโหมด 2D เมื่อความถี่ของการ์ดแสดงผลลดลงอย่างมาก กังหันจะทำงานที่ 44-46% ของพลังงาน เราจะบอกคุณเกี่ยวกับระดับเสียงในส่วนใดส่วนหนึ่งต่อไปนี้ของเนื้อหาวันนี้ แต่สำหรับตอนนี้ เราจะตรวจสอบว่าตัวทำความเย็น GeForce GTX 480 มาตรฐานจะมีประสิทธิภาพเพียงใด

ในการสร้างโหลดและวอร์มอัพการ์ดแสดงผล เราใช้การทดสอบ Firefly Forest ที่ใช้ทรัพยากรมากจากแพ็คเกจ 3DMark 2006 กึ่งสังเคราะห์ที่ความละเอียด 2560x1600 พร้อมการกรองแบบแอนไอโซทรอปิกที่ระดับ 16x ตรวจสอบอุณหภูมิของ GPU และพลังงานกังหันของการ์ดวิดีโอ (เป็น %) โดยใช้ MSI Afterburner เวอร์ชัน 1.5.1 ซึ่งยังไม่รองรับ GeForce GTX 480 อย่างสมบูรณ์ อุณหภูมิห้องระหว่างการทดสอบคือ 25 °C การทดสอบดำเนินการในกรณีของยูนิตระบบแบบปิด การกำหนดค่าซึ่งคุณจะพบในส่วนที่มีวิธีการทดสอบ ทำการทดสอบก่อนที่จะแยกชิ้นส่วนการ์ดแสดงผลโดยใช้อินเทอร์เฟซการระบายความร้อนมาตรฐาน

ลองดูอุณหภูมิของ GeForce GTX 480 ในโหมดกังหันอัตโนมัติและที่กำลังสูงสุด:


ปรับความเร็วสูงสุดอัตโนมัติ


เห็นได้ชัดว่าการ์ดแสดงผลร้อนมาก แม้ว่าจะมีการโหลดในรูปแบบของการทดสอบจาก 3DMark 2006 อุณหภูมิของ GPU ก็สูงถึง 95 °C อย่างรวดเร็ว แต่ด้วยการเพิ่มความเร็วกังหันเป็น 70-78% (~3600 rpm) ทำให้ลดลงเหลือ 91.. 92 °C และไม่มีการเปลี่ยนแปลงเพิ่มเติมตลอดการทดสอบ หากคุณตั้งค่ากังหันให้มีกำลังสูงสุดด้วยตนเอง (~4780 รอบต่อนาที) อุณหภูมิของ GPU จะไม่เกิน 68 °C ประสิทธิภาพหม้อน้ำขึ้นอยู่กับความเร็วในการหมุนของกังหันสูงมากซึ่งประการแรกบ่งชี้ว่าพื้นที่การกระจายตัวไม่เพียงพอ

นอกจากนี้เรายังตรวจสอบประสิทธิภาพของตัวทำความเย็น GeForce GTX 480 อ้างอิงโดยใช้ FurMark เวอร์ชัน 1.8.0 (พร้อม exe ที่เปลี่ยนชื่อ) ซึ่งเปิดตัวในโหมดเต็มหน้าจอที่ความละเอียด 2560x1600 พร้อมการกรองแอนไอโซทรอปิกระดับ 16x ที่เปิดใช้งานในไดรเวอร์ GeForce ในโหมดอัตโนมัติ เราสามารถเห็นภาพเดียวกันกับเมื่อทดสอบใน 3DMark 2006 โดยมีความแตกต่างเพียงอย่างเดียวคืออุณหภูมิสูงสุดในตอนแรกสูงถึง 98 °C และหลังจากเพิ่มความเร็วกังหันโดยอัตโนมัติเป็น 4150 rpm ก็ลดลงเหลือ 91- 92 เท่าเดิม องศาเซลเซียส ที่ความเร็วการหมุนกังหันสูงสุดจะได้ผลลัพธ์ดังต่อไปนี้:


ส่งผลให้อุณหภูมิของ GPU สูงถึง 86 °C อย่างที่คุณเห็นการ์ดแสดงผลใหม่ร้อนมากและระบบระบายความร้อนก็มีเสียงดังในโหมด 3 มิติ อย่างไรก็ตาม ผู้มีโอกาสเป็นเจ้าของ GeForce GTX 480 ไม่ควรอารมณ์เสียเกี่ยวกับเรื่องนี้ เนื่องจากผลิตภัณฑ์ชั้นนำจาก NVIDIA และ ATI ไม่เคยมีอุณหภูมิและระดับเสียงต่ำมาก่อน นอกจากนี้ คูลเลอร์ทางเลือกจะปรากฏขึ้นในไม่ช้า ซึ่งจะ "นำ" คูลเลอร์มาตรฐานที่มีอุณหภูมิสูงถึง 30 ° C และในขณะเดียวกันก็ทำงานเงียบกว่าอย่างไม่มีที่เปรียบ (โปรดจำไว้ว่า Arctic Cooling Accelero Xtreme GTX 280หรือผลิตภัณฑ์เทอร์มอลไรท์) คำถามค่อนข้างจะแตกต่างออกไป - การซื้อผลิตภัณฑ์มูลค่า 500 ดอลลาร์สหรัฐนั้นสมเหตุสมผลเพียงใดซึ่งต้องเปลี่ยนระบบทำความเย็นมาตรฐานและมีแนวโน้มที่จะสูญเสียการรับประกัน? อีกทางเลือกหนึ่งคือรอให้ GeForce GTX 480 พร้อมคูลเลอร์ทางเลือกปรากฏขึ้น

ในการตรวจสอบศักยภาพการโอเวอร์คล็อกของ GeForce GTX 480 เราใช้ยูทิลิตี้ EVGA Precision v1.9.2:



เป็นที่ชัดเจนว่าด้วยการควบคุมอุณหภูมิบนโปรเซสเซอร์กราฟิกที่ "ดิบ" ที่ยังคง "ดิบ" ไม่มีใครคาดหวังผลลัพธ์ที่น่าประทับใจในการโอเวอร์คล็อกได้ และมันก็เกิดขึ้น - ความถี่ของโปรเซสเซอร์กราฟิกโดยไม่สูญเสียความเสถียรและคุณภาพของภาพลดลงเพียง 45 MHz ด้วย 745 MHz สุดท้าย (+6.4%) แต่ชิปหน่วยความจำ 0.4 ns นั้นเป็นที่ชื่นชอบอย่างแท้จริง ทำให้สามารถทำงานได้อย่างเสถียรที่ความเร็ว 4780 MHz (+29.3%):


ฉันไม่แน่ใจ 100% ว่าการทดสอบหน่วยความจำจาก OCCT เวอร์ชันล่าสุดทำงานได้อย่างถูกต้องกับ GeForce GTX 480 แต่จะทดสอบหน่วยความจำเกือบทั้งหมด 1.5 GB ที่มีอยู่ในการ์ดแสดงผล:



การโอเวอร์คล็อกหน่วยความจำวิดีโอไม่ส่งผลกระทบต่อสภาพอุณหภูมิของแผงวงจรพิมพ์ของการ์ดแสดงผลและโปรเซสเซอร์กราฟิกซึ่งค่อนข้างสมเหตุสมผล

ในตอนท้ายของการตรวจสอบการ์ดแสดงผลใหม่ เราขอเตือนคุณว่าราคาที่แนะนำสำหรับ NVIDIA GeForce GTX 480 คือ 499 ดอลลาร์ การขายการ์ดวิดีโอควรเริ่มทั่วโลกในวันที่ 12 เมษายน

การกำหนดค่าการทดสอบ เครื่องมือ และวิธีการทดสอบ

การทดสอบทั้งหมดดำเนินการภายในเคสยูนิตระบบแบบปิด การกำหนดค่าประกอบด้วยส่วนประกอบต่อไปนี้:

เมนบอร์ด: ASUS P6T Deluxe (Intel X58 Express, LGA 1366, BIOS 2101);
โปรเซสเซอร์กลาง: Intel Core i7-920, 2.67 GHz (Bloomfield, C0, 1.2 V, 4x256 KB L2, 8 MB L3);
ระบบระบายความร้อน: XIigmatek Balder SD1283 (พร้อม Thermalright TR-FDB สองตัวที่ 1100 รอบต่อนาที);
อินเตอร์เฟซการระบายความร้อน: Arctic Cooling MX-2;
RAM: DDR3 3x2 GB Wintec AMPX 3AXH1600C8WS6GT (1600 MHz / 8-8-8-24 / 1.65 V);
ดิสก์ระบบ: SSD OCZ Agility EX (SATA-II, 60 GB, SLC, Indillinx, เฟิร์มแวร์ v1.31);
ดิสก์สำหรับเกมและการทดสอบ: เวสเทิร์น ดิจิตอล VelociRaptor (SATA-II, 300 GB, 10,000 rpm, 16 MB, NCQ) ในกล่อง Scythe Quiet Drive ขนาด 3.5";
ดิสก์เก็บถาวร: Western Digital Caviar Green WD10EADS (SATA-II, 1000 GB, 5400 rpm, 32 MB, NCQ);
เคส: Antec Twelve Hundred (ผนังด้านหน้า - Noiseblocker NB-Multiframe S-Series MF12-S1 สามตัวที่ 900 rpm; ด้านหลัง - Scythe SlipStream 120 สองตัวที่ 900 rpm; ด้านบน - พัดลมมาตรฐาน 200 มม. ที่ 400 rpm );
แผงควบคุมและการตรวจสอบ: Zalman ZM-MFC2;
แหล่งจ่ายไฟ: Zalman ZM1000-HP 1000 W, พัดลม 140 มม.
จอมอนิเตอร์: 30" Samsung 305T Plus

เพื่อลดการพึ่งพาโปรเซสเซอร์ของการ์ดแสดงผลในบางโหมดของเกมแต่ละเกมที่รวมอยู่ในการทดสอบ โปรเซสเซอร์ Quad-Core 45 นาโนเมตรถูกโอเวอร์คล็อกด้วยตัวคูณ 21 และฟังก์ชันการปรับเทียบ Load-Line เปิดใช้งานเป็น 4.0 GHz โดยเพิ่มขึ้น แรงดันไฟฟ้าถึง ไบออสเมนบอร์ดบอร์ดสูงถึง 1.3725 V



RAM ทำงานด้วยไทม์มิ่ง 7-7-7-14-1T ที่แรงดันไฟฟ้า 1.64 V พารามิเตอร์อื่นๆ ทั้งหมดใน BIOS ของเมนบอร์ดที่เกี่ยวข้องกับการโอเวอร์คล็อกโปรเซสเซอร์หรือหน่วยความจำไม่เปลี่ยนแปลง (เหลืออยู่ในตำแหน่ง "อัตโนมัติ")

สำหรับการเปรียบเทียบกับ NVIDIA GeForce GTX 480, Leadtek WinFast GTX 285 และ XFX GeForce GTX 295 2x896 MB:




ในบรรดาการ์ดแสดงผลบน ATI GPU การทดสอบรวมถึง Radeon HD 5870 1 GB และโปรเซสเซอร์คู่ Radeon HD 5970 2x1 GB:




ตอนนี้เรามาดูส่วนซอฟต์แวร์และเครื่องมือกันดีกว่า การทดสอบซึ่งเริ่มเมื่อวันที่ 23 มีนาคม พ.ศ. 2553 ดำเนินการภายใต้การดูแลของ ระบบปฏิบัติการ Microsoft Windows 7 Ultimate x64 พร้อมการอัปเดตที่สำคัญทั้งหมด ณ วันที่ที่ระบุและมีไดรเวอร์ต่อไปนี้:

เมนบอร์ดชิปเซ็ต บอร์ดอินเทลไดรเวอร์ชิปเซ็ต - 9.1.1.1025 WHQL ;
ไลบรารีรันไทม์ของผู้ใช้ DirectX วันที่วางจำหน่าย - กุมภาพันธ์ 2553
ไดรเวอร์การ์ดแสดงผลสำหรับ ATI Catalyst 10.3 GPUs;
ไดรเวอร์การ์ดแสดงผลสำหรับ NVIDIA GPUs: ไดรเวอร์ GeForce/ION 197.17 เบต้าสำหรับ GeForce GTX 480 และ ไดรเวอร์ GeForce/ION 197.25 เบต้าสำหรับการ์ดแสดงผล NVIDIA อื่น ๆ
ไดรเวอร์เร่งความเร็วทางฟิสิกส์ - NVIDIA ซอฟต์แวร์ระบบ PhysX 9.10.0129.

การทดสอบการ์ดแสดงผลในเกมดำเนินการในสองความละเอียด: 1920x1080 และ 2560x1600 ในความเห็นของเรา การทดสอบการ์ดแสดงผลที่มีประสิทธิภาพดังกล่าวด้วยความละเอียดที่ต่ำกว่านั้นไม่มีประโยชน์ในทางปฏิบัติ และจะนำไปสู่การเพิ่มจำนวนการทดสอบและการจำกัดประสิทธิภาพของการ์ดแสดงผลตามความเร็วของแพลตฟอร์มเท่านั้น

สำหรับการทดสอบ มีการใช้โหมดคุณภาพกราฟิกสองโหมด: "คุณภาพสูง + AF16x" - คุณภาพพื้นผิวสูงสุดในไดรเวอร์ที่เปิดใช้งานการกรองแอนไอโซทรอปิกระดับ 16x และ "คุณภาพสูง + AF16x + AA 4(8)x" พร้อมการกรองแอนไอโซทรอปิกระดับ 16x เปิดใช้งานและป้องกันนามแฝง (MSAA) แบบเต็มหน้าจอเป็น 4x หรือ 8x หากอัตราเฟรมเฉลี่ยยังคงสูงพอสำหรับเกมที่สะดวกสบาย การกรองแบบแอนไอโซทรอปิกและการลดรอยหยักแบบเต็มหน้าจอเปิดใช้งานโดยตรงในการตั้งค่าเกมหรือในการตั้งค่าเหล่านั้น ไฟล์การกำหนดค่า. หากไม่มีการตั้งค่าเหล่านี้ในเกม พารามิเตอร์จะเปลี่ยนไปในแผงควบคุมของไดรเวอร์ Catalyst และ GeForce การซิงค์แนวตั้งถูกปิดใช้งานในแผงควบคุมไดรเวอร์

เกมทั้งหมดได้รับการอัปเดตด้วยแพตช์ล่าสุดเมื่อเริ่มจัดทำบทความนี้ ในที่สุด รายการทดสอบประกอบด้วยแพ็คเกจกึ่งสังเคราะห์ 2 ชุด การสาธิตเทคโน 1 รายการ และเกม 21 เกม ซึ่งรวมถึง ข่าวล่าสุด. ต่อไปนี้คือลักษณะของรายการทดสอบพร้อมคำอธิบายสั้นๆ เกี่ยวกับเทคนิคต่างๆ (เกมจะจัดเรียงตามลำดับการเปิดตัว):

3DMark 2006 (DirectX 9/10) - สร้าง 1.2.0, การตั้งค่าเริ่มต้นและ 2560x1600 พร้อม AF16x และ AA8x;
3DMark Vantage (DirectX 10) - เวอร์ชัน 1.0.2.1, โปรไฟล์การตั้งค่า "ประสิทธิภาพ" (ดำเนินการทดสอบพื้นฐานเท่านั้น)
Unigine Heaven Demo (DirectX 11) - เวอร์ชัน 2.0, การตั้งค่าคุณภาพสูงสุด, เทสเซลเลชั่น "สุดขีด"
World In Conflict (DirectX 10) - เวอร์ชัน 1.0.1.0(b34), โปรไฟล์คุณภาพกราฟิก “สูงมาก”, “Water Reflection Clouds” - เปิด, ทดสอบในตัวเกม;
Crysis (DirectX 10) - เวอร์ชัน 1.2.1, โปรไฟล์การตั้งค่า "สูงมาก", การบันทึกการสาธิต "Assault Harbor" สองรอบจาก Crysis Benchmark Tool เวอร์ชัน 1.0.0.5;
Unreal Tournament 3 (DirectX 9) - เวอร์ชัน 2.1, การตั้งค่ากราฟิกสูงสุดในเกม (ระดับ 5), เปิดใช้งาน Motion Blur และ Hardware Physics, ฉาก FlyBy ได้รับการทดสอบที่ระดับ "vCTF-Corruption" (สองรอบติดต่อกัน), HardwareOC UT3 คือ ใช้ม้านั่ง v1.5.0.0;
สภาพ Lost Planet Extreme: Colonies Edition (DirectX 10) - เวอร์ชัน 1.0, ระดับกราฟิก “คุณภาพสูงสุด”, การเรนเดอร์ HDR DX10, การทดสอบในตัวเกม, ผลลัพธ์จะแสดงในฉากแรก (ARENA1)
Far Cry 2 (DirectX 10) - เวอร์ชัน 1.03, โปรไฟล์การตั้งค่า “Ultra High”, รอบการทดสอบสองครั้ง “Ranch Small” จาก Far Cry 2 Benchmark Tool v1.0.0.1;
Call of Duty 5: World at War (DirectX 9) - เกมเวอร์ชัน 1.6, การตั้งค่ากราฟิกและพื้นผิวที่ตั้งค่าเป็นระดับ "พิเศษ", การบันทึกการสาธิต "Breach" ในระดับชื่อเดียวกัน
BattleForge: Lost Souls (DirectX 11) - เวอร์ชัน 1.2 (03/19/2010), การตั้งค่าคุณภาพกราฟิกสูงสุด, เปิดใช้งานเงา, เปิดใช้งานเทคโนโลยี SSAO, การทดสอบรันสองครั้งในตัวเกม;
Stormrise (DirectX 10.1) - เวอร์ชัน 1.0.0.0, การตั้งค่าคุณภาพสูงสุดสำหรับเอฟเฟกต์และเงา, ปิดใช้งาน “การบดบังบรรยากาศ”, การรันฉากสาธิตสองครั้งในภารกิจ “$mn_sp05”;
Tom Clancy's H.A.W.X. (DirectX 10) - เวอร์ชัน 1.03, การตั้งค่าคุณภาพกราฟิกสูงสุด, เปิดใช้งานเทคนิค HDR, DOF และ Ambient occlusion, การทดสอบในตัว (รันสองครั้ง);
Call of Juarez: Bound in Blood (DirectX 10.1) - เวอร์ชัน 1.0.1.0, การตั้งค่าคุณภาพกราฟิกสูงสุด, ขนาดแผนที่เงา = 1024, การบันทึกสาธิต 110 วินาทีที่จุดเริ่มต้นของระดับ "Miners Massacre";
Wolfenstein MP (OpenGL 2.0) - เวอร์ชัน 1.3, การตั้งค่ากราฟิกสูงสุด, การบันทึกการสาธิตของตัวเอง "d2" ที่ระดับ "Manor";
Batman: Arkham Asylum (Direct3D 9) - เวอร์ชัน 1.1, รายละเอียดสูงสุด, “ฟิสิกส์” สูงสุด, การทดสอบสองครั้งที่สร้างในเกม;
Resident Evil 5 (DirectX 10.1) - เวอร์ชัน 1.0 ทดสอบการทดสอบตัวแปรด้วยการตั้งค่ากราฟิกสูงสุดโดยไม่มีภาพเบลอ ผลลัพธ์ที่ได้ถือเป็นค่าเฉลี่ยของฉากที่สามของการทดสอบซึ่งใช้ทรัพยากรมากที่สุด
S.T.A.L.K.E.R.: Call of Pripyat (DirectX 11) - เวอร์ชัน 1.6.02, โปรไฟล์การตั้งค่า “ปรับปรุงแสงแบบไดนามิก DX11” พร้อมการตั้งค่าด้วยตนเองเพิ่มเติมของพารามิเตอร์ทั้งหมดให้สูงสุด ทดสอบการบันทึกการสาธิตของเราเอง “cop03” ที่ระดับ “Backwater”;
Borderlands (DirectX 9) - เกมเวอร์ชัน 1.2.1 ทดสอบ "timedemo1_p" ด้วยการตั้งค่าคุณภาพสูงสุด
Left 4 Dead 2 (DirectX 9) - เกมเวอร์ชัน 2.0.1.1 คุณภาพสูงสุด ทดสอบการบันทึกการสาธิต "d333" (สองรอบ) บนแผนที่ "Swamp Fever" ด่าน "Swamp";
Colin McRae: DiRT 2 (DirectX 9/11) - เกมเวอร์ชัน 1.1 การทดสอบในตัวประกอบด้วยสองรอบในสนามลอนดอนพร้อมการตั้งค่าคุณภาพกราฟิกสูงสุด
Wings Of Prey (DirectX 9) - เกมเวอร์ชัน 1.0.2.1 คุณภาพพื้นผิว "Ultra Ultra High" และการตั้งค่าคุณภาพกราฟิกสูงสุดอื่น ๆ ทดสอบการบันทึกการสาธิตสองนาทีที่ระดับ "Escort" จากแคมเปญ "Battle of Britain"
Warhammer 40,000: Dawn of War II - Chaos Rising (DirectX 10.1) - เวอร์ชัน 2.1.0.4679 การตั้งค่ากราฟิกในเมนูเกมได้รับการตั้งค่าไว้ที่ระดับ "Ultra" การทดสอบสามหรือสี่ครั้งที่มีอยู่ในเกม
Metro 2033 (DirectX 10/11) - เวอร์ชัน 1.0, การตั้งค่าคุณภาพสูงสุด, ใช้ฉากที่มีสคริปต์นาน 160 วินาทีในการทดสอบ ที่ระดับ Chaser การส่งผ่านแบบลำดับสองครั้ง
Just Cause 2 (DirectX 11) - เวอร์ชัน 1.0.0.1, การตั้งค่าคุณภาพสูงสุด, ปิดใช้งานเทคนิคการเบลอพื้นหลังและการจำลองน้ำของ GPU, การสาธิต Dark Tower ตามลำดับสองครั้ง

มากกว่า คำอธิบายโดยละเอียดคุณสามารถค้นหาวิธีทดสอบการ์ดแสดงผลและการตั้งค่ากราฟิกได้ในเกมบางเกมที่อยู่ในรายการที่สร้างขึ้นเป็นพิเศษ หัวข้อการประชุมของเราพร้อมทั้งร่วมหารือและปรับปรุงเทคนิคเหล่านี้

หากเกมใช้ความสามารถในการบันทึกจำนวนเฟรมขั้นต่ำต่อวินาที สิ่งนี้ก็สะท้อนให้เห็นในไดอะแกรมด้วย การทดสอบแต่ละครั้งดำเนินการสองครั้ง โดยผลสุดท้ายจะเป็นค่าที่ดีที่สุดของทั้งสองค่าที่ได้รับ แต่เฉพาะในกรณีที่ความแตกต่างระหว่างค่าเหล่านั้นไม่เกิน 1% หากความแตกต่างระหว่างการทดสอบเกิน 1% ให้ทำการทดสอบซ้ำอย่างน้อยหนึ่งครั้งเพื่อให้ได้ผลลัพธ์ที่ถูกต้อง

ผลการทดสอบประสิทธิภาพของการ์ดแสดงผลและการวิเคราะห์

ในแผนภาพผลการทดสอบสำหรับการ์ดวิดีโอ ATI Radeon HD 5970 และ Radeon HD 5870 จะถูกเน้นด้วยสีแดง ซึ่งเป็นฮีโร่ของบทความในวันนี้ GeForce GTX 480 อยู่ในสีเขียว NVIDIA แบบดั้งเดิม และ GeForce GTX 295 และ GTX การ์ดแสดงผล 285 ใบมีเครื่องหมายสีน้ำเงินเขียว การทดสอบการ์ดแสดงผลที่โอเวอร์คล็อกไม่ได้ดำเนินการโดยเป็นส่วนหนึ่งของบทความของวันนี้ เนื่องจากสมควรได้รับบทความแยกต่างหาก

ลองดูผลการทดสอบและวิเคราะห์กัน

3ดีมาร์ก 2549



ในการทดสอบกึ่งสังเคราะห์ครั้งแรก GeForce GTX 480 นั้นเหนือกว่าคู่แข่งหลักอย่าง Radeon HD 5870 เพียงเล็กน้อยเท่านั้น แต่การ์ดแสดงผลทั้งสองนั้นเร็วกว่า GeForce GTX 295 ที่ใช้โปรเซสเซอร์ดูอัล Radeon HD 5970 ในโหมดคุณภาพสูง และความละเอียด 2560x1600 นั้นเหนือกว่าผู้เข้าร่วมการทดสอบอื่นๆ ทั้งหมด รวมถึง GeForce GTX 480

3ดีมาร์ค แวนเทจ



สถานการณ์จะแตกต่างกันเล็กน้อยใน 3DMark Vantage แต่เฉพาะในโปรไฟล์การตั้งค่า "ประสิทธิภาพ" เท่านั้น โดยที่ GeForce GTX 480 นั้นเป็น "นกแก้ว" 3D เกือบ 2,000 ตัวที่เร็วกว่า Radeon HD 5870 ด้วยการโหลดที่เพิ่มขึ้น การ์ดแสดงผลจึงแสดงประสิทธิภาพที่เหมือนกัน .

Unigine Heaven สาธิต 2.0

เนื่องจากการ์ดแสดงผล GeForce GTX 285 และ GTX 295 ไม่รองรับ DirectX 11 เพื่อการเปรียบเทียบที่ถูกต้องกับ GeForce GTX 480 การ์ดเหล่านี้ทั้งหมดจึงได้รับการทดสอบก่อนหน้านี้ในโหมด DirectX 10 โดยปิดใช้งานเทสเซลเลชั่น:



ผลลัพธ์ของ GeForce GTX 480 ในการสาธิต Heaven เป็นเหมือนยาหม่องสำหรับจิตวิญญาณของผู้ซื้อการ์ดแสดงผลนี้ แท้จริงแล้ว ผลิตภัณฑ์ใหม่นี้แสดงให้เห็นถึงประสิทธิภาพที่ยอดเยี่ยม และในโหมดที่ยากที่สุด ก็มีประสิทธิภาพเหนือกว่าคู่แข่งสองรายจากค่ายของตัวเองอย่างมาก

ตอนนี้เรามาดูกันว่า GeForce GTX 480 ในโหมด DirectX 11 ดีแค่ไหนโดยเปิดใช้งาน tessellation (ผลลัพธ์ของการ์ดแสดงผลใน DirectX 10 เป็นตัวเอียง):


อย่างที่คุณเห็น GeForce GTX 480 แข่งขันกับโปรเซสเซอร์ดูอัล Radeon HD 5970 ได้อย่างง่ายดายและทิ้งคู่แข่งโดยตรงอย่าง Radeon HD 5870 ไว้ไกล หากในอนาคตอันใกล้นี้เทสเซลจะมีชัยในเกมการซื้อ GeForce GTX 480 จะดูมากกว่านั้นมาก น่าสนใจกว่า ATI อย่างไรก็ตาม นี่เป็นเหมือน "การคาดเดาใบชา" มากกว่า ดังนั้นเรามาปล่อยให้เรื่องนี้เป็นหน้าที่ของพวกคลั่งไคล้และไปยังการทดสอบการเล่นเกมกันดีกว่า

โลกในความขัดแย้ง


ในเกม World in Conflict GeForce GTX 480 กลายเป็นว่าเร็วกว่า Radeon HD 5870 และยังสามารถแข่งขันกับ GeForce GTX 295 โปรเซสเซอร์ดูอัลได้สำเร็จซึ่งเหนือกว่ารุ่นหลังในจำนวนเฟรมขั้นต่ำต่อวินาที ประสิทธิภาพของการ์ดวิดีโอ Radeon HD 5970 แบบดูอัลชิปนั้นอยู่นอกเหนือการเข้าถึงของผู้เข้าร่วมการทดสอบในปัจจุบัน แต่การ์ดแสดงผลนี้ไม่มีความเหนือกว่าในจำนวนเฟรมขั้นต่ำต่อวินาทีซึ่งสำคัญมากสำหรับความสะดวกสบาย การเล่นเกม

คริซิส


หลายคนคาดหวังว่าด้วยการเปิดตัว "Fermi" ในที่สุดเกม Crysis ก็จะถูกยึดครองด้วยการ์ดแสดงผลตัวประมวลผลตัวเดียวเช่นกัน แต่กลับกลายเป็นว่าห่างไกลจากกรณีนี้ นอกจากนี้ GeForce GTX 480 ยังมีข้อได้เปรียบเหนือ Radeon HD 5870 เล็กน้อย ซึ่งสร้างความประหลาดใจให้กับหลายๆ คนที่คาดหวังผลิตภัณฑ์ใหม่นี้ แต่ GTX 480 ในโหมดคุณภาพที่ยากที่สุดจะให้จำนวนเฟรมขั้นต่ำต่อวินาทีในระดับที่สูงกว่าและยังสามารถจัดการกับ GeForce GTX 295 ได้อย่างง่ายดาย

การแข่งขันอันเรียล 3


Unreal Tournament 3 ยังคงวาดภาพ "ภาพเขียนสีน้ำมัน" ต่อไป โดยจัดอันดับการ์ดแสดงผลตามประสิทธิภาพในลักษณะเดียวกับที่พิจารณาจากราคา GeForce GTX 480 เร็วกว่า Radeon HD 5870 แต่ช้ากว่าการ์ดแสดงผลแบบดูอัลโปรเซสเซอร์ทั้งสองตัว

สภาพ Lost Planet Extreme: Colonies Edition


สิ่งสูงสุดที่ GeForce GTX 480 สามารถทำได้ในเกม Lost Planet คือการแซงหน้า Radeon HD 5870 ในโหมดทดสอบสามในสี่โหมดและแข่งขันอย่างเท่าเทียมกันกับ GeForce GTX 295 การ์ดแสดงผล Radeon HD 5970 แบบโปรเซสเซอร์คู่คือ ยังเร็วที่สุด

ไกลร้องไห้ 2


เป็นไปไม่ได้ที่จะไม่สังเกตประสิทธิภาพที่ค่อนข้างมั่นใจของการ์ดแสดงผลใหม่ในเกม Far Cry 2 โดยที่ GeForce GTX 480 ไม่เพียง แต่ทิ้ง Radeon HD 5870 ไว้ข้างหลังทุกที่เท่านั้น แต่ยังแข่งขันกันอย่างเท่าเทียมกับ "เครื่องบิน" ผู้ให้บริการ” Radeon HD 5970 ในโหมดกราฟิกคุณภาพสูงโดยใช้การลดรอยหยักแบบเต็มหน้าจอ

Call of Duty 5: โลกแห่งสงคราม


หากต้องการเล่น Call of Duty 5: World at War ซึ่งไม่ต้องการมาตรฐานสมัยใหม่เลย การ์ดแสดงผลที่ทดสอบในปัจจุบันก็เพียงพอแล้ว รวมถึงความละเอียด 2560x1600 และ MSAA8x อย่างไรก็ตามหากเราเปรียบเทียบ GeForce GTX 480 และ Radeon HD 5870 เราสามารถพูดถึงประสิทธิภาพที่เท่าเทียมกันของการ์ดแสดงผลในเกมนี้

BattleForge: วิญญาณที่หายไป


แม้ว่า BattleForge: Lost Souls จะเป็นเกมมืออาชีพ ATI แต่การ์ดแสดงผลบน NVIDIA GF100 GPU จะแพ้ Radeon HD 5870 ในโหมดที่ไม่มีเทคนิคการปรับปรุงคุณภาพกราฟิกเท่านั้น เมื่อเปิดใช้งานการป้องกันนามแฝง GeForce GTX 480 ก็สามารถก้าวไปข้างหน้าได้เล็กน้อย

สตอร์มไรซ์


แต่ในเกมอื่นที่เปิดตัวภายใต้การดูแลอย่างใกล้ชิดของ ATI การ์ดแสดงผล GeForce GTX จะไม่มีโอกาส ดังนั้นพวกเขาจะแข่งขันกันเองเท่านั้น

H.A.W.X. ของ Tom Clancy


ในโปรแกรมจำลองการบิน H.A.W.X. ของ Tom Clancy ตรงกันข้าม GeForce GTX 480 ไม่เพียงบดขยี้ Radeon HD 5870 เท่านั้น แต่ยังรวมถึง Radeon HD 5970 ซึ่งเป็นเรือธงที่ใช้โปรเซสเซอร์คู่ด้วย โปรดทราบว่าในโหมดกราฟิกคุณภาพสูงข้อดีของ GTX 480 เหนือ GTX 285 เกิน 2 เท่า

Call of Juarez: ผูกพันในเลือด



Call of Juarez: Bound in Blood เช่น BattleForge และ Stormrise เหมาะกว่าสำหรับการ์ดวิดีโอที่ใช้ ATI GPU อย่างไรก็ตาม สิ่งนี้ไม่ได้ป้องกัน GeForce GTX 480 จากการล้ำหน้า Radeon HD 5870 ควรสังเกตว่า Call of Juarez ไม่สามารถจัดเป็นเกมที่ใช้ทรัพยากรมากได้ เนื่องจากแม้จะมีความละเอียดสูงสุดหนึ่ง GeForce GTX 285 หรือ Radeon HD 4870 บางรุ่น HD 5770 ก็เพียงพอแล้ว

ส.ส.วูลเฟนสไตน์


ชัยชนะของการ์ดแสดงผล ATI ใน Wolfenstein ค่อนข้างน่าประหลาดใจเนื่องจาก NVIDIA ทำงานได้ดีกว่ากับ OpenGL มาโดยตลอดและตามกฎแล้วเป็นผู้นำในเกมดังกล่าว อย่างไรก็ตาม GeForce GTX 480 ไม่ตรงกับ Radeon HD 5870 ในเกมนี้

แบทแมน: โรงพยาบาลอาร์กแฮม


แต่มีบางอย่างที่จะต่อต้านในเกม Batman: Arkham Asylum กล่าวคือการสนับสนุนฮาร์ดแวร์เพื่อเร่งเอฟเฟกต์ทางกายภาพ PhysX เพื่อให้การ์ดแสดงผลที่ใช้ ATI GPU ทำงานได้สำเร็จในเกมนี้ คุณต้องติดตั้ง GeForce เป็นการ์ดแสดงผลตัวที่สอง หรือปิดใช้งานเอฟเฟกต์เหล่านี้ทั้งหมด จริงอยู่ที่เกมมีข้อบกพร่องมากในแง่กราฟิกดังนั้นตัวเลือกแรกจึงน่าสนใจกว่ามากแม้ว่าจะมีราคาแพงกว่าในแง่ของการเงินและเวลาในการจัดระเบียบการทำงานร่วมกันของไดรเวอร์ Catalyst และ GeForce นอกจากนี้ควรสังเกตว่า GeForce GTX 480 แสดงให้เห็นถึงประสิทธิภาพที่ยอดเยี่ยมใน Batman: Arkham Asylum ซึ่งเหนือกว่า GeForce GTX 295 แบบโปรเซสเซอร์คู่

เรซิเดนต์อีวิล 5


GeForce GTX 480 ไม่ทิ้งโอกาสให้กับคู่แข่งในเกม Resident Evil 5 ยิ่งไปกว่านั้นดังที่เราเห็นการ์ดแสดงผลที่ใช้โปรเซสเซอร์กราฟิก GF100 ใหม่สามารถต้านทานโปรเซสเซอร์ยักษ์ใหญ่ทั้งสองในรูปแบบของ GeForce GTX ได้สำเร็จ 295 และ Radeon HD 5970

S.T.A.L.K.E.R.: เสียงเรียกของ Pripyat

เราต้องเตือนคุณอีกครั้งว่าการ์ดแสดงผล GeForce GTX 285 และ GTX 295 ไม่รองรับ DirectX 11 ดังนั้นก่อนที่จะดูแผนภาพหลักเพื่อการเปรียบเทียบที่ถูกต้องกับ GeForce GTX 480 ตัวหลังได้รับการทดสอบก่อนหน้านี้ใน DirectX 10 โหมด:



ไม่สามารถพูดได้ว่าประสิทธิภาพของ GeForce GTX 480 ในเกม S.T.A.L.K.E.R.: Call of Pripyat อยู่ในระดับสูง ไม่มีข้อได้เปรียบที่สำคัญเหนือ GTX 285 หรืออย่างน้อยก็มีความก้าวหน้าเหนือ GTX 295 และใน DirectX 11 การ์ดแสดงผลใหม่ไม่มีอะไรจะอวด:




ชายแดน


ในเกม Borderlands การต่อสู้ระหว่าง Radeon HD 5870 และ GeForce GTX 480 ดำเนินไปด้วยระดับความสำเร็จที่แตกต่างกัน ในโหมดที่ไม่มีการลดรอยหยัก การ์ดแสดงผลที่ใช้ NVIDIA GPU จะเร็วขึ้น และเมื่อเปิดใช้งาน MSAA8x Radeon จะออกมาข้างหน้า แต่มีความละเอียดเพียง 1920x1080 เท่านั้น

เหลือ 4 ตาย 2


หากคุณชอบที่จะบดขยี้ซอมบี้อย่างไม่มีที่สิ้นสุดในเกม Left 4 Dead 2 ก็ควรเลือกใช้การ์ดแสดงผลที่มี ATI GPU เนื่องจากการ์ดแสดงผลมีประสิทธิภาพสูงกว่าการ์ด NVIDIA เกมดังกล่าวไม่ต้องใช้ทรัพยากรมาก ดังนั้นการ์ดแสดงผลที่ทดสอบในวันนี้ก็เพียงพอแล้ว

คอลิน แมคเร: DiRT 2

การ์ดแสดงผล GeForce GTX 2xx ไม่รองรับ DirectX 11 ดังนั้นก่อนอื่นเราจะเปรียบเทียบ GeForce GTX 480 กับการ์ดเหล่านี้ในโหมด DirectX 9 ที่ยุติธรรม:



ต่อไปเรามาดูผลลัพธ์ใน DirectX 11 ที่การ์ดวิดีโอ Radeon เข้าร่วมอยู่แล้ว (ผลลัพธ์ DX9 สำหรับ GTX 2xx ก็มีอยู่เช่นกัน แต่เป็นตัวเอียง):


แม้ว่าจะไม่มากนัก แต่ GeForce GTX 480 ก็ยังเร็วกว่า Radeon HD 5870 ในเกมนี้

ปีกแห่งเหยื่อ


เทคโนโลยี CrossFireX ไม่ทำงานในเครื่องจำลองการบินใหม่ Wings Of Prey ดังนั้น Radeon HD 5970 จึงกลายเป็นการ์ดแสดงผลที่ช้าที่สุดในการทดสอบ ในขณะเดียวกัน เทคโนโลยี SLI ก็ใช้งานได้ดี ทำให้ GeForce GTX 295 เหนือกว่าการ์ดแสดงผลอื่นๆ GeForce GTX 480 นั้นเหนือกว่า Radeon HD 5870 เล็กน้อยในแง่ของผลรวมการทดสอบในทุกโหมด

Warhammer 40,000: Dawn of War II - ความโกลาหลที่เพิ่มขึ้น


Warhammer 40,000: Dawn of War II เป็นหนึ่งในเกมที่ต้องใช้โปรเซสเซอร์มากที่สุด ดังนั้นผลลัพธ์จึงสามารถเปรียบเทียบได้ในโหมดคุณภาพสูงสุดและความละเอียด 2560x1600 เท่านั้น ซึ่ง GeForce GTX 480 นั้นเร็วกว่า Radeon HD 5870 เล็กน้อยในแง่ของ เฟรมเฉลี่ยต่อวินาที แต่ช้ากว่าในแง่ของขั้นต่ำ โดยทั่วไปตามตัวบ่งชี้นี้ GeForce GTX 480 กลายเป็นการ์ดแสดงผลที่แย่ที่สุดใน Warhammer 40,000: Dawn of War II ซึ่งค่อนข้างบ่งชี้ว่าการปรับให้เหมาะสมไม่เพียงพอ ไดรเวอร์ GeForceดังนั้นมันอาจจะได้รับการแก้ไขในไม่ช้า

เมโทร 2033

การทดสอบการ์ดแสดงผลในเกมใหม่ Metro 2033 ดำเนินการตั้งแต่เริ่มต้นในระดับ "Chaser" ในฉากที่มีสคริปต์ซึ่งฮีโร่และผู้ช่วยสองคนนั่งบนรถเข็นและไม่สามารถเคลื่อนที่ได้เนื่องจากสามารถรับได้ ผลลัพธ์ที่มีความสามารถในการทำซ้ำในระดับสูงมาก การทดสอบดำเนินการโดยใช้ FRAPS ภายใน 160 วินาทีหลังจากโหลดระดับ เนื่องจากการตั้งค่าคุณภาพกราฟิกสูงสุดสำหรับ DirectX 11 Metro 2033 จึงเป็นไปได้ที่จะทดสอบการ์ดแสดงผลเพียงการ์ดเดียวจากห้ารายการที่เข้าร่วมในบทความ จึงใช้การเรนเดอร์ DirectX10 สำหรับการทดสอบ:



GeForce GTX 480 นั้นเร็วกว่า Radeon HD 5870 เล็กน้อยและการ์ดแสดงผลทั้งสองนี้ด้อยกว่าโปรเซสเซอร์ดูอัล Radeon HD 5970 อย่างมาก ขอเสริมว่าเทคโนโลยี CrossFireX ไม่ทำงานใน Wings Of Prey ใน Metro 2033 ที่เราเจอ ประสิทธิภาพต่ำของเทคโนโลยี SLI และในเกมถัดไป Just Cause 2 กลับกลายเป็นว่าใช้งานไม่ได้โดยสิ้นเชิง

หลังจากการทดสอบทั้งหมดเสร็จสิ้น ประสิทธิภาพของ GeForce GTX 480 ก็ได้รับการทดสอบเพิ่มเติมในเกม Metro 2033 และในโหมด DirectX 11 น่าเสียดายที่เมื่อถึงเวลานั้นเราได้คืนการ์ดแสดงผล Radeon HD 5870 และ HD 5970 แล้ว ดังนั้น ATI การ์ดแสดงผล Radeon HD 5850 ทำหน้าที่เป็นคู่แข่ง 1 GB โอเวอร์คล็อกจากเล็กน้อย 725/4000 MHz เพื่อการเปรียบเทียบ เราใช้ฉากสาธิต "Chaser" เดียวกันกับการตั้งค่าคุณภาพสูงสุด ผลลัพธ์มีความน่าสนใจมาก:



ที่ความละเอียด 1920x1080 Radeon HD 5850 ที่โอเวอร์คล็อกอยู่ไม่ไกลจาก GeForce GTX 480 แต่ที่ 2560x1600 "สไลด์โชว์" ที่แท้จริงจะเริ่มบน Radeon ในขณะที่ GeForce GTX 480 แสดงผลลัพธ์ที่สูงกว่าสามเท่า แต่สิ่งนี้ยังคงไม่อนุญาตให้การ์ดแสดงผลใหม่มอบจำนวนเฟรมต่อวินาทีที่สะดวกสบายให้กับผู้เล่นในเกมนี้ ยิ่งกว่านั้น แม้ในขณะที่เรียกใช้ฉากทดสอบ ฉันสังเกตเห็น "การเบลอ" ของรูปภาพบน GeForce และตัดสินใจตรวจสอบด้วยภาพหน้าจอ (แม้ว่าจะอยู่ในระดับที่แตกต่างกัน เนื่องจากคุณไม่สามารถจับภาพหน้าจอที่เหมือนกันใน "Chaser") คุณสามารถประเมินความแตกต่างของคุณภาพของภาพได้ด้วยตัวเอง (ความละเอียด 1920x1080):

ATI Radeon HD 5850 NVIDIA GeForce GTX 480







สังเกตได้ง่ายว่าคุณภาพของภาพบนการ์ดแสดงผล Radeon สูงขึ้นอย่างเห็นได้ชัด พื้นผิวทั้งหมดถูกวาดไว้อย่างชัดเจนมาก โดยไม่มีรอยเปื้อนหรือเบลอ ฉันขอเตือนคุณว่าการตั้งค่าคุณภาพกราฟิกในเกมเหมือนกันบนการ์ดแสดงผลทั้งสอง: เปิดใช้งาน DirectX 11, “สูงมาก”, AF16x, AAA, “Advanced DOF” และ “Tesselation” นอกจากนี้ ในไดรเวอร์ Catalyst และ GeForce/ION โหมดคุณภาพสูงสุดสำหรับการกรองพื้นผิวได้รับการตั้งค่าเป็น "คุณภาพสูง" (ค่าเริ่มต้นคือ "คุณภาพ") ดังนั้นอาจเป็นเพราะคุณภาพที่ลดลงนี้ที่ทำให้ GeForce GTX 480 ได้รับประสิทธิภาพที่สูงขึ้นใน Metro 2033? ผู้พัฒนาเกม Metro 2033 ตอบคำถามนี้ทันทีภายในเวลาไม่ถึงวัน นี่คือคำตอบ:

“ไม่ ความแตกต่างที่เห็นได้ชัดเจนในจอแสดงผลไม่เกี่ยวอะไรกับประสิทธิภาพของการ์ดแสดงผล แน่นอนว่าในโหมดการลดรอยหยักบางโหมด การ์ดแสดงผล NVIDIA และ ATI จะแสดงภาพที่แตกต่างกัน ตอนนี้เรากำลังพยายามทำความเข้าใจว่าสามารถแก้ไขได้เร็วแค่ไหน ขอย้ำอีกครั้งว่าสิ่งนี้ไม่เกี่ยวข้องกับประสิทธิภาพการทำงาน”

Oles Shishkovtsov, 4A Games, ประธานเจ้าหน้าที่ฝ่ายเทคนิค

เอาล่ะรอดู

เพียงแค่ทำให้เกิด 2


ในเกมใหม่ Just Cause 2 นั้น GeForce GTX 480 นั้นด้อยกว่า Radeon HD 5870 ในจำนวนเดียวกับที่ชนะใน Metro 2033

ต่อไป เรามาวิเคราะห์ผลลัพธ์ในแผนภูมิสรุปที่สร้างขึ้นจากการทดสอบเกมเท่านั้น

แผนภูมิสรุปการเปรียบเทียบประสิทธิภาพ

ในแผนภาพสรุปคู่แรกเราขอเชิญคุณประเมินประสิทธิภาพที่เพิ่มขึ้นของ GeForce GTX 480 เมื่อเปรียบเทียบกับการ์ดแสดงผลโปรเซสเซอร์เดี่ยวที่เร็วที่สุดของ NVIDIA GPU รุ่นก่อนหน้า - GeForce GTX 285 ซึ่งประสิทธิภาพในไดอะแกรมคือ ถือเป็น 100% และผลลัพธ์ของ GeForce GTX 480 จะแสดงเป็นเปอร์เซ็นต์เพิ่มขึ้น ( ในเกม S.T.A.L.K.E.R.: Call of Pripyat และ Colin McRae: DiRT 2 ผลลัพธ์ถูกเปรียบเทียบในการเรนเดอร์ DX10 และ DX9 ตามลำดับ):



โดยทั่วไปที่นี่ทุกอย่างชัดเจนและเข้าใจได้ ในโหมดที่ไม่มีการลดรอยหยัก โดยเฉลี่ยแล้ว GeForce GTX 480 จะเร็วกว่าในการทดสอบการเล่นเกมมากกว่าการ์ดวิดีโอระดับบนสุดของ GeForce GTX 285 รุ่นก่อนหน้าถึง 30-37% ขึ้นอยู่กับความละเอียด และในโหมดที่มีการป้องกันรอยหยัก นามแฝง 46-48% ควรสังเกตที่นี่ว่าด้วยการเปิดตัวการ์ดวิดีโอ Radeon ซีรีส์ที่ 5 ประสิทธิภาพที่เพิ่มขึ้นเมื่อเทียบกับการ์ดวิดีโอ ATI รุ่นก่อนหน้าก็สูงขึ้น การเพิ่มประสิทธิภาพที่เด่นชัดที่สุดได้รับการบันทึกไว้ในเกมเช่น Tom Clancy's H.A.W.X., Far Cry 2 และ Metro 2033 และความแตกต่างที่มีนัยสำคัญน้อยที่สุดในประสิทธิภาพของการ์ดวิดีโอทั้งสองนี้คือในเกมที่ไม่ต้องใช้ทรัพยากรมาก เช่น Call of Duty 5: โลกแห่งสงครามหรือ Wolfenstein

ไดอะแกรมต่อไปนี้มีไว้สำหรับการต่อสู้ระหว่างโปรเซสเซอร์ดูอัล GeForce GTX 295 และเรือธงตัวประมวลผลเดี่ยวรุ่นใหม่ GeForce GTX 480 ผลลัพธ์ของ GeForce GTX 295 ถือเป็นแกนศูนย์ (ในเกม S.T.A.L.K.E.R.: Call of Pripyat และ Colin McRae: DiRT 2 ผลลัพธ์ในการเรนเดอร์ DX10 และ DX9 ถูกเปรียบเทียบอีกครั้ง ตามลำดับ):



GeForce GTX 480 กำลังต่อสู้กับการ์ดวิดีโอโปรเซสเซอร์ดูอัลรุ่นก่อนหน้า GeForce GTX 295 ที่มีระดับความสำเร็จที่แตกต่างกัน ในบางเกม การ์ดแสดงผลแบบดูอัลชิปจะเร็วกว่า และในบางเกมคือ GeForce GTX 480 เรายังอดไม่ได้ที่จะนึกถึงการเผชิญหน้าครั้งก่อนระหว่าง Radeon HD 5870 และ Radeon HD 4870 X2 เมื่อการ์ดแสดงผลบน โปรเซสเซอร์กราฟิกใหม่นั้นเร็วกว่าเรือธงดูอัลชิปของรุ่นก่อนหน้าเกือบตลอดเวลา อย่างไรก็ตามในเกมใหม่ล่าสุด Metro 2033 และ Just Cause 2 ความเหนือกว่าของ GeForce GTX 480 นั้นค่อนข้างใหญ่เนื่องจากเทคโนโลยี SLI ที่ยังไม่สามารถใช้งานได้ในผลิตภัณฑ์ใหม่เหล่านี้

ตอนนี้จากผลรวมของการทดสอบเกมมาประเมินการเผชิญหน้าระหว่าง GeForce GTX 480 และ Radeon HD 5870 ใหม่ ผลลัพธ์จะแสดงในไดอะแกรมคู่ต่อไปนี้โดยที่ประสิทธิภาพของ Radeon HD 5870 ถือเป็นแกนศูนย์ และผลลัพธ์ของ GeForce GTX 480 สะท้อนให้เห็นในรูปแบบของการเบี่ยงเบนจากมัน:



และที่นี่เครื่องชั่งจะชี้ไปทางใดทางหนึ่ง โดยมีการเปลี่ยนแปลงที่สำคัญในเปอร์เซ็นต์การเพิ่มหรือลดความสามารถในการผลิต ดังนั้นในสิบสองเกม - World in Conflict, Crysis, Unreal Tournament 3, Lost Planet: Colonies, Far Cry 2, Tom Clancy's H.A.W.X., Call of Juarez: Bound in Blood (!), Batman: Arkham Asylum (ไม่มี "doping" สำหรับ Radeon ), Resident Evil 5, Borderlands, Colin McRae: DiRT 2 และ Metro 2033, GeForce GTX 480 อยู่ข้างหน้าและในห้าเกม - BattleForge, Stormrise, S.T.A.L.K.E.R.: Call of Pripyat, Left 4 Dead 2 และ Just Cause 2 - มันคือ เร็วขึ้นแล้ว Radeon HD 5870 ในสี่เกมที่เหลือมีทั้งความเท่าเทียมกันหรือข้อได้เปรียบเล็กน้อยของการ์ดแสดงผลตัวใดตัวหนึ่งอาจกล่าวได้ว่าความเหนือกว่าอย่างล้นหลามของ GeForce GTX 480 ที่ทุกคนรอคอยเหนือ Radeon HD 5870 ในปัจจุบันไม่มีอยู่จริง

ในที่สุดไดอะแกรมสองสามอันสุดท้ายซึ่งคุณสามารถดูช่องว่างระหว่าง GeForce GTX 480 และการ์ดแสดงผลที่เร็วที่สุดในยุคของเรา - Radeon HD 5970:



เทคโนโลยี CrossFireX ไม่ทำงานในเกม Wings Of Prey และการขาดการรองรับ PhysX ในเกม Batman: Arkham Asylum ทำให้ GeForce GTX 480 มีประสิทธิภาพเหนือกว่า Radeon HD 5970 ที่ใช้โปรเซสเซอร์ดูอัล ในเกม Tom Clancy's H.A.W.X. และ Resident Evil 5 ความเร็วของการ์ดแสดงผลจะใกล้เคียงกันและในกรณีอื่น ๆ Radeon HD 5970 จะเร็วกว่า GeForce GTX 480

การใช้พลังงาน ความร้อนของการ์ดแสดงผล และระดับเสียง

มีการใช้พลังงานของระบบที่มีการ์ดแสดงผลต่างกัน ดัดแปลงเป็นพิเศษเพื่อวัตถุประสงค์เหล่านี้แหล่งจ่ายไฟ โหลดสูงสุดถูกสร้างขึ้นโดยการรัน FurMark 1.8.0 หนึ่งตัวในโหมดทดสอบความเสถียรและความละเอียด 2560x1600 (พร้อม AF16x) รวมถึง FurMark ร่วมกับ Linpack x64 (LinX 0.6.4, 4096 MB, 7 เธรด) เมื่อพิจารณาแล้วว่าทั้งสองอย่าง โปรแกรมที่ระบุสร้างโหลดสูงสุดตามลำดับสำหรับระบบวิดีโอและโปรเซสเซอร์กลาง เพื่อให้เราสามารถค้นหาการใช้พลังงานสูงสุดของทั้งระบบและกำหนดแหล่งจ่ายไฟที่จำเป็นสำหรับระบบ (โดยคำนึงถึงประสิทธิภาพ)

ผลลัพธ์ที่ได้แสดงไว้ในแผนภาพ:






เห็นได้ง่ายว่าระบบที่มี GeForce GTX 480 ที่โหลดสูงสุดจะกินไฟมากกว่าระบบที่มี Radeon HD 5870 ประมาณ 130 วัตต์ ทั้งเมื่อโหลดด้วย FurMark และเมื่อรวมกับ FurMark และ Linpack x64 ยิ่งไปกว่านั้น ระบบที่ใช้ GeForce GTX 480 ยังกินไฟได้มากกว่าระบบที่ใช้โปรเซสเซอร์คู่ Radeon HD 5970! นี่เป็นการ์ดแสดงผลที่ "ตะกละ" อย่างแท้จริง ถึงกระนั้น GeForce GTX 295 ยังคงเป็นผู้นำด้านการใช้พลังงาน ในโหมด 2D ความแตกต่างระหว่างการใช้ระบบที่มีการ์ดวิดีโอ GeForce GTX 480 และ Radeon HD 5870 คือ 26 วัตต์โดยมีประโยชน์ต่อ Radeon โดยวิธีการเกี่ยวกับผลประโยชน์

สมมติว่าคุณเป็น "คนบ้าเกม" และเล่นวันละ 8 ชั่วโมงตลอดทั้งเดือน และลองจินตนาการว่าในช่วงเวลานี้โหลดบนระบบย่อยวิดีโอจะสูงสุดเสมอนั่นคือความแตกต่างในการใช้พลังงานของระบบที่มี NVIDIA GeForce GTX 480 และ ATI Radeon HD 5870 จะเท่ากับ 130 วัตต์ต่อชั่วโมงอย่างต่อเนื่อง ดังนั้นภายในหนึ่งเดือน ระบบที่มีการ์ดแสดงผล NVIDIA ใหม่จะ "กลืนกิน" ไฟฟ้ามากกว่าระบบที่มีการ์ดแสดงผล ATI ขนาด 32.2 kW ของคู่แข่ง! ฉันไม่พบต้นทุนปัจจุบันเฉลี่ยของกิโลวัตต์ชั่วโมงในสหพันธรัฐรัสเซีย (ได้รับการอนุมัติโดยหน่วยงานที่เป็นส่วนประกอบของสหพันธรัฐรัสเซีย) ดังนั้นเราจะยกตัวอย่างมอสโกโดยที่กิโลวัตต์ชั่วโมงจะขึ้นอยู่กับ มิเตอร์ภาษีเดียว ราคา 2 รูเบิล 42 โกเปค. ดังนั้นเจ้าของระบบที่ใช้ GeForce GTX 480 เมื่อเปรียบเทียบกับเจ้าของระบบที่ใช้ Radeon HD 5870 จะจบลงด้วย "การใช้จ่ายเกิน" มากถึง 78 รูเบิลต่อเดือน! ตามที่คุณเข้าใจเงื่อนไขที่กำหนดซึ่งได้รับเงินจำนวนนี้นั้นไม่สมจริง ที่จริงแล้วจำนวนเงินควรน้อยกว่าสี่เท่าเป็นอย่างน้อย แต่ถึงแม้ว่านี่จะเป็นเรื่องจริงและ 78 รูเบิลต่อเดือนก็กลายเป็นจริงแล้วลองตอบตัวเองดู - นี่เป็นเงินที่สามารถใช้เป็นข้อโต้แย้งได้จริงหรือเมื่อเปรียบเทียบการ์ดแสดงผลที่มีราคามากกว่า 18,000 รูเบิล?

ตอนนี้เรามาเปรียบเทียบสภาวะอุณหภูมิของการ์ดแสดงผลที่ทดสอบทั้งหมดกับการทำงานของกังหันอัตโนมัติ โหลดถูกสร้างขึ้นโดยการทดสอบ Firefly Forest 15 รอบจากแพ็คเกจ 3DMark 2006 กึ่งสังเคราะห์ที่ความละเอียด 2560x1600 พร้อมการกรองแบบแอนไอโซทรอปิกที่ระดับ 16x การทดสอบถูกดำเนินการในกล่องยูนิตระบบแบบปิดที่อุณหภูมิห้อง 25 °C ลองดูผลลัพธ์:



มีความเหนือกว่าอย่างมีนัยสำคัญของ Radeon HD 5870 เหนือ GeForce GTX 480 ในแง่ของอุณหภูมิ GPU ทั้งในโหมดไม่ได้ใช้งานและภายใต้การโหลด

และสิ่งสุดท้ายที่ต้องทำก่อนที่จะสรุปคือการประเมินระดับเสียงของการ์ดแสดงผล ระดับเสียงของระบบระบายความร้อนมาตรฐานของการ์ดวิดีโออ้างอิงวัดโดยใช้เครื่องวัดระดับเสียงอิเล็กทรอนิกส์ CENTER-321 หลังเวลา 13.00 น. ในห้องที่ปิดสนิทซึ่งมีพื้นที่ประมาณ 20 ตารางเมตร ม. พร้อมหน้าต่างกระจกสองชั้น ระดับเสียงของตัวทำความเย็นแต่ละตัววัดนอกตัวเครื่องยูนิตระบบ เมื่อแหล่งกำเนิดเสียงรบกวนเพียงตัวเดียวในห้องคือตัวทำความเย็นและกังหันของเครื่อง เครื่องวัดระดับเสียงซึ่งติดตั้งอยู่บนขาตั้งจะติดตั้งอยู่ที่จุดหนึ่งอย่างเคร่งครัดที่ระยะห่าง 150 มม. จากโรเตอร์พัดลมทำความเย็น เมนบอร์ดที่ใส่การ์ดแสดงผลโดยติดตั้งระบบระบายความร้อนไว้นั้นถูกวางไว้ที่มุมโต๊ะโดยใช้แผ่นรองโพลียูรีเทนโฟม:


ขีดจำกัดการวัดด้านล่างของเครื่องวัดระดับเสียงคือ 29.8 dBA และระดับเสียงของเครื่องทำความเย็นที่สะดวกสบาย (เพื่อไม่ให้สับสนกับระดับต่ำ) เมื่อวัดจากระยะห่างดังกล่าวคือประมาณ 37 dBA ความเร็วในการหมุนของกังหันของเครื่องทำความเย็นมาตรฐานเปลี่ยนไปตลอดช่วงการทำงานทั้งหมดโดยใช้ตัวควบคุมของเราโดยการเปลี่ยนแรงดันไฟฟ้าในขั้นตอน 0.5 V

ข้อมูลที่ได้รับเกี่ยวกับระดับเสียงของ Radeon HD 5970 และ HD 5870 แตกต่างกันภายใน 0.1 dBA ในแต่ละจุดการวัด ดังนั้นจึงรวมกันในกราฟ เป็นไปไม่ได้ที่จะวัดระดับเสียงของ GeForce GTX 295 บนขาตั้งเนื่องจากการ์ดแสดงผลนี้จะต้องถูกถอดประกอบทั้งหมดเพื่อไปที่ขั้วต่อกังหัน ผลการวัดจะแสดงในกราฟต่อไปนี้ (เส้นประแสดงช่วงความเร็วกังหันทั้งหมด เส้นทึบแสดงช่วงความเร็วจริงเมื่อทดสอบใน 3DMark 2006 ซึ่งเราได้อธิบายไว้ข้างต้น):



สิ่งแรกที่คุณต้องสังเกตจากผลการวัดคือความจริงที่ว่าไม่มีระบบระบายความร้อนมาตรฐานของการ์ดวิดีโออ้างอิงใดที่เงียบ สิ่งที่สองที่คุณสามารถใส่ใจได้คือเส้นโค้งระดับเสียงของตัวทำความเย็น GeForce GTX 480 ผ่านไปใต้เส้นโค้งระดับเสียงของคู่แข่งอย่าง Radeon HD 5870 เราสามารถสรุปได้ว่าตัวทำความเย็น GeForce GTX 480 นั้นเงียบกว่า Radeon มาตรฐานหรือไม่ HD 5870 คูลเลอร์? อย่างไรก็ตาม นี่เป็นเรื่องจริงสำหรับการเปรียบเทียบคูลเลอร์เหล่านี้ที่ความเร็วการหมุนของกังหันเท่ากัน แต่ในทางปฏิบัติสิ่งนี้จะไม่เกิดขึ้น เนื่องจากเมื่อกังหัน GeForce GTX 480 ทำงานโดยอัตโนมัติ ความเร็วในการหมุนจะแตกต่างกันไปในช่วงตั้งแต่ 2100 ถึง 3600 รอบต่อนาที ในขณะที่เปิดอยู่ Radeon HD 5870 มีช่วงความเร็วเพียง 1270-2040 รอบต่อนาที (ดูแผนภูมิอุณหภูมิด้านบน) เนื่องจากการกระจายความร้อนที่สูงมากของ GPU GF100 วิศวกรของ NVIDIA จึงต้องเพิ่มขีดจำกัดอุณหภูมิใน BIOS ของการ์ดแสดงผลและตั้งค่าเป็นความเร็วกังหันที่สูงขึ้น ผลลัพธ์ที่ได้คือระดับเสียงสูงที่อุณหภูมิสูงขึ้น อนิจจาแม้ในพารามิเตอร์นี้จนกระทั่งมีโปรเซสเซอร์กราฟิกรุ่นใหม่ที่ร้อนแรงน้อยกว่าปรากฏขึ้น GeForce GTX 480 ก็แพ้ Radeon HD 5870

บทสรุป

แล้วเราได้อะไรหลังจากการเปิดตัว Radeon HD 5870 หกเดือน? หากเราทำการทดสอบทั้งหมดร่วมกัน (ซึ่งน่าจะไม่ถูกต้อง) การ์ดแสดงผล GeForce GTX 480 ใหม่จะเร็วกว่า Radeon HD 5870 โดยเฉลี่ย 5-15% ขึ้นอยู่กับการทดสอบ โหมดคุณภาพ และความละเอียด อย่างไรก็ตาม ในการทดสอบรายบุคคลมีทั้งชัยชนะและความพ่ายแพ้ที่น่าประทับใจกว่า ดังนั้นในความเห็นของเรา การพิจารณาเกมแต่ละเกมนั้นถูกต้องมากกว่า ซึ่งเป็นสิ่งที่เราทำไว้ข้างต้นในหัวข้อเกี่ยวกับผลการทดสอบประสิทธิภาพของการ์ดแสดงผล โดยทั่วไปแล้ว เราต้องยอมรับว่า GeForce GTX 480 กลายเป็นการ์ดแสดงผลที่มีโปรเซสเซอร์ตัวเดียวที่เร็วที่สุด

ในทางกลับกัน ชัยชนะครั้งนี้มาพร้อมกับราคาที่สูงเกินไปสำหรับ NVIDIA ประการแรก เราไม่ได้หมายถึงการใช้พลังงานสูง ระดับเสียงที่มากเกินไป หรือการสร้างความร้อนที่ไม่สามารถยอมรับได้ แต่หมายถึงเวลา เวลาที่ผ่านไปนับตั้งแต่การเปิดตัว Radeon HD 5870 นั้นสูญหายไปอย่างไม่อาจแก้ไขได้ ปัจจุบัน การ์ดแสดงผล ATI/AMD ชั้นนำรุ่นใหม่ไม่ได้จำหน่ายแค่จำนวนมากเท่านั้น แต่ยังมีไดรเวอร์เวอร์ชันอย่างเป็นทางการถึง 6 เวอร์ชันด้วย ในขณะที่ NVIDIA GeForce GTX 480 ไม่มีเวอร์ชันอย่างเป็นทางการ (!) เวอร์ชันเดียว และมีเพียงเวอร์ชันเดียวเท่านั้นที่ยังอยู่ในช่วงเบต้า การทดสอบ การเปิดตัวการ์ดแสดงผลใหม่ล่าช้าดังกล่าวสามารถพิสูจน์ได้จากประสิทธิภาพที่เหนือกว่าคู่แข่งโดยรวมและอย่างล้นหลาม (+50% หรือมากกว่า) เท่านั้น แต่ NVIDIA ยังไม่สามารถทำได้จนถึงปัจจุบัน

สำหรับการใช้พลังงานที่สูง สำหรับราคาไฟฟ้าต่อกิโลวัตต์ของเรา การโต้แย้งที่สนับสนุนผลิตภัณฑ์ใด ๆ (ATI หรือ NVIDIA) ดูไร้สาระและตลกด้วยซ้ำ ปัญหาระดับเสียงและการเกิดความร้อนสูงแก้ไขได้ด้วยการติดตั้งระบบทำความเย็นทางเลือกซึ่งแบรนด์ดังชื่อดังได้เริ่มประกาศไปแล้ว NVIDIA ยังมีความสามารถพิเศษอยู่บ้าง เช่น PhysX และ CUDA รวมถึงการฉายภาพที่เหนือกว่าคู่แข่งในเกมที่รองรับ DirectX 11 โดยใช้เทสเซลเลชั่น ไม่น่าเป็นไปได้ที่ใครจะปฏิเสธความเป็นไปได้ในการปรับแต่งไดรเวอร์ GeForce ต่อไป ดังนั้นเราจึงรับรองกับคุณว่าเราจะไม่ จำกัด ตัวเองเพียงแค่ทำความคุ้นเคยกับการ์ดแสดงผลใหม่และจะศึกษาความสามารถทั้งหมดต่อไปในเร็ว ๆ นี้

และสิ่งสุดท้ายที่เราทุกคนไม่ควรลืมก็คือ การแข่งขันที่ดีเท่านั้นที่สามารถช่วยลดราคาสำหรับการ์ดแสดงผลและผลิตภัณฑ์ไฮเทคอื่น ๆ ได้ ดังนั้นความเป็นผู้นำที่ไม่อาจปฏิเสธได้ของผู้ผลิตรายใดรายหนึ่งจะได้รับประโยชน์เพียงผู้ผลิตรายเดียวหรือหลายรายหากพวกเขา ตัวอย่างการสมรู้ร่วมคิด แต่ไม่ใช่คุณและฉันอย่างแน่นอน :-)

ขอบคุณ:
สำนักงานตัวแทนรัสเซียของ NVIDIA และ Irina Shekhovtsova เป็นการส่วนตัว
สำนักงานตัวแทนของรัสเซียของ AMD และโดยส่วนตัว Kirill Kochetkov
สำหรับการ์ดแสดงผลที่ให้มาสำหรับการทดสอบ

วัสดุอื่น ๆ ในหัวข้อนี้


การใช้พลังงานของการ์ดแสดงผล: ฤดูใบไม้ผลิ 2010
เราต้องการ PhysX หรือไม่? การทดสอบ EVGA GeForce GTX 275 CO-OP PhysX Edition
Metro 2033 และการ์ดจอสมัยใหม่

เมื่อเร็ว ๆ นี้การนำเสนอชุดแรกของการ์ดแสดงผลที่ใช้ NVIDIA และ GTX 470 ซึ่งอิงจากการทดสอบตัวอย่างอย่างเป็นทางการของ NVIDIA นั้นมีเสียงดังสนั่น แต่ตอนนี้เฉพาะตัวเร่งความเร็วกราฟิกดังกล่าวเท่านั้นที่เริ่มปรากฏบนชั้นวางของในร้าน แน่นอนว่ายังคงมีการวางอุบายของความเท่าเทียมกันของตัวอย่างและตัวอย่างอนุกรม สิ่งนี้ได้รับการเสริมโดยเฉพาะอย่างยิ่งจากการตัดสินใจของผู้ผลิตแม้แต่ในรุ่นเรือธงของสายผลิตภัณฑ์ NVIDIA ก็ยังให้ใช้ชิป GF100 เวอร์ชันที่ตัดทอนลงเล็กน้อย (GPU ตามการออกแบบ Fermi) แต่เราจะพยายามบอกคุณเกี่ยวกับทุกสิ่งตามลำดับ

สถาปัตยกรรม Fermi ที่ใช้ใน NVIDIA และ GTX470 GPU (การ์ดวิดีโอ) ได้รับการประกาศย้อนกลับไปในเดือนกันยายน พ.ศ. 2552 และเพียงหกเดือนต่อมาผู้ใช้ก็สามารถใช้ประโยชน์จากข้อดีของสถาปัตยกรรมนี้ได้ ราคาที่ประกาศไว้ของการ์ดแสดงผลสถาปัตยกรรม GF100 ควรอยู่ที่ 500 เหรียญสหรัฐหรือ 350 เหรียญสหรัฐสำหรับ GTX 470 ซึ่งสูงกว่าเรือธงชิปเดี่ยวจาก AMD เล็กน้อย แม้ว่าในตลาดของเราการ์ดแสดงผลเหล่านี้จะมีราคาแพงกว่าอย่างเห็นได้ชัด เป็นที่น่าสังเกตว่าปัญหาที่ AMD พบในการผลิต GPU โดยใช้เทคโนโลยีการผลิต TSMC 40nm ไม่อนุญาตให้ตลาดมีผลิตภัณฑ์ประสิทธิภาพสูงจำนวนที่ต้องการพร้อมรองรับ DirectX 11 เมื่อพิจารณาถึงความเป็นไปได้ที่ NVIDIA ทิ้งไว้ในการปิดการใช้งาน ส่วนที่เป็นปัญหาของ GPU สำหรับทั้งสายแม้แต่ชิป "ตัวท็อป" ก็ไม่ได้ใช้ศักยภาพของ GF100 อย่างเต็มที่ เราหวังว่าจะมีอุปทานที่สมบูรณ์มากขึ้นในตลาดด้วยการ์ดแสดงผลที่ใช้ GTX470

NVIDIA ได้กำหนดสถาปัตยกรรม Fermi ให้เป็นแกนหลักในการคำนวณ โดยผลักไสบทบาทดั้งเดิมของ GPU ในการเร่งกราฟิก 3D ในเกมให้อยู่ในพื้นหลัง สถาปัตยกรรม Fermi เป็นการพัฒนาอย่างต่อเนื่องของกลุ่มผลิตภัณฑ์การ์ดประมวลผล Tesla ที่ใช้ในระบบที่ต้องการประสิทธิภาพ ข้อเท็จจริงนี้ได้รับการยืนยันโดยการรองรับหน่วยความจำแก้ไขข้อผิดพลาด (ECC) และประสิทธิภาพการประมวลผลแบบ double precision ที่ได้รับการปรับปรุง ผลกำไรที่อาจเกิดขึ้นจากการทำงานด้านเทคนิคบางอย่างควบคู่กันไปนั้นมีมหาศาล และการลงทุนในการพัฒนาของ NVIDIA ซอฟต์แวร์ได้นำไปสู่การเป็นผู้นำอย่างมีนัยสำคัญเหนือ AMD และ Intel ในตลาดที่กำลังเติบโตนี้

NVIDIA Fermi (GF100)

ความสามารถที่วางแผนไว้ของการ์ดแสดงผลใหม่ควรจะเพิ่มศักยภาพด้านประสิทธิภาพเป็นสองเท่า รุ่นเรือธงบน GF100 เทียบกับการ์ดกราฟิกที่ใช้ GT200 เช่น GTX285 แต่ทฤษฎีไม่ได้แปลไปสู่ผลลัพธ์เชิงปฏิบัติเสมอไป

ตัวชิป GF100 มี 512 CUDA cores (คลัสเตอร์การประมวลผลกราฟิก 4 คลัสเตอร์ แต่ละคลัสเตอร์มี Streaming Multiprocessors 4 ตัว และแต่ละคอร์มี 32 CUDA core) แต่เหลือเพียง 480 CUDA cores ซึ่งน้อยกว่าสถาปัตยกรรม GF100 ดั้งเดิมถึง 32 cores การลดความซับซ้อนนี้เกิดขึ้นโดยการปิดการใช้งานมัลติโปรเซสเซอร์ SM หนึ่งตัวใน GF100 ซึ่งเห็นได้ชัดว่าเป็นเพราะเป็นไปไม่ได้ที่จะรับโปรเซสเซอร์กราฟิกที่มีคุณสมบัติครบถ้วนในปริมาณที่เพียงพอ

ในทางกลับกัน มัลติโปรเซสเซอร์ SM แต่ละตัวยังมีหน่วยพื้นผิวของตัวเองและกลไก PolyMorph (ลอจิกฟังก์ชันคงที่ซึ่งให้ประสิทธิภาพที่เพิ่มขึ้นสำหรับการคำนวณทางเรขาคณิต) ด้วยเหตุนี้ ฉันจึงได้หน่วยพื้นผิว 60 หน่วยจาก 64 หน่วย และเครื่องยนต์ PolyMorph 15 เครื่อง

ในส่วนของไปป์ไลน์ GF100 ที่ไม่ขึ้นอยู่กับคลัสเตอร์ GPC ไม่มีการบล็อกการปิดระบบสำหรับ NVIDIA ROP ทั้งหกส่วนยังคงอยู่ที่นี่ แต่ละพาร์ติชันสามารถส่งออกพิกเซลจำนวนเต็ม 32 บิตจำนวนแปดพิกเซลพร้อมกัน ซึ่งหมายความว่าเราได้รับ 48 พิกเซลต่อรอบสัญญาณนาฬิกา GF100 เต็มรูปแบบที่มีพาร์ติชัน ROP ทั้งหมดรองรับอินเทอร์เฟซหน่วยความจำ GDDR5 384 บิต (นั่นคือ อินเทอร์เฟซ 64 บิตต่อพาร์ติชัน) GPU รองรับการกำหนดค่าดังกล่าว และหน่วยความจำ 256 MB ต่ออินเทอร์เฟซทำให้เรามีหน่วยความจำ GDDR5 ทั้งหมด 1.5 GB (แบนด์วิดท์คือ 177 GB/s หากคุณรวมไว้ด้วย ความถี่สัญญาณนาฬิกา 924 เมกะเฮิรตซ์)

การลดกำลังการทำงานของชิปดั้งเดิมทั้งหมดนี้เป็นผลมาจากปัญหาในการผลิตคริสตัลที่ใช้งานได้จาก NVIDIA แต่ความจำเป็นในการแนะนำโซลูชั่นใหม่ให้กับตลาดตัวเร่งความเร็วระดับ Hi-End ทำให้พวกเขาต้อง "ทิ้ง" อย่างน้อยก็ตัด- โปรเซสเซอร์กราฟิก GF100 เวอร์ชันดาวน์พร้อมสถาปัตยกรรม Fermi แต่ไม่ว่าผลลัพธ์จะเป็นอย่างไร มันก็อยู่ที่นั่นและคุ้มค่าที่จะทดสอบและอธิบาย

การ์ดแสดงผลการผลิตที่มีการออกแบบกล่องซึ่งเป็นลักษณะเฉพาะของผู้ผลิตรายนี้มาถึงห้องปฏิบัติการทดสอบของเราแล้ว

บรรจุภัณฑ์ของการ์ดแสดงผลได้รับการออกแบบเป็นสีดำและสีเหลือง ที่ด้านหน้าของกล่องกระดาษแข็งจะระบุรุ่นของการ์ดแสดงผลจำนวนหน่วยความจำประเภทและแบนด์วิดท์ของบัสหน่วยความจำ นอกจากนี้ยังมีการกล่าวถึงการสนับสนุนเทคโนโลยี NVIDIA PhysX ที่เป็นกรรมสิทธิ์และการมีตัวเชื่อมต่อ HDMI ที่มุมขวาบนผู้ผลิตดึงความสนใจไปที่การสนับสนุนเทคโนโลยีที่เป็นกรรมสิทธิ์: NVIDIA CUDA, NVIDIA PureVideo HD, NVIDIA SLI

ที่ด้านหลังของกล่องจะมีภาพรวมเล็กน้อยเกี่ยวกับความสามารถของการ์ดแสดงผลนี้ มีการอธิบายข้อดีของการใช้เทคโนโลยี: NVIDIA 3D Vision Surround และ PhysX

ข้างในนั้นมีการ์ดแสดงผลและส่วนประกอบการจัดส่งเพิ่มเติม เมื่อใช้ร่วมกับตัวเร่งความเร็วกราฟิก คุณจะได้รับสิ่งต่อไปนี้:

  • อะแดปเตอร์จ่ายไฟของการ์ดแสดงผลจากตัวเชื่อมต่อหกพินสองตัวถึงหนึ่ง PCI Express แปดพิน
  • อะแดปเตอร์จ่ายไฟของการ์ดแสดงผลจากตัวเชื่อมต่อ MULEX สองตัวถึงหนึ่ง PCI Express หกพิน
  • อะแดปเตอร์จาก DVI เป็น VGA;
  • อะแดปเตอร์จาก Mini-HDMI เป็น HDMI;
  • คู่มือการใช้งาน;
  • ดิสก์พร้อมซอฟต์แวร์และไดรเวอร์
  • แผ่นสาธิตที่อธิบายคุณสมบัติใหม่ทั้งหมดของการ์ดแสดงผลนี้

ฉันต้องการทราบว่าอะแดปเตอร์ไฟฟ้าที่รวมอยู่ในแพ็คเกจจะบังคับให้ผู้ใช้ใช้แหล่งจ่ายไฟที่ทรงพลังพอสมควรพร้อมตัวเชื่อมต่อที่เหมาะสมสำหรับการเชื่อมต่อการ์ดแสดงผลอย่างชัดเจน นี่อาจทำให้เกิดปัญหาเมื่อเลือกการกำหนดค่า โดยทั่วไปแพ็คเกจควรครอบคลุมความแตกต่างทั้งหมดของการติดตั้งการ์ดแสดงผลนี้ในยูนิตระบบที่ทันสมัย

แผงวงจรพิมพ์

การ์ดแสดงผลนั้นถูกสร้างขึ้นบน PCB สีเข้มซึ่งด้านหน้าถูกปกคลุมด้วยระบบระบายความร้อนด้วยปลอกพลาสติกสีเข้ม เราขอเตือนคุณว่าการ์ดแสดงผลนี้รองรับบัส PCI Express 2.0 x16 เข้ากันได้กับ DirectX 11 Shader Model 5.0 และ OpenGL 3.2 และยังรองรับ เทคโนโลยี NVIDIAเทคโนโลยี PureVideo HD, NVIDIA 3D Vision Surround, เทคโนโลยี NVIDIA PhysX, เทคโนโลยี NVIDIA CUDA และเทคโนโลยี NVIDIA SLI

ด้านหลังของ PCB การ์ดแสดงผลดูเรียบง่ายกว่ามาก ที่นี่เราสามารถสังเกตได้เฉพาะชิประบบพลังงาน GPU - ตัวควบคุม CHL8266 PWM ที่ใช้หกเฟส มีทรานซิสเตอร์สามตัวสำหรับแต่ละเฟสกำลัง (ตัวหนึ่งอยู่ที่ต้นแขนและสองตัวที่แขนท่อนล่าง) วิธีการนี้ช่วยให้สามารถขจัดความร้อนออกจากองค์ประกอบของระบบย่อยพลังงานได้ดีขึ้น ชิป uP6210AG ตัวที่สองเป็นที่รู้จักกันดีในหมู่ผู้อ่านของเราจากการ์ดวิดีโออื่นที่ใช้ GPU จาก NVIDIA ให้พลังงานสองเฟสสำหรับชิปหน่วยความจำของการ์ดแสดงผลนี้ โดยรวมแล้วเราได้รับระบบจ่ายไฟ 6+2 เฟสสำหรับการ์ดแสดงผล

เมื่อดูภายใต้ระบบระบายความร้อนคุณสามารถระบุได้ทันทีว่าการ์ดแสดงผลนี้เหมือนกับเวอร์ชัน "อ้างอิง" โดยสิ้นเชิง การ์ดแสดงผลใช้แผงวงจรยาว 267 มม. (10.5 นิ้ว) ซึ่งสั้นกว่าตัวเร่งความเร็วบน Radeon HD 5870 ประมาณหนึ่งเซนติเมตร ซึ่งสามารถช่วยให้ใส่ลงในเคสสมัยใหม่ได้เกือบทุกรุ่น

หากต้องการจ่ายไฟเพิ่มเติม (นอกเหนือจากบัส PCI Express) ต้องใช้ปลั๊กหกพินหนึ่งตัวและแปดพินหนึ่งตัว NVIDIA อ้างว่าการ์ดดังกล่าวมี TDP 250 W ซึ่งน้อยกว่า Radeon HD 5970 อย่างมากซึ่งแทบจะไม่พอดีกับเพดาน 300 W ที่กำหนดโดย PCI-SIG ดังนั้น สำหรับโซลูชัน "ระดับบน" NVIDIA ขอแนะนำให้ใช้พาวเวอร์ซัพพลายที่มีกำลังไฟ 600 W หรือสูงกว่า

บอร์ดมีช่องสองช่องที่แผงด้านหลังของเคส เพื่อให้ระบบระบายความร้อนมีปริมาตรเพียงพอ ผู้ใช้จะต้องเพิ่มพื้นที่ว่างภายในเคส

แผงอินเทอร์เฟซประกอบด้วยพอร์ต DVI สองพอร์ตและ mini-HDMI หนึ่งพอร์ต นอกจากนี้ช่องที่สองจะถูกครอบครองโดยตะแกรงไอเสียซึ่งทำให้มั่นใจได้ว่าลมร้อนจะถูกเป่าออกจากยูนิตระบบ

ระบบทำความเย็น

มาดูระบบระบายความร้อนของการ์ดแสดงผลให้ละเอียดยิ่งขึ้น มันจำลองเวอร์ชัน "อ้างอิง" อย่างสมบูรณ์และวิศวกรของ NVIDIA พยายามอย่างชัดเจนเพื่อให้มีประสิทธิภาพมากที่สุดเท่าที่จะเป็นไปได้ แต่เนื่องจากการ์ดแสดงผลที่ตะกละทำให้อุณหภูมิของส่วนประกอบที่ได้จึงยังคงอยู่ในระดับที่ค่อนข้างสูง

ท่อความร้อนห้าท่อ เคสกระจายความร้อนเพิ่มเติม และการออกแบบตามหลักอากาศพลศาสตร์ของกังหันนั้น ล้วนสร้างความประทับใจร่วมกันในความซับซ้อนสูงสุด เห็นได้ชัดว่านี่คือการออกแบบการระบายความร้อนที่มีประสิทธิภาพมากที่สุดในบรรดาการออกแบบอ้างอิงใดๆ ที่เราเคยเห็นมา อากาศที่สูบโดยกังหันด้านข้างจะไหลผ่านหม้อน้ำอะลูมิเนียม ซึ่งมีท่อทองแดงห้าท่อแทรกอยู่ และออกไปด้านนอกของตัวเครื่อง

คุณลักษณะเฉพาะของการออกแบบนี้คือตำแหน่งของด้านใดด้านหนึ่งของหม้อน้ำโดยตรงบนพื้นผิวของเคสการ์ด ซึ่งช่วยเพิ่มการกระจายความร้อนได้อย่างชัดเจน แต่เนื่องจากระบบระบายความร้อนให้ความร้อนที่ดี คุณจึงสามารถถูกไฟไหม้ได้หากถือสิ่งนี้ ส่วนหนึ่งของการ์ดแสดงผล

นวัตกรรมที่โดดเด่นที่นี่คือแผ่นฮีทซิงค์เพิ่มเติมที่ช่วยระบายความร้อนออกจากพื้นผิวของ GPU และชิปหน่วยความจำ แผ่นทั่วไปครอบคลุมส่วนบนของบอร์ดการ์ดแสดงผลและให้การระบายความร้อนผ่านอินเทอร์เฟซการระบายความร้อนพิเศษจากชิปหน่วยความจำและทรานซิสเตอร์ระบบไฟฟ้า

มาดูการทดสอบระบบทำความเย็นกันดีกว่า เมื่อโหลดสูงสุด อุณหภูมิ GPU อยู่ที่ 101 ° C ที่น่าประทับใจ ซึ่งไม่ถือว่าเป็นอุณหภูมิวิกฤตสำหรับ GPU นี้ ในเวลาเดียวกันระบบทำความเย็นทำงานได้ 92% และสร้างระดับเสียงที่เห็นได้ชัดเจน

และในโหมดปกติ (โหมด 2D) ตัวทำความเย็นจะทำงานที่ 44% ของกำลังสูงสุด ในโหมดนี้การทำงานของมันจะสังเกตเห็นได้ชัดเจนเมื่อเทียบกับเสียงรบกวนรอบข้างทั่วไป ระบบระบายความร้อนที่ติดตั้งบนการ์ดแสดงผลนี้ให้ประสิทธิภาพตามปกติ แต่ความต้องการของ GPU ของการ์ดแสดงผลบังคับให้พยายามทำให้อุณหภูมิที่ยอมรับได้อย่างชัดเจน เสียงของระบบระบายความร้อนนั้นขึ้นอยู่กับโหลดของการ์ดแสดงผลอย่างชัดเจนและไม่สามารถเรียกว่าเงียบได้

ทีนี้มาดูการศึกษาโดยละเอียดกันดีกว่า ลักษณะทางเทคนิคการ์ดแสดงผล เริ่มต้นด้วยการให้ คำอธิบายสั้น ๆในรูปแบบตาราง:

NVIDIA GPU ที่ติดตั้งที่นี่มีป้ายกำกับ GF100-375-A3

แผนภาพความถี่ของการ์ดแสดงผลและคุณสมบัติอื่น ๆ มีลักษณะดังนี้:

ตัวอย่างนี้จำลองคุณลักษณะทั้งหมดของตัวเร่งความเร็วเวอร์ชัน "อ้างอิง" บน NVIDIA อย่างสมบูรณ์ GPU บน ZT-40101-10P ทำงานที่ 701 MHz และโดเมนเชเดอร์ที่ 1401 MHz ตามลำดับ หน่วยความจำวิดีโอได้รับความถี่จริง 924 MHz หรือความถี่ที่มีประสิทธิภาพ 3696 MHz

การ์ดแสดงผลที่ทดสอบใช้ชิปหน่วยความจำ SAMSUNG GDDR5 ที่มีความจุรวม 1536 MB เครื่องหมาย K4G10325FE-HC04 ระบุว่าชิปเหล่านี้ให้เวลาในการเข้าถึง 0.4 ns ซึ่งสอดคล้องกับความถี่จริงที่ 1250 MHz หรือ 5000 MHz ที่มีประสิทธิภาพ และมีพื้นที่ว่างที่สำคัญสำหรับการโอเวอร์คล็อก

การทดสอบ

ซีพียู Intel Core 2 Quad Q9550 (LGA775, 2.83 GHz, L2 12 MB) @3.8 GHz
เมนบอร์ด NForce 790i-สุพรีม (LGA775, nForce 790i อัลตร้า SLI, DDR3, ATX)
GIGABYTE GA-EP45T-DS3R (LGA775, Intel P45, DDR3, ATX)
คูลเลอร์ Noctua NH-U12P (LGA775, 54.33 CFM, 12.6-19.8 เดซิเบล)
Thermalright SI-128 (LGA775) + VIZO Starlet UVLED120 (62.7 CFM, 31.1 dB)
ระบายความร้อนเพิ่มเติม VIZO ใบพัด PCL-201 (+1 ช่อง, 16.0-28.3 CFM, 20 dB)
แกะ 2x DDR3-1333 1024 MB คิงส์ตัน PC3-10600 (KVR1333D3N9/1G)
ฮาร์ดดิสก์ Hitachi Deskstar HDS721616PLA380 (160 GB, 16 MB, SATA-300)
แหล่งจ่ายไฟ Seasonic M12D-850 (850 วัตต์, 120 มม., 20 เดซิเบล)
Seasonic SS-650JT (650 วัตต์, 120 มม., 39.1 เดซิเบล)
กรอบ Spire SwordFin SP9007B (ฟูลทาวเวอร์) + Coolink SWiF 1202 (120x120x25, 53 CFM, 24 dB)
เฝ้าสังเกต Samsung SyncMaster 757MB (DynaFlat, 2048×1536@60 Hz, MPR II, TCO'99)

ในระหว่างการทดสอบ เห็นได้ชัดว่าการ์ดแสดงผลยืนยันสถานะเป็นตัวเร่งกราฟิกชิปเดี่ยวที่ทรงพลังที่สุดจนถึงปัจจุบัน ผลิตภัณฑ์ GPU ใหม่จาก NVIDIA นั้นมีประสิทธิภาพเร็วกว่าคู่แข่งในชิป AMD เล็กน้อยอย่างเห็นได้ชัด แต่เมื่อพิจารณาถึงการใช้พลังงานและอุณหภูมิในการทำงานซึ่งยังทำให้เกิดเสียงรบกวนที่เพิ่มขึ้นและเมื่อพิจารณาจากป้ายราคาแล้ว ก็ไม่สามารถเรียกได้ว่าสมดุลอย่างแน่นอน สารละลาย. นอกจากนี้ ยังมีข้อสงสัยเกี่ยวกับความเป็นไปได้ในการสร้างเวอร์ชันดูอัลชิปที่ใช้ NVIDIA ซึ่งมีประสิทธิภาพเหนือกว่าตัวเร่งกราฟิกดูอัลชิปบน Radeon HD 5970

การโอเวอร์คล็อก

การโอเวอร์คล็อกการ์ดแสดงผลนี้ไม่สามารถเรียกได้ว่าโดดเด่นเช่นกัน เราแทบจะไม่สามารถโอเวอร์คล็อกหน่วยความจำบนการ์ดแสดงผลได้ แม้ว่าตัวชิปเองจะทำงานช้ากว่าความถี่ที่ระบุอย่างชัดเจนก็ตาม แต่ตัว GPU เองที่มีแรงดันไฟฟ้า 1.05 V สามารถโอเวอร์คล็อกได้ที่ 770 MHz และอุณหภูมิแกนกลางคือ 87 ° C แต่ในระหว่างการโอเวอร์คล็อก การ์ดแสดงผลจะอยู่ในสภาพที่แตกต่างจากในระหว่างการทดสอบประสิทธิภาพระบบทำความเย็น โดยเฉพาะอย่างยิ่ง แผงด้านข้างของเคสถูกถอดออก และติดตั้งพัดลมขนาด 120 มม. ใกล้กับการ์ดแสดงผล ซึ่งช่วยปรับปรุงสภาพการระบายความร้อนเล็กน้อย และ ตัวทำความเย็นจะทำงานอย่างต่อเนื่องที่ความเร็วการหมุน 100% ด้วยกลไกซอฟต์แวร์สำหรับควบคุมแรงดันไฟฟ้าเราจึงทำการทดลองต่อไป เมื่อจ่ายไฟ 1.075 V GPU ก็สามารถโอเวอร์คล็อกได้ที่ 784 MHz และอุณหภูมิเพิ่มขึ้นเป็น 91 ° C ผลลัพธ์ที่ดีที่สุดเกิดขึ้นที่ 1.1 V เมื่อ GPU ถูกโอเวอร์คล็อกที่ 790 MHz แต่ตอนนี้อุณหภูมิภายใต้การโหลดเพิ่มขึ้นเป็น 99 ° C

มาดูกันว่าการเร่งความเร็วแบบแมนนวลส่งผลต่อประสิทธิภาพอย่างไร:

แพคเกจทดสอบ

ความถี่มาตรฐาน

การ์ดแสดงผลโอเวอร์คล็อก

ผลผลิตเพิ่มขึ้น %

คะแนน 3DMark
คะแนน SM2.0
คะแนน HDR/SM3.0
ผลงาน

Serious Sam 2, คุณภาพสูงสุด, AA4x/AF16x, fps

1600×1200
2048×1536

เหยื่อ, คุณภาพสูงสุด, AA4x/AF16x, fps

1600×1200
2048×1536

Call Of Juarez คุณภาพสูงสุด ไม่มี AA/AF, fps

1280×1024
1600×1200
2048×1536

Call Of Juarez คุณภาพสูงสุด AA4x/AF16x, fps

1280×1024
1600×1200
2048×1536

Crysis, คุณภาพสูงสุด, ไม่มี AA/AF, fps

1280×1024
1600×1200
2048×1536

Crysis, คุณภาพสูงสุด, AA4x/AF16x, fps

1280×1024
1600×1200
2048×1536

Crysis Warhead, คุณภาพสูงสุด, ไม่มี AA/AF, fps

1280×1024
1600×1200

Crysis Warhead, คุณภาพสูงสุด, AA4x/AF16x, fps

1280×1024
1600×1200

Far Cry 2 คุณภาพสูงสุด ไม่มี AA/AF, fps

1280×1024
1600×1200
2048×1536

Far Cry 2, คุณภาพสูงสุด, AA4x/AF16x, fps

1280×1024
1600×1200
2048×1536

กำไรจากการโอเวอร์คล็อกค่อนข้างอ่อนแอ และเมื่อพิจารณาถึงอุณหภูมิการทำงานสูงสุดของการ์ดแสดงผลแม้ว่าจะไม่มีการโอเวอร์คล็อกก็ตาม ความเป็นไปได้ของการ์ดรุ่นหลังก็ยังเป็นที่น่าสงสัย เนื่องจากคุณจะต้องทำงานอย่างหนักเพื่อเพิ่มประสิทธิภาพการระบายความร้อนของ GPU และแม้แต่ที่ความถี่ปกติ โซลูชัน "ชั้นนำ" นี้สามารถมอบประสิทธิภาพการเล่นเกมที่ดีได้อย่างง่ายดายแม้กับผู้ใช้ที่มีความต้องการสูง

ผลลัพธ์

การ์ดแสดงผลที่ใช้โปรเซสเซอร์กราฟิก NVIDIA รวมถึง ZT-40101-10P ที่ทดสอบแล้วกลายเป็นโซลูชันชิปตัวเดียวที่มีประสิทธิผลมาก ยิ่งไปกว่านั้น GPU GF100 พร้อมสถาปัตยกรรม Fermi ที่ใช้ในตอนแรกมีคอร์สตรีมมิ่ง 512 คอร์ แต่เนื่องจากปัญหาบางประการในการรับชิปตามจำนวนที่ต้องการในระหว่างการผลิต การ์ดแสดงผล "อันดับต้น ๆ" ที่ใช้นั้นจึงใช้เพียง 480 คอร์เท่านั้น แต่เนื่องจากความถี่ในการทำงานที่ค่อนข้างสูง โดยทั่วไปแล้วตัวเร่งความเร็วจึงยังคงเร็วกว่าการ์ดชิปเดี่ยวของคู่แข่งที่ใช้ Radeon HD 5870 แม้ว่าผู้นำตลาดยังคงเป็นโซลูชันดูอัลชิปจาก AMD – Radeon HD 5970

อย่างไรก็ตาม หากประสิทธิภาพของการ์ดแสดงผลชิปตัวเดียวบน GPU จาก NVIDIA นั้นเหนือกว่าโซลูชันที่เกี่ยวข้องบนชิปจาก AMD แสดงว่าการใช้พลังงานไม่ใช่จุดแข็งของการ์ด NVIDIA อย่างชัดเจน แน่นอนว่าสำหรับผู้ที่ชื่นชอบหลาย ๆ คนนี่ไม่ใช่เกณฑ์การคัดเลือก แต่ในบางกรณีก็คุ้มค่าที่จะคิดถึงแง่มุมนี้เนื่องจากการใช้พลังงานที่เพิ่มขึ้นไม่เพียงทำให้ค่าไฟฟ้าเพิ่มขึ้นเล็กน้อยเท่านั้น ในความเป็นจริง พลังงานทั้งหมดที่ใช้โดยตัวเร่งกราฟิกจะกระจายไปในรูปของความร้อน ซึ่งจะต้องถูกกำจัดออกอย่างรวดเร็วเพื่อหลีกเลี่ยงความร้อนสูงเกินไปและความล้มเหลวของส่วนประกอบที่มีเทคโนโลยีสูง ซึ่งจะนำไปสู่ระบบระบายความร้อนที่ซับซ้อนมากขึ้นและการเพิ่มขึ้นของ เสียงรบกวน.

NVIDIA GeForce GTX 480M- การ์ดแสดงผลระดับบนสุดที่สร้างขึ้นบนสถาปัตยกรรม Fermi รองรับ DirectX 11 เต็มรูปแบบและผลิตโดยใช้เทคโนโลยี 40 นาโนเมตรจาก TSMC ด้วย 352 คอร์ GTX480Mสามารถเปรียบเทียบได้กับ GTX465สำหรับคอมพิวเตอร์เดสก์ท็อป แต่มีความถี่ต่ำกว่า GeForce GTX 480Mมีหน่วยความจำวิดีโอ GDDR5 ที่รวดเร็ว 2 GB (แยก) ดังนั้นประสิทธิภาพจึงควรอยู่ในระดับของการ์ด ATI Mobility Radeon HD 5870

ชิป Fermi หรือที่รู้จักในชื่อ GF100 ได้รับการออกแบบใหม่และปัจจุบันมีทรานซิสเตอร์ 3 พันล้านตัว (พร้อมเชเดอร์ทั้งหมด 512 ตัว) เมื่อเทียบกับเดสก์ท็อป HD 5870 ซึ่งมีทรานซิสเตอร์ถึง 2.13 พันล้านตัวหรือ ความคล่องตัว Radeon HD 5870(RV870) พร้อมทรานซิสเตอร์ 1.04 พันล้านตัว GTX480Mดูน่าประทับใจทีเดียว

ชิป Fermi แบบเคลื่อนที่ประกอบด้วยแกนเชเดอร์สูงสุด 352 คอร์ (1 มิติ) พร้อมด้วยหน่วยแรสเตอร์ไรเซชัน (ROP) 32 หน่วย และหน่วยพื้นผิว 44 หน่วย (หน่วยพื้นผิว) บัสหน่วยความจำเป็นแบบ 256 บิต แต่เนื่องจากหน่วยความจำ GDDR5 ที่รวดเร็ว จึงไม่น่าจะเป็นปัญหา การใช้พลังงานอยู่ที่ 100 W TDP รวมบอร์ด MXM และ 2 GB GDDR5 โดยทั่วไปแล้ว AMD จะวัดปริมาณการใช้พลังงานของชิปแยกกัน ดังนั้นจึงไม่สามารถเปรียบเทียบได้โดยตรง GTX480Mเหมาะสำหรับโน้ตบุ๊กขนาดใหญ่ที่มีระบบระบายความร้อนที่ดีเท่านั้น ในตอนแรก มีเพียง Clevo เท่านั้นที่ตัดสินใจติดตั้งการ์ดใบนี้ในแบร์โบน - 17" D901F และ 18" X8100

ผลงาน NVIDIA GeForce GTX 480Mควรจะดีกว่า ATI Mobility Radeon HD 5870 และเท่าเทียม ระบบมือถือ Geforce GTX 285M SLI และ เรดออน เอชดี 4770สำหรับคอมพิวเตอร์เดสก์ท็อป มันหมายความว่าอย่างนั้น GTX480M- การ์ดแสดงผลเดี่ยวที่เร็วที่สุดในไตรมาสแรกของปี 2010 เกม DirectX 10 สมัยใหม่ควรทำงานได้อย่างคล่องแคล่วที่ความละเอียดสูง พร้อมการเรนเดอร์ที่ดีและการป้องกันนามแฝง เฉพาะเกมที่มีความต้องการสูงอย่าง Crysis Warhead เท่านั้นที่อาจต้องลดรายละเอียดลงเล็กน้อย เนื่องจากการรองรับฮาร์ดแวร์สำหรับ DirectX 11 (เช่น เทสเซลเลชั่นที่ดี) การ์ดแสดงผลที่สร้างบนสถาปัตยกรรม Fermi ควรทำงานได้ดีในเกม DirectX 11 ซึ่งจะปรากฏขึ้นมากขึ้นเรื่อยๆ

เช่นเดียวกับการ์ดวิดีโอซีรีส์ GeForce 300M GeForce GTX 480Mรองรับ PureVideo HD พร้อมโปรเซสเซอร์วิดีโอ VP4 ซึ่งหมายความว่าการ์ดแสดงผลสามารถถอดรหัสวิดีโอ HD ใน H.254, VC-1, MPEG-2 และ MPEG-4 ASP ได้อย่างสมบูรณ์ เมื่อใช้ Flash 10.1 การ์ดกราฟิกจะเร่งความเร็วการประมวลผลวิดีโอ Flash ได้ด้วย แกน NVIDIA GeForce GTX 480Mสามารถใช้สำหรับการคำนวณทั่วไปโดยใช้ CUDA หรือ DirectCompute ตัวอย่างเช่น การเข้ารหัสวิดีโอ HD สามารถทำได้เร็วกว่ามากโดยใช้เชเดอร์คอร์ของ GPU มากกว่า CPU สมัยใหม่ PhysX ซึ่งรองรับโดย Fermi มือถือ ช่วยให้คุณสามารถคำนวณเอฟเฟกต์ทางฟิสิกส์ในเกมที่เกี่ยวข้องได้ (เม็ดฝนที่ตกลงมา หมอกที่กระจายตัว ฯลฯ)

เมื่อเทียบกับกราฟิกการ์ดเดสก์ท็อป GeForce GTX 480Mสามารถจับคู่กับการ์ดโอเวอร์คล็อกได้ NVIDIA GeForce GTX465(ความถี่ 607/1200) และ เรดออน เอชดี 5770.

กว่าหกเดือนที่ผ่านมาการ์ดแสดงผล ATI Radeon 5xxx Series ปรากฏในตลาดอะแดปเตอร์วิดีโอ พวกเขามาพร้อมกับการสนับสนุนฮาร์ดแวร์สำหรับ DirectX 11 และ Shader Model 5.0, เทสเซลเลชั่น และคุณสมบัติอื่นๆ อีกมากมายสำหรับผู้ที่ชื่นชอบการเล่นวิดีโอเกม น่าเสียดาย (หรือโชคดี...) คู่แข่งในนาม NVIDIA ไม่สามารถจัดหาคู่แข่งได้ทันเวลา ดังนั้น AMD (อย่างแม่นยำยิ่งขึ้นคือแผนก ATI ซึ่งพัฒนาชิปกราฟิก) จึงเก็บเกี่ยวผลแห่งความสำเร็จทั้งหมด แท้จริงแล้ว "ท่วม" ตลาดด้วยการ์ดแสดงผลที่รองรับ DirectX 11

NVIDIA ซึ่งไม่เคยละทิ้งการประชาสัมพันธ์ผลิตภัณฑ์ของตนก็ไม่ทำให้ผิดหวังในครั้งนี้เช่นกันโดยจงใจให้อาหารแก่ผู้ที่ชื่นชอบด้วยเศษขนมปังจากตารางปรมาจารย์ของนักพัฒนา NVIDIA GF100 โดยใช้สถาปัตยกรรมไมโคร Fermi ครั้งแรกที่เราได้ยินรายละเอียดบางอย่างเกี่ยวกับโครงสร้างของชิป GF100 เมื่อหกเดือนที่แล้วเล็กน้อย ตั้งแต่นั้นมาในส่วนลึกของห้องปฏิบัติการลับของ บริษัท NVIDIA ก็มีการสร้างคู่แข่งของการ์ดแสดงผล ATI Radeon ซีรีส์ห้าพันชุดซึ่งต้องปฏิบัติตามสัญญาทั้งหมดที่ให้ไว้ก่อนหน้านี้อย่างแท้จริง ปาฏิหาริย์จึงเกิดขึ้น! หนึ่งเดือนที่ผ่านมา ท่ามกลางเสียงพลุและการประโคมของนักวิเคราะห์ การ์ดแสดงผล GTX 480 และ GTX 470 ได้เปิดตัวอย่างอิสระในตลาดโลก พวกเขาดำเนินชีวิตตาม "การรอคอยอันยาวนาน" หรือไม่?

การโฆษณา

โครงสร้างและสถาปัตยกรรมของ NVIDIA GF100

ปัจจุบันมีอะแดปเตอร์วิดีโอเพียงสองตัวจาก NVIDIA ในตลาดที่รองรับ DirectX 11 พวกเขาควรกำหนดเส้นทางสำหรับการเคลื่อนไหวทั้งหมดของบรรทัดใหม่ ไพ่สูงสุดบน ช่วงเวลานี้คือ GTX 480

“ ความฝันเป็นจริง…” ดูเหมือนว่านี่คือสิ่งที่ยูริโทนอฟร้อง แต่ปรากฏว่า “มันไม่เกิดขึ้นจริง” เดิมที GTX 480 ควรจะมีคุณสมบัติ 512 "คอร์ CUDA ประสิทธิภาพสูง" แต่ด้วยเหตุผลบางอย่าง NVIDIA ไม่สามารถดำเนินการตามแผนได้ 100% ส่งผลให้จำนวนโปรเซสเซอร์ GTX 480 ลดลงจาก 512 เป็น 480


โลกแห่งโปรแกรมฟรีและเคล็ดลับที่เป็นประโยชน์
2024 whatsappss.ru

ผู้ผลิต: NVIDIA
ชุด: GeForce GTX 400M
รหัส: เฟอร์มี
สตรีม: 352 - รวมเป็นหนึ่งเดียว
ความถี่สัญญาณนาฬิกา: 425* เมกะเฮิรตซ์
ความถี่เชเดอร์: 850* เมกะเฮิรตซ์
ความถี่หน่วยความจำ: 1200* เมกะเฮิรตซ์
ความกว้างบัสหน่วยความจำ: 256 บิต
ประเภทหน่วยความจำ: GDDR5
หน่วยความจำสูงสุด: 2048 เมกะไบต์
หน่วยความจำทั่วไป: เลขที่
ไดเร็กเอ็กซ์: DirectX 11, Shader 5.0
การใช้พลังงาน: 100 วัตต์
ทรานซิสเตอร์: 3000 ล้าน
เทคโนโลยี: 40 นาโนเมตร
ขนาดแล็ปท็อป: ใหญ่
วันที่วางจำหน่าย: 25.05.2010