Počet výpočetních (shaderových) jednotek nebo procesorů. Grafické karty Frekvence jednotky Shader

Základní komponenty grafické karty:

  • východy;
  • rozhraní;
  • chladící systém;
  • GPU;
  • video paměť.

Grafické technologie:

  • slovník;
  • Architektura GPU: vlastnosti
    vertexové/pixelové jednotky, shadery, rychlost plnění, texturové/rastrové jednotky, potrubí;
  • Architektura GPU: technologie
    technický proces, frekvence GPU, místní videopaměť (hlasitost, sběrnice, typ, frekvence), řešení s více grafickými kartami;
  • zrakové funkce
    DirectX, vysoký dynamický rozsah (HDR), vyhlazování na celé obrazovce, filtrování textur, textury s vysokým rozlišením.

Slovníček základních grafických pojmů

Obnovovací frekvence

Stejně jako v kině nebo televizi váš počítač simuluje pohyb na monitoru zobrazením sekvence snímků. Obnovovací frekvence monitoru udává, kolikrát za sekundu bude obraz na obrazovce aktualizován. Například frekvence 75 Hz odpovídá 75 aktualizacím za sekundu.

Pokud počítač zpracovává snímky rychleji, než dokáže monitor vytisknout, mohou ve hrách nastat problémy. Pokud například počítač vykresluje 100 snímků za sekundu a obnovovací frekvence monitoru je 75 Hz, pak kvůli překrývání může monitor během obnovovací periody zobrazit pouze část obrazu. V důsledku toho se objevují vizuální artefakty.

Jako řešení můžete povolit V-Sync (vertikální synchronizaci). Omezuje počet snímků, které může počítač odeslat do obnovovací frekvence monitoru, a zabraňuje tak artefaktům. Pokud povolíte V-Sync, počet snímků vypočítaný ve hře nikdy nepřekročí obnovovací frekvenci. To znamená, že při 75 Hz počítač nevydá více než 75 snímků za sekundu.

Pixel

Slovo „Pixel“ znamená „ obr tur el ement" - prvek obrázku. Jedná se o drobný bod na displeji, který může svítit určitou barvou (ve většině případů je odstín zobrazen kombinací tří základních barev: červené, zelené a modré). Pokud je rozlišení obrazovky 1024x768, můžete vidět matici 1024 pixelů na šířku a 768 pixelů na výšku. Všechny pixely dohromady tvoří obrázek. Obraz na obrazovce se aktualizuje 60 až 120krát za sekundu, v závislosti na typu zobrazení a výstupu dat z grafické karty. CRT monitory obnovují zobrazení řádek po řádku, zatímco ploché LCD monitory mohou aktualizovat každý pixel samostatně.

Vrchol

Všechny objekty ve 3D scéně se skládají z vrcholů. Vrchol je bod v trojrozměrném prostoru se souřadnicemi X, Y a Z. Několik vrcholů lze seskupit do mnohoúhelníku: nejčastěji je to trojúhelník, ale jsou možné i složitější tvary. Na mnohoúhelník se poté aplikuje textura, díky které objekt vypadá realisticky. 3D krychle znázorněná na obrázku výše se skládá z osmi vrcholů. Složitější objekty mají zakřivené povrchy, které jsou ve skutečnosti tvořeny velmi velkým počtem vrcholů.

Textura

Textura je jednoduše 2D obrázek libovolné velikosti, který je namapován na 3D objekt, aby simuloval jeho povrch. Například naše 3D krychle se skládá z osmi vrcholů. Před nanesením textury vypadá jako jednoduchá krabička. Ale když aplikujeme texturu, krabice se zbarví.

Shader

Programy Pixel shader umožňují grafické kartě produkovat působivé efekty, jako je například tato voda Staré svitky: Zapomnění.

Dnes existují dva typy shaderů: vertex a pixel. Vertex shader programy mohou upravovat nebo transformovat 3D objekty. Programy Pixel shader umožňují měnit barvy pixelů na základě některých dat. Představte si zdroj světla ve 3D scéně, který způsobí, že osvětlené objekty budou svítit jasněji, a zároveň způsobí, že na ostatní objekty budou vrženy stíny. Toho všeho je dosaženo změnou barevné informace pixelů.

Pixel shadery se používají k vytváření složitých efektů ve vašich oblíbených hrách. Kód shaderu může například zvýšit jas pixelů obklopujících 3D meč. Další shader dokáže zpracovat všechny vrcholy složitého 3D objektu a simulovat výbuch. Vývojáři her se stále více obracejí k vytváření složitých shader programů realistická grafika. Téměř každá moderní hra s bohatou grafikou používá shadery.

S vydáním dalšího aplikačního programovacího rozhraní (API), Microsoft DirectX 10, bude uveden na trh třetí typ shaderu, nazývaný geometry shaders. S jejich pomocí bude možné předměty rozbíjet, upravovat a dokonce i ničit v závislosti na požadovaném výsledku. Třetí typ shaderů lze naprogramovat úplně stejně jako první dva, ale jeho role bude jiná.

Míra plnění

Velmi často na krabici s grafickou kartou najdete hodnotu míry plnění. V zásadě míra plnění udává, jak rychle může GPU vydávat pixely. Starší grafické karty měly míru zaplnění trojúhelníku. Dnes však existují dva typy míry vyplnění: rychlost vyplnění pixelů a rychlost vyplnění textury. Jak již bylo zmíněno, míra plnění pixelů odpovídá rychlosti výstupu pixelů. Vypočítá se jako počet rastrových operací (ROP) vynásobený taktovací frekvencí.

Míra vyplnění textury je počítána odlišně od ATi a nVidia. Nvidia věří, že rychlost se získá vynásobením počtu pixel pipelines hodinovou frekvencí. A ATi násobí počet texturových jednotek rychlostí hodin. V principu jsou obě metody správné, protože nVidia používá jednu texturovou jednotku na pixel shader jednotku (tedy jednu na pixel pipeline).

S ohledem na tyto definice pojďme dál a proberme nejdůležitější funkce GPU, co dělají a proč jsou tak důležité.

Architektura GPU: Funkce

Realismus 3D grafiky velmi závisí na výkonu grafické karty. Čím více bloků shaderu pixelů procesor obsahuje a čím vyšší je frekvence, tím více efektů lze aplikovat na 3D scénu pro zlepšení jejího vizuálního vnímání.

GPU obsahuje mnoho různých funkčních bloků. Podle počtu některých komponent lze odhadnout výkon GPU. Než se přesuneme dále, zopakujme si nejdůležitější funkční bloky.

Vertex procesory (jednotky vertex shader)

Stejně jako jednotky pixel shader, vertex procesory provádějí shader kód, který se dotýká vrcholů. Vzhledem k tomu, že větší rozpočet vertexů umožňuje vytvářet složitější 3D objekty, je výkon vertexových procesorů velmi důležitý ve 3D scénách s složité objekty nebo s velkým počtem z nich. Jednotky vertex shader však stále nemají tak zjevný dopad na výkon jako pixelové procesory.

Procesory pixelů (jednotky shaderu pixelů)

Procesor pixelů je součást grafického čipu určená ke zpracování programů pro stínování pixelů. Tyto procesory provádějí výpočty, které se týkají pouze pixelů. Vzhledem k tomu, že pixely obsahují informace o barvách, umožňují pixel shadery dosáhnout působivých grafických efektů. Například většina vodních efektů, které vidíte ve hrách, je vytvořena pomocí pixel shaderů. Typicky se počet pixelových procesorů používá k porovnání výkonu pixelů grafických karet. Pokud má jedna karta osm jednotek pixel shader a druhá 16 jednotek, pak je logické předpokládat, že grafická karta s 16 jednotkami bude rychlejší při zpracování složitých programů pixel shader. V úvahu je třeba vzít i takt, ale dnes je zdvojnásobení počtu pixelových procesorů energeticky efektivnější než zdvojnásobení frekvence grafického čipu.

Jednotné shadery

Sjednocené shadery zatím do světa PC nedorazily, ale chystaný standard DirectX 10 je založen na podobné architektuře. To znamená, že struktura kódu vertexů, geometrie a pixelových programů bude stejná, i když shadery budou vykonávat jinou práci. Nová specifikace je k vidění na Xboxu 360, kde GPU speciálně navrhla společnost ATi pro Microsoft. Bude velmi zajímavé sledovat, jaký potenciál nové DirectX 10 přinese.

Jednotky mapování textur (TMU)

Textury by měly být vybrány a filtrovány. Tuto práci provádějí jednotky mapování textur, které pracují ve spojení s pixelovými a vertexovými shader jednotkami. Úkolem TMU je aplikovat texturové operace na pixely. Počet texturových jednotek v GPU se často používá k porovnání výkonu textury grafických karet. Není nerozumné předpokládat, že grafická karta s více TMU poskytne lepší výkon textury.

Rastrové operátorské jednotky (ROP)

Rastrové procesory jsou zodpovědné za zápis pixelových dat do paměti. Rychlost, s jakou se tato operace provádí, je rychlost plnění. V počátcích 3D akcelerátorů byly ROP a míra plnění velmi důležitými vlastnostmi grafických karet. Dnes je práce ROP stále důležitá, ale výkon grafické karty již není omezen těmito bloky, jako tomu bylo kdysi. Proto se výkon (a počet) ROP zřídka používá k vyhodnocení rychlosti grafické karty.

Dopravníky

Pipelines se používají k popisu architektury grafických karet a poskytují velmi jasnou představu o výkonu GPU.

Dopravník nelze považovat za striktně technický pojem. GPU používá různé kanály, které plní různé funkce. Historicky potrubí znamenalo pixelový procesor, který byl připojen k jeho jednotce mapování textur (TMU). Například grafická karta Radeon 9700 používá osm pixelových procesorů, z nichž každý je připojen k vlastní TMU, takže se předpokládá, že karta má osm kanálů.

Ale moderní procesory Je velmi těžké to popsat počtem dopravníků. Ve srovnání s předchozími návrhy používají nové procesory modulární, fragmentovanou strukturu. Za inovátora v této oblasti lze považovat společnost ATi, která u grafických karet řady X1000 přešla na modulární strukturu, což umožnilo dosáhnout nárůstu výkonu prostřednictvím vnitřní optimalizace. Některé bloky CPU jsou využívány více než jiné a pro zlepšení výkonu GPU se ATi pokusilo najít kompromis mezi počtem potřebných bloků a oblastí matrice (kterou nelze příliš zvětšit). V této architektuře již pojem „pixel pipeline“ ztratil svůj význam, protože pixelové procesory již nejsou připojeny k vlastním TMU. Například GPU ATi Radeon X1600 má 12 pixel shader jednotek a pouze čtyři jednotky TMU pro mapování textur. Nedá se tedy říci, že by architektura tohoto procesoru měla 12 pixel pipelines, stejně jako nelze říci, že jsou pouze čtyři. Nicméně, podle tradice, pixel pipelines jsou stále zmíněny.

Vezmeme-li v úvahu výše uvedené předpoklady, počet pixel pipeline v GPU se často používá k porovnání grafických karet (s výjimkou řady ATi X1x00). Pokud například vezmete grafické karty s 24 a 16 kanály, pak je docela rozumné předpokládat, že karta s 24 kanály bude rychlejší.

Architektura GPU: Technologie

Technický proces

Tento termín označuje velikost jednoho prvku (tranzistoru) čipu a přesnost výrobního procesu. Zlepšení technických procesů umožňuje získat prvky menších rozměrů. Například proces 0,18 mikronu produkuje větší prvky než proces 0,13 mikronu, takže není tak účinný. Menší tranzistory pracují s nižším napětím. Pokles napětí zase vede ke snížení tepelného odporu, což má za následek snížení množství generovaného tepla. Vylepšení technického procesu umožňuje zmenšit vzdálenost mezi funkčními bloky čipu a přenos dat trvá kratší dobu. Kratší vzdálenosti, nižší napětí a další vylepšení umožňují dosáhnout vyšších rychlostí hodin.

Pochopení poněkud komplikuje to, že dnes se pro označení technického procesu používají jak mikrometry (μm), tak nanometry (nm). Ve skutečnosti je vše velmi jednoduché: 1 nanometr se rovná 0,001 mikrometru, takže procesy 0,09 μm a 90 nm jsou totéž. Jak bylo uvedeno výše, menší procesní technologie umožňuje vyšší rychlosti hodin. Pokud například porovnáme grafické karty s čipy 0,18 mikronu a 0,09 mikronu (90 nm), pak je docela rozumné očekávat od 90 nm karty vyšší frekvenci.

Rychlost hodin GPU

Rychlost hodin GPU se měří v megahertzech (MHz), což jsou miliony hodinových cyklů za sekundu.

Rychlost hodin přímo ovlivňuje výkon GPU. Čím vyšší je, tím více práce lze dokončit během vteřiny. Jako první příklad si vezměme grafické karty nVidia GeForce 6600 a 6600 GT: grafický procesor 6600 GT běží na 500 MHz a běžná karta 6600 - na 400 MHz. Vzhledem k tomu, že procesory jsou technicky identické, 20% zvýšení taktu 6600 GT má za následek vyšší výkon.

Takt ale není všechno. Mějte na paměti, že výkon je výrazně ovlivněn architekturou. Jako druhý příklad si vezměme grafické karty GeForce 6600 GT a GeForce 6800 GT. GPU 6600 GT taktuje na 500 MHz, ale 6800 GT běží na pouhých 350 MHz. Nyní vezměme v úvahu, že 6800 GT používá 16 pixel pipelines, zatímco 6600 GT používá pouze osm. Proto 6800 GT s 16 pipeline na 350 MHz dá přibližně stejný výkon jako procesor s osmi pipelines a dvojnásobným taktem (700 MHz). Díky tomu lze rychlost hodin snadno použít k porovnání výkonu.

Místní video paměť

Paměť grafické karty výrazně ovlivňuje výkon. Ale různé parametry paměť je ovlivněna různými způsoby.

Velikost video paměti

Velikost video paměti lze pravděpodobně nazvat nejvíce přeceňovaným parametrem grafické karty. Nezkušení spotřebitelé často používají kapacitu videopaměti ke vzájemnému porovnání různých karet, ale ve skutečnosti má kapacita malý vliv na výkon ve srovnání s parametry, jako je frekvence paměťové sběrnice a rozhraní (šířka sběrnice).

Ve většině případů bude karta se 128 MB videopaměti fungovat téměř stejně jako karta s 256 MB. Samozřejmě existují situace, kdy více paměti zlepší výkon, ale mějte na paměti, že více paměti automaticky nepovede k vyšší rychlosti hraní.

Hlasitost může být užitečná ve hrách s texturami ve vysokém rozlišení. Vývojáři hry poskytují pro hru několik sad textur. A čím více paměti je na grafické kartě, tím vyšší rozlišení mohou mít načtené textury. Textury s vysokým rozlišením poskytují více vysoké rozlišení a detaily ve hře. Proto je docela rozumné vzít kartu s velkým množstvím paměti, pokud všechna ostatní kritéria splňují. Ještě jednou připomeňme, že šířka paměťové sběrnice a její frekvence mají na výkon mnohem silnější vliv než množství fyzické paměti na kartě.

Šířka paměťové sběrnice

Šířka paměťové sběrnice je jedním z nejdůležitějších aspektů výkonu paměti. Moderní sběrnice mají šířku od 64 do 256 bitů a v některých případech dokonce 512 bitů. Čím širší je paměťová sběrnice, tím více informací dokáže přenést za hodinový cyklus. A to přímo ovlivňuje produktivitu. Pokud například použijete dvě sběrnice se stejnými frekvencemi, teoreticky 128bitová sběrnice přenese dvakrát tolik dat za hodinový cyklus než 64bitová sběrnice. A 256bitová sběrnice je dvakrát tak velká.

Vyšší šířka pásma sběrnice (vyjádřená v bitech nebo bajtech za sekundu, 1 byte = 8 bitů) poskytuje vyšší výkon paměti. To je důvod, proč je paměťová sběrnice mnohem důležitější než její velikost. Při stejných frekvencích pracuje 64bitová paměťová sběrnice rychlostí pouze 25 % 256bitové!

Vezměme si následující příklad. Grafická karta se 128 MB video paměti, ale s 256bitovou sběrnicí, poskytuje mnohem vyšší paměťový výkon než 512 MB model s 64bitovou sběrnicí. Je důležité si uvědomit, že u některých karet z řady ATi X1x00 výrobci uvádějí specifikace interní paměťové sběrnice, nás však zajímají parametry externí sběrnice. Například X1600 má interní kruhovou sběrnici, která je široká 256 bitů, ale externí, která je široká pouze 128 bitů. A ve skutečnosti paměťová sběrnice pracuje na 128bitovém výkonu.

Typy paměti

Paměť lze rozdělit do dvou hlavních kategorií: SDR (single data transfer) a DDR (double data transfer), ve kterých jsou data přenášena dvakrát rychleji za takt. Dnes je technologie SDR s jedním přenosem zastaralá. Od té doby paměti DDR data se přenášejí dvakrát rychleji než SDR, je důležité si uvědomit, že grafické karty s pamětí DDR nejčastěji indikují dvojnásobnou frekvenci, nikoli fyzickou. Pokud je například paměť DDR specifikována na 1000 MHz, pak je to efektivní frekvence, na které by měla pracovat normální paměť SDR, aby byla zajištěna stejná propustnost. Ale ve skutečnosti je fyzická frekvence 500 MHz.

Z tohoto důvodu jsou mnozí překvapeni, když je pro paměť jejich grafické karty uvedena frekvence 1200 MHz DDR a utility hlásí 600 MHz. Takže si na to budete muset zvyknout. Paměť DDR2 a GDDR3/GDDR4 funguje na stejném principu, tedy s dvojitým přenosem dat. Rozdíl mezi pamětí DDR, DDR2, GDDR3 a GDDR4 spočívá v technologii výroby a některých detailech. DDR2 může pracovat na vyšších frekvencích než paměti DDR a DDR3 může pracovat na ještě vyšších frekvencích než DDR2.

Frekvence paměťové sběrnice

Stejně jako procesor, i paměť (nebo přesněji paměťová sběrnice) funguje na určitých rychlosti hodin, měřeno v megahertzech. Zde zvýšení rychlosti hodin přímo ovlivňuje výkon paměti. A frekvence paměťové sběrnice je jedním z parametrů, který se používá k porovnání výkonu grafických karet. Pokud jsou například všechny ostatní charakteristiky (šířka paměťové sběrnice atd.) stejné, pak je zcela logické říci, že grafická karta s pamětí 700 MHz je rychlejší než karta s pamětí 500 MHz.

Opět platí, že takt není všechno. Paměť 700 MHz se 64bitovou sběrnicí bude pomalejší než 400 MHz paměť se 128bitovou sběrnicí. Výkon 400 MHz paměti na 128bitové sběrnici je přibližně ekvivalentní 800 MHz paměti na 64bitové sběrnici. Měli byste také pamatovat na to, že frekvence GPU a paměti jsou zcela odlišné parametry a obvykle se liší.

Rozhraní grafické karty

Všechna data přenášená mezi grafickou kartou a procesorem procházejí rozhraním grafické karty. Dnes se pro grafické karty používají tři typy rozhraní: PCI, AGP a PCI Express. Liší se šířkou pásma a dalšími vlastnostmi. Je jasné, že čím vyšší propustnost, tím vyšší rychlost výměny. Vysokou šířku pásma však dokážou využívat pouze nejmodernější karty, a to jen částečně. V určitém okamžiku přestala být rychlost rozhraní překážkou, dnes je prostě dostatečná.

Nejpomalejší sběrnicí, pro kterou byly grafické karty vyrobeny, je PCI (Peripheral Components Interconnect). Aniž bych šel do historie, samozřejmě. PCI skutečně snížilo výkon grafických karet, takže přešly na rozhraní AGP (Accelerated Graphics Port). Ale i specifikace AGP 1.0 a 2x omezovaly výkon. Když standard zvýšil rychlosti na úrovně AGP 4x, začali jsme se blížit praktickému limitu šířky pásma, kterou grafické karty zvládnou. Specifikace AGP 8x opět zdvojnásobila propustnost oproti AGP 4x (2,16 GB/s), ale nedošlo k žádnému znatelnému nárůstu grafický výkon ještě jsme to nedostali.

Nejnovější a nejrychlejší sběrnice je PCI Express. Nové grafické karty obvykle využívají rozhraní PCI Express x16, které kombinuje 16 linek PCI Express s celkovou propustností 4 GB/s (jeden směr). To je dvojnásobná propustnost oproti AGP 8x. Sběrnice PCI Express poskytuje zmíněnou šířku pásma v obou směrech (přenos dat do a z grafické karty). Rychlost standardu AGP 8x už ale byla dostatečná, a tak jsme se ještě nesetkali se situací, kdy by přechod na PCI Express přinesl nárůst výkonu oproti AGP 8x (pokud jsou ostatní hardwarové parametry stejné). Například AGP verze GeForce 6800 Ultra bude fungovat identicky jako 6800 Ultra pro PCI Express.

Dnes je nejlepší pořídit si kartu s rozhraním PCI Express, která na trhu vydrží ještě několik let. Nejvýkonnější karty se již nevyrábějí s rozhraním AGP 8x a řešení PCI Express je zpravidla snazší najít než analogy AGP a jsou levnější.

Řešení na více grafických kartách

Použití více grafických karet ke zvýšení grafického výkonu není nový nápad. V počátcích 3D grafiky vstoupilo 3dfx na trh se dvěma grafickými kartami běžícími paralelně. Ale se zmizením 3dfx byla technologie pro spolupráci více spotřebitelských grafických karet odsouzena k zapomnění, ačkoli ATI vydala podobné systémy pro profesionální simulátory od uvedení Radeonu 9700. Před několika lety se tato technologie vrátila na trh: s příchodem řešení nVidia SLI a o něco později ATi Crossfire.

Sdílení více grafických karet poskytuje dostatečný výkon pro spuštění hry ve vysoké kvalitě. vysoké rozlišení. Ale výběr toho či onoho řešení není tak jednoduchý.

Začněme tím, že řešení založená na více grafických kartách vyžadují velké množství energie, takže napájecí zdroj musí být dostatečně výkonný. Všechno toto teplo bude muset z grafické karty odvést, takže je třeba věnovat pozornost skříni PC a chlazení, aby se systém nepřehříval.

Nezapomeňte také, že SLI/CrossFire vyžaduje vhodnou základní desku (ať už pro jednu nebo jinou technologii), která obvykle stojí více než standardní modely. Konfigurace nVidia SLI bude fungovat pouze na určitých deskách nForce4 a pouze na kartách ATi CrossFire základní desky s čipovou sadou CrossFire nebo na některých modelech Intel. Aby to bylo komplikované, některé konfigurace CrossFire vyžadují, aby jedna z karet byla speciální: CrossFire Edition. Po vydání CrossFire umožnila ATi u některých modelů grafických karet zahrnutí technologie spolupráce prostřednictvím sběrnice PCI Express a s vydáním nových verzí ovladačů se počet možných kombinací zvyšuje. Ale přesto hardwarový CrossFire s odpovídající kartou CrossFire Edition poskytuje vyšší výkon. Karty CrossFire Edition jsou ale také dražší než běžné modely. Na tento moment Softwarový režim CrossFire (bez karty CrossFire Edition) můžete povolit na grafických kartách Radeon X1300, X1600 a X1800 GTO.

Je třeba zvážit i další faktory. Přestože dvě grafické karty spolupracující společně poskytují zvýšení výkonu, zdaleka to není dvojnásobek. Zaplatíte ale dvakrát tolik peněz. Nejčastěji je zvýšení produktivity 20-60%. A v některých případech kvůli dodatečným výpočetním nákladům na párování nedochází k žádnému zvýšení. Z tohoto důvodu se konfigurace s více kartami pravděpodobně nevyplatí u levnějších modelů, protože dražší grafická karta obvykle vždy předčí několik levnějších karet. Obecně pro většinu spotřebitelů pořízení řešení SLI/CrossFire nedává smysl. Pokud ale chcete povolit všechny možnosti vylepšení kvality nebo hrát v extrémních rozlišeních, například 2560x1600, kdy potřebujete vypočítat více než 4 miliony pixelů na snímek, pak se bez dvou nebo čtyř spárovaných grafických karet neobejdete.

Vizuální vlastnosti

Kromě čistě hardwarových specifikací, různé generace a modely GPU se mohou lišit v sadě funkcí. Často se například uvádí, že karty ATi Radeon X800 XT generace jsou kompatibilní s Shader Model 2.0b (SM), zatímco nVidia GeForce 6800 Ultra je kompatibilní s SM 3.0, ačkoli jejich hardwarové specifikace jsou si blízké (16 pipelines ). Mnoho spotřebitelů se proto rozhoduje ve prospěch jednoho či druhého řešení, aniž by věděli, co tento rozdíl znamená.

Verze Microsoft DirectX a Shader Model

Tato jména se nejčastěji používají ve sporech, ale málokdo ví, co ve skutečnosti znamenají. Pro pochopení začněme historií grafických API. DirectX a OpenGL jsou grafická rozhraní API, tedy rozhraní pro programování aplikací – standardy otevřeného kódu dostupné všem.

Před příchodem grafických API používal každý výrobce GPU pro komunikaci s hrami svůj vlastní mechanismus. Vývojáři museli napsat samostatný kód pro každý GPU, který chtěli podporovat. Velmi drahý a neefektivní přístup. K vyřešení tohoto problému byla vyvinuta rozhraní API pro 3D grafiku, takže vývojáři píší kód pro konkrétní rozhraní API, nikoli pro konkrétní grafickou kartu. Poté se problémy s kompatibilitou dostaly na ramena výrobců grafických karet, kteří museli zajistit, aby ovladače byly kompatibilní s API.

Jediným problémem zůstává, že se dnes používají dvě různá API, a to Microsoft DirectX a OpenGL, kde GL znamená Graphics Library. Vzhledem k tomu, že DirectX API je dnes ve hrách populárnější, zaměříme se na něj. A tento standard měl silnější vliv na vývoj her.

DirectX je vytvoření společnosti Microsoft. Ve skutečnosti DirectX obsahuje několik API, z nichž pouze jedno se používá pro 3D grafiku. DirectX obsahuje API pro zvuk, hudbu, vstupní zařízení atd. Direct3D API je zodpovědné za 3D grafiku v DirectX. Když mluví o grafických kartách, mají na mysli toto, takže v tomto ohledu jsou pojmy DirectX a Direct3D zaměnitelné.

DirectX je pravidelně aktualizován s tím, jak se vyvíjí grafické technologie a vývojáři her implementují nové techniky programování her. Jak DirectX rychle rostlo na popularitě, výrobci GPU začali přizpůsobovat nové verze produktů tak, aby vyhovovaly funkcím DirectX. Z tohoto důvodu jsou grafické karty často vázány na hardwarovou podporu jedné nebo druhé generace DirectX (DirectX 8, 9.0 nebo 9.0c).

Aby to bylo komplikované, části rozhraní Direct3D API se mohou v průběhu času měnit, aniž by se měnily generace DirectX. Specifikace DirectX 9.0 například specifikuje podporu pro Pixel Shader 2.0. Ale Aktualizace DirectX 9.0c obsahuje Pixel Shader 3.0. Přestože jsou karty třídy DirectX 9, mohou podporovat různé sady funkcí. Například Radeon 9700 podporuje Shader Model 2.0 a Radeon X1800 podporuje Shader Model 3.0, i když obě karty lze klasifikovat jako DirectX 9 generace.

Pamatujte, že při vytváření nových her vývojáři berou v úvahu majitele starých strojů a grafických karet, protože pokud tento segment uživatelů ignorujete, úroveň prodeje bude nižší. Z tohoto důvodu je do her zabudováno více cest kódu. Hra třídy DirectX 9 má pravděpodobně cestu DirectX 8 a dokonce cestu DirectX 7 pro kompatibilitu Obvykle, pokud je vybrána stará cesta, některé virtuální efekty, které jsou přítomné na nových grafických kartách, ze hry zmizí. Ale dál alespoň, můžete hrát i na starém hardwaru.

Mnoho nových her vyžaduje instalaci nejnovější verze DirectX, i když grafická karta je z předchozí generace. To znamená, že nová hra, která bude používat cestu DirectX 8, bude stále vyžadovat instalaci nejnovější verze DirectX 9 pro grafickou kartu třídy DirectX 8.

Jaké jsou rozdíly mezi různé verze Direct3D API v DirectX? Rané verze DirectX – 3, 5, 6 a 7 – byly relativně jednoduché ve schopnostech rozhraní Direct3D API. Vývojáři si mohli vybrat vizuální efekty ze seznamu a poté vyzkoušet, jak ve hře fungovaly. Dalším významným krokem v programování grafiky bylo DirectX 8. Zavedlo možnost programovat grafickou kartu pomocí shaderů, takže vývojáři měli poprvé volnost programovat efekty tak, jak potřebovali. DirectX 8 podporované verze Pixel Shader 1.0 až 1.3 a Vertex Shader 1.0. DirectX 8.1, aktualizovaná verze DirectX 8, obdržela Pixel Shader 1.4 a Vertex Shader 1.1.

V DirectX 9 můžete vytvářet ještě složitější shader programy. DirectX 9 podporuje Pixel Shader 2.0 a Vertex Shader 2.0. DirectX 9c, aktualizovaná verze DirectX 9, obsahovala specifikaci Pixel Shader 3.0.

DirectX 10, nadcházející verze API, bude doprovázet nové Verze Windows Průhled. DirectX 10 nelze nainstalovat v systému Windows XP.

HDR osvětlení a OpenEXR HDR

HDR znamená „High Dynamic Range“. Hra s osvětlením HDR může produkovat mnohem realističtější obraz než hra bez něj a ne všechny grafické karty podporují osvětlení HDR.

Před příchodem grafických karet DirectX 9 byly GPU výrazně omezeny přesností výpočtů osvětlení. Až dosud bylo možné osvětlení vypočítat pouze s 256 (8 bity) vnitřními úrovněmi.

Když se objevily grafické karty DirectX 9, byly schopny produkovat osvětlení s vysokou přesností - plných 24 bitů nebo 16,7 milionů úrovní.

S 16,7 miliony úrovní a dalším krokem ve výkonu grafických karet DirectX 9/Shader Model 2.0 se HDR osvětlení stalo možným na počítačích. Jedná se o poměrně složitou technologii a je třeba ji sledovat v dynamice. Pokud budeme mluvit jednoduchými slovy, pak osvětlení HDR zvýší kontrast (tmavé odstíny se zdají tmavší, světlé odstíny světlejší), přičemž se zvýší množství detailů osvětlení v tmavých a světlých oblastech. Hra s HDR osvětlením se zdá živější a realističtější než bez něj.

GPU kompatibilní s nejnovější specifikací Pixel Shader 3.0 umožňují vyšší 32bitové přesné výpočty osvětlení a prolnutí s plovoucí desetinnou čárkou. Grafické karty třídy SM 3.0 tak mohou podporovat speciální metodu osvětlení OpenEXR HDR speciálně navrženou pro filmový průmysl.

Některé hry, které podporují pouze osvětlení OpenEXR HDR, nebudou fungovat s osvětlením HDR na grafických kartách Shader Model 2.0. Hry, které se nespoléhají na metodu OpenEXR, však poběží na jakékoli grafické kartě s rozhraním DirectX 9. Například Oblivion používá metodu OpenEXR HDR a umožňuje osvětlení HDR pouze na nejnovějších grafických kartách, které podporují specifikaci Shader Model 3.0. Například nVidia GeForce 6800 nebo ATi Radeon X1800. Hry, které využívají 3D engine Half-Life 2, včetně Counter-Strike: Source a chystaného Half-Life 2: Aftermath, umožňují povolit vykreslování HDR na starších grafických kartách DirectX 9, které podporují pouze Pixel Shader 2.0. Příkladem může být řada GeForce 5 nebo ATi Radeon 9500.

Nakonec mějte na paměti, že všechny formy vykreslování HDR vyžadují seriózní výpočetní výkon a dokáže srazit na kolena i ty nejvýkonnější GPU. Pokud chcete hrát nejnovější hry S HDR osvětlením se neobejdete bez vysoce výkonné grafiky.

Vyhlazování na celé obrazovce

Anti-aliasing na celé obrazovce (zkráceně AA) umožňuje eliminovat charakteristické „žebříky“ na hranicích polygonů. Je ale třeba vzít v úvahu, že vyhlazování na celé obrazovce spotřebovává velké množství výpočetních zdrojů, což vede k poklesu snímkové frekvence.

Vyhlazování je velmi závislé na výkonu video paměti, takže vysokorychlostní grafická karta s rychlou pamětí bude schopna vypočítat vyhlazování na celé obrazovce s menším dopadem na výkon než levná grafická karta. Antialiasing lze povolit v různých režimech. Například 4x antialiasing vytvoří lepší obraz než 2x antialiasing, ale bude to velký zásah do výkonu. Zatímco 2x antialiasing zdvojnásobuje horizontální a vertikální rozlišení, režim 4x jej zčtyřnásobuje.

Filtrování textur

Textury jsou aplikovány na všechny 3D objekty ve hře a čím větší je úhel zobrazeného povrchu, tím více bude textura vypadat zdeformovaně. K odstranění tohoto efektu používají GPU filtrování textur.

První metoda filtrování se nazývala bilineární a produkovala charakteristické pruhy, které nebyly příliš příjemné pro oči. Situace se zlepšila zavedením trilineárního filtrování. Obě možnosti fungují na moderních grafických kartách prakticky bez omezení výkonu.

Dnes nejvíc nejlepší způsob Filtrování textur je anizotropní filtrování (AF). Stejně jako antialiasing na celé obrazovce lze anizotropní filtrování povolit na různých úrovních. Například 8x AF dá více vysoká kvalita filtrování než 4x AF. Stejně jako antialiasing na celé obrazovce vyžaduje anizotropní filtrování určité množství výpočetního výkonu, který se zvyšuje se zvyšující se úrovní AF.

Textury s vysokým rozlišením

Všechny 3D hry jsou vytvářeny s ohledem na specifické specifikace a jeden z těchto požadavků určuje texturovou paměť, kterou bude hra potřebovat. Všechny potřebné textury se musí během hry vejít do paměti grafické karty, jinak výkon od přístupu k texturám výrazně klesne RAM způsobuje značné zpoždění, nemluvě o stránkovacím souboru na pevném disku. Pokud tedy vývojář hry počítá se 128 MB video paměti jako Minimální požadavek, pak by sada aktivních textur neměla v žádném okamžiku přesáhnout 128 MB.

Moderní hry mají několik sad textur, takže hra poběží bez problémů na starších grafických kartách s menší videopamětí i na nových kartách s větší videopamětí. Například hra může obsahovat tři sady textur: pro 128 MB, 256 MB a 512 MB. Dnes existuje jen velmi málo her, které podporují 512 MB videopaměti, ale stále jsou tím nejobjektivnějším důvodem, proč si koupit grafickou kartu s tímto množstvím paměti. Zatímco zvýšení paměti má malý nebo žádný dopad na výkon, budete mít prospěch z lepší vizuální kvality, pokud hra podporuje vhodnou sadu textur.

Co potřebujete vědět o grafických kartách?

V kontaktu s

absolventské práce

Rasterizační operační jednotky (ROP)

Rasterizační jednotky provádějí operace zápisu pixelů vypočítaných grafickou kartou do vyrovnávacích pamětí a operace jejich míchání (blendování). Jak je uvedeno výše, výkon bloků ROP ovlivňuje míru plnění a to je jedna z hlavních charakteristik grafických karet. A ačkoliv v Nedávno jeho hodnota se poněkud snížila a stále existují případy, kdy výkon aplikace silně závisí na rychlosti a počtu bloků ROP. Nejčastěji je to způsobeno aktivním používáním filtrů pro následné zpracování a aktivací vyhlazování při vysokých nastaveních obrazu.

Automatizace účtování bankovních transakcí a její implementace v programu 1C Accounting

Pokud lze všechny činnosti podniku rozdělit do podnikových procesů, pak lze procesy rozdělit na menší složky. V metodice budování podnikových procesů se tomu říká dekompozice...

Vnitřní a periferie PC

Studium diskrétního populačního modelu pomocí programu Model Vision Studio

Hlavním „stavebním kamenem“ popisu v MVS je blok. Blok je nějaký aktivní objekt, fungující paralelně a nezávisle na jiných objektech v nepřetržitém čase. Blok je orientovaný blok...

Využití LMS Moodle ve vzdělávacím procesu

Každé hřiště musí mít centrální oblast. Nesmí existovat levý nebo pravý sloupec s bloky. Ale různé bloky zahrnuté v systému řízení výuky Moodle zvyšují funkčnost...

Studium schopností učitele v systému dálkové studium Moodle

Chcete-li do kurzu přidat nové zdroje, prvky, bloky nebo upravit stávající, klikněte na tlačítko Upravit umístěné v ovládacím bloku. Obecná forma Okno kurzu v editačním režimu je znázorněno na obrázku 2.5: Obrázek 2...

Simulace během vývoje software

Slovník jazyk UML zahrnuje tři typy stavebních bloků: entity; vztah; diagramy. Entity jsou abstrakce, které jsou základními prvky modelu...

Simulace práce v knihovně

Operátory - bloky tvoří logiku modelu. GPSS/PC má asi 50 různých typů bloků, z nichž každý plní specifickou funkci. Za každým z těchto bloků se nachází odpovídající podprogram překladače...

Klíčové vlastnosti CSS3

Text můžete navrhnout originálním způsobem pomocí různých konverzačních bloků, které jsou opět vytvořeny na základě technologií CSS3. (Obr. 5.) Obr. 5...

Klíčové vlastnosti CSS3

Účinek průsvitnosti prvku je jasně viditelný na obrázku na pozadí a rozšířil se v různých operační systémy protože vypadá stylově a krásně...

Příprava textový dokument v souladu s STP 01-01

Rozšiřující jednotky (karty) nebo karty (Cards), jak se jim někdy říká, lze použít k servisu zařízení připojených k IBM PC. Lze je použít ke spojení přídavná zařízení(displejové adaptéry, diskový řadič atd.)...

Porucha a oprava grafické karty

Tyto bloky pracují ve spojení s shader procesory všech specifikovaných typů, vybírají a filtrují texturová data nezbytná k vytvoření scény...

Registrační program výrobního procesu pro automatizovaný systém elektronický průmysl řízení podniku

Existuje 11 typů bloků, ze kterých lze vyrobit specifický MES systém pro konkrétní výrobu...

Vývoj softwarového balíku pro výpočet náhrad za velké opravy

Na nejnižší úrovni granularity jsou data databáze Oracle uložena v datových blocích. Jeden blok dat odpovídá určitému počtu bajtů fyzického místa na disku...

Vývoj systému správy hardwaru a softwaru pro dopravní platformy v Simatic Step-7

Systémové jednotky jsou součásti operačního systému. Mohou být uloženy programy (systémové funkce, SFC) nebo daty (systémové datové bloky, SDB). Systémové jednotky poskytují přístup k důležitým funkcím systému...

Zařízení obsažená v počítači

Rozšiřující jednotky (karty) nebo karty (Cards), jak se jim někdy říká, lze použít k servisu zařízení připojených k IBM PC. Lze je použít pro připojení dalších zařízení (adaptéry displeje, diskový řadič atd.)...

Architektura GPU: Funkce

Realismus 3D grafiky velmi závisí na výkonu grafické karty. Čím více bloků shaderu pixelů procesor obsahuje a čím vyšší je frekvence, tím více efektů lze aplikovat na 3D scénu pro zlepšení jejího vizuálního vnímání.

GPU obsahuje mnoho různých funkčních bloků. Podle počtu některých komponent lze odhadnout výkon GPU. Než se přesuneme dále, zopakujme si nejdůležitější funkční bloky.

Vertex procesory (jednotky vertex shader)

Stejně jako jednotky pixel shader, vertex procesory provádějí shader kód, který se dotýká vrcholů. Vzhledem k tomu, že větší rozpočet na vertex umožňuje vytváření složitějších 3D objektů, je výkon vertexových procesorů velmi důležitý ve 3D scénách se složitými nebo velkým počtem objektů. Jednotky vertex shader však stále nemají tak zjevný dopad na výkon jako pixelové procesory.

Procesory pixelů (jednotky shaderu pixelů)

Procesor pixelů je součást grafického čipu určená ke zpracování programů pro stínování pixelů. Tyto procesory provádějí výpočty, které se týkají pouze pixelů. Vzhledem k tomu, že pixely obsahují informace o barvách, umožňují pixel shadery dosáhnout působivých grafických efektů. Například většina vodních efektů, které vidíte ve hrách, je vytvořena pomocí pixel shaderů. Typicky se počet pixelových procesorů používá k porovnání výkonu pixelů grafických karet. Pokud má jedna karta osm jednotek pixel shader a druhá 16 jednotek, pak je logické předpokládat, že grafická karta s 16 jednotkami bude rychlejší při zpracování složitých programů pixel shader. V úvahu je třeba vzít i takt, ale dnes je zdvojnásobení počtu pixelových procesorů energeticky efektivnější než zdvojnásobení frekvence grafického čipu.

Jednotné shadery

Sjednocené shadery zatím do světa PC nedorazily, ale chystaný standard DirectX 10 je založen na podobné architektuře. To znamená, že struktura kódu vertexů, geometrie a pixelových programů bude stejná, i když shadery budou vykonávat jinou práci. Nová specifikace je k vidění na Xboxu 360, kde GPU speciálně navrhla společnost ATi pro Microsoft. Bude velmi zajímavé sledovat, jaký potenciál nové DirectX 10 přinese.

Jednotky mapování textur (TMU)

Textury by měly být vybrány a filtrovány. Tuto práci provádějí jednotky mapování textur, které pracují ve spojení s pixelovými a vertexovými shader jednotkami. Úkolem TMU je aplikovat texturové operace na pixely. Počet texturových jednotek v GPU se často používá k porovnání výkonu textury grafických karet. Není nerozumné předpokládat, že grafická karta s více TMU poskytne lepší výkon textury.

Rastrové operátorské jednotky (ROP)

Rastrové procesory jsou zodpovědné za zápis pixelových dat do paměti. Rychlost, s jakou se tato operace provádí, je rychlost plnění. V počátcích 3D akcelerátorů byly ROP a míra plnění velmi důležitými vlastnostmi grafických karet. Dnes je práce ROP stále důležitá, ale výkon grafické karty již není omezen těmito bloky, jako tomu bylo kdysi. Proto se výkon (a počet) ROP zřídka používá k vyhodnocení rychlosti grafické karty.

Dopravníky

Pipelines se používají k popisu architektury grafických karet a poskytují velmi jasnou představu o výkonu GPU.

Dopravník nelze považovat za striktně technický pojem. GPU používá různé kanály, které plní různé funkce. Historicky potrubí znamenalo pixelový procesor, který byl připojen k jeho jednotce mapování textur (TMU). Například grafická karta Radeon 9700 používá osm pixelových procesorů, z nichž každý je připojen k vlastní TMU, takže se předpokládá, že karta má osm kanálů.

Moderní procesory je ale velmi obtížné popsat počtem pipeline. Ve srovnání s předchozími návrhy používají nové procesory modulární, fragmentovanou strukturu. Za inovátora v této oblasti lze považovat společnost ATi, která u grafických karet řady X1000 přešla na modulární strukturu, což umožnilo dosáhnout nárůstu výkonu prostřednictvím vnitřní optimalizace. Některé bloky CPU jsou využívány více než jiné a pro zlepšení výkonu GPU se ATi pokusilo najít kompromis mezi počtem potřebných bloků a oblastí matrice (kterou nelze příliš zvětšit). V této architektuře již pojem „pixel pipeline“ ztratil svůj význam, protože pixelové procesory již nejsou připojeny k vlastním TMU. Například GPU ATi Radeon X1600 má 12 pixel shader jednotek a pouze čtyři jednotky TMU pro mapování textur. Nedá se tedy říci, že by architektura tohoto procesoru měla 12 pixel pipelines, stejně jako nelze říci, že jsou pouze čtyři. Nicméně, podle tradice, pixel pipelines jsou stále zmíněny.

Vezmeme-li v úvahu výše uvedené předpoklady, počet pixel pipeline v GPU se často používá k porovnání grafických karet (s výjimkou řady ATi X1x00). Pokud například vezmete grafické karty s 24 a 16 kanály, pak je docela rozumné předpokládat, že karta s 24 kanály bude rychlejší.


OBSAH

Moderní grafické procesory obsahují mnoho funkčních bloků, jejichž počet a vlastnosti určují výslednou rychlost vykreslování ovlivňující komfort hry. Na základě srovnatelného počtu těchto bloků v různých video čipech můžete zhruba odhadnout, jak je konkrétní GPU rychlý. Video čipy mají poměrně mnoho vlastností, v této části se budeme zabývat pouze těmi nejdůležitějšími z nich.

Rychlost hodin video čipu

Provozní frekvence GPU se obvykle měří v megahertzích, tj. v milionech cyklů za sekundu. Tato charakteristika přímo ovlivňuje výkon video čipu - čím vyšší je, tím více práce může GPU vykonat za jednotku času, procesu velké množství vrcholy a pixely. Příklad z reálného života: frekvence video čipu nainstalovaného na desce Radeon HD 6670 je 840 MHz a přesně stejný čip v modelu Radeon HD 6570 pracuje na frekvenci 650 MHz. V souladu s tím se budou všechny hlavní výkonnostní charakteristiky lišit. Není to však pouze provozní frekvence čipu, která určuje výkon; jeho rychlost je výrazně ovlivněna samotnou grafickou architekturou: designem a počtem prováděcích jednotek, jejich charakteristikami atd.

V některých případech se takt jednotlivých bloků GPU liší od rychlosti zbytku čipu. To znamená, že různé části GPU pracují na různých frekvencích, a to bylo provedeno za účelem zvýšení účinnosti, protože některé bloky jsou schopny pracovat na vyšších frekvencích, zatímco jiné nikoli. Většina GPU je vybavena takovými GPU. grafické karty GeForce od společnosti NVIDIA. Čerstvým příkladem je videočip v modelu GTX 580, z nichž většina pracuje na frekvenci 772 MHz a univerzální výpočetní jednotky čipu mají frekvenci dvojnásobnou – 1544 MHz.

Míra naplnění (míra naplnění)

Míra plnění ukazuje, jak rychle je videočip schopen kreslit pixely. Existují dva typy výplně: míra výplně pixelů a míra výplně textury. Míra vyplnění pixelů ukazuje rychlost vykreslování pixelů na obrazovce a závisí na provozní frekvenci a počtu jednotek ROP (operační jednotky rasterizace a prolnutí) a rychlost vyplnění textury je rychlost vzorkování dat textury, která závisí na provozní frekvenci. a počet jednotek textury.

Například maximální rychlost vyplnění pixelů GeForce GTX 560 Ti je 822 (frekvence čipu) × 32 (počet jednotek ROP) = 26 304 megapixelů za sekundu a rychlost vyplnění textury je 822 × 64 (počet jednotek texturování) = 52 608 megatexelů. /s Zjednodušeně je situace taková - čím větší je první číslo, tím rychleji dokáže grafická karta vykreslit hotové pixely, a čím větší je druhé, tím rychleji se vzorkují texturová data.

Přestože důležitost „čisté“ míry plnění v poslední době výrazně poklesla a ustoupila rychlosti výpočtu, jsou tyto parametry stále velmi důležité, zejména pro hry s jednoduchou geometrií a relativně jednoduchými výpočty pixelů a vertexů. Oba parametry tedy zůstávají pro moderní hry důležité, ale musí být vyvážené. Proto je počet jednotek ROP v moderních video čipech obvykle menší než počet jednotek textur.

Počet výpočetních (shaderových) jednotek nebo procesorů

Možná jsou nyní tyto bloky hlavními částmi video čipu. Vystupují speciální programy, známé jako shadery. Navíc, pokud dřívější pixel shadery prováděly pixel shader bloky a vertex shadery prováděly vertexové bloky, pak se na nějakou dobu grafické architektury sjednotily a tyto univerzální výpočetní jednotky se začaly zabývat různými výpočty: vertexovými, pixelovými, geometrickými a dokonce i univerzálními výpočty.

Poprvé byla jednotná architektura použita ve videočipu herní konzole Microsoft Xbox 360, tento GPU byl vyvinut společností ATI (později koupil AMD). A ve video čipech pro osobní počítače na desce se objevily jednotné shader jednotky NVIDIA GeForce 8800. A od té doby jsou všechny nové videočipy založeny na jednotné architektuře, která má univerzální kód pro různé shader programy (vertex, pixel, geometrie atd.) a odpovídající unifikované procesory dokážou spustit jakýkoli program.

Na základě počtu výpočetních jednotek a jejich frekvence můžete porovnat matematický výkon různých grafických karet. Většina her je nyní omezena výkonem pixel shaderů, takže počet těchto bloků je velmi důležitý. Pokud je například jeden model grafické karty založen na GPU s 384 výpočetními procesory ve svém složení a další ze stejné řady má GPU se 192 výpočetními jednotkami, pak při stejné frekvenci bude druhý dvakrát pomalejší pro zpracování jakéhokoli typu shaderů a obecně budou stejné produktivnější.

I když nelze činit jednoznačné závěry o výkonu pouze na základě počtu samotných výpočetních jednotek, je třeba počítat s taktovací frekvencí a různou architekturou jednotek různých generací a výrobců čipů. Pouze na základě těchto čísel můžete porovnávat čipy pouze v rámci stejné řady jednoho výrobce: AMD nebo NVIDIA. V ostatních případech je třeba věnovat pozornost výkonnostním testům ve hrách nebo aplikacích, o které máte zájem.

Texturovací jednotky (TMU)

Tyto GPU jednotky pracují ve spojení s výpočetními procesory, vybírají a filtrují texturu a další data nezbytná pro konstrukci scény a všeobecné výpočty. Počet texturových jednotek ve videočipu určuje výkon textury – tedy rychlost načítání texelů z textur.

Přestože je v poslední době kladen větší důraz na matematické výpočty a některé textury jsou nahrazovány procedurálními, zatížení bloků TMU je stále poměrně vysoké, protože kromě hlavních textur je třeba provádět výběry také z normálních a displacementových map, stejně jako vyrovnávací paměti cílového vykreslování mimo obrazovku.

Vezmeme-li v úvahu důraz mnoha her, včetně výkonu texturovacích jednotek, můžeme říci, že počet jednotek TMU a odpovídající vysoký texturní výkon jsou také jedním z nejdůležitějších parametrů pro video čipy. Tento parametr má zvláštní dopad na rychlost vykreslování obrazu při použití anizotropního filtrování, které vyžaduje další vzorky textur, stejně jako u složitých algoritmů měkkých stínů a nových algoritmů, jako je Screen Space Ambient Occlusion.

Rasterizační operační jednotky (ROP)

Rasterizační jednotky provádějí operace zápisu pixelů vypočítaných grafickou kartou do vyrovnávacích pamětí a operace jejich míchání (blendování). Jak jsme uvedli výše, výkon bloků ROP ovlivňuje míru plnění a to je jedna z hlavních charakteristik grafických karet všech dob. A přestože jeho význam v poslední době také poněkud poklesl, stále existují případy, kdy výkon aplikace závisí na rychlosti a počtu bloků ROP. Nejčastěji je to způsobeno aktivním používáním post-processingových filtrů a aktivací vyhlazování při vysokých herních nastaveních.

Ještě jednou poznamenejme, že moderní video čipy nelze posuzovat pouze podle počtu různých bloků a jejich frekvence. Každá řada GPU používá novou architekturu, ve které se prováděcí jednotky velmi liší od starých a poměr počtu různých jednotek se může lišit. Bloky AMD ROP v některých řešeních tedy mohou vykonat více práce za takt než bloky v řešení NVIDIA a naopak. Totéž platí o schopnostech texturových jednotek TMU – ty se v různých generacích GPU liší různých výrobců, a to je třeba vzít v úvahu při srovnávání.

Geometrické bloky

Až donedávna nebyl počet jednotek pro zpracování geometrie nijak zvlášť důležitý. Na většinu úloh stačil jeden blok na GPU, protože geometrie ve hrách byla docela jednoduchá a hlavním těžištěm výkonu byly matematické výpočty. Význam paralelního zpracování geometrie a počet odpovídajících bloků dramaticky vzrostl s příchodem podpory teselace geometrie v DirectX 11. NVIDIA byla první, která paralelizovala zpracování geometrických dat, když se v jejích čipech rodiny GF1xx objevilo několik odpovídajících bloků. AMD pak podobné řešení vydalo (pouze ve špičkových řešeních řady Radeon HD 6700 založených na čipech Cayman).

V tomto materiálu nebudeme zabíhat do podrobností, lze je přečíst v základních materiálech na našem webu věnovaném grafickým procesorům kompatibilním s DirectX 11. Zde je pro nás důležité, že počet jednotek pro zpracování geometrie má obrovský dopad na celkový výkon v nejnovějších hrách, které používají teselaci, jako je Metro 2033, HAWX 2 a Crysis 2 (s nejnovějšími záplatami). A při výběru moderní herní grafické karty je velmi důležité věnovat pozornost geometrickému výkonu.

Velikost video paměti

Vlastní paměť je využívána videočipy k ukládání potřebných dat: textur, vrcholů, dat vyrovnávací paměti atd. Zdálo by se, že čím více je, tím lépe. Ale není to tak jednoduché; odhadnout výkon grafické karty na základě množství video paměti je nejčastější chyba! Nezkušení uživatelé nejčastěji přeceňují hodnotu videopaměti a stále ji používají k porovnávání různých modelů grafických karet. To je pochopitelné - tento parametr je jedním z prvních, který je uveden v seznamech charakteristik hotových systémů a je také napsán na krabicích grafických karet velký tisk. Nezkušenému kupujícímu se proto zdá, že protože je dvakrát tolik paměti, měla by být rychlost takového řešení dvakrát vyšší. Skutečnost se od tohoto mýtu liší v tom, že vzpomínka může být odlišné typy a vlastnosti a růst produktivity roste jen do určitého objemu a po jeho dosažení se prostě zastaví.

Takže v každé hře a při určitých nastaveních a herních scénách je určité množství video paměti, které stačí pro všechna data. A i když tam dáte 4 GB videopaměti, nebude důvod, aby to zrychlovalo vykreslování, rychlost bude omezena výše probíranými prováděcími jednotkami a paměti prostě bude dost. To je důvod, proč v mnoha případech grafická karta s 1,5 GB videopaměti běží stejnou rychlostí jako karta se 3 GB (všechny ostatní věci jsou stejné).

Jsou situace, kdy více paměti vede k viditelnému nárůstu výkonu – jde o velmi náročné hry, zejména při ultravysokých rozlišeních a při nastavení maximální kvality. Ne vždy ale k takovým případům dochází a je třeba počítat s množstvím paměti, nezapomínat na to, že výkon nad určitou částku prostě nezvýší. Paměťové čipy mají více důležité parametry, jako je šířka paměťové sběrnice a její pracovní frekvence. Toto téma je tak rozsáhlé, že se podrobněji podíváme na výběr velikosti video paměti šestý díl náš materiál.

Šířka paměťové sběrnice

Šířka paměťové sběrnice je nejdůležitější charakteristika, ovlivňující šířku pásma paměti (MBB). Větší šířka umožňuje za jednotku času přenést více informací z video paměti do GPU a zpět, což má ve většině případů pozitivní vliv na výkon. Teoreticky může 256bitová sběrnice přenést dvakrát tolik dat za cyklus hodin než 128bitová sběrnice. V praxi je rozdíl v rychlosti vykreslování, i když nedosahuje dvojnásobku, v mnoha případech s důrazem na šířku pásma videopaměti tomu velmi blízký.

Moderní herní grafické karty používají různé šířky sběrnice: od 64 do 384 bitů (dříve existovaly čipy s 512bitovou sběrnicí), v závislosti na cenovém rozpětí a době vydání. konkrétní model GPU U nejlevnějších low-endových grafických karet se nejčastěji používá 64 a méně často 128 bitů, pro střední úroveň od 128 do 256 bitů a grafické karty z vyšší cenové kategorie využívají sběrnice o šířce 256 až 384 bitů. Šířka sběrnice již nemůže růst čistě kvůli fyzickým omezením - velikost GPU je nedostatečná pro umístění více než 512bitové sběrnice, a to je příliš drahé. Šířka pásma paměti se proto nyní zvyšuje použitím nových typů paměti (viz níže).

Frekvence video paměti

Dalším parametrem, který ovlivňuje šířku pásma paměti, je její hodinová frekvence. A zvýšení šířky pásma často přímo ovlivňuje výkon grafické karty ve 3D aplikacích. Frekvence paměťové sběrnice na moderních grafických kartách se pohybuje od 533 (1066, s přihlédnutím ke zdvojnásobení) MHz do 1375 (5500, s přihlédnutím ke čtyřnásobku) MHz, to znamená, že se může lišit více než pětkrát! A protože šířka pásma závisí jak na frekvenci paměti, tak na šířce její sběrnice, paměť s 256bitovou sběrnicí pracující na frekvenci 800 (3200) MHz bude mít větší šířku pásma ve srovnání s pamětí pracující na frekvenci 1000 (4000) MHz se 128 -bitová sběrnice.

Při nákupu relativně levných grafických karet, z nichž mnohé mají pouze 128bitové nebo dokonce 64bitové rozhraní, je třeba věnovat zvláštní pozornost parametrům šířky paměťové sběrnice, jejímu typu a provozní frekvenci, což má extrémně negativní dopad na jejich výkon. . Obecně nedoporučujeme kupovat grafickou kartu využívající 64bitovou sběrnici videopaměti pro herní PC. Je vhodné dát přednost alespoň střední úrovni s alespoň 128- nebo 192bitovou sběrnicí.

Typy paměti

Moderní grafické karty jsou vybaveny několika různými typy paměti. Staré jednorychlostní SDR paměti již nikde nenajdete, ale moderní typy DDR a GDDR pamětí mají výrazně odlišné vlastnosti. Různé typy DDR a GDDR umožňují přenášet dvakrát až čtyřikrát více dat při stejné hodinové frekvenci za jednotku času, a proto se údaj o pracovní frekvenci často zdvojnásobí nebo zčtyřnásobí, vynásobí se 2 nebo 4. Pokud je tedy specifikována frekvence 1400 MHz pro paměti DDR pak tato paměť pracuje na fyzické frekvenci 700 MHz, ale udávají takzvanou „efektivní“ frekvenci, tedy frekvenci, na které musí paměť SDR pracovat, aby poskytovala stejnou šířku pásma. To samé s GDDR5, ale frekvence je dokonce čtyřnásobná.

Hlavní výhodou nových typů pamětí je schopnost pracovat na vyšších taktech, a tedy zvýšit šířku pásma ve srovnání s předchozími technologiemi. Toho je dosaženo na úkor zvýšených latencí, které však nejsou pro grafické karty tak důležité. První deskou, která používala paměti DDR2, byla NVIDIA GeForce FX 5800 Ultra. Od té doby technologie grafické paměti výrazně pokročila a byl vyvinut standard GDDR3, který se blíží specifikacím DDR2, s některými změnami speciálně pro grafické karty.

GDDR3 je paměť speciálně navržená pro grafické karty, se stejnými technologiemi jako DDR2, ale s vylepšenou spotřebou a charakteristikou odvodu tepla, což umožnilo vytvořit čipy, které pracují na vyšších taktech. Navzdory skutečnosti, že standard byl vyvinut společností ATI, první grafickou kartou, která jej používala, byla druhá modifikace NVIDIA GeForce FX 5700 Ultra a další byla GeForce 6800 Ultra.

GDDR4 je dalším vývojem „grafické“ paměti, která běží téměř dvakrát rychleji než GDDR3. Hlavní rozdíly mezi GDDR4 a GDDR3, které jsou pro uživatele významné, jsou opět ve zvýšené provozní frekvenci a snížené spotřebě energie. Technicky se paměť GDDR4 příliš neliší od GDDR3, jde o další vývoj stejných myšlenek. První grafické karty s čipy GDDR4 na desce byly ATI Radeon X1950 XTX a NVIDIA produkty založené na tomto typu paměti vůbec nevydávala. Výhody nových paměťových čipů oproti GDDR3 jsou v tom, že spotřeba modulů může být zhruba o třetinu nižší. Toho je dosaženo díky nižšímu jmenovitému napětí pro GDDR4.

GDDR4 se však příliš nepoužívá ani v řešeních AMD. Počínaje rodinou GPU RV7x0 podporují řadiče paměti grafické karty nový typ paměti GDDR5 pracující na efektivní čtyřnásobné frekvenci až 5,5 GHz a vyšší (teoreticky jsou možné frekvence až 7 GHz), což poskytuje propustnost až až 176 GB/s pomocí 256bitového rozhraní. Pokud bylo pro zvýšení šířky pásma paměti GDDR3/GDDR4 nutné použít 512bitovou sběrnici, pak přechod na použití GDDR5 umožnil zdvojnásobit výkon při menší velikosti krystaly a nižší spotřeba energie.

Nejmodernější typy videopamětí jsou GDDR3 a GDDR5, liší se od DDR v některých detailech a pracují i ​​s dvojnásobným/čtyřnásobným přenosem dat. Tyto typy pamětí využívají některé speciální technologie ke zvýšení provozní frekvence. Paměť GDDR2 tedy obvykle pracuje na vyšších frekvencích ve srovnání s DDR, GDDR3 na ještě vyšších frekvencích a GDDR5 poskytuje v tuto chvíli maximální frekvenci a šířku pásma. Levné modely jsou však stále vybaveny „negrafickou“ pamětí DDR3 s výrazně nižší frekvencí, takže musíte pečlivěji vybírat grafickou kartu.