Počet výpočtových (shader) jednotiek alebo procesorov. Grafické karty Frekvencia jednotiek Shader

Základné komponenty grafickej karty:

  • výstupy;
  • rozhrania;
  • chladiaci systém;
  • GPU;
  • video pamäť.

Grafické technológie:

  • slovník;
  • Architektúra GPU: funkcie
    jednotky vertex/pixel, shadery, rýchlosť plnenia, jednotky textúry/rastra, potrubia;
  • Architektúra GPU: technológia
    technický proces, frekvencia GPU, lokálna video pamäť (hlasitosť, zbernica, typ, frekvencia), riešenia s viacerými grafickými kartami;
  • zrakové funkcie
    DirectX, vysoký dynamický rozsah (HDR), anti-aliasing na celej obrazovke, filtrovanie textúr, textúry s vysokým rozlíšením.

Slovník základných grafických pojmov

Obnovovacia frekvencia

Rovnako ako v kine alebo televízii váš počítač simuluje pohyb na monitore zobrazením sekvencie snímok. Obnovovacia frekvencia monitora udáva, koľkokrát za sekundu sa bude obraz na obrazovke aktualizovať. Napríklad frekvencia 75 Hz zodpovedá 75 aktualizáciám za sekundu.

Ak počítač spracováva snímky rýchlejšie, ako dokáže monitor vytlačiť, v hrách sa môžu vyskytnúť problémy. Napríklad, ak počítač vykresľuje 100 snímok za sekundu a obnovovacia frekvencia monitora je 75 Hz, potom v dôsledku prekrývania môže monitor počas obnovovacej periódy zobraziť iba časť obrazu. V dôsledku toho sa objavujú vizuálne artefakty.

Ako riešenie môžete povoliť V-Sync (vertikálna synchronizácia). Obmedzuje počet snímok, ktoré môže počítač odoslať do obnovovacej frekvencie monitora, čím zabraňuje vzniku artefaktov. Ak povolíte V-Sync, počet snímok vypočítaný v hre nikdy neprekročí obnovovaciu frekvenciu. To znamená, že pri frekvencii 75 Hz bude mať počítač na výstupe maximálne 75 snímok za sekundu.

Pixel

Slovo „Pixel“ znamená „ obr ture el ement“ – prvok obrázka. Ide o drobnú bodku na displeji, ktorá môže svietiť určitou farbou (vo väčšine prípadov sa odtieň zobrazuje kombináciou troch základných farieb: červenej, zelenej a modrej). Ak je rozlíšenie obrazovky 1024 x 768, potom môžete vidieť maticu 1024 pixelov na šírku a 768 pixelov na výšku. Všetky pixely spolu tvoria obrázok. Obraz na obrazovke sa aktualizuje 60 až 120-krát za sekundu, v závislosti od typu zobrazenia a výstupu údajov z grafickej karty. CRT monitory obnovujú zobrazenie riadok po riadku, zatiaľ čo ploché LCD monitory môžu obnovovať každý pixel samostatne.

Vertex

Všetky objekty v 3D scéne sa skladajú z vrcholov. Vrchol je bod v trojrozmernom priestore so súradnicami X, Y a Z. Viacero vrcholov možno zoskupiť do mnohouholníka: najčastejšie je to trojuholník, ale sú možné aj zložitejšie tvary. Na mnohouholník sa potom aplikuje textúra, vďaka ktorej objekt vyzerá realisticky. 3D kocka zobrazená na obrázku vyššie pozostáva z ôsmich vrcholov. Zložitejšie objekty majú zakrivené povrchy, ktoré sú v skutočnosti tvorené veľmi veľkým počtom vrcholov.

textúra

Textúra je jednoducho 2D obrázok ľubovoľnej veľkosti, ktorý je namapovaný na 3D objekt, aby simuloval jeho povrch. Napríklad naša 3D kocka pozostáva z ôsmich vrcholov. Pred aplikáciou textúry vyzerá ako jednoduchá škatuľka. Ale keď aplikujeme textúru, krabica sa zafarbí.

Shader

Programy Pixel shader umožňujú grafickej karte vytvárať pôsobivé efekty, ako napríklad táto voda Elder Scrolls: Zabudnutie.

Dnes existujú dva typy shaderov: vertex a pixel. Programy Vertex shader môžu upravovať alebo transformovať 3D objekty. Programy Pixel shader vám umožňujú meniť farby pixelov na základe niektorých údajov. Predstavte si zdroj svetla v 3D scéne, ktorý spôsobí, že osvetlené objekty budú žiariť jasnejšie, a zároveň spôsobí, že na iné objekty budú vrhať tiene. To všetko je dosiahnuté zmenou informácií o farbe pixelov.

Pixel shadery sa používajú na vytváranie zložitých efektov vo vašich obľúbených hrách. Napríklad kód shadera môže spôsobiť, že pixely obklopujúce 3D meč žiaria jasnejšie. Ďalší shader dokáže spracovať všetky vrcholy zložitého 3D objektu a simulovať výbuch. Vývojári hier sa čoraz viac obracajú na vytváranie zložitých shader programov realistická grafika. Takmer každá moderná hra s bohatou grafikou používa shadery.

S vydaním ďalšieho aplikačného programovacieho rozhrania (API), Microsoft DirectX 10, bude vydaný aj tretí typ shadera, nazývaný geometry shaders. S ich pomocou bude možné predmety rozbiť, upraviť a dokonca zničiť v závislosti od požadovaného výsledku. Tretí typ shaderov je možné naprogramovať úplne rovnakým spôsobom ako prvé dva, ale jeho úloha bude iná.

Miera plnenia

Veľmi často na krabici s grafickou kartou nájdete hodnotu miery plnenia. Miera plnenia v podstate udáva, ako rýchlo dokáže GPU vydávať pixely. Staršie grafické karty mali mieru plnenia trojuholníka. Dnes však existujú dva typy miery plnenia: miera plnenia pixelov a miera plnenia textúry. Ako už bolo spomenuté, miera plnenia pixelov zodpovedá rýchlosti výstupu pixelov. Vypočíta sa ako počet rastrových operácií (ROP) vynásobený frekvenciou hodín.

ATi a nVidia počítajú rýchlosť plnenia textúry odlišne. Nvidia verí, že rýchlosť sa získa vynásobením počtu pixelových potrubí frekvenciou hodín. A ATi násobí počet textúrových jednotiek rýchlosťou hodín. V princípe sú obe metódy správne, keďže nVidia používa jednu textúrovú jednotku na pixel shader jednotku (teda jednu na pixel pipeline).

S ohľadom na tieto definície poďme ďalej a diskutujme o najdôležitejších funkciách GPU, o tom, čo robia a prečo sú také dôležité.

Architektúra GPU: Funkcie

Realizmus 3D grafiky vo veľkej miere závisí od výkonu grafickej karty. Čím viac blokov shadera pixelov procesor obsahuje a čím vyššia je frekvencia, tým viac efektov možno aplikovať na 3D scénu na zlepšenie jej vizuálneho vnímania.

GPU obsahuje mnoho rôznych funkčných blokov. Podľa počtu niektorých komponentov môžete odhadnúť výkon GPU. Predtým, ako prejdeme ďalej, zopakujme si najdôležitejšie funkčné bloky.

Vertexové procesory (vertex shader jednotky)

Podobne ako jednotky pixel shader, aj vertexové procesory vykonávajú shader kód, ktorý sa dotýka vrcholov. Keďže väčší rozpočet na vrcholy umožňuje vytvárať zložitejšie 3D objekty, výkon procesorov vrcholov je veľmi dôležitý v 3D scénach s komplexné objekty alebo s veľkým počtom z nich. Jednotky vertex shader však stále nemajú taký zjavný vplyv na výkon ako pixelové procesory.

Procesory pixelov (jednotky shaderov pixelov)

Procesor pixelov je komponent grafického čipu určený na spracovanie programov na úpravu pixelov. Tieto procesory vykonávajú výpočty, ktoré sa týkajú iba pixelov. Keďže pixely obsahujú informácie o farbe, pixel shadery vám umožňujú dosiahnuť pôsobivé grafické efekty. Napríklad väčšina vodných efektov, ktoré vidíte v hrách, je vytvorená pomocou pixel shaderov. Typicky sa počet pixelových procesorov používa na porovnanie výkonu pixelov grafických kariet. Ak má jedna karta osem jednotiek pixel shader a druhá 16 jednotiek, potom je logické predpokladať, že grafická karta so 16 jednotkami bude rýchlejšia pri spracovávaní zložitých programov na shader pixelov. Do úvahy treba brať aj takt, no dnes je zdvojnásobenie počtu pixelových procesorov energeticky efektívnejšie ako zdvojnásobenie frekvencie grafického čipu.

Zjednotené shadery

Zjednotené shadery do sveta PC ešte nedorazili, no pripravovaný štandard DirectX 10 je založený na podobnej architektúre. To znamená, že štruktúra kódu vrcholov, geometrie a pixelových programov bude rovnaká, hoci shadery budú vykonávať inú prácu. Novú špecifikáciu je možné vidieť na Xbox 360, kde GPU špeciálne navrhol ATi pre Microsoft. Bude veľmi zaujímavé sledovať, aký potenciál prinesie nové DirectX 10.

Jednotky mapovania textúr (TMU)

Textúry by mali byť vybrané a filtrované. Túto prácu vykonávajú jednotky mapovania textúr, ktoré pracujú v spojení s pixelovými a vertex shader jednotkami. Úlohou TMU je aplikovať textúrne operácie na pixely. Počet textúrových jednotiek v GPU sa často používa na porovnanie výkonu textúr grafických kariet. Je rozumné predpokladať, že grafická karta s viacerými jednotkami TMU poskytne lepší výkon textúr.

Rastrové operátorské jednotky (ROP)

Rastrové procesory sú zodpovedné za zápis pixelových dát do pamäte. Rýchlosť, akou sa táto operácia vykonáva, je rýchlosť plnenia. V prvých dňoch 3D akcelerátorov boli ROP a miera plnenia veľmi dôležitými charakteristikami grafických kariet. Dnes je práca ROP stále dôležitá, ale výkon grafickej karty už nie je obmedzený týmito blokmi, ako to bolo kedysi. Preto sa výkon (a počet) ROP zriedka používa na vyhodnotenie rýchlosti grafickej karty.

Dopravníky

Potrubia sa používajú na popis architektúry grafických kariet a poskytujú veľmi jasnú predstavu o výkone GPU.

Dopravník nemožno považovať za striktný technický pojem. GPU používa rôzne potrubia, ktoré vykonávajú rôzne funkcie. Historicky potrubie znamenalo pixelový procesor, ktorý bol pripojený k jeho jednotke mapovania textúr (TMU). Napríklad grafická karta Radeon 9700 používa osem pixelových procesorov, z ktorých každý je pripojený k vlastnej TMU, takže karta má osem kanálov.

ale moderné procesory Je to veľmi ťažké opísať počtom dopravníkov. V porovnaní s predchádzajúcimi návrhmi nové procesory využívajú modulárnu, fragmentovanú štruktúru. Za inovátora v tejto oblasti možno považovať spoločnosť ATi, ktorá pri rade grafických kariet X1000 prešla na modulárnu štruktúru, čo umožnilo dosiahnuť zvýšenie výkonu internou optimalizáciou. Niektoré bloky CPU sa využívajú viac ako iné a na zlepšenie výkonu GPU sa ATi pokúsilo nájsť kompromis medzi počtom potrebných blokov a oblasťou matrice (ktorá sa nedá veľmi zväčšiť). V tejto architektúre pojem „pixel pipeline“ už stratil svoj význam, pretože pixelové procesory už nie sú pripojené k vlastným TMU. Napríklad GPU ATi Radeon X1600 má 12 pixel shader jednotiek a iba štyri jednotky TMU na mapovanie textúr. Nedá sa teda povedať, že by architektúra tohto procesora mala 12 pixel pipelines, rovnako ako nemožno povedať, že sú len štyri. Tradične sa však stále spomínajú pipeline pixelov.

Berúc do úvahy vyššie uvedené predpoklady, počet pixelov v GPU sa často používa na porovnanie grafických kariet (s výnimkou radu ATi X1x00). Napríklad, ak vezmete grafické karty s 24 a 16 kanálmi, potom je celkom rozumné predpokladať, že karta s 24 kanálmi bude rýchlejšia.

Architektúra GPU: Technológia

Technický proces

Tento pojem označuje veľkosť jedného prvku (tranzistora) čipu a presnosť výrobného procesu. Vylepšenia technických procesov umožňujú získať prvky menších rozmerov. Napríklad 0,18 mikrónový proces vytvára väčšie znaky ako 0,13 mikrónový proces, takže nie je taký efektívny. Menšie tranzistory pracujú pri nižšom napätí. Pokles napätia zase vedie k zníženiu tepelného odporu, čo má za následok zníženie množstva generovaného tepla. Vylepšenia v technickom procese umožňujú zmenšiť vzdialenosť medzi funkčnými blokmi čipu a prenos dát trvá kratšie. Kratšie vzdialenosti, nižšie napätie a ďalšie vylepšenia umožňujú dosiahnuť vyššie rýchlosti hodín.

Pochopenie trochu komplikuje to, že dnes sa na označenie technického procesu používajú mikrometre (μm) aj nanometre (nm). V skutočnosti je všetko veľmi jednoduché: 1 nanometer sa rovná 0,001 mikrometra, takže procesy 0,09 μm a 90 nm sú to isté. Ako je uvedené vyššie, menšia procesná technológia umožňuje vyššie rýchlosti hodín. Napríklad, ak porovnáme grafické karty s čipmi 0,18 mikrónu a 0,09 mikrónu (90 nm), potom je celkom rozumné očakávať vyššiu frekvenciu od 90 nm karty.

Rýchlosť hodín GPU

Frekvencia hodín GPU sa meria v megahertzoch (MHz), čo sú milióny hodinových cyklov za sekundu.

Rýchlosť hodín priamo ovplyvňuje výkon GPU. Čím je vyššia, tým viac práce dá sa to urobiť za sekundu. Ako prvý príklad si vezmime grafické karty nVidia GeForce 6600 a 6600 GT: grafický procesor 6600 GT beží na frekvencii 500 MHz a obyčajná karta 6600 - pri 400 MHz. Keďže procesory sú po technickej stránke identické, 20 % zvýšenie taktu 6600 GT má za následok vyšší výkon.

Rýchlosť hodín však nie je všetko. Majte na pamäti, že výkon je výrazne ovplyvnený architektúrou. Ako druhý príklad si vezmime grafické karty GeForce 6600 GT a GeForce 6800 GT. GPU 6600 GT pracuje na frekvencii 500 MHz, ale 6800 GT beží iba na 350 MHz. Teraz zoberme do úvahy, že 6800 GT používa 16 pixel pipeline, zatiaľ čo 6600 GT používa iba osem. Preto 6800 GT so 16 pipeline na 350 MHz podá približne rovnaký výkon ako procesor s ôsmimi pipeline a dvojnásobným taktom (700 MHz). Vďaka tomu možno rýchlosť hodín ľahko použiť na porovnanie výkonu.

Lokálna video pamäť

Pamäť grafickej karty výrazne ovplyvňuje výkon. ale rôzne parametre pamäť je ovplyvnená rôznymi spôsobmi.

Veľkosť videopamäte

Množstvo video pamäte možno pravdepodobne nazvať najviac nadhodnoteným parametrom grafickej karty. Neskúsení spotrebitelia často používajú kapacitu videopamäte na vzájomné porovnávanie rôznych kariet, ale v skutočnosti má kapacita malý vplyv na výkon v porovnaní s parametrami, ako je frekvencia pamäťovej zbernice a rozhranie (šírka zbernice).

Vo väčšine prípadov bude karta so 128 MB videopamäte fungovať takmer rovnako ako karta s 256 MB. Samozrejme, existujú situácie, kedy viac pamäte zlepší výkon, no majte na pamäti, že viac pamäte automaticky nepovedie k vyššej rýchlosti hrania.

Objem môže byť užitočný v hrách s textúrami vo vysokom rozlíšení. Vývojári hry poskytujú pre hru niekoľko sád textúr. A čím viac pamäte je na grafickej karte, tým vyššie rozlíšenie môžu mať načítané textúry. Textúry s vysokým rozlíšením poskytujú viac vysoké rozlíšenie a detaily v hre. Preto je celkom rozumné vziať kartu s veľkým množstvom pamäte, ak sa všetky ostatné kritériá zhodujú. Pripomeňme ešte raz, že šírka pamäťovej zbernice a jej frekvencia majú na výkon oveľa silnejší vplyv ako množstvo fyzickej pamäte na karte.

Šírka pamäťovej zbernice

Šírka pamäťovej zbernice je jedným z najdôležitejších aspektov výkonu pamäte. Moderné zbernice majú šírku od 64 do 256 bitov a v niektorých prípadoch dokonca 512 bitov. Čím širšia je pamäťová zbernica, tým viac informácií dokáže preniesť za cyklus hodín. A to priamo ovplyvňuje produktivitu. Napríklad, ak použijete dve zbernice s rovnakými frekvenciami, teoreticky 128-bitová zbernica prenesie dvakrát toľko údajov za cyklus hodín ako 64-bitová zbernica. A 256-bitová zbernica je dvakrát väčšia.

Vyššia šírka pásma zbernice (vyjadrená v bitoch alebo bajtoch za sekundu, 1 bajt = 8 bitov) poskytuje vyšší výkon pamäte. To je dôvod, prečo je pamäťová zbernica oveľa dôležitejšia ako jej veľkosť. Pri rovnakých frekvenciách pracuje 64-bitová pamäťová zbernica rýchlosťou iba 25 % oproti 256-bitovej!

Zoberme si nasledujúci príklad. Grafická karta so 128 MB video pamäte, ale s 256-bitovou zbernicou, poskytuje oveľa vyšší pamäťový výkon ako 512 MB model so 64-bitovou zbernicou. Dôležité je podotknúť, že pri niektorých kartách z rady ATi X1x00 výrobcovia uvádzajú špecifikácie internej pamäťovej zbernice, nás však zaujímajú parametre externej zbernice. Napríklad X1600 má internú kruhovú zbernicu, ktorá je široká 256 bitov, ale externú, ktorá má šírku iba 128 bitov. A v skutočnosti pamäťová zbernica pracuje pri 128-bitovom výkone.

Typy pamäte

Pamäť možno rozdeliť do dvoch hlavných kategórií: SDR (jednotný prenos dát) a DDR (dvojitý prenos dát), v ktorých sa dáta prenášajú dvakrát rýchlejšie za takt. Dnes je technológia SDR s jedným prevodom zastaraná. Od r DDR pamäte dáta sa prenášajú dvakrát rýchlejšie ako SDR; je dôležité si uvedomiť, že grafické karty s pamäťou DDR najčastejšie uvádzajú dvojnásobnú frekvenciu, nie fyzickú. Napríklad, ak je pamäť DDR špecifikovaná na 1000 MHz, potom je to efektívna frekvencia, pri ktorej by mala fungovať normálna pamäť SDR, aby sa dosiahla rovnaká priepustnosť. Ale v skutočnosti je fyzická frekvencia 500 MHz.

Z tohto dôvodu sú mnohí prekvapení, keď je pre pamäť ich grafickej karty uvedená frekvencia 1200 MHz DDR a utility uvádzajú 600 MHz. Takže si budete musieť zvyknúť. Pamäť DDR2 a GDDR3/GDDR4 funguje na rovnakom princípe, teda s dvojitým prenosom dát. Rozdiel medzi pamäťami DDR, DDR2, GDDR3 a GDDR4 spočíva v technológii výroby a niektorých detailoch. DDR2 môže pracovať na vyšších frekvenciách ako pamäť DDR a DDR3 môže pracovať na ešte vyšších frekvenciách ako DDR2.

Frekvencia pamäťovej zbernice

Rovnako ako procesor, aj pamäť (presnejšie pamäťová zbernica) funguje na určitých rýchlosti hodín, merané v megahertzoch. Tu zvýšenie rýchlosti hodín priamo ovplyvňuje výkon pamäte. A frekvencia pamäťovej zbernice je jedným z parametrov, ktorý sa používa na porovnanie výkonu grafických kariet. Napríklad, ak sú všetky ostatné charakteristiky (šírka pamäťovej zbernice atď.) rovnaké, potom je celkom logické povedať, že grafická karta s pamäťou 700 MHz je rýchlejšia ako karta s pamäťou 500 MHz.

Opäť platí, že rýchlosť hodín nie je všetko. 700 MHz pamäť so 64-bitovou zbernicou bude pomalšia ako 400 MHz pamäť so 128-bitovou zbernicou. Výkon 400 MHz pamäte na 128-bitovej zbernici je približne ekvivalentný 800 MHz pamäti na 64-bitovej zbernici. Mali by ste tiež pamätať na to, že frekvencia GPU a pamäte sú úplne odlišné parametre a zvyčajne sa líšia.

Rozhranie grafickej karty

Všetky dáta prenášané medzi grafickou kartou a procesorom prechádzajú cez rozhranie grafickej karty. Dnes sa pre grafické karty používajú tri typy rozhraní: PCI, AGP a PCI Express. Líšia sa šírkou pásma a inými charakteristikami. Je jasné, že čím vyššia priepustnosť, tým vyššia rýchlosť výmeny. Veľkú šírku pásma však dokážu využívať len najmodernejšie karty a aj to len čiastočne. V určitom okamihu rýchlosť rozhrania prestala byť prekážkou, dnes je jednoducho postačujúca.

Najpomalšia zbernica, pre ktorú boli grafické karty vyrobené, je PCI (Peripheral Components Interconnect). Bez zachádzania do histórie, samozrejme. PCI skutočne znížilo výkon grafických kariet, takže prešli na rozhranie AGP (Accelerated Graphics Port). Ale aj špecifikácie AGP 1.0 a 2x obmedzovali výkon. Keď štandard zvýšil rýchlosti na úroveň AGP 4x, začali sme sa približovať k praktickému limitu šírky pásma, ktorý grafické karty dokážu zvládnuť. Špecifikácia AGP 8x opäť zdvojnásobila priepustnosť v porovnaní s AGP 4x (2,16 GB/s), ale nedošlo k žiadnemu citeľnému zvýšeniu grafický výkon ešte sme ho nedostali.

Najnovšia a najrýchlejšia zbernica je PCI Express. Nové grafické karty zvyčajne využívajú rozhranie PCI Express x16, ktoré kombinuje 16 liniek PCI Express s celkovou priepustnosťou 4 GB/s (v jednom smere). To je dvojnásobná priepustnosť oproti AGP 8x. Zbernica PCI Express poskytuje spomínanú šírku pásma v oboch smeroch (prenos dát do a z grafickej karty). Ale rýchlosť štandardu AGP 8x už bola dostatočná, a tak sme sa ešte nestretli so situáciou, že by prechod na PCI Express priniesol zvýšenie výkonu oproti AGP 8x (ak sú ostatné hardvérové ​​parametre rovnaké). Napríklad AGP verzia GeForce 6800 Ultra bude fungovať identicky ako 6800 Ultra pre PCI Express.

Dnes je najlepšie kúpiť si kartu s rozhraním PCI Express, tá zostane na trhu ešte niekoľko rokov. Najvýkonnejšie karty sa už nevyrábajú s rozhraním AGP 8x a riešenia PCI Express sa spravidla dajú ľahšie nájsť ako analógy AGP a sú lacnejšie.

Riešenia na viacerých grafických kartách

Použitie viacerých grafických kariet na zvýšenie grafického výkonu nie je nový nápad. V začiatkoch 3D grafiky vstúpilo 3dfx na trh s dvoma grafickými kartami bežiacimi paralelne. Ale po zmiznutí 3dfx bola technológia pre spoluprácu viacerých spotrebiteľských grafických kariet odložená do zabudnutia, hoci ATI vydala podobné systémy pre profesionálne simulátory od vydania Radeonu 9700. Pred pár rokmi sa technológia vrátila na trh: s príchodom riešení nVidia SLI a o niečo neskôr ATi Crossfire.

Zdieľanie viacerých grafických kariet poskytuje dostatočný výkon na spustenie hry pri nastavení vysokej kvality. s vysokým rozlíšením. Výber jedného alebo druhého riešenia však nie je taký jednoduchý.

Začnime tým, že riešenia založené na viacerých grafických kartách vyžadujú veľké množstvo energie, takže napájanie musí byť dostatočne výkonné. Všetko toto teplo bude treba z grafickej karty odviesť, takže treba dávať pozor na PC skrinku a chladenie, aby sa systém neprehrial.

Pamätajte tiež, že SLI/CrossFire vyžaduje vhodnú základnú dosku (buď pre jednu alebo druhú technológiu), ktorá zvyčajne stojí viac ako štandardné modely. konfigurácia nVidia SLI bude fungovať iba na určitých doskách nForce4 a iba na kartách ATi CrossFire základné dosky s čipovou sadou CrossFire alebo na niektorých modeloch Intel. Aby sa veci skomplikovali, niektoré konfigurácie CrossFire vyžadujú, aby jedna z kariet bola špeciálna: CrossFire Edition. Po vydaní CrossFire umožnila ATi pre niektoré modely grafických kariet zahrnutie technológie spolupráce cez zbernicu PCI Express a s vydaním nových verzií ovládačov sa počet možných kombinácií zvyšuje. Hardvérový CrossFire s príslušnou kartou CrossFire Edition však stále poskytuje vyšší výkon. Karty CrossFire Edition sú ale aj drahšie ako bežné modely. Zapnuté tento moment Softvérový režim CrossFire (bez karty CrossFire Edition) môžete povoliť na grafických kartách Radeon X1300, X1600 a X1800 GTO.

Je potrebné zvážiť aj ďalšie faktory. Hoci dve grafické karty spolupracujúce poskytujú zvýšenie výkonu, zďaleka to nie je dvojnásobok. Zaplatíte však dvakrát toľko peňazí. Najčastejšie je zvýšenie produktivity 20-60%. A v niektorých prípadoch kvôli dodatočným výpočtovým nákladom na párovanie nedôjde k žiadnemu zvýšeniu. Z tohto dôvodu je nepravdepodobné, že by sa konfigurácie viacerých kariet vyplatili pri lacnejších modeloch, pretože drahšia grafická karta zvyčajne vždy prekoná niekoľko lacnejších kariet. Vo všeobecnosti pre väčšinu spotrebiteľov nákup riešenia SLI/CrossFire nedáva zmysel. Ak však chcete povoliť všetky možnosti vylepšenia kvality alebo hrať v extrémnych rozlíšeniach, napríklad 2560 x 1600, keď potrebujete vypočítať viac ako 4 milióny pixelov na snímku, potom sa nezaobídete bez dvoch alebo štyroch spárovaných grafických kariet.

Vizuálne vlastnosti

Okrem čisto hardvérových špecifikácií, rôzne generácie a modely GPU sa môžu líšiť v sade funkcií. Často sa napríklad hovorí, že karty generácie ATi Radeon X800 XT sú kompatibilné so Shader Model 2.0b (SM), zatiaľ čo nVidia GeForce 6800 Ultra je kompatibilná s SM 3.0, hoci ich hardvérové ​​špecifikácie sú si blízke (16 pipeline ). Preto sa mnohí spotrebitelia rozhodujú v prospech jedného alebo druhého riešenia bez toho, aby vedeli, čo tento rozdiel znamená.

Verzie Microsoft DirectX a Shader Model

Tieto mená sa najčastejšie používajú v sporoch, no málokto vie, čo v skutočnosti znamenajú. Aby sme to pochopili, začnime históriou grafických API. DirectX a OpenGL sú grafické API, teda aplikačné programové rozhrania – štandardy otvoreného kódu dostupné pre každého.

Pred príchodom grafických API používal každý výrobca GPU na komunikáciu s hrami vlastný mechanizmus. Vývojári museli napísať samostatný kód pre každý GPU, ktorý chceli podporovať. Veľmi drahý a neefektívny prístup. Na vyriešenie tohto problému boli vyvinuté API pre 3D grafiku, aby vývojári písali kód pre špecifické API, a nie pre konkrétnu grafickú kartu. Potom padli problémy s kompatibilitou na plecia výrobcov grafických kariet, ktorí museli zabezpečiť, aby boli ovládače kompatibilné s API.

Jediným problémom zostáva, že dnes sa používajú dve rôzne API, a to Microsoft DirectX a OpenGL, kde GL znamená Graphics Library. Keďže DirectX API je dnes v hrách populárnejšie, zameriame sa práve naň. A tento štandard mal silnejší vplyv na vývoj hier.

DirectX je vytvorenie spoločnosti Microsoft. V skutočnosti DirectX obsahuje niekoľko API, z ktorých iba jedno sa používa pre 3D grafiku. DirectX obsahuje API pre zvuk, hudbu, vstupné zariadenia atď. Direct3D API je zodpovedné za 3D grafiku v DirectX. Keď hovoria o grafických kartách, majú na mysli toto, takže v tomto ohľade sú pojmy DirectX a Direct3D zameniteľné.

DirectX sa pravidelne aktualizuje s pokrokom v grafických technológiách a s implementáciou nových techník programovania hier. Keďže popularita DirectX rýchlo rástla, výrobcovia GPU začali prispôsobovať vydania nových produktov tak, aby vyhovovali schopnostiam DirectX. Z tohto dôvodu sú grafické karty často viazané na hardvérovú podporu jednej alebo druhej generácie DirectX (DirectX 8, 9.0 alebo 9.0c).

Aby sa veci skomplikovali, časti rozhrania Direct3D API sa môžu časom meniť bez toho, aby sa menili generácie DirectX. Napríklad špecifikácia DirectX 9.0 špecifikuje podporu pre Pixel Shader 2.0. ale Aktualizácia DirectX 9.0c obsahuje Pixel Shader 3.0. Takže aj keď sú karty triedy DirectX 9, môžu podporovať rôzne sady funkcií. Napríklad Radeon 9700 podporuje Shader Model 2.0 a Radeon X1800 podporuje Shader Model 3.0, hoci obe karty možno klasifikovať ako generáciu DirectX 9.

Pamätajte, že pri vytváraní nových hier vývojári berú do úvahy majiteľov starých strojov a grafických kariet, pretože ak ignorujete tento segment používateľov, úroveň predaja bude nižšia. Z tohto dôvodu je do hier zabudovaných viacero kódových ciest. Hra DirectX 9 má pravdepodobne z dôvodu kompatibility cestu DirectX 8 a dokonca cestu DirectX 7. Zvyčajne, ak je vybratá stará cesta, niektoré virtuálne efekty, ktoré sú prítomné na nových grafických kartách, z hry zmiznú. Ale na najmenej, môžete hrať aj na starom hardvéri.

Mnoho nových hier vyžaduje inštaláciu najnovšej verzie DirectX, aj keď grafická karta je z predchádzajúcej generácie. To znamená, že nová hra, ktorá bude používať cestu DirectX 8, bude stále vyžadovať inštaláciu najnovšej verzie DirectX 9 pre grafickú kartu triedy DirectX 8.

Aké sú rozdiely medzi rôzne verzie Direct3D API v DirectX? Skoré verzie DirectX – 3, 5, 6 a 7 – boli relatívne jednoduché v schopnostiach rozhrania Direct3D API. Vývojári si mohli vybrať vizuálne efekty zo zoznamu a potom otestovať, ako v hre fungovali. Ďalším významným krokom v programovaní grafiky bolo DirectX 8. Predstavilo možnosť programovania grafickej karty pomocou shaderov, takže vývojári mali po prvýkrát voľnosť pri programovaní efektov tak, ako potrebovali. DirectX 8 podporované verzie Pixel Shader 1.0 až 1.3 a Vertex Shader 1.0. DirectX 8.1, aktualizovaná verzia DirectX 8, dostala Pixel Shader 1.4 a Vertex Shader 1.1.

V DirectX 9 môžete vytvárať ešte zložitejšie shader programy. DirectX 9 podporuje Pixel Shader 2.0 a Vertex Shader 2.0. DirectX 9c, aktualizovaná verzia DirectX 9, obsahovala špecifikáciu Pixel Shader 3.0.

DirectX 10, pripravovaná verzia API, bude sprevádzať novinku Verzia systému Windows Vista. DirectX 10 nemôžete nainštalovať v systéme Windows XP.

HDR osvetlenie a OpenEXR HDR

HDR znamená „Vysoký dynamický rozsah“. Hra s osvetlením HDR dokáže vytvoriť oveľa realistickejší obraz ako hra bez neho a nie všetky grafické karty podporujú osvetlenie HDR.

Pred príchodom grafických kariet DirectX 9 boli GPU výrazne obmedzené presnosťou výpočtov osvetlenia. Doteraz bolo možné počítať osvetlenie len s 256 (8 bitmi) vnútornými úrovňami.

Keď sa objavili grafické karty DirectX 9, boli schopné produkovať osvetlenie s vysokou presnosťou - plných 24 bitov alebo 16,7 milióna úrovní.

S 16,7 miliónmi úrovní a ďalším krokom vo výkone grafických kariet DirectX 9/Shader Model 2.0 sa HDR osvetlenie stalo možným na počítačoch. Ide o pomerne zložitú technológiu a musíte ju sledovať v dynamike. Ak sa porozprávame jednoduchými slovami, potom HDR osvetlenie zvýši kontrast (tmavé odtiene sa zdajú tmavšie, svetlé odtiene svetlejšie), pričom sa zvýši množstvo detailov osvetlenia v tmavých a svetlých oblastiach. Hra s HDR osvetlením pôsobí živšie a realistickejšie ako bez neho.

GPU kompatibilné s najnovšou špecifikáciou Pixel Shader 3.0 umožňujú 32-bitové presné výpočty osvetlenia a miešanie s pohyblivou rádovou čiarkou. Grafické karty triedy SM 3.0 teda môžu podporovať špeciálnu metódu osvetlenia OpenEXR HDR špeciálne navrhnutú pre filmový priemysel.

Niektoré hry, ktoré podporujú iba osvetlenie OpenEXR HDR, nebudú fungovať s osvetlením HDR na grafických kartách Shader Model 2.0. Hry, ktoré sa nespoliehajú na metódu OpenEXR, však pobežia na akejkoľvek grafickej karte DirectX 9. Napríklad Oblivion používa metódu OpenEXR HDR a HDR osvetlenie povoľuje len na najnovších grafických kartách, ktoré podporujú špecifikáciu Shader Model 3.0. Napríklad nVidia GeForce 6800 alebo ATi Radeon X1800. Hry, ktoré využívajú 3D engine Half-Life 2, vrátane Counter-Strike: Source a pripravovaného Half-Life 2: Aftermath, umožňujú povoliť vykresľovanie HDR na starších grafických kartách DirectX 9, ktoré podporujú iba Pixel Shader 2.0. Príkladom je rad GeForce 5 alebo ATi Radeon 9500.

Nakoniec majte na pamäti, že všetky formy vykresľovania HDR vyžadujú vážne výpočtový výkon a dokáže zraziť na kolená aj tie najvýkonnejšie GPU. Ak chcete hrať najnovšie hry S HDR osvetlením sa nezaobídete bez výkonnej grafiky.

Vyhladzovanie na celej obrazovke

Vyhladzovanie na celej obrazovke (skrátene AA) vám umožňuje eliminovať charakteristické „rebríky“ na hraniciach polygónov. Malo by sa však vziať do úvahy, že anti-aliasing na celú obrazovku spotrebuje veľa výpočtových zdrojov, čo vedie k poklesu snímkovej frekvencie.

Vyhladzovanie je veľmi závislé od výkonu videopamäte, takže vysokorýchlostná grafická karta s rýchlou pamäťou bude schopná vypočítať vyhladzovanie na celej obrazovke s menším dopadom na výkon ako lacná grafická karta. Antialiasing je možné aktivovať v rôznych režimoch. Napríklad 4x antialiasing vytvorí lepší obraz ako 2x antialiasing, ale bude to veľký zásah do výkonu. Kým 2x antialiasing zdvojnásobí horizontálne a vertikálne rozlíšenie, 4x režim ho zoštvornásobí.

Filtrovanie textúry

Textúry sa aplikujú na všetky 3D objekty v hre a čím väčší je uhol zobrazovaného povrchu, tým zdeformovanejšie bude textúra vyzerať. Na odstránenie tohto efektu používajú GPU filtrovanie textúr.

Prvý spôsob filtrovania sa nazýval bilineárny a produkoval charakteristické pruhy, ktoré neboli veľmi príjemné pre oči. Situácia sa zlepšila zavedením trilineárneho filtrovania. Obe možnosti fungujú na moderných grafických kartách prakticky bez zníženia výkonu.

Dnes najviac najlepšia cesta Filtrovanie textúr je anizotropné filtrovanie (AF). Rovnako ako antialiasing na celej obrazovke, anizotropné filtrovanie môže byť povolené na rôznych úrovniach. Napríklad 8x AF dá viac vysoká kvalita filtrovanie ako 4x AF. Rovnako ako antialiasing na celej obrazovke, anizotropné filtrovanie vyžaduje určité množstvo výpočtového výkonu, ktoré sa zvyšuje so zvyšujúcou sa úrovňou AF.

Textúry s vysokým rozlíšením

Všetky 3D hry sú vytvorené s ohľadom na špecifické špecifikácie a jedna z týchto požiadaviek určuje textúrovú pamäť, ktorú bude hra potrebovať. Všetky potrebné textúry sa musia počas hry zmestiť do pamäte grafickej karty, inak výkon výrazne klesne od prístupu k textúre RAM spôsobuje značné oneskorenie, nehovoriac o stránkovacom súbore na pevnom disku. Ak teda vývojár hry počíta so 128 MB videopamäte ako minimálna požiadavka, potom by súbor aktívnych textúr nemal kedykoľvek presiahnuť 128 MB.

Moderné hry majú niekoľko sád textúr, takže hra bez problémov pobeží na starších grafických kartách s menšou video pamäťou, ako aj na nových kartách s väčšou video pamäťou. Napríklad hra môže obsahovať tri sady textúr: pre 128 MB, 256 MB a 512 MB. V súčasnosti existuje len veľmi málo hier, ktoré podporujú 512 MB videopamäte, no stále sú tým najobjektívnejším dôvodom na kúpu grafickej karty s takýmto množstvom pamäte. Zatiaľ čo zvýšenie pamäte má malý alebo žiadny vplyv na výkon, budete mať prospech zo zlepšenej vizuálnej kvality, ak hra podporuje vhodnú sadu textúr.

Čo potrebujete vedieť o grafických kartách?

V kontakte s

absolventská práca

Rasterization Operation Units (ROP)

Rasterizačné jednotky vykonávajú operácie zápisu pixelov vypočítaných grafickou kartou do vyrovnávacích pamätí a operácie ich zmiešania (zmiešania). Ako je uvedené vyššie, výkon blokov ROP ovplyvňuje mieru plnenia a to je jedna z hlavných charakteristík grafických kariet. A hoci v V poslednej dobe jeho hodnota sa o niečo znížila a stále existujú prípady, kedy výkon aplikácie silne závisí od rýchlosti a počtu blokov ROP. Najčastejšie je to kvôli aktívnemu používaniu filtrov na následné spracovanie a aktivácii antialiasingu pri vysokých nastaveniach obrazu.

Automatizácia účtovania bankových transakcií a jej implementácia v programe 1C Accounting

Ak je možné všetky činnosti podniku rozdeliť do podnikových procesov, potom je možné procesy rozdeliť na menšie zložky. V metodológii budovania podnikových procesov sa to nazýva dekompozícia...

Vnútorné a periférií PC

Štúdium diskrétneho modelu populácie pomocou programu Model Vision Studio

Hlavným „stavebným kameňom“ popisu v MVS je blok. Blok je nejaký aktívny objekt, fungujúce paralelne a nezávisle od iných objektov v nepretržitom čase. Blok je orientovaný blok...

Využitie LMS Moodle vo vzdelávacom procese

Každý kurz musí mať centrálnu oblasť. Nesmie existovať ľavý alebo pravý stĺpec s blokmi. Ale rôzne bloky zahrnuté v systéme riadenia výučby Moodle zvyšujú funkčnosť...

Štúdium schopností učiteľa v systéme dištančné vzdelávanie Moodle

Ak chcete pridať nové zdroje, prvky, bloky alebo upraviť existujúce vo svojom kurze, kliknite na tlačidlo Upraviť umiestnené v ovládacom bloku. Všeobecná forma Okno kurzu v režime úprav je znázornené na obrázku 2.5: Obrázok 2...

Simulácia počas vývoja softvér

Slovník jazyk UML zahŕňa tri typy stavebných blokov: entity; vzťah; diagramy. Entity sú abstrakcie, ktoré sú základnými prvkami modelu...

Simulácia práce v knižnici

Operátory - bloky tvoria logiku modelu. GPSS/PC má asi 50 rôznych typov blokov, z ktorých každý plní špecifickú funkciu. Za každým z týchto blokov sa nachádza zodpovedajúci podprogram prekladača...

Kľúčové vlastnosti CSS3

Text môžete navrhnúť originálnym spôsobom pomocou rôznych konverzačných blokov, ktoré sú opäť vytvorené na základe technológií CSS3. (Obr. 5.) Obr. 5...

Kľúčové vlastnosti CSS3

Účinok priesvitnosti prvku je jasne viditeľný na obrázku na pozadí a rozšíril sa v rôznych oblastiach operačné systémy pretože vyzerá štýlovo a krásne...

Príprava textový dokument v súlade s STP 01-01

Rozširujúce bloky (karty) alebo karty (Cards), ako sa niekedy nazývajú, možno použiť na servis zariadení pripojených k IBM PC. Môžu byť použité na pripojenie prídavné zariadenia(displejové adaptéry, radič disku atď.)...

Porucha a oprava grafickej karty

Tieto bloky pracujú v spojení s shader procesormi všetkých špecifikovaných typov; vyberajú a filtrujú textúrové dáta potrebné na zostavenie scény...

Registračný program výrobného procesu pre automatizovaný systém elektronický priemysel riadenie podniku

Existuje 11 typov blokov, z ktorých je možné vyrobiť špecifický MES systém pre konkrétnu výrobu...

Vývoj softvérového balíka na výpočet náhrady za väčšie opravy

Na najnižšej úrovni granularity sú údaje databázy Oracle uložené v dátových blokoch. Jeden blok údajov zodpovedá určitému počtu bajtov fyzického miesta na disku...

Vývoj systému riadenia hardvéru a softvéru pre dopravné platformy v Simatic Step-7

Systémové jednotky sú komponenty operačného systému. Môžu byť uložené programami (systémové funkcie, SFC) alebo dátami (systémové dátové bloky, SDB). Systémové jednotky poskytujú prístup k dôležitým funkciám systému...

Zariadenia zahrnuté v počítači

Rozširujúce bloky (karty) alebo karty (Cards), ako sa niekedy nazývajú, možno použiť na servis zariadení pripojených k IBM PC. Môžu byť použité na pripojenie ďalších zariadení (adaptéry displeja, radič diskov atď.)...

Architektúra GPU: Funkcie

Realizmus 3D grafiky vo veľkej miere závisí od výkonu grafickej karty. Čím viac blokov shadera pixelov procesor obsahuje a čím vyššia je frekvencia, tým viac efektov možno aplikovať na 3D scénu na zlepšenie jej vizuálneho vnímania.

GPU obsahuje mnoho rôznych funkčných blokov. Podľa počtu niektorých komponentov môžete odhadnúť výkon GPU. Predtým, ako prejdeme ďalej, zopakujme si najdôležitejšie funkčné bloky.

Vertexové procesory (vertex shader jednotky)

Podobne ako jednotky pixel shader, aj vertexové procesory vykonávajú shader kód, ktorý sa dotýka vrcholov. Pretože väčší rozpočet na vrcholy umožňuje vytvárať zložitejšie 3D objekty, výkon vertexových procesorov je veľmi dôležitý v 3D scénach so zložitými alebo veľkým počtom objektov. Jednotky vertex shader však stále nemajú taký zjavný vplyv na výkon ako pixelové procesory.

Procesory pixelov (jednotky shaderov pixelov)

Procesor pixelov je komponent grafického čipu určený na spracovanie programov na úpravu pixelov. Tieto procesory vykonávajú výpočty, ktoré sa týkajú iba pixelov. Keďže pixely obsahujú informácie o farbe, pixel shadery vám umožňujú dosiahnuť pôsobivé grafické efekty. Napríklad väčšina vodných efektov, ktoré vidíte v hrách, je vytvorená pomocou pixel shaderov. Typicky sa počet pixelových procesorov používa na porovnanie výkonu pixelov grafických kariet. Ak má jedna karta osem jednotiek pixel shader a druhá 16 jednotiek, potom je logické predpokladať, že grafická karta so 16 jednotkami bude rýchlejšia pri spracovávaní zložitých programov na shader pixelov. Do úvahy treba brať aj takt, no dnes je zdvojnásobenie počtu pixelových procesorov energeticky efektívnejšie ako zdvojnásobenie frekvencie grafického čipu.

Zjednotené shadery

Zjednotené shadery do sveta PC ešte nedorazili, no pripravovaný štandard DirectX 10 je založený na podobnej architektúre. To znamená, že štruktúra kódu vrcholov, geometrie a pixelových programov bude rovnaká, hoci shadery budú vykonávať inú prácu. Novú špecifikáciu je možné vidieť na Xbox 360, kde GPU špeciálne navrhol ATi pre Microsoft. Bude veľmi zaujímavé sledovať, aký potenciál prinesie nové DirectX 10.

Jednotky mapovania textúr (TMU)

Textúry by mali byť vybrané a filtrované. Túto prácu vykonávajú jednotky mapovania textúr, ktoré pracujú v spojení s pixelovými a vertex shader jednotkami. Úlohou TMU je aplikovať textúrne operácie na pixely. Počet textúrových jednotiek v GPU sa často používa na porovnanie výkonu textúr grafických kariet. Je rozumné predpokladať, že grafická karta s viacerými jednotkami TMU poskytne lepší výkon textúr.

Rastrové operátorské jednotky (ROP)

Rastrové procesory sú zodpovedné za zápis pixelových dát do pamäte. Rýchlosť, akou sa táto operácia vykonáva, je rýchlosť plnenia. V prvých dňoch 3D akcelerátorov boli ROP a miera plnenia veľmi dôležitými charakteristikami grafických kariet. Dnes je práca ROP stále dôležitá, ale výkon grafickej karty už nie je obmedzený týmito blokmi, ako to bolo kedysi. Preto sa výkon (a počet) ROP zriedka používa na vyhodnotenie rýchlosti grafickej karty.

Dopravníky

Potrubia sa používajú na popis architektúry grafických kariet a poskytujú veľmi jasnú predstavu o výkone GPU.

Dopravník nemožno považovať za striktný technický pojem. GPU používa rôzne potrubia, ktoré vykonávajú rôzne funkcie. Historicky potrubie znamenalo pixelový procesor, ktorý bol pripojený k jeho jednotke mapovania textúr (TMU). Napríklad grafická karta Radeon 9700 používa osem pixelových procesorov, z ktorých každý je pripojený k vlastnej TMU, takže karta má osem kanálov.

Moderné procesory je však veľmi ťažké opísať počtom potrubí. V porovnaní s predchádzajúcimi návrhmi nové procesory využívajú modulárnu, fragmentovanú štruktúru. Za inovátora v tejto oblasti možno považovať spoločnosť ATi, ktorá pri rade grafických kariet X1000 prešla na modulárnu štruktúru, čo umožnilo dosiahnuť zvýšenie výkonu internou optimalizáciou. Niektoré bloky CPU sa využívajú viac ako iné a na zlepšenie výkonu GPU sa ATi pokúsilo nájsť kompromis medzi počtom potrebných blokov a oblasťou matrice (ktorá sa nedá veľmi zväčšiť). V tejto architektúre už pojem „pixel pipeline“ stratil svoj význam, keďže pixelové procesory už nie sú pripojené k vlastným TMU. Napríklad GPU ATi Radeon X1600 má 12 pixel shader jednotiek a iba štyri jednotky TMU na mapovanie textúr. Nedá sa teda povedať, že by architektúra tohto procesora mala 12 pixel pipelines, rovnako ako nemožno povedať, že sú len štyri. Tradične sa však stále spomínajú pipeline pixelov.

Berúc do úvahy vyššie uvedené predpoklady, počet pixelov v GPU sa často používa na porovnanie grafických kariet (s výnimkou radu ATi X1x00). Napríklad, ak vezmete grafické karty s 24 a 16 kanálmi, potom je celkom rozumné predpokladať, že karta s 24 kanálmi bude rýchlejšia.


OBSAH

Moderné grafické procesory obsahujú veľa funkčných blokov, ktorých počet a charakteristiky určujú výslednú rýchlosť vykresľovania, ktorá ovplyvňuje komfort hry. Na základe porovnateľného počtu týchto blokov v rôznych video čipoch môžete približne odhadnúť, ako rýchly je konkrétny GPU. Video čipy majú pomerne veľa charakteristík, v tejto časti sa budeme zaoberať len najdôležitejšími z nich.

Rýchlosť hodín video čipu

Prevádzková frekvencia GPU sa zvyčajne meria v megahertzoch, t.j. v miliónoch cyklov za sekundu. Táto charakteristika priamo ovplyvňuje výkon video čipu – čím je vyšší, tým viac práce dokáže GPU vykonať za jednotku času, procesu veľká kvantita vrcholy a pixely. Príklad z reálneho života: frekvencia video čipu nainštalovaného na doske Radeon HD 6670 je 840 MHz a presne ten istý čip v modeli Radeon HD 6570 pracuje na frekvencii 650 MHz. V súlade s tým sa budú všetky hlavné výkonnostné charakteristiky líšiť. Nie je to však len prevádzková frekvencia čipu, ktorá určuje výkon; jeho rýchlosť je výrazne ovplyvnená samotnou grafickou architektúrou: dizajnom a počtom vykonávacích jednotiek, ich charakteristikami atď.

V niektorých prípadoch sa takt jednotlivých blokov GPU líši od pracovnej frekvencie zvyšku čipu. To znamená, že rôzne časti GPU pracujú na rôznych frekvenciách, a to s cieľom zvýšiť efektivitu, pretože niektoré bloky sú schopné pracovať pri vyšších frekvenciách, zatiaľ čo iné nie. Väčšina GPU je vybavená takýmito GPU. Grafické karty GeForce od spoločnosti NVIDIA. Ako nedávny príklad sa pozrime na videočip v modeli GTX 580, z ktorých väčšina pracuje na frekvencii 772 MHz a univerzálne výpočtové jednotky čipu majú frekvenciu dvojnásobnú – 1544 MHz.

Miera plnenia

Miera plnenia ukazuje, ako rýchlo je video čip schopný kresliť pixely. Existujú dva typy výplne: miera výplne pixelov a miera výplne textúry. Miera plnenia pixelov ukazuje rýchlosť vykresľovania pixelov na obrazovke a závisí od prevádzkovej frekvencie a počtu jednotiek ROP (operačné jednotky rasterizácie a prelínania) a rýchlosť vypĺňania textúry je rýchlosť vzorkovania údajov o textúre, ktorá závisí od prevádzkovej frekvencie. a počet jednotiek textúry.

Napríklad maximálna rýchlosť vypĺňania pixelov GeForce GTX 560 Ti je 822 (frekvencia čipu) × 32 (počet jednotiek ROP) = 26304 megapixelov za sekundu a rýchlosť vypĺňania textúry je 822 × 64 (počet jednotiek textúrovania) = 52608 megatexlov. /s Zjednodušene povedané, situácia je takáto - čím väčšie je prvé číslo, tým rýchlejšie dokáže grafická karta vykresliť hotové pixely a čím je druhé väčšie, tým rýchlejšie sa vzorkujú údaje o textúre.

Hoci dôležitosť „čistej“ miery plnenia v poslednom čase výrazne klesla a ustúpila rýchlosti výpočtov, tieto parametre sú stále veľmi dôležité, najmä pre hry s jednoduchou geometriou a relatívne jednoduchými výpočtami pixelov a vrcholov. Oba parametre teda zostávajú dôležité pre moderné hry, no musia byť vyvážené. Preto je počet jednotiek ROP v moderných video čipoch zvyčajne menší ako počet jednotiek textúr.

Počet výpočtových (shaderových) jednotiek alebo procesorov

Možno sú teraz tieto bloky hlavnými časťami video čipu. Vystupujú špeciálne programy, známe ako shadery. Navyše, ak staršie pixel shadery vykonávali bloky pixel shaderov a vertex shadery vykonávali vertexové bloky, potom sa grafické architektúry na nejaký čas zjednotili a tieto univerzálne výpočtové jednotky sa začali zaoberať rôznymi výpočtami: vertexovými, pixelovými, geometrickými a dokonca univerzálnymi výpočtami.

Po prvýkrát bola jednotná architektúra použitá vo video čipe hracia konzola Microsoft Xbox 360, tento GPU vyvinula ATI (neskôr kúpila AMD). A vo video čipoch pre osobné počítače na doske sa objavili jednotné shader jednotky NVIDIA GeForce 8800. A odvtedy sú všetky nové video čipy založené na jednotnej architektúre, ktorá má univerzálny kód pre rôzne shader programy (vertex, pixel, geometria atď.) a zodpovedajúce unifikované procesory dokážu vykonávať akýkoľvek program.

Na základe počtu výpočtových jednotiek a ich frekvencie môžete porovnať matematický výkon rôznych grafických kariet. Väčšina hier je teraz obmedzená výkonom pixel shaderov, takže počet týchto blokov je veľmi dôležitý. Napríklad, ak je jeden model grafickej karty založený na GPU s 384 výpočtovými procesormi vo svojom zložení a ďalší z toho istého radu má GPU so 192 výpočtovými jednotkami, potom pri rovnakej frekvencii bude druhý dvakrát pomalší na spracovanie akéhokoľvek typ shaderov a vo všeobecnosti bude rovnaký produktívnejší.

Aj keď len na základe počtu výpočtových jednotiek nemožno vyvodiť jednoznačné závery o výkone, je potrebné brať do úvahy taktovaciu frekvenciu a rôznu architektúru jednotiek rôznych generácií a výrobcov čipov. Iba na základe týchto čísel môžete porovnávať čipy iba v rámci rovnakého radu jedného výrobcu: AMD alebo NVIDIA. V ostatných prípadoch je potrebné venovať pozornosť výkonnostným testom v hrách alebo aplikáciách, o ktoré máte záujem.

Textúrovacie jednotky (TMU)

Tieto jednotky GPU pracujú v spojení s výpočtovými procesormi, vyberajú a filtrujú textúru a ďalšie údaje potrebné na konštrukciu scény a všeobecné výpočty. Počet textúrových jednotiek vo videočipe určuje výkon textúry – teda rýchlosť načítavania texelov z textúr.

Aj keď sa v poslednom čase kladie väčší dôraz na matematické výpočty a niektoré textúry sa nahrádzajú procedurálnymi, zaťaženie blokov TMU je stále dosť vysoké, keďže okrem hlavných textúr treba robiť výbery aj z máp normál a posunov, ako aj vyrovnávacie pamäte cieľového vykresľovania mimo obrazovky.

Ak vezmeme do úvahy dôraz mnohých hier, vrátane výkonu textúrovacích jednotiek, môžeme povedať, že počet jednotiek TMU a zodpovedajúci vysoký výkon textúr sú tiež jedným z najdôležitejších parametrov pre video čipy. Tento parameter má osobitný vplyv na rýchlosť vykresľovania obrazu pri použití anizotropného filtrovania, ktoré si vyžaduje ďalšie vzorky textúr, ako aj pri zložitých algoritmoch mäkkých tieňov a nových algoritmoch, ako je oklúzia prostredia obrazovky.

Rasterization Operation Units (ROP)

Rasterizačné jednotky vykonávajú operácie zápisu pixelov vypočítaných grafickou kartou do vyrovnávacích pamätí a operácie ich zmiešania (zmiešania). Ako sme uviedli vyššie, výkon blokov ROP ovplyvňuje mieru plnenia a to je jedna z hlavných charakteristík grafických kariet všetkých čias. A hoci jeho význam v poslednej dobe tiež trochu klesol, stále existujú prípady, kedy výkon aplikácie závisí od rýchlosti a počtu blokov ROP. Najčastejšie je to kvôli aktívnemu používaniu filtrov na následné spracovanie a aktivácii anti-aliasingu pri vysokých nastaveniach hry.

Ešte raz si všimnime, že moderné video čipy nemožno posudzovať len podľa počtu rôznych blokov a ich frekvencie. Každá séria GPU používa novú architektúru, v ktorej sú vykonávacie jednotky veľmi odlišné od starých a pomer počtu rôznych jednotiek sa môže líšiť. Bloky AMD ROP v niektorých riešeniach teda môžu vykonávať viac práce za cyklus hodín ako bloky v Riešenia NVIDIA, a naopak. To isté platí pre schopnosti textúrových jednotiek TMU – tie sú v rôznych generáciách GPU odlišné rôznych výrobcov, a to treba brať do úvahy pri porovnávaní.

Geometrické bloky

Až donedávna nebol počet jednotiek na spracovanie geometrie obzvlášť dôležitý. Na väčšinu úloh stačil jeden blok na GPU, keďže geometria v hrách bola pomerne jednoduchá a hlavným zameraním výkonu boli matematické výpočty. Význam spracovania paralelnej geometrie a počet zodpovedajúcich blokov sa dramaticky zvýšil s príchodom podpory mozaikovania geometrie v DirectX 11. NVIDIA bola prvá, ktorá paralelizovala spracovanie geometrických údajov, keď sa v jej čipoch rodiny GF1xx objavilo niekoľko zodpovedajúcich blokov. Potom AMD vydalo podobné riešenie (iba v špičkových riešeniach radu Radeon HD 6700 založených na čipoch Cayman).

V tomto materiáli nebudeme zachádzať do podrobností, tie si môžete prečítať v základných materiáloch na našej webovej stránke venovanej grafickým procesorom kompatibilným s DirectX 11. Pre nás je dôležité, že počet jednotiek na spracovanie geometrie má obrovský vplyv na celkový výkon v najnovších hrách, ktoré využívajú teseláciu, ako sú Metro 2033, HAWX 2 a Crysis 2 (s najnovšími záplatami). A pri výbere modernej hernej grafickej karty je veľmi dôležité venovať pozornosť geometrickému výkonu.

Veľkosť videopamäte

Vlastnú pamäť využívajú video čipy na ukladanie potrebných dát: textúry, vrcholy, dáta vyrovnávacej pamäte atď. Zdá sa, že čím viac je, tým lepšie. Ale nie je to také jednoduché; odhadovanie výkonu grafickej karty na základe množstva video pamäte je najčastejšou chybou! Neskúsení používatelia najčastejšie preceňujú hodnotu videopamäte a stále ju používajú na porovnávanie rôznych modelov grafických kariet. Je to pochopiteľné - tento parameter je jedným z prvých, ktorý je uvedený v zoznamoch charakteristík hotových systémov a je tiež napísaný na krabiciach grafických kariet veľká tlač. Neskúsenému kupujúcemu sa preto zdá, že keďže pamäť má dvakrát toľko, rýchlosť takéhoto riešenia by mala byť dvakrát vyššia. Realita sa od tohto mýtu líši v tom, že spomienka môže byť odlišné typy a charakteristiky a rast produktivity rastie len do určitého objemu a po jeho dosiahnutí sa jednoducho zastaví.

Takže v každej hre a pri určitých nastaveniach a herných scénach je určité množstvo video pamäte, ktoré stačí na všetky dáta. A aj keď tam dáte 4 GB videopamäte, nebude dôvod, aby to zrýchľovalo vykresľovanie, rýchlosť bude obmedzená vyššie diskutovanými jednotkami vykonávania a pamäte bude jednoducho dosť. To je dôvod, prečo v mnohých prípadoch grafická karta s 1,5 GB videopamäte beží rovnakou rýchlosťou ako karta s 3 GB (všetky ostatné veci sú rovnaké).

Sú situácie, kedy viac pamäte vedie k viditeľnému zvýšeniu výkonu – ide o veľmi náročné hry, najmä pri ultravysokých rozlíšeniach a pri nastavení maximálnej kvality. No nie vždy k takýmto prípadom dochádza a treba počítať s množstvom pamäte, pričom netreba zabúdať, že výkon nad určitú hranicu jednoducho nezvýši. Pamäťové čipy majú viac dôležité parametre, ako je šírka pamäťovej zbernice a jej prevádzková frekvencia. Táto téma je taká rozsiahla, že sa budeme podrobnejšie zaoberať výberom množstva videopamäte šiesta časť náš materiál.

Šírka pamäťovej zbernice

Šírka pamäťovej zbernice je najdôležitejšia charakteristika ovplyvňujúce šírku pásma pamäte (MBB). Väčšia šírka umožňuje preniesť viac informácií z videopamäte do GPU a späť za jednotku času, čo má vo väčšine prípadov pozitívny vplyv na výkon. Teoreticky môže 256-bitová zbernica preniesť dvakrát toľko údajov za cyklus hodín ako 128-bitová zbernica. V praxi je rozdiel v rýchlosti vykresľovania, hoci nedosahuje dvojnásobok, v mnohých prípadoch veľmi blízko k tomu s dôrazom na šírku pásma videopamäte.

Moderné herné grafické karty používajú rôzne šírky zbernice: od 64 do 384 bitov (predtým existovali čipy s 512-bitovou zbernicou), v závislosti od cenového rozpätia a času vydania. konkrétny model GPU Pre najlacnejšie low-end grafické karty sa najčastejšie používa 64 a menej často 128 bitov, pre strednú úroveň od 128 do 256 bitov a grafické karty z vyššej cenovej kategórie využívajú zbernice so šírkou 256 až 384 bitov. Šírka zbernice už nemôže rásť čisto kvôli fyzickým obmedzeniam - veľkosť matrice GPU je nedostatočná na umiestnenie viac ako 512-bitovej zbernice, a to je príliš drahé. Šírka pásma pamäte sa preto teraz zvyšuje použitím nových typov pamäte (pozri nižšie).

Frekvencia videopamäte

Ďalším parametrom, ktorý ovplyvňuje šírku pásma pamäte, je jej hodinová frekvencia. A zvýšenie šírky pásma často priamo ovplyvňuje výkon grafickej karty v 3D aplikáciách. Frekvencia pamäťovej zbernice na moderných grafických kartách sa pohybuje od 533 (1066, berúc do úvahy zdvojnásobenie) MHz do 1375 (5500, berúc do úvahy štvornásobok) MHz, to znamená, že sa môže líšiť viac ako päťkrát! A keďže šírka pásma závisí od frekvencie pamäte a šírky jej zbernice, pamäť s 256-bitovou zbernicou pracujúcou na frekvencii 800 (3200) MHz bude mať väčšiu šírku pásma v porovnaní s pamäťou pracujúcou na frekvencii 1000 (4000) MHz so 128 -bitová zbernica.

Pri nákupe relatívne lacných grafických kariet, z ktorých mnohé majú iba 128-bitové alebo dokonca 64-bitové rozhrania, je potrebné venovať osobitnú pozornosť parametrom šírky pamäťovej zbernice, jej typu a prevádzkovej frekvencii, čo má mimoriadne negatívny vplyv na ich výkon. . Vo všeobecnosti neodporúčame kupovať grafickú kartu využívajúcu 64-bitovú zbernicu videopamäte pre herný počítač. Je vhodné dať prednosť aspoň strednej úrovni s minimálne 128- alebo 192-bitovou zbernicou.

Typy pamäte

Moderné grafické karty sú vybavené niekoľkými rôznymi typmi pamäte. Staré jednorýchlostné SDR pamäte už nikde nenájdete, no moderné typy DDR a GDDR pamätí majú výrazne odlišné vlastnosti. Rôzne druhy DDR a GDDR vám umožňujú prenášať dvakrát alebo štyrikrát viac údajov pri rovnakej frekvencii hodín za jednotku času, a preto sa údaj o prevádzkovej frekvencii často zdvojnásobí alebo zoštvornásobí, vynásobí sa 2 alebo 4. Ak je teda špecifikovaná frekvencia 1400 MHz pre pamäť DDR , potom táto pamäť pracuje na fyzickej frekvencii 700 MHz, ale označujú takzvanú „efektívnu“ frekvenciu, teda frekvenciu, na ktorej musí pamäť SDR pracovať, aby poskytovala rovnakú šírku pásma. To isté s GDDR5, ale frekvencia je dokonca štvornásobná.

Hlavnou výhodou nových typov pamätí je schopnosť pracovať pri vyšších rýchlostiach hodín, a teda zvýšiť šírku pásma v porovnaní s predchádzajúcimi technológiami. Dosahuje sa to na úkor zvýšených latencií, ktoré však pre grafické karty nie sú také dôležité. Prvou doskou, ktorá používala pamäte DDR2, bola NVIDIA GeForce FX 5800 Ultra. Odvtedy technológia grafickej pamäte výrazne pokročila a bol vyvinutý štandard GDDR3, ktorý je blízky špecifikáciám DDR2, s niektorými zmenami špeciálne pre grafické karty.

GDDR3 je pamäť špeciálne navrhnutá pre grafické karty, s rovnakými technológiami ako DDR2, ale so zlepšenou spotrebou a charakteristikami odvodu tepla, čo umožnilo vytvárať čipy, ktoré pracujú pri vyšších rýchlostiach hodín. Napriek tomu, že štandard vyvinula ATI, prvá grafická karta, ktorá ho použila, bola druhá modifikácia NVIDIA GeForce FX 5700 Ultra a ďalšia bola GeForce 6800 Ultra.

GDDR4 je ďalším vývojom „grafickej“ pamäte, ktorá beží takmer dvakrát rýchlejšie ako GDDR3. Hlavné rozdiely medzi GDDR4 a GDDR3, ktoré sú pre používateľov významné, sú opäť zvýšené prevádzkové frekvencie a znížená spotreba energie. Technicky sa pamäť GDDR4 od GDDR3 príliš nelíši, ide o ďalší vývoj tých istých myšlienok. Prvými grafickými kartami s čipmi GDDR4 na palube boli ATI Radeon X1950 XTX a NVIDIA vôbec nevydala produkty založené na tomto type pamäte. Výhody nových pamäťových čipov oproti GDDR3 spočívajú v tom, že spotreba modulov môže byť približne o tretinu nižšia. To je dosiahnuté prostredníctvom nižšieho menovitého napätia pre GDDR4.

GDDR4 však nie je veľmi využívaná ani v riešeniach AMD. Počnúc rodinou GPU RV7x0, radiče pamäte grafickej karty podporujú nový typ pamäte GDDR5 pracujúcej na efektívnej štvornásobnej frekvencii až do 5,5 GHz a vyššej (teoreticky sú možné frekvencie až do 7 GHz), čo poskytuje priepustnosť až až 176 GB/s pomocou 256-bitového rozhrania. Ak na zvýšenie šírky pásma pamäte GDDR3/GDDR4 bolo potrebné použiť 512-bitovú zbernicu, potom prechod na používanie GDDR5 umožnil zdvojnásobiť výkon pri menšie veľkosti kryštály a menšiu spotrebu energie.

Najmodernejšie typy videopamätí sú GDDR3 a GDDR5, líšia sa od DDR v niektorých detailoch a pracujú aj s dvojitým/štvornásobným prenosom dát. Tieto typy pamätí využívajú niektoré špeciálne technológie na zvýšenie prevádzkovej frekvencie. Pamäť GDDR2 teda zvyčajne pracuje na vyšších frekvenciách v porovnaní s DDR, GDDR3 na ešte vyšších frekvenciách a GDDR5 poskytuje v súčasnosti maximálnu frekvenciu a šírku pásma. Lacné modely sú však stále vybavené „negrafickou“ pamäťou DDR3 s výrazne nižšou frekvenciou, takže grafickú kartu musíte vyberať opatrnejšie.