AMD Bulldozer je najnovšia generácia procesorov AMD. Kto je správca systému?

AMD sa rozhodla zaujať úplne odlišný prístup k novej architektúre Bulldozer. Bolo rozhodnuté vytvoriť dvojjadrové moduly, ktoré zdieľajú niektoré zdroje (L2 cache, modul s pohyblivou rádovou čiarkou), ale nie sú na sebe úplne nezávislé. (pozri obrázok nižšie)
Podľa AMD to bolo urobené s cieľom optimalizovať procesor a zároveň znížiť cenu procesora. Optimalizácia spočíva v tom, že na bežných viacjadrových procesoroch môžu byť niektoré moduly nečinné a takéto moduly je možné kombinovať v architektúre Bulldozer. A ak je modulov menej, znamená to, že sa bude plytvať menej materiálom, čo bude mať zase pozitívny vplyv na náklady, úspory energie a zníženie tepla.
Preto, hoci AMD bude svoje nové procesory Bulldozer nazývať dvojjadrové, v skutočnosti nebudú skutočne dvojjadrové, keďže nebudú mať úplne nezávislé jadrá. A meno" dvojjadrový procesor» budú použité na marketingové účely.

Na vytvorenie " štvorjadrových procesorov“, AMD používa dve z týchto jednotiek, takže procesor má v skutočnosti dva „procesory“ vo vnútri (dva stavebné bloky sú zobrazené na obrázku nižšie), a nie štyri. AMD bude nové procesory naďalej označovať ako štvorjadrové.


Osemjadrový procesor založený na architektúre Bulldozer.

Teraz sa pozrime bližšie na moduly Fetch a Decode používané v architektúre Bulldozer.

Moduly Fetch a Decode

Modul Fetch je zodpovedný za načítanie inštrukcií na dekódovanie z cache resp Náhodný vstup do pamäťe.

Moduly Fetch a Decode.

Ako už bolo uvedené, vzorkovacie moduly používajú dve „jadrá“ naraz. Vyrovnávaciu pamäť inštrukcií L1 tiež používajú dve jadrá súčasne, ale každé jadro procesora má vlastnú vyrovnávaciu pamäť údajov L1.
AMD už oznámilo, že vyrovnávacia pamäť inštrukcií L1 používaná v architektúre Bulldozer pozostáva zo 64 KB dvojcestnej vyrovnávacej pamäte s asociáciou. Rovnaká konfigurácia sa používa v procesoroch s architektúrou AMD64, rozdiel je však v tom, že procesory AMD64 majú vyrovnávaciu pamäť L1 na jadro, zatiaľ čo procesory Bulldozer budú mať jednu vyrovnávaciu pamäť L1 na pár jadier. Dátová vyrovnávacia pamäť však bude mať len 16 KB, čo je výrazne menej ako 64 KB na jadro, ktoré sa používa v procesoroch založených na architektúre AMD64.

TLB (Translation Look-aside Buffer- ultrarýchla vyrovnávacia pamäť). Boli odhalené veľkosti TLB. Sú to vyrovnávacie pamäte s malým množstvom pamäte, určené na konverziu adries virtuálnej pamäte na fyzické adresy.
Virtuálna pamäť, známejšia ako stránkovací súbor, je technológia, pri ktorej sa množstvo pamäte RAM „zvýši“ špeciálnym súborom na pevnom disku.

Počítačové programy sú písané pomocou x86 inštrukcií, ale v súčasnosti procesory rozumejú len natívnym RISC inštrukciám. Dekódovací modul je zodpovedný za prevod inštrukcií programu x86 na mikroinštrukcie RISC. Architektúra Bulldozer má štyri dekodéry, ale tento moment AMD nezverejňuje, ktoré inštrukcie každý dekodér vykonáva. Typicky jeden z týchto dekodérov vykonáva zložité, komplexné inštrukcie pomocou dodaného mikrokódu ROM („µcode“ alebo „microcode“). Dekódovanie zložitých inštrukcií je ukončené po niekoľkých hodinových cykloch, po ktorých sa prevedú na niekoľko mikroinštrukcií. Výrobcovia zvyčajne optimalizujú svoje procesory takým spôsobom, že pri dekódovaní najbežnejších inštrukcií sú vykonávané iba v jednom hodinovom cykle.

Úvod Niet pochýb o tom, že nové procesory AMD, založené na mikroarchitektúre Bulldozer, patria medzi najočakávanejšie produkty nielen tohto roku, ale minimálne súčasných piatich rokov. Má to viacero dôvodov, ako aj existenciu obrovskej armády fanúšikov produktov AMD. Niektorí ľudia majú čerstvé spomienky na časy, keď procesory tejto spoločnosti boli vo všetkých ohľadoch lepšie ako Intel. Niektorí ľudia milujú produkty AMD pre ich vyváženú kombináciu ceny a výkonu. A na niektorých zapôsobili emocionálne príbehy AMD o výhodách mikroarchitektúry vyvíjanej v rámci spoločnosti. To všetko pridalo na mnoho rokov únavného čakania na vydanie procesorov generácie Bulldozer a tu je výsledok – tento článok čítate s veľkou pozornosťou a neskrývaným záujmom.

Jednoznačne to však stojí za to. Situácia na trhu procesorov v najbližších rokoch závisí od toho, ako úspešná bude mikroarchitektúra Bulldozer. Koniec koncov, iba spoločnosť Intel má inžinierske a výrobné zdroje na to, aby každé dva až tri roky uvádzala na trh nové mikroarchitektonické riešenia. AMD je pri vývoji nútené držať sa oveľa meranejšieho tempa. Je to desivé pamätať si, ale mikroarchitektúra, ktorá sa používa v dnešných procesoroch Phenom II a Athlon II, siaha až do roku 1999 a odvtedy na nej AMD robí len kozmetické zmeny. Nerobíme si preto žiadne zvláštne ilúzie o tom, že by sa vývojový cyklus s vydaním Bulldozer zrazu stal aktívnejší. Je zrejmé, že Bulldozer bude jadrom ponuky výkonu AMD počas niekoľkých nasledujúcich rokov.

Zapnuté aktuálna verzia Plány spoločnosti na rozvoj tejto mikroarchitektúry sú vypracované do roku 2014, no takmer určite bude pokračovať aj ďalej.

Skutočnosť, že AMD sľubuje každoročné zvýšenie výkonu o 10-15 percent, je skôr alarmujúcim príznakom ako povzbudivým. S najväčšou pravdepodobnosťou takéto zvýšenie zabezpečí predovšetkým zvýšenie taktovacích frekvencií a až potom nejaké nové mikroarchitektonické vylepšenia.

Inými slovami, úspech mikroarchitektúry Bulldozer v jej súčasnej podobe bude mať rozhodujúci vplyv na budúcu pozíciu AMD, na konkurencieschopnosť jej produktov a v konečnom dôsledku aj na celkovú situáciu na trhu procesorov.

Samozrejme nemožno poprieť, že Bulldozer pre AMD nie je jediným kľúčovým produktom. Táto mikroarchitektúra je dnes zameraná na segment vysokovýkonných desktopov a serverov. AMD má zároveň ďalšie návrhy pre iné segmenty trhu. Napríklad lacné, cenovo výhodné procesory s mikroarchitektúrou Bobcat alebo APU z rodiny Llano, ktoré spoločnosť uviedla na trh začiatkom tohto roka, sú pre spoločnosť nemenej dôležité oblasti. A tieto návrhy, ako sme videli z výsledkov testov, sú úspešnými riešeniami, ktoré môžu primerane fungovať ako riešenia pre netbooky a nettopy, ako aj ako základ pre integrované platformy v stredných cenových reláciách.

Úspech či neúspech Bulldozeru má však oveľa významnejšie dôsledky. Po prvé, táto mikroarchitektúra sa zameriava na segmenty trhu s oveľa vyššími ziskovými maržami – servery a systémy na produktivitu desktopov. Preto môže mať oveľa silnejší vplyv na finančnú situáciu AMD. Po druhé, úspech procesory AMD séria C, E a A - to, úprimne povedané, nie je vôbec zásluhou inžinierov, ktorí sa podieľajú na vývoji dizajnu mikroprocesorov. Trhový úspech týchto CPU (alebo APU, ak sa budeme držať terminológie AMD) pramení z prítomnosti grafických jadier rodiny Radeon HD, ktoré si našli cestu do procesorov AMD vďaka včasnej kúpe ATI. Buldozér je druh kvalifikačnej skúšky pre inžiniersky tím pracujúci špeciálne na mikroarchitektúre výpočtových jadier. A do tretice, Bulldozer sa nakoniec stane základom celého radu procesorov AMD, s výnimkou riešení pre energeticky efektívne platformy. Takže v konečnom dôsledku je to táto mikroarchitektúra, ktorá príde do nižších segmentov trhu a vytlačí K10 takmer všade, vrátane procesorov Llano.



Stručne povedané, je sotva možné preceňovať dôležitosť úspešného uvedenia procesorov s mikroarchitektúrou Bulldozer. Ide o ikonický produkt na emocionálnej aj materialistickej úrovni. A preto naozaj chcem, aby sme, obrazne povedané, videli novú K7 alebo K8 aj v skutočnosti.

Ešte pred testovaním však môžeme povedať, že šanca na zopakovanie takéhoto javu je malá. Samotný Intel minule pomohol AMD zmocniť sa dlane, keď sa snažil presadiť ďaleko od ideálnej mikroarchitektúry NetBurst. Potom sa inžinieri Intelu zamerali na zvýšenie rýchlosti hodín, čo nakoniec narazilo na prekážky v podobe gigantických zvodových prúdov, zatiaľ čo AMD ponúklo vyváženejšiu mikroarchitektúru zameranú na vykonávanie väčšieho počtu inštrukcií za cyklus hodín. Ale po tom, čo Intel zrevidoval svoju doktrínu a predstavil novú Core mikroarchitektúru, zameranú aj na vykonanie maximálneho počtu inštrukcií za cyklus hodín, AMD sa vrátilo do pozície zaostávajúceho, kde bolo doteraz.

Je zrejmé, že prekonať moderné procesory Intel v počte inštrukcií vykonaných za jeden hodinový cyklus je veľmi ťažké. Dnešná mikroarchitektúra Sandy Bridge je výsledkom minimálne troch optimalizačných cyklov inherentne efektívneho dizajnu, takže od AMD nemôžeme očakávať ešte vyššiu špecifickú efektivitu jadra. Navyše, inžinieri AMD si takýto cieľ ani nestanovili.

Hlavná myšlienka Buldozéra je inde. Podľa vývojárov by procesory postavené na tejto mikroarchitektúre mali vykazovať dobrý výkon vďaka vysokým taktom a väčšiemu počtu výpočtových jadier ako ich konkurenti a predchodcovia. Zároveň by mali zostať celkom ziskové vo výrobe, to znamená, že by nemali mať príliš veľký polovodičový kryštál a nemali by vykazovať príliš vysoký odvod tepla z hľadiska jednotlivého jadra.

Tajomstvo viacjadrového dizajnu AMD

Je celkom jasné, že zvýšenie počtu procesorových jadier nevyhnutne znamená zvýšenie plochy procesorového čipu. V dôsledku toho sa zvyšuje náročnosť výroby aj cena finálnych produktov. Preto sa napríklad procesory s maximálnym počtom výpočtových jadier dnes používajú iba v segmente serverov - firemní zákazníci sú oveľa ochotnejší zaplatiť peniaze ako jednotliví používatelia. Postup, ktorý si AMD zvolilo na zvýšenie počtu jadier pri zachovaní prijateľných nákladov na výsledné procesory, musí byť spojený so zjednodušením samotných jadier. Na druhej strane však zjednodušenie jadier so sebou prináša nežiaduci efekt – pokles výkonu v aplikáciách so slabo paralelizovanými záťažami, ktorých je v súčasnosti stále dostatočné množstvo.

Inžinieri AMD sa preto vydali vlastnou cestou. Mikroarchitektúra jednotlivých jadier sa stala zložitejšou, čím sa zvyšuje počet inštrukcií vykonaných na takt vždy, keď je to možné.



Bolo však rozhodnuté, že časť zdrojov, ktoré sú zvyčajne prítomné v každom jadre, no zároveň sú príliš efektívne, budú zdieľané medzi pármi výpočtových jadier.



Výsledná dvojjadrová zostava sa stala základným stavebným kameňom procesorov Bulldozer. Takýto uzol, v terminológii AMD nazývaný modul, má dve úplné sady celočíselných ovládačov. Zároveň však jednotka s pohyblivou rádovou čiarkou, zariadenia na predbežné načítanie a dekódovanie inštrukcií, ako aj vyrovnávacia pamäť druhej úrovne existujú v jednej kópii pre niekoľko jadier a zdieľajú medzi nimi svoje zdroje. Podľa odhadov vývojárov je sila týchto prvkov celkom dostatočná pre dve jadrá, pretože pri servise jedného jadra v reálnom živote sú často nečinné. Navyše, oneskorenia v ich neprerušovanej prevádzke nemajú vážny vplyv na výsledný výkon.

Jeden popísaným spôsobom navrhnutý dvojjadrový modul je podľa samotnej AMD schopný dodať až 80 % výkonu plnohodnotného dvojjadrového procesora. Zároveň úspory v rozpočte tranzistora (a teda v oblasti polovodičového kryštálu) dosahujú 44%.

Vďaka tomuto dômyselnému zhutneniu jadra sa AMD podarilo začleniť osemjadrový (alebo štvormodulový) dizajn do základného dizajnu polovodičovej matrice Bulldozer.



Navyše pomerne významná časť kryštálu je odovzdaná do vyrovnávacej pamäte. Cache druhej úrovne, zdieľané medzi pármi jadier v rámci každého procesorového modulu, majú kapacitu 2 MB a celková L3 cache pamäť pre celý procesor je 8 MB. Ak teda vezmeme do úvahy tradičnú exkluzívnu organizáciu vyrovnávacích pamätí AMD, môžeme povedať, že ich celkový objem je 16 MB na osemjadrový procesor. Zároveň oblasť buldozérového polovodičového kryštálu zostáva v prijateľných medziach, takže vývojári AMD plne dosiahli svoj cieľ.



V absolútnych číslach to znamená, že osemjadrové buldozéry budú mať menšiu polovodičovú matricu ako napríklad šesťjadrové procesory Thuban (Phenom II X6), postavené na mikroarchitektúre K10. Treba však mať na pamäti, že Bulldozér sa bude vyrábať pokročilejším technickým procesom s 32 nm štandardmi. V porovnaní s modernými štvorjadrovými procesormi Intel Sandy Bridge budú mať nové osemjadrové procesory AMD len o 45 % väčšiu plochu.

Štvorjadrové procesory Sandy Bridge však vďaka podpore technológie Hyper-Threading, rovnako ako Bulldozer, môžu byť predstavené operačnému systému ako osemjadrové procesory. To určite vyvolá polemiku o legálnosti označovania Bulldozer za plnohodnotné osemjadrové procesory. Malo by sa však chápať, že AMD a Intel dospeli k prípustnosti súčasného vykonávania ôsmich výpočtových vlákien rôznymi spôsobmi. Vývojári Intelu sa naskrutkovali do svojej mikroarchitektúry pridané vlastnosti, čo umožňuje dvom vláknam bežať vo vnútri jedného jadra na jednej sade vykonávacích zariadení. AMD naopak vyrezalo „extra“ diely z dvoch plnohodnotných jadier, no vo vnútri každého modulu boli iba dve sady ovládačov.



Výsledkom je, že technológia Hyper-Threading od Intelu zvyšuje výkon vo viacerých vláknach iba o 15 – 20 %, zatiaľ čo riešenie od AMD poskytuje zvýšenie výkonu o 80 % pri prechode zo 4 na 8 vlákien.

Aj keď, samozrejme, polovodičový kryštál osemjadrového Bulldozéra je svojou modulárnou štruktúrou naozaj veľmi podobný tomu štvorjadrovému.


Viac pokynov na cyklus?

Samotné zvýšenie počtu procesorových jadier vás ďaleko nedostane. To sa ukázalo aj po uvedení šesťjadrových procesorov Phenom II X6, ktoré sú vo všeobecnosti výkonovo horšie ako štvorjadrové Sandy Bridge. Vývojári AMD sa preto neobmedzili len na rozsiahle zmeny dizajnu. Základná mikroarchitektúra Bulldozeru bola v porovnaní s K10 prepracovaná o niečo menej ako úplne, čo dáva nádej na zrýchlenie prevádzky systémov na procesoroch AMD nielen vo viacvláknových úlohách, ale aj v aplikáciách s nízkou úrovňou paralelizmu. Navyše, tieto nádeje sú založené na úplne objektívnych okolnostiach. Zatiaľ čo predchádzajúce mikroarchitektúry AMD boli navrhnuté tak, aby vykonávali tri inštrukcie na takt (na jednom jadre), mikroarchitektúra Bulldozer predpokladá vykonanie štyroch inštrukcií na takt a je v tejto charakteristike bližšia konkurenčným procesorom s Core mikroarchitektúrou.

Kvalitatívne zmeny možno vysledovať od úplne prvých fáz vykonávacieho potrubia - od fázy predbežného načítania a dekódovania pokynov. Tieto stupne sú spoločné pre páry jadier v rámci jedného modulu, takže AMD si dalo obzvlášť záležať na tom, aby sa nestali mikroarchitektonickým prekážkou. Inštrukcie sú načítané z vyrovnávacej pamäte L1I na dekódovanie v blokoch po 32 bajtoch – dvakrát väčších ako v procesoroch s mikroarchitektúrou Core (druhá generácia). Samotná vyrovnávacia pamäť inštrukcií prvej úrovne má kapacitu 64 KB a dvojkanálovú asociativitu. Z vyrovnávacej pamäte druhej úrovne sa do nej vopred načítajú pokyny určené na dekódovanie.

Blok predikcie vetvenia, ktorý je najviac priamo zapojený do procesu vzorkovania, obsahuje dve sady vyrovnávacích pamätí, ktoré nezávisle monitorujú aktivitu rôznych jadier. Pri predpovedaní výsledkov logických vetiev sa teda Bulldozer nepletie medzi vláknami. Keďže cieľom novej mikroarchitektúry je pracovať pri vysokých rýchlostiach hodín, kvalita jednotky predikcie vetvenia je nanajvýš dôležitá. Preto boli algoritmy použité v ňom úplne prepracované a AMD dúfa, že účinnosť predikcie vetiev Bulldozer sa zlepší.



Inštrukčný dekodér Bulldozer x86 tiež rozdeľuje svoje zdroje medzi dve jadrá a je schopný dekódovať až 4 prichádzajúce inštrukcie za cyklus. Jeho výkon je však obmedzený na vydávanie iba štyroch makro inštrukcií (vyplývajúcich z dekódovania v podmienkach AMD), zatiaľ čo inštrukcie x86 je možné rozdeliť na 1-2 alebo dokonca viac makro inštrukcií. Hoci teda dekodér zvýšil svoj výkon o tretinu v porovnaní s predchádzajúcou generáciou mikroarchitektúry, jeho rýchlosť nemusí stačiť vzhľadom na to, že má za úlohu podporovať dva celočíselné a jeden výpočtový klaster s reálnym číslom.

Je potrebné poznamenať, že v buldozéri sa použila aj určitá analógia technológie fúzie makrofúznych pokynov. Niektoré skupiny x86 inštrukcií možno spojiť do jedného celku a preniesť cez dekodér ako jednu inštrukciu – AMD to nazýva Branch Fusion.

Dekódované makroinštrukcie sú rozdelené do troch výpočtových klastrov, z ktorých dva sú pozostatkami plnohodnotných výpočtových jadier a jeden je reálne očíslovaný, zdieľaný medzi jadrami. Každý z týchto klastrov má svoju vlastnú logiku zmeny poradia inštrukcií a svoj vlastný plánovač. To samozrejme znamená, že AMD si zachováva schopnosť úplne nahradiť alebo doplniť niektoré z týchto klastrov v budúcich produktoch.

Zmena poradia inštrukcií v každom z klastrov je založená na použití súboru fyzického registra, ktorý ukladá odkazy na obsah registrov a eliminuje potrebu neustálych prenosov dát v rámci procesora pri preskupovaní poradia inštrukcií. Tento prístup nahradil na svojom mieste vyrovnávaciu pamäť pre zmenu poradia, pretože súbor fyzického registra je nielen efektívnejší z hľadiska spotreby energie, ale aj priaznivejší z hľadiska zvyšovania rýchlosti procesora.

Celočíselné klastre obsahujú dve aritmetické vykonávacie jednotky (ALU) a dve pamäťové adresové jednotky (AGU). Oproti mikroarchitektúre K10 sa počet zariadení zmenšil o jedno ALU a jedno AGU, no AMD ubezpečuje, že výkon to výrazne nezníži, no oblasť jadra výrazne ušetrí. Ľahko sa domnievame, že mať viac ako dve ALU a AGU v každom celočíselnom klastri naozaj nedáva praktický zmysel, pretože z dekodéra nemôžu prísť viac ako štyri makro inštrukcie na jeden hodinový cyklus na vykonanie oboma klastrami.



Súčasne sa pohony stali univerzálnejšími, prakticky sa nelíšia vo svojich funkciách.

Organizácia subsystému vyrovnávacej pamäte sa vážne zmenila. Cache L1D sa znížila zo 64 na 16 KB a stala sa zahrnutou aj pre zápis. Zároveň sa zvýšila jeho asociativita na 4 kanály, okrem toho bol pridaný „prediktor cesty“. Zníženie veľkosti dátovej vyrovnávacej pamäte prvej úrovne je kompenzované výrazným zvýšením jej priepustnosti, teraz dokáže obsluhovať až tri 128-bitové operácie súčasne: dve čítania a jeden zápis.

Je zrejmé, že zmeny v šírke pásma vyrovnávacej pamäte L1D do značnej miery súvisia s potrebou implementovať 256-bitové inštrukcie AVX do mikroarchitektúry, ktorej podpora sa objavila v jednotke FPU zdieľanej medzi jadrami. To však neznamená, že aktuátory v reálnom počte sa stali 256-bitovými. V skutočnosti má modul Bulldozer dve 128-bitové zariadenia a inštrukcie AVX sú dekódované ako spojené páry 128-bitových inštrukcií. Na ich vykonanie sa teda kombinujú zariadenia FMAC (s pohyblivou rádovou čiarkou multiply-accumulate) a výkon klastra s reálnym číslom sa zníži na jeden príkaz AVX na modul procesora za cyklus hodín.



FPU nemá vlastnú vyrovnávaciu pamäť prvej úrovne, takže tento klaster pracuje s údajmi cez celočíselné zariadenia.

Keďže inžinieri AMD už prevzali úlohu implementácie podpory pre inštrukcie AVX navrhnuté spoločnosťou Intel, k procesorom Bulldozer boli pridané ďalšie relevantné sady: inštrukcie SSE4.2 a AESNI zamerané na urýchlenie operácií šifrovania. Okrem toho AMD predstavilo niekoľko vlastných príkazov: trojoperandové násobenie-sčítanie FMA4 a vlastnú víziu ďalšieho vývoja AVX – XOP.



Cache L2 v Bulldozer je zdieľaná v rámci modulu procesora a zdieľaná medzi jadrami. Jeho kapacita je pôsobivých 2 MB a jeho asociativita je 16 kanálov. Avšak latencia cache pracujúcej podľa tejto schémy sa zvýšila na 18-20 cyklov, napriek tomu, že šírka zbernice zostala rovnaká ako predtým - 128-bit. To znamená, že vyrovnávacia pamäť L2 v Bulldozer, aj keď je veľká, nie je príliš rýchla, konkurenčné a predchádzajúce procesory ponúkajú vyrovnávaciu pamäť L2 s približne polovičnou latenciou. V spojení s malou vyrovnávacou pamäťou L1D s latenciou 4 cyklov (čo je tiež viac ako v mikroarchitektúre K10) to všetko nevyzerá veľmi povzbudivo. AMD však tvrdí, že latencia vyrovnávacej pamäte bola zvýšená iba preto, aby Bulldozer mohol pracovať pri vysokých rýchlostiach hodín.



Okrem toho inžinieri AMD implementovali efektívnu jednotku predbežného načítania, ktorá je navrhnutá tak, aby vopred načítala potrebné údaje do vyrovnávacej pamäte prvej a druhej úrovne. Výkon týchto blokov sa údajne zlepšil a teraz sú dokonca schopné rozpoznať nepravidelné dátové štruktúry.

Teoreticky robí Buldozér dobrý dojem. AMD úplne prepracovalo svoj starý prístup k mikroarchitektúre procesorov a implementovalo úplne prepracovaný dizajn. Čo na prvý pohľad vyzerá veľmi sľubne, pretože nová mikroarchitektúra je optimalizovaná na vykonávanie štyroch, a nie troch inštrukcií za takt na jednom jadre procesora. Navyše podporuje makro spájanie inštrukcií počas procesu dekódovania, čo ďalej zvyšuje špecifický výkon.

Ale všetko vyzerá tak dobre, len pokiaľ sa pozeráme len na jedno jadro a nemyslíme na to, že v skutočnosti sú také jadrá spojené do párov. A dvojjadrový modul Bulldozer má príliš veľa spoločných častí na pár jadier. Najmä v dôsledku skutočnosti, že takýto modul má iba jednu jednotku na vyzdvihnutie inštrukcií a jeden dekodér, maximálny počet inštrukcií vykonaných za cyklus hodín zostáva rovný štyrom pre celú dvojjadrovú zostavu. To znamená, že logickým ekvivalentom pre jedno jadro Sandy Bridge z hľadiska teoretického výkonu je modul a nie jadro Bulldozer. Schopnosť modulu vykonávať dve vlákna v tomto prípade vyzerá ako úplne logická odpoveď AMD na technológiu Hyper-Threading.

Samozrejme, naše testovanie skutočných procesorov dá všetko na svoje miesto, ale už v štádiu zvažovania mikroarchitektúry sme nútení myslieť si, že umiestnenie Bulldozeru ako plnohodnotných osemjadrových procesorov je marketingový ťah. Spoľahlivejšie posúdenie výpočtových schopností týchto procesorov by malo vychádzať z počtu modulov, ktoré sú z pohľadu teoretického výkonu dokonale porovnateľné s jadrami postavenými na druhej generácii mikroarchitektúry Intel Core.

V tejto súvislosti vyvstáva úplne logická otázka – prečo sa AMD vôbec trápilo s implementáciou dvojvláknového spracovania v rámci jedného procesorového modulu? Prečo by nebolo možné skombinovať aktuátory distribuované cez dve jadrá do jedného klastra? Má to viacero dôvodov.

Po prvé, na súčasné zaťaženie veľkého počtu akčných členov prácou je vo všeobecnom prípade potrebná pokročilá vnútroprocesorová logika. AMD očividne nedokázalo implementovať vysoko efektívnu predikciu vetiev, inštrukcie a jednotky na predbežné načítanie údajov v mikroarchitektúre Bulldozer. Preto sa úloha paralelizácie práce a optimálnejšieho využitia vykonávacích zariadení presúva na výrobcov softvéru, ktorí musia pre Bulldozer dodávať produkty s podporou multi-threadingu.

Po druhé, zvýšenie počtu súbežne vykonávaných vlákien nie je také zlé. Ak pre používateľov stolných počítačov, a najmä pre hráčov, osem pomerne jednoduchých jadier Bulldozer nesľubuje žiadne konkrétne výhody, potom by v serverových aplikáciách mala byť takáto mikroarchitektúra splnená veľmi priaznivo. Je teda celkom možné, že hlavným cieľom pri vývoji Bulldozeru nebolo uspokojiť túžby nadšencov, ale obnoviť pozíciu AMD na trhu serverov.

Turbo Core ešte viac Turbo

Energetická účinnosť je jedným z najdôležitejšie vlastnosti moderné procesory. Napríklad v ich budúce mikroarchitektúry Intel dbá na znižovanie spotreby energie takmer na prvom mieste. AMD sa do tohto bodu ešte nedostalo, inžinieri tejto spoločnosti bojujú predovšetkým o výkon. To však neznamená, že sa vývojári vôbec nestarali o tepelné a energetické vlastnosti Bulldozéra. Naopak, po Llano si do procesorov Bulldozer našli cestu zásadne nové prístupy k zvyšovaniu energetickej účinnosti. V tomto prípade však inžinieri využili uvoľnený potenciál ani nie tak na šetrenie peňazí, ale na vyžmýkanie dodatočného výkonu zvýšením taktovacích frekvencií.

Samozrejme, nová výrobná technológia priniesla určité zlepšenia z hľadiska spotreby energie a odvodu tepla. Buldozér využíva 32nm procesnú technológiu využívajúcu vysoko dielektrický materiál, kovové hradlové tranzistory a technológiu SOI. Inými slovami, ide o rovnaký technický proces GlobalFoundries, ktorý vyrába procesory Llano. Vďaka Nová technológia Pri štandardoch 32 nm prevádzkové napájacie napätia sériových osemjadrových procesorov Bulldozer nepresahujú 1,4 V.

Hlavnou inováciou, ktorá prešla z Llano do Bulldozeru, sú však tranzistory výkonovej brány, určené na odpojenie napájania určitých častí procesora. V Bulldozer vám umožňujú nezávisle odbúrať napätie z jednotlivých dvojjadrových modulov a z vyrovnávacej pamäte.



Keď sa obe výpočtové jadrá v module dostanú do úsporného stavu C6, modul sa vypne. Bohužiaľ, túto technológiu nemožno použiť na jadrá procesorov, pretože v Bulldozer jednoducho neexistujú žiadne vyhradené jadrá - zdieľajú niektoré zdroje so svojimi susedmi modulov.

Stavy šetrenia energie jadier C6 sú riadené technológiou Bulldozer a Turbo Core. V tých momentoch, keď je aspoň polovica modulov procesora Bulldozer vo vypnutom stave, zvyšuje svoje napájacie napätie a taktovaciu frekvenciu. Tento nútený prevádzkový režim sa nazýva Max Turbo Boost.

Max Turbo Boost však nie je žiadnou novinkou, takéto automatické pretaktovanie zaviedlo AMD v procesoroch Thuban postavených na mikroarchitektúre K10. Skutočnou novinkou je režim All Core Boost, v ktorom sa dokáže zvýšiť takt nad nominálnu hodnotu aj pri aktívnych všetkých jadrách procesora. Vylepšená verzia Turbo Core implementovaná v Bulldozéri umožňuje procesoru s dobrou presnosťou posúdiť jeho praktickú spotrebu energie a odvod tepla na základe informácií o pracovnom zaťažení určitých blokov. Ak je teda podľa tohto hodnotenia aktuálny odvod tepla a spotreba energie výrazne pod limitom, procesor môže zvýšiť napájacie napätie a taktovaciu frekvenciu, aj keď ani jedno jadro nie je v pasívnom stave.



Prevádzková frekvencia procesorov s mikroarchitektúrou Bulldozer je teda extrémne premenlivá hodnota. V závislosti od „závažnosti“ vykonávaných algoritmov a počtu zapojených jadier sa môže dynamicky meniť vo veľmi širokom rozsahu až do 900 MHz.

Aktualizovaná platforma pre stolné počítače

S predstavením novej mikroarchitektúry AMD nielenže nezmenilo dizajn platformy, ale dokonca zachovalo kompatibilitu procesorov Bulldozer s existujúcou infraštruktúrou. V súlade s tým, rovnako ako ich predchodcovia, nové procesory obsahujú integrovaný severný most vrátane vyrovnávacej pamäte tretej úrovne, radiča pamäte a radiča zbernice Hyper-Transport. Zároveň, napriek tomu, že všetky novo vydané procesory AMD a Intel majú vo vnútri zabudovaný aj radič grafickej zbernice PCI Express, Bulldozer toto nemá.



Rovnako ako v procesoroch postavených na mikroarchitektúre K10, aj v Bulldozéri vstavaný northbridge používa vlastnú taktovaciu frekvenciu, ktorá je pre rôzne modely nastavená na 2,0-2,2 GHz. Upozorňujeme, že táto frekvencia má určitý vplyv na výkon, pretože priamo ovplyvňuje rýchlosť vyrovnávacej pamäte L3. Ktorý v súčasnej verzii procesorov má objem zväčšený na 8 MB a má 64-kanálovú asociativitu. V súlade so želaniami podnikových používateľov sú údaje uložené v tejto vyrovnávacej pamäti chránené kódom na opravu chýb ECC.

Pamäťový radič zabudovaný v Bulldozéri nemá žiadne zásadne nové možnosti. Rovnako ako predtým, podporuje DDR3 SDRAM, používa dvojkanálový dizajn a v skutočnosti pozostáva z dvoch nezávislých jednokanálových ovládačov, ktoré môžu pracovať v párovanom alebo odpojenom režime. AMD pridalo len podporu pre typy pamätí s vyššou rýchlosťou, pričom deklarovalo kompatibilitu s DDR3-1867 a postaralo sa o kompatibilitu s energeticky efektívnymi modulmi s pracovným napätím 1,25 a 1,35 V.

Keď už hovoríme o desktopovej modifikácii Bulldozer, ktorá má svoje vlastné kódové označenie Zambezi, treba poznamenať, že je zameraná na nový Zásuvková platforma AM3+, známy aj pod kódovým označením Scorpius. procesor zásuvka AM3+ má 942 pinov, o jeden viac ako Socket AM3. Napriek tomu však Zambezi zostáva kompatibilný so staršími doskami Socket AM3. Pri inštalácii nových procesorov do starých základných dosiek sa v skutočnosti stratia iba niektoré funkcie správy napájania. Rýchlosť prepínania frekvencie teda klesá, keď sú spustené technológie Turbo Core a Cool"n"Quiet a Vdrop nefunguje.

Avšak v čase, keď bol prepustený Zambezi, AMD a výrobcovia základné dosky pripravili plejádu nových produktov založených na nových logických zostavách série 900. Štruktúra typického systému založeného na procesore Zambezi a postavenom na novom čipsete je znázornená na blokovej schéme nižšie.


Rozdiely medzi novým čipsetom AMD 990FX (a jeho zjednodušenými verziami AMD 990X a AMD 970) spočívajú výlučne v podpore špecifických elektrických vlastností Socket AM3+ a neprinášajú so sebou žiadne nové rozhrania. Rovnako ako čipsety série 800, aj nový južný most obsahuje šesť portov SATA 6 Gbps a štrnásť portov USB 2.0. Bez ohľadu na to, ako veľmi by sme chceli v nových zostavách systémovej logiky vidieť podporu pre špecifikáciu PCI Express 3.0 alebo prinajhoršom pre porty USB 3.0, ani tentokrát v nich nič také nie je. To je mimochodom veľmi zvláštne, pretože podpora USB 3.0 bola zavedená v čipsetoch pre platformu Socket FM1 nižšej úrovne.

Rozdiely medzi modifikáciami novej série systémových logických sád spočívajú výlučne v podpore rôznych konfigurácií viacerých GPU.


Rad procesorov Zambezi

Vydanie procesorov Zambezi dokončí aktualizáciu modelový rad, ktorú ponúka AMD. Desktopové procesory založené na mikroarchitektúre Bulldozer sa stanú novou vlajkovou loďou tohto výrobcu a rýchlo vytlačia z trhu všetky druhy modifikácií Phenom II.

S dôrazom na inováciu novej mikroarchitektúry bude AMD používať nový marketingový názov pre desktopové procesory Zambezi – FX. Na jednej strane dokonale zapadá do nového názvoslovia, ktoré zahŕňa označovanie procesorov písmenami, a na druhej strane ide o odkaz na legendárne procesory Athlon 64 FX, ktoré boli pred šiestimi či siedmimi rokmi najrýchlejšie desktopové CPU. Tie časy sú však nenávratne preč, tak sa pozrime, čo nám AMD teraz pripraví.

V blízkej budúcnosti bude ponuka procesorov série FX zahŕňať štyri modely.



Napriek tomu, že rozdiel medzi modelmi procesorov Zambezi nie je len v taktoch, ale aj v počte aktívnych výpočtových jadier, všetky budú založené na rovnakom unifikovanom polovodičovom čipe. Tu je:



Ak chcete získať procesory s menej ako ôsmimi jadrami, AMD niektoré z nich na polovodičovom čipe zakáže. Otázna je stále možnosť ich spätného odomknutia, ako to bolo možné pri procesoroch s mikroarchitektúrou K10. V BIOSe základných dosiek založených na logických súboroch série 900, ktoré prešli našim laboratóriom, sú však príslušné možnosti prítomné, takže existuje nádej na priaznivé riešenie tohto problému.

Zakázanie jadier na získanie úprav šesťjadrových a štvorjadrových procesorov bude prebiehať „modul po module“. To znamená, že budú zablokované celé dvojjadrové moduly a nie „druhé“ jadrá v nich, hoci takáto taktika by bola z hľadiska výkonu oveľa výhodnejšia. Vydanie šesťjadrových a štvorjadrových procesorov postavených na mikroarchitektúre Bulldozer sa však nevysvetľuje ani tak marketingovými úvahami, ako skôr potrebou implementácie odmietnutia, ktoré vzhľadom na pomerne veľké rozmery čipu a nový technologický postup, bude dosť veľa.

Napriek tomu, že AMD priostruje novú mikroarchitektúru tak, aby fungovala na vysokých taktovacích frekvenciách, dosiahnuté hodnoty zatiaľ nemôžeme označiť za impozantný prelom. Štvorgigahertzová bariéra ostáva neprekonaná a nominálna frekvencia staršieho FX procesora je ešte nižšia ako napríklad u Phenom II X4 980. Radi by sme dúfali, že so zlepšením technológie výroby pôjdu frekvencie Zambezi rýchlo hore . Ak však veríte súčasnej verzii plánov AMD, linka sa zrýchli najskôr v prvom štvrťroku 2012.

Z hľadiska uvoľňovania tepla a spotreby energie nedochádza k žiadnemu prelomu. AMD už dlho hovorilo o tom, ako bude mikroarchitektúra Bulldozer energeticky efektívnejšia, no v skutočnosti majú staršie osemjadrové modely rovnakú úroveň TDP ako starší Phenom II. Je pravda, že po určitom čase by spoločnosť mala pridať do svojej ponuky 95-wattovú verziu FX-8120 a procesor FX-8100 s rovnakým vypočítaným odvodom tepla.

Ceny nových procesorov série FX však vyzerajú viac než lákavo. AMD nechce vybočiť zo svojho kurzu ponúkania platforiem za priaznivejšiu cenu ako jeho konkurenti, takže staršie osemjadrové modely Zambezi sa stavajú proti starším procesorom Intel Core i5. Vo všeobecnosti spoločnosť AMD plánuje dodržiavať nasledujúcu schému umiestnenia svojich produktov:



Inými slovami, AMD nemá v úmysle konkurovať šesťjadrovým procesorom Intel a sľubnej platforme LGA2011, ale chce sa zamerať na dobytie segmentu strednej ceny.

Dobrou správou pre nadšencov bude fakt, že vo všetkých procesoroch série FX nebudú blokované žiadne násobiče. Všetky Zambezi je možné nielen jednoducho pretaktovať jednoduchou zmenou základného násobiteľa, ale možno ich tiež podobne prekonfigurovať pomocou technológie Turbo Core. K dispozícii je aj pretaktovanie pamäťového subsystému a frekvencia severného mostíka zabudovaného v procesore.

Testovací procesor: AMD FX-8150

AMD poslalo našim redaktorom starší procesor z rodiny Zambezi, FX-8150.



Má nominálnu rýchlosť hodín 3,6 GHz a viac detailné informácie Jeho charakteristiky je možné získať z daného screenshotu CPU-Z.



Upozorňujeme, že procesor je založený na krokovaní B2 – a toto nie je prvá verzia. Predchádzajúce úpravy polovodičového kryštálu výrobca zamietol, pretože nedokázali fungovať na pôvodne plánovaných taktovacích frekvenciách. To spôsobilo určité oneskorenie oznámenia, ktoré bolo pôvodne plánované na jar, potom v lete, no v skutočnosti sa stalo v polovici októbra.

Dnes dosiahnutá frekvencia 3,6 GHz však nevyzerá príliš pôsobivo. AMD aj Intel majú produkty, ktoré bežia pri vyšších rýchlostiach. FX-8150 má však veľmi sľubnú technológiu Turbo Core, ktorá pri nízkej záťaži dokáže automaticky zvýšiť frekvenciu procesora až na 4,2 GHz.



Je pozoruhodné, že frekvenciu 3,9 GHz je možné dosiahnuť aj pri zaťažení všetkých výpočtových jadier, no zároveň ponecháva priestor na automatické pretaktovanie bez toho, aby sa prekročili hranice spotreby energie a odvodu tepla.



V nečinnosti technológia Cool"n"Quiet znižuje frekvenciu FX-8150 na 1,4 GHz. Napájacie napätie klesne na 0,85 V.


Ako sme testovali

Porovnali sme nový osemjadrový procesor AMD FX-8150, postavený na mikroarchitektúre Bulldozer, s jedným z jeho predchodcov, šesťjadrovým Phenom II X6, a s konkurenčnými (cenovými) ponukami Intel – štvorjadrovými Jadrové procesory i5-2500 a Core i7-2600. Pre väčšiu prehľadnosť boli do výsledkov navyše pridané ukazovatele výkonu pre šesťjadrový procesor Core i7-990X.

Výsledkom bolo, že testovacie systémy obsahovali nasledujúce softvérové ​​a hardvérové ​​komponenty:

Procesory:

AMD FX-8150 (Zambezi, 8 jadier, 3,6 GHz, 8 MB L2 + 8 MB L3);
AMD Phenom II X6 1100T (Thuban, 6 jadier, 3,3 GHz, 3 MB L2 + 6 MB L3);
Intel Core i7-2600K (Sandy Bridge, 4 jadrá, 3,4 GHz, 1 MB L2 + 8 MB L3);
Intel Core i5-2500K (Sandy Bridge, 4 jadrá, 3,3 GHz, 1 MB L2 + 6 MB L3);
Intel Core i7-990X Extrémna edícia(Gulftown, 6 jadier, 3,46 GHz, 1,5 MB L2 + 12 MB L3).

Chladič CPU: NZXT Havik 140;
Základné dosky:

Gigabyte 990FXA-UD5 (Socket AM3+, AMD 990FX + SB950);
ASUS P8Z68-V PRO (LGA1155, Intel Z68 Express);
Gigabyte X58A-UD5 (LGA1366, Intel X58 Express).

Pamäť:

2 x 2 GB, DDR3-1600 SDRAM, 9-9-9-27 (Kingston KHX1600C8D3K2/4GX);
3 x 2 GB, DDR3-1600 SDRAM, 9-9-9-27 (Crucial BL3KIT25664TG1608).

Grafická karta: AMD Radeon HD 6970.
Pevný disk: Kingston SNVP325-S2/128GB.
Napájanie: Tagan TG880-U33II (880 W).
Operačný systém: Microsoft Windows 7 SP1 Ultimate x64.
Ovládače:

Ovládač čipovej sady Intel 9.2.0.1030;
Intel Management Engine Driver 7.1.10.1065;
Intel Rapid Storage Technology 10.6.0.1022;
Ovládač displeja AMD Catalyst 11.10.

Upozorňujeme, že testovanie bolo vykonané pod aktuálnou verziou operačného systému Windows 7, ale AMD uvádza, že správca úloh tohto OS nedistribuuje výpočtové vlákna najoptimálnejším spôsobom. Windows 7 primárne uprednostňuje nasmerovanie vlákien do jadier umiestnených v rôznych moduloch. A to skutočne poskytuje vyšší špecifický výkon, pretože znižuje zaťaženie blokov rozdelených vo vnútri modulu. Táto stratégia však bráni zahrnutiu turbo režimov, ktoré by mohol procesor využiť, ak by bol niektorý z dvojjadrových modulov v úspornom režime.

Sľubná operačná sála systém Windows 8 bude nasledovať inú taktiku a vlákna budú priradené najskôr jadrám v rámci toho istého modulu. V dôsledku toho spoločnosť AMD sľubuje, že v rade aplikácií sa môže výkon systémov založených na Zambezi zvýšiť až o 10 %.

Výkon

Predbežné vyhodnotenie účinnosti mikroarchitektúry Bulldozer

Predtým, ako sme začali „skutočné“ testovanie procesorov, rozhodli sme sa zistiť, čo môžeme od mikroarchitektúry Bulldozer v princípe očakávať. Za týmto účelom sme vykonali malé porovnanie procesora s touto mikroarchitektúrou s inými CPU s mikroarchitektúrami K10 a Sandy Bridge za umelo vytvorených rovnakých podmienok: pri rovnakej frekvencii hodín a s rovnakým počtom aktivovaných jadier.

Presnejšie povedané, porovnali sme AMD FX-8150, Phenom II X6 1100T a Core i7-2600 na 3,6 GHz s povolenými iba dvoma procesorovými jadrami. Kvôli čistote experimentu boli všetky technológie úspory energie a automatického pretaktovania prirodzene deaktivované. Ako testovacie nástroje bola zvolená sada jednoduchých syntetických benchmarkov zahrnutých v utilite SiSoft Sandra 2011, v ktorom sme násilne zakázali všetky inštrukčné sady staršie ako SSE3, pretože nie sú podporované v mikroarchitektúre K10.



Čísla v tabuľke hovoria hlasnejšie ako akékoľvek slová. Výkon mikroarchitektúry Bulldozer je oveľa nižší ako výkon predchádzajúcich procesorov. Spojenie párov jadier do jedného modulu so zdieľanými zdrojmi a s tým súvisiace zjednodušenie mikroarchitektúry viedlo k tomu, že pri rovnakej frekvencii klesol špecifický výkon Bulldozer na jadro o 25-40% v porovnaní s predchádzajúcou generáciou AMD mikroarchitektúry. Výsledkom je, že jadrá Bulldozer sú takmer o polovicu pomalšie ako jadrá Sandy Bridge. Navyše, výkon modulu procesora Bulldozer, ktorý obsahuje dve jadrá, je ešte nižší ako rýchlosť jedného jadra Sandy Bridge s povolenou technológiou Hyper-Threading. Mali by sme očakávať výkonové rekordy od procesora postaveného na takejto mikroarchitektúre? Otázka je rečnícka.

Po ceste sa pozrime na praktické vlastnosti vyrovnávacie pamäte a pamäťové podsystémy. Na vyhodnotenie rýchlosti prevádzky týchto funkčných jednotiek sme vykonali testy v utilite Cachemem z balíka Aida64. Vo všetkých prípadoch bola použitá pamäť DDR3-1600 s latenciou 9-9-9-27-1T. Rovnako ako v predchádzajúcom prípade zostali frekvencie procesora vyrovnané na úrovni 3,6 GHz.



V Zambezi sa oproti procesorom Phenom II zvýšili praktické latencie všetkých cache aj pamäťového subsystému. Hovorili sme o tom pri zvažovaní mikroarchitektúry Bulldozer. Zmenou logickej organizácie vyrovnávacej pamäte sa však jej priepustnosť zvýšila takmer vo všetkých prípadoch.

Súčasne je v Sandy Bridge implementovaný najrýchlejší dvojkanálový pamäťový radič a najrýchlejší subsystém vyrovnávacej pamäte. Aj keď, samozrejme, z hľadiska kapacity vyrovnávacej pamäte je procesor Intel o niečo nižší ako médiá s mikroarchitektúrou Bulldozer.

Celkový výkon

Na vyhodnotenie výkonu procesora v bežných úlohách už tradične využívame test Bapco SYSmark 2012, ktorý simuluje prácu používateľov v bežných moderných kancelárske programy a aplikácie na vytváranie a spracovanie digitálneho obsahu. Myšlienka testu je veľmi jednoduchá: vytvára jedinú metriku charakterizujúcu váženú priemernú rýchlosť počítača v bežných aplikáciách.

Pripomeňme si, že pred nejakým časom sa AMD pokúsilo trollovať SYSmark a šírilo obvinenia, že bol zaujatý kvôli použitiu „nesprávnej“ sady skutočných aplikácií. Podľa nášho názoru však takýto úsudok nie je opodstatnený, keďže ide o bežné a skutočne obľúbené programy, ktoré sa používajú na hodnotenie výkonu, pričom podiel každého z nich ku konečnému výsledku ukazuje nasledujúci diagram:



Preto sme neopustili používanie SYSmark 2012 a naďalej používame jeho metriky na hodnotenie bežného výkonu.



Prvý test je takým sklamaním. Výsledok osemjadrového FX-8150 je len o 10 % lepší ako výkon šesťjadrového Phenom II X6 1100T a, prirodzene, vôbec nedosahuje výkon štvorjadrových procesorov Intel. Takže taktika, ktorú AMD zvolila na implementáciu veľkého počtu jadier s nízkym špecifickým výkonom do procesora namiesto mierneho počtu zložitých, vo všeobecnosti neprináša pozitívny výsledok.

Hlbšie pochopenie výsledkov SYSmark 2012 môže poskytnúť pohľad na skóre výkonu získané v rôznych scenároch používania systému.

Scenár Office Productivity simuluje typickú kancelársku prácu: príprava textu, spracovanie tabuliek, práca s e-mailom a navštevovanie internetových stránok. Skript používa nasledujúcu sadu aplikácií: ABBYY FineReader Pro 10.0, Adobe Acrobat Pro 9, Adobe Flash Hráč 10.1 Microsoft Excel 2010, Microsoft internet Explorer 9, Microsoft Outlook 2010, Microsoft PowerPoint 2010, Microsoft Word 2010 a WinZip Pro 14.5.



Scenár Media Creation simuluje vytváranie reklamy pomocou vopred nasnímaných digitálnych obrázkov a videí. Na tento účel sa používajú obľúbené balíky Adobe: Photoshop CS5 Extended, Premiere Pro CS5 a After Effects CS5.



Vývoj webu je scenár, v rámci ktorého sa modeluje tvorba webovej stránky. Použité aplikácie: Adobe Photoshop CS5 Extended, Adobe Premiere Pro CS5, Adobe Dreamweaver CS5, Mozilla Firefox 3.6.8 a Microsoft Internet Explorer 9.



Scenár Data/Financial Analysis je venovaný štatistickej analýze a prognózovaniu trhových trendov, ktorá sa vykonáva v programe Microsoft Excel 2010.



Skript 3D modelovania je úplne venovaný vytváraniu trojrozmerných objektov a vykresľovaniu statických a dynamických scén pomocou Adobe Photoshop CS5 Extended, Autodesk 3ds Max 2011, Autodesk AutoCAD 2011 a Google SketchUp Pro 8.



Posledný scenár, Správa systému, zahŕňa vytváranie záloh a inštaláciu softvéru a aktualizácií. Zapojených je tu viacero rôzne verzie Inštalátor Mozilla Firefox a WinZip Pro 14.5.



O rôzne modely Použitie procesora s mikroarchitektúrou Bulldozer demonštruje zásadne odlišné výsledky. V niektorých prípadoch sa ukazuje byť ešte pomalší ako Phenom II X6, no existujú aj opačné situácie. Vo všeobecnosti platí toto všeobecné pravidlo: výhoda FX-8150 sa prejaví najmä tam, kde je pracovná záťaž viacvláknová a dobre paralelizovaná, ale nie je výpočtovo zložitá.

Aj v tých najpriaznivejších situáciách však FX-8150 zaostáva za Core i5-2500. Jediný scenár, kde sú tieto procesory porovnateľné v rýchlosti, je 3D vykresľovanie. V priemere je ponuka Intelu pred novým produktom AMD o pôsobivých 25 %. žiaľ.

Herný výkon

Ako viete, výkon platforiem vybavených vysokovýkonnými procesormi vo veľkej väčšine moderných hier je určený silou grafického subsystému. Preto sa pri testovaní procesorov snažíme vykonávať testy tak, aby sme čo najviac odstránili záťaž z grafickej karty: vyberajú sa hry najviac závislé od procesora a testy sa vykonávajú bez zapnutia anti -aliasing a s inštaláciou zďaleka najviac vysoké rozlíšenia. To znamená, že získané výsledky umožňujú vyhodnotiť nie tak úroveň fps dosiahnuteľnú v systémoch s modernými grafickými kartami, ale ako dobre fungujú procesory v princípe pri hernom zaťažení. Na základe prezentovaných výsledkov je teda celkom možné špekulovať o tom, ako sa budú procesory správať v budúcnosti, keď sa na trhu objavia rýchlejšie možnosti grafických akcelerátorov.


















Hry nepatria do kategórie úloh, ktoré generujú paralelizované viacvláknové zaťaženie. Pre dnešné herné aplikácie sú preto vhodnejšie procesory so štyrmi jadrami a nie tie viacjadrové monštrá, ktoré ponúka AMD. Jasné znázornenie tohto tvrdenia vidíme na nižšie uvedených diagramoch. Nový osemjadrový FX-8150 nie je o nič rýchlejší ako jeho šesťjadrový predchodca Phenom II X6.

Čo sa týka pomeru herného výkonu medzi Zambezi a Sandy Bridge, AMD je k novinke stále oveľa pesimistickejšie. Súčasná mikroarchitektúra procesorov Intel oveľa lepšie zvláda typické pracovné zaťaženie generované 3D hrami a nie je nádej, že by AMD niekedy dokázalo dobehnúť konkurenčné procesory v tejto kategórii úloh. Inými slovami, použitie buldozéra v herných systémoch môže mať zmysel len vtedy, keď existuje istota, že výkon konkrétneho procesora je dostatočný pre konkrétny video subsystém v konkrétnej skupine hier. Aj v tomto prípade si však treba uvedomiť, že pri ďalšom upgrade video akcelerátora môžete zostať vo vážnej nevýhode oproti tým používateľom, ktorí spočiatku preferovali platformu a moderné procesory Intel.

Okrem herných testov predstavíme aj výsledky syntetického benchmarku Futuremark 3DMark 11, spusteného s profilom Extreme.



Účelom pridania týchto výsledkov bolo ukázať úplne ideálnu situáciu pre FX-8150, kedy video subsystém neumožňuje naplno realizovať výkon procesora. Tu hlavná záťaž padá na grafickú kartu a procesor hrá iba podpornú úlohu. V takýchto prípadoch sa môžeme baviť o rovnocennom výkone procesorov Bulldozer a Sandy Bridge, aj keď to, samozrejme, nie je úplne pravda.



FX-8150 však vyzerá dobre (v porovnaní s predchádzajúcimi výsledkami) aj vo fyzickom teste 3DMark 11. fyzikálny model Nový osemjadrový procesor AMD beží rýchlosťou porovnateľnou so štvorjadrovým Core i5-2500.

Testy v aplikáciách

Celkovo bol vážený priemer Bulldozer a herný výkon na stolnom počítači hlboko pod našimi očakávaniami. Nezúfajme však a skúsme nájsť tie prípady, kedy je nová mikroarchitektúra AMD schopná ukázať svoje silné stránky.

Na meranie rýchlosti procesorov pri komprimácii informácií používame archivátor WinRAR, pomocou ktorého archivujeme priečinok s rôznymi súbormi s celkovým objemom 1,4 GB s maximálnym stupňom kompresie.



Výsledok FX-8150 sa blíži Core i5-2500. WinRAR nepatrí medzi aplikácie, ktoré dokážu paralelizovať svoje výpočty naprieč všetkými ôsmimi jadrami Bulldozer, no zdá sa, že gigantická vyrovnávacia pamäť zachraňuje situáciu.

Druhý podobný test rýchlosti archivácie sa vykonáva v programe 7-zip s použitím kompresného algoritmu LZMA2.



V 7-zip je výkon FX-8150 chvályhodný. Tento osemjadrový procesor sa dokáže priblížiť k rýchlosti štvorjadrového Core i7-2600, ktorý zahŕňa podporu Hyper-Threading a ktorý podobne ako Bulldozer dokáže vykonávať osem vlákien súčasne.

Výkon šifrovania procesorov sa meria pomocou vstavaného benchmarku populárnej kryptografickej utility TrueCrypt. Je potrebné poznamenať, že je nielen schopný efektívne zaťažiť ľubovoľný počet jadier, ale podporuje aj špecializovanú sadu inštrukcií AES.



Dobre paralelné, jednoduché celočíselné algoritmy sú to, čo mikroarchitektúra Bulldozer potrebuje. V takýchto prípadoch, ako vidíme, je možné dosiahnuť veľmi vynikajúci výkon. Najmä pokiaľ ide o šifrovanie, FX-8150 zaostáva len za šesťjadrovým Core i7-990X a predbieha všetky procesory pre platformu LGA1155.

Pri testovaní rýchlosti prekódovania zvuku použite tento nástroj Apple iTunes, ktorý konvertuje obsah CD do formátu AAC. Všimnite si, že charakteristickým znakom tohto programu je možnosť využívať iba dvojicu procesorových jadier.



Je lepšie držať programy, ktoré generujú malý počet výpočtových vlákien, ďaleko od Bulldozéra. Niektoré jadrá tohto CPU sú príliš slabé na to, aby v takýchto prípadoch vykazovali nejaké slušné výsledky.

Výkon meriame v Adobe Photoshop pomocou vlastného testu, ktorý je kreatívne prepracovaný Test rýchlosti retušovania umelcov vo Photoshope, ktorá zahŕňa typické spracovanie štyroch 10-megapixelových snímok zhotovených digitálnym fotoaparátom.



Vo Photoshope nie je výkon FX-8150 taký katastrofálny ako výkon procesorov s mikroarchitektúrou K10, ale stále je ďaleko za Core i5-2500. Je zrejmé, že veľká vyrovnávacia pamäť je v tomto prípade dobrou pomôckou pre mikroarchitektúru Bulldozer, ale toto samo osebe vás ďaleko nedostane. Efektívnosť a špecifický výkon výpočtových jadier má stále prvoradý význam.

Testovanie sme vykonali aj v program Adobe Photoshop Lightroom 3. Testovací scenár zahŕňa následné spracovanie a export do JPEG sto 12-megapixelových obrázkov vo formáte RAW.



Lightroom dokáže paralelizovať spracovanie fotografií naprieč ľubovoľným počtom jadier, a preto tu osemjadrový FX-8150 vykazuje dobré výsledky. „Nie je to zlé“ je však v tomto prípade relatívny pojem, v skutočnosti je jeho výkon porovnateľný iba s Core i5-2500. To znamená, že dve jadrá Bulldozer sa rovnajú jednému jadru Sandy Bridge bez podpory Hyper-Threading.

Výkon v Adobe Premiere Pro sa testuje meraním času vykresľovania vo formáte H.264 Blu-Ray projektu obsahujúceho video HDV 1080p25 s rôznymi aplikovanými efektmi.



Procesory AMD predchádzajúcej generácie dobre zvládali aj prekódovanie videa. Mikroarchitektúra Bulldozer umožnila mierne zvýšenie výkonu v aplikáciách tohto charakteru a v dôsledku toho je FX-8150 ešte rýchlejší ako Core i5-2500.

Rýchlosť úpravy videa pomocou Adobe After Effects bola hodnotená meraním doby chodu preddefinovanej sady filtrov a efektov, vrátane rozostrenia, vytvárania hrbolčekov, prelínania snímok, vytvárania žiary, pridávania rozostrenia pohybu, tieňovania, 2D a 3D manipulácie, inverzie, atď.



Napriek tomu, že záťaž je dobre paralelizovaná, FX-8150 zaostáva za konkurentmi Intelu v After Effects.

Na meranie rýchlosti prekódovania videa do formátu H.264 slúži x264 HD test, založený na meraní doby spracovania zdrojového videa vo formáte MPEG-2, zaznamenaného v rozlíšení 720p s tokom 4 Mbit/sec. Je potrebné poznamenať, že výsledky tohto testu majú veľký praktický význam, pretože kodek x264, ktorý sa v ňom používa, je základom mnohých populárnych nástrojov na prekódovanie, napríklad HandBrake, MeGUI, VirtualDub atď.






Pri prekódovaní videa pomocou kodeku x264 procesory AMD vždy vykazovali dobrý výkon. S vydaním osemjadrovej mikroarchitektúry sa ich výsledky ďalej zvýšili a teraz FX-8150 dokonca prekonáva Core i7-2600 v druhom, na zdroje najnáročnejšom prechode kódovania. So značnými ťažkosťami sme teda napokon našli okrem TrueCrypt aj druhú aplikáciu, kde si výkon procesora s mikroarchitektúrou Bulldozer zaslúži lichotivé recenzie.

Výpočtový výkon a rýchlosť vykresľovania meriame v Autodesk 3ds max 2011 pomocou špecializovaného testu SPECapc. Od tohto testovania začíname používať novú profesionálnu verziu SPECapc pre 3ds Max 2011.






Rendering je tiež jednou z úloh, ktoré podliehajú optimalizácii pre viacjadrové mikroarchitektúry. Ale napriek tomu je FX-8150 stále pomalší ako Core i5-2500 a Core i7-2600, nehovoriac o Core i7-990X. Na druhej strane neexistuje žiadna hanebná situácia, keď nový procesor AMD stráca na svojom predchodcovi.

Pri spriemerovaní výsledkov v jednotlivých aplikáciách bol FX-8150 približne o 14 % rýchlejší ako Phenom II X6 1100T v našej sade aplikácií. A to mu umožnilo pracovať nie horšie ako Core i5-2500 v o niečo menej ako polovici prípadov. Rozdiel oproti ďalšiemu modelu Sandy Bridge, Core i7-2600, však zostáva významný a predstavuje viac ako 10 %.

Spotreba energie

Napriek tomu, že sa nám podarilo nájsť súbor úloh, pri ktorých možno výkon Bulldozeru nazvať prijateľným, procesory založené na novej mikroarchitektúre nevyzerajú nijako revolučne. Jedinou nádejou zostáva spotreba energie, pretože predtým boli procesory AMD v tomto parametri viac než výrazne horšie ako ich konkurenti. Ak teraz veríte sľubom vývojárov, mikroarchitektúra sa viac zamerala na energetickú efektívnosť a nový 32-nm technologický proces mal prispieť k zlepšeniu elektrické charakteristiky. Pozrime sa teda na FX-8150 optikou výkonu na watt.

Nasledujúce grafy, pokiaľ nie je uvedené inak, znázorňujú celkovú spotrebu systému (bez monitora), meranú „po“ napájaní a predstavujúcu súčet spotreby energie všetkých komponentov zapojených do systému. Účinnosť samotného napájania sa v tomto prípade neberie do úvahy. Počas meraní záťaž procesorov vytvárala 64-bitová verzia utility LinX 0.6.4. Okrem toho, aby sme správne odhadli spotrebu energie pri nečinnosti, aktivovali sme všetky dostupné technológie na úsporu energie: C1E, C6, AMD Cool"n"Quiet a Enhanced Intel SpeedStep.



Pri nečinnosti sa spotreba systémov s procesormi postavenými na mikroarchitektúre Bulldozer znížila ako spotreba podobných systémov s CPU rodiny Phenom II. Moderné systémy Intel LGA1155 však v nečinnom režime spotrebujú podstatne menej.



V prípade, že je výpočtová záťaž jednovláknová, spotreba systémov Socket AM3+ prudko stúpa, samozrejme kvôli vysokej agresivite technológie Turbo Core. So systémami postavenými na procesory Intel, to sa nedodržiava a opäť sa môžu pochváliť výrazne vyššou energetickou účinnosťou.



Pri plnom viacvláknovom zaťažení sa situácia príliš nelíši. Je to len systém s procesorom LGA1366 Core i7-990X, ktorý „postúpil dopredu“. Inak je všetko ako predtým. Pokiaľ ide o spotrebu energie, FX-8150 sa nemôže pochváliť žiadnym zvláštnym úspechom. Začal spotrebovávať o niečo menej ako Phenom II X6 1100T, ale procesory Sandy Bridge sú aspoň jeden a pol krát hospodárnejšie.

AMD využilo všetku energetickú účinnosť získanú zavedením novej mikroarchitektúry na zvýšenie taktovacích frekvencií. A v dôsledku toho žiadne nevidíme nová úroveň efektívnosť, ani zásadne lepší výkon. V súlade s tým, pokiaľ ide o výkon na watt, je Bulldozer, rovnako ako jeho predchodcovia, vážne horší ako konkurenčné mikroarchitektúry od spoločnosti Intel.

Pre informáciu uvádzame spotrebu pri plnej záťaži, meranú samostatne v napájacích obvodoch procesora a základnej dosky.






„Čistá“ spotreba osemjadrového FX-8150 prevyšuje spotrebu Procesory Sandy Most približne dvakrát. Vzhľadom na to, že oba procesory sa vyrábajú pomocou rovnakého technologického procesu a majú podobné napätie jadra, stáva sa neuveriteľne zaujímavým, čo AMD myslelo, keď hovorilo o energetickej účinnosti svojej mikroarchitektúry Bulldozer.

Pretaktovanie

Platforma Socket AM3+ a procesory série FX sú pôvodne umiestnené ako overclockery. Svedčí o tom ako kompletné odomknutie všetkých násobičov, tak aj experimenty uskutočnené pod záštitou AMD, v ktorých bol vytvorený svetový rekord v pretaktovaní pomocou jedného z procesorov FX-8150. Sľubne vyzerajú aj vyhlásenia spoločnosti, že nová mikroarchitektúra je optimalizovaná pre prevádzku na vysokých taktovacích frekvenciách. Naozaj dostaneme nový zázrak pretaktovania od AMD? Skontrolujme to.

Pretaktovanie akýchkoľvek FX procesorov je veľmi jednoduché, nie nadarmo je na ich logu napísané „Unlocked“. Frekvencia procesora môže byť zmenená multiplikátorom buď cez BIOS Setup alebo pomocou špecializovaných utilít poskytovaných ako AMD samotnou (Overdrive Utility), tak aj výrobcami základných dosiek. Podobne v systémoch Socket AM3+ môžete pretaktovať northbridge a pamäť zabudovanú v procesore.

Počas testovania sa nám podarilo dosiahnuť stabilnú prevádzku nášho FX-8150 na frekvencii 4,6 GHz. Pre zabezpečenie stability v tomto stave bolo potrebné zvýšiť napájacie napätie procesora na 1,475 V a navyše bolo potrebné povoliť funkciu Load-Line Calibration. Počas testov stability teplota procesora pracujúceho na tejto frekvencii nepresiahla 85 stupňov podľa snímača zásuvky alebo 75 stupňov podľa snímača zabudovaného v procesore. Na odvádzanie tepla pripomíname, že bol použitý účinný vzduchový chladič NZXT Havik 140.



Upozorňujeme, že zároveň sme sa pokúsili pretaktovať severný most zabudovaný v CPU, pretože zvýšenie jeho frekvencie má pozitívny vplyv na rýchlosť vyrovnávacej pamäte tretej úrovne a pamäťového radiča. Žiaľ, výrazné pretaktovanie tohto procesorového uzla narazilo na neviditeľnú bariéru a frekvenciu nad 2,4 GHz nedokázal dosiahnuť, aj keď sme sa súčasne pokúšali zvýšiť jeho napájacie napätie.

V každom prípade je pretaktovanie FX-8150 na 4,6 GHz dobrý výsledok, najmä ak vezmeme do úvahy fakt, že procesory AMD z rodiny Phenom II boli zriedkavo pretaktované na vzduchu nad 4,0 GHz. Inými slovami, mikroarchitektúra Bulldozer v skutočnosti umožnila mierne posunúť frekvenčnú hranicu vyššie.

Pretaktovanie FX procesorov však treba porovnávať v prvom rade nie so starým Phenom II, ale s konkurenčnými procesormi Core i5 a Core i7 pre systémy LGA1155. Ale jednoznačne nezrýchľujú o nič horšie. Napríklad celkom typické pretaktovanie pre Core i5-2500K so zvýšením napätia o 0,15 V nad nominálnu hodnotu a pri použití vzduchového chladiča je 4,7 GHz. A na tomto pozadí sa výsledok FX-8150 už nezdá byť taký brilantný.

Dojem z pretaktovania Zambezi sa ešte viac zhorší, ak porovnáme výkon pretaktovaného FX-8150 a pretaktovaného Core i5-2500K (v zátvorkách je uvedený nárast výkonu oproti nominálnemu režimu):



Vo všeobecnosti pretaktovanie nemení kvalitu výsledkov. Ale tam, kde bol FX-8150 rýchlejší v nominálnom režime, sa rozdiel zmenšil. A tam, kde bol Core i5-2500 na čele, si upevnil svoju výhodu. Nie je to prekvapujúce: frekvencia FX-8150 pri pretaktovaní sa zvýšila o 28%, zatiaľ čo zvýšenie frekvencie Core i5-2500K bolo 42%. A vo všeobecnosti, ako sa dá posúdiť podľa veľkosti nárastu výkonu z pretaktovania, mikroarchitektúra Sandy Bridge citlivejšie reaguje na zvyšujúce sa frekvencie. Inými slovami, aj keď vezmeme do úvahy pretaktovanie, procesory s mikroarchitektúrou Bulldozer, hoci sa pretaktujú celkom dobre, nevyzerajú silnejšie ako konkurenti Intelu.

závery

Úspech alebo neúspech? Určite mnohí z vás chcú na konci článku vidieť jasný verdikt. Všetko je však v tomto prípade veľmi nejednoznačné a AMD svojim Bulldozérom postavilo recenzentov do veľmi ťažkej pozície.

Faktom je, že AMD preukázalo úplne neštandardný prístup k vývoju mikroarchitektúry. Vzhľadom na to, že výkon procesora pozostáva z troch komponentov: počtu inštrukcií vykonaných v jadre procesora za takt, frekvencie a počtu jadier, posunuli vývojári svoje priority na počet jadier. Zároveň sa znížil špecifický výkon jednotlivých jadier, no výsledný dizajn otvoril cestu k vytvoreniu lacných osemjadrových alebo aj zložitejších procesorov. Toto je veľmi silný krok pre trh serverov, kde sa viacvláknové zaťaženie a procesory veľké množstvo jadrá sú veľmi žiadané. Je teda veľmi pravdepodobné, že nová mikroarchitektúra Bulldozer umožní AMD výrazne zlepšiť svoju pozíciu na trhu výkonných serverov.

Dnes sme sa však zoznámili s procesorom FX, postaveným na tejto mikroarchitektúre, ale zameraným na stolné počítače. A tu sa naplno prejavil rozpor medzi hardvérovými schopnosťami Bulldozer a typickým pracovným zaťažením pracovnej plochy. Je obzvlášť sklamaním, že marketingová kampaň bola štruktúrovaná takým spôsobom, že mnohí verili v Bulldozer ako vychádzajúcu hviezdu na trhu so stolnými počítačmi. Tieto nádeje však neboli predurčené naplniť sa.


Procesory FX, ktoré sú založené na mikroarchitektúre Bulldozer, dokázali svoje prednosti preukázať len v malej podskupine úloh, ktoré riešili bežní používatelia. Medzi typickými bežnými aplikáciami nie je veľa príkladov, ktoré generujú jednoduché celočíselné viacvláknové pracovné zaťaženie a vysoký výkon Bulldozeru sa odhalí iba v tomto prípade. Výsledkom bolo, že Bulldozer sa v niektorých prípadoch ukázal byť nielen pomalší ako konkurenčné riešenia od Intelu, ale dokonca ešte horší ako procesor Phenom II X6, postavený na mikroarchitektúre predchádzajúcej generácie. A to znamená, že AMD nedokázalo vyrobiť revolučný desktopový procesor.

V skutočnosti je FX len ďalším Phenomom, ktorý sa zdá byť sám o sebe celkom dobrý, najmä v porovnaní s jeho predchodcami. FX procesory sú vo všeobecnosti rýchlejšie ako Phenom II, výrazne lepšie sa pretaktujú a majú o niečo nižšiu spotrebu, takže ich možno považovať za dobrú náhradu za nosiče zastaranej mikroarchitektúry K10.

Pripomeňme však, že AMD je vo vojne nielen sama so sebou, ale aj sama so sebou od spoločnosti Intel. Preto sme stále nútení vysloviť sklamaný záver, že procesory FX majú skutočný zmysel iba v tých stolných počítačoch, ktoré sú zamerané na spracovanie videa a transkódovanie. V iných prípadoch v porovnaní s procesormi Sandy Bridge ich výkon málokedy vyzerá povzbudivo. To isté možno povedať o spotrebe energie a pretaktovaní. Samostatne je potrebné dodať, že procesory AMD FX sa podľa očakávania ukázali ako zlá voľba pre herné systémy, pretože moderné 3D hry prakticky nepoužívajú skutočne viacvláknové algoritmy. Fanúšikovia produktov AMD si s tým však zrejme potrpia, vzhľadom na to, že počet snímok za sekundu v hrách často obmedzuje grafika, nie procesor.

Inými slovami, trhové vyhliadky procesorov FX budú závisieť od dvoch faktorov: aká veľká je armáda prívržencov AMD; a na tom, ako šikovne bude výrobca riadiť cenovú páku. Jednoznačne sa však neočakáva, že by sa stolné procesory s mikroarchitektúrou Bulldozer stali všeobecne populárnymi.

AMD si málokedy dopraje čerstvé architektúry procesorov. Ak Intel aktualizuje štruktúru každé dva roky, konkurent to naposledy zaznamenal v roku 2007 a vydal K10, prepracovanú verziu starého K8. Takže objavenie sa nového buldozéra je významnou udalosťou. Na niekoľko nasledujúcich rokov sa architektúra stane základom pre všetky kryštály AMD, ako aj prvou šancou po dlhom čase súťažiť s Intelom v pretekoch o výkon.

Ideme ako pár

Vytvorením Bulldozeru inžinieri AMD opustili osvedčenú stratégiu zlepšovania a čiastočného kopírovania starého vývoja. Štruktúra kameňov sa zásadne líši od toho, čo sme zvyknutí vidieť v systémoch x86.

Prvou a najdôležitejšou novinkou je pôvodné usporiadanie. Všetky špičkové verzie Bulldozer sú oficiálne vybavené ôsmimi jadrami. V skutočnosti však existujú štyri plnohodnotné moduly, akurát každý má dve výpočtové jednotky. Vyzerá to takto: dva celočíselné aritmetické klastre (nazývajú sa jadrá a sú priamo zodpovedné za výpočty) zdieľajú front-end, klaster s pohyblivou rádovou čiarkou (FPU) a vyrovnávaciu pamäť druhej úrovne zväčšenú na 2 MB.

Prínosom takéhoto tandemu je úspora miesta, zníženie spotreby energie a výrobných nákladov. Nevýhoda – zdieľanie rovnakých zostáv má zlý vplyv na výsledný výkon. Pri veľkom zaťažení si jeden Front-End nemusí poradiť s dvomi jadrami. AMD stratu výkonu nepopiera: dvojka je podľa nej asi o 20 % slabšia ako plnohodnotný dvojjadrový procesor.

Komunikačné ťažkosti

Na odstránenie úzkeho miesta sa Front-End musel naučiť, ako efektívne zdieľať zdroje medzi dvoma jadrami. Aby sa to dosiahlo, bola prepracovaná jednotka predikcie vetvy a príkazový dekodér, ktorý dostal štvrtý kanál na spracovanie inštrukcií (ako v Sandy Bridge) a technológiu. Fúzia pobočiek. Ten vám umožňuje zlepiť časť pokynov do jednej operácie. To všetko by malo urýchliť prácu Front-Endu a zabrániť nečinnosti kryštálu.

Čo sa týka samotných jadier, ide o sadu Out-of-Order, load/unload, L1 cache a dva výpočtové klastre. Jednotka vykonávania mimo poradia má teraz fyzický register súborov. Rovnako ako v Sandy Bridge sa do neho vkladajú adresy na ukladanie pracovných údajov, čo vám umožňuje uvoľniť hlavný kanál mimo prevádzky. Procesor na nakladanie/vykladanie dostal zvýšenú vyrovnávaciu pamäť, zdvojnásobenú kapacitu a schopnosť pracovať virtuálne adresy, čo by teoreticky malo zvýšiť rýchlosť práce s vyrovnávacou pamäťou L1. Ten v Bulldozéri sa štyrikrát zmenšil: 16 oproti 64 KB v K10. Strata bola kompenzovaná rýchlosťou práce. Asociativita L1 sa zvýšila z dvoch na štyri kanály, čo znamená dvojnásobok O vyššiu efektivitu vyhľadávania.

V jednom module sú tri výpočtové klastre: dva celočíselné a jeden na prácu s údajmi s pohyblivou rádovou čiarkou. V porovnaní s K10 stratila prvá dvojica jednu ALU (zaoberala sa výpočtami) a AGU (zaoberala sa pamäťovými adresami). Teoreticky to znamená znížený špičkový výkon. V praxi bude zmena prakticky nepostrehnuteľná: je ťažké plne načítať celočíselné klastre.

Hlavné zmeny sa dotkli FPU, ktorá je zodpovedná za zložité výpočty s pohyblivou rádovou čiarkou. V K10 sa stal oveľa výkonnejším: dostal pár MMX a 128-bitových FMAC zariadení na vykonávanie operácií sčítania a násobenia. Na rozdiel od K10 boli FMAC univerzálne: môžu sa navzájom nahradiť, čo má pozitívny vplyv na rýchlosť výpočtu. Navyše sa naučili kombinovať operácie do jedného výrazu, čo zvýšilo presnosť výpočtov.

Okrem toho FPU dostal aktualizovaný súbor pokynov. Po prvé, procesor teraz spolupracuje s AVX, ktorý podporuje 256-bitové registre. Pre ich výpočty, ako v Sandy Bridge, sa kombinujú dva FMAC. Po druhé, buldozér môže pracovať s inštrukciami SSE 4.2, AENSI, FMA4 a XOP. Posledné dve sady sú jedinečné pre AMD. Pre vás a pre mňa všetky tieto zmeny znamenajú iba jednu vec – príkazy, ktoré boli predtým zadané v niekoľkých hodinových cykloch, sa teraz budú počítať v jednom, čo priamo ovplyvňuje výkon. Je pravda, že na zvýšenie rýchlosti je potrebná podpora pokynov zo softvéru.

Lepidlo a nožnice

Výsledkom je, že každý modul Bulldozer pozostáva z jedného front-endu, vyrovnávacej pamäte údajov L2 a L1, dvoch celočíselných klastrov a bloku na prácu s číslami s pohyblivou rádovou čiarkou. Celkovo môže jeden kameň obsahovať až štyri takéto sady. Každý z nich má zároveň prístup k množstvu spoločných prvkov. Prvým je dvojkanálový pamäťový radič s podporou DDR3-1866 MHz. Druhou je vyrovnávacia pamäť L3, ktorej objem sa v porovnaní s K10 zvýšil zo 6 na 8 MB a asociativita - zo 48 na 64 kanálov. Všimnite si, že na rozdiel od Sandy Bridge sa frekvencia vyrovnávacej pamäte L3 nezhoduje s rýchlosťou jadier. Ak špičkový model pracuje na frekvencii 3,6 GHz, potom pamäte najnovšej úrovne sú na frekvencii 2,2 GHz. To vedie k viditeľným oneskoreniam, ktoré negatívne ovplyvňujú výkon. Podľa AMD bola táto obeta vykonaná v záujme stabilnej prevádzky na vysokých frekvenciách.

Tadam!

Napriek architektonickým trikom a 32nm procesnej technológii zaberá Bulldozer impozantných 315 metrov štvorcových. milimetrov. To je asi jeden a pol krát viac ako štvorjadrový Sandy Bridge a starší Llano. Spotreba sa našťastie udržala v rozumných medziach – 125 W.

Okrem osemjadrových modelov existujú verzie so šiestimi a štyrmi výpočtových jednotiek. Mladší bratia vychádzajú z rovnakého osemjadrového dizajnu, ale majú vypnutý jeden alebo dva moduly.

Základná frekvencia sa pohybuje od 3,1 do 3,6 GHz. Rovnako ako Sandy Bridge, aj Bulldozer má technológiu automatického pretaktovania. Špeciálny čip zodpovedný za Turbo Core 2.0, sleduje aktuálnu záťaž jadra a úroveň TDP a akonáhle sa naskytne príležitosť, zvýši frekvenciu procesora. V prípade špičkového kryštálu je možné pri použití všetkých modulov zvýšiť rýchlosť o 300 MHz. Ak sú niektoré zdroje nečinné - na 600 MHz. Pri nízkom zaťažení prejde buldozér do režimu úspory energie, za to je zodpovedná technológia Cool"n"Ticho.

Manuálne pretaktovanie je jednoduché. Po prvé, celý rad má odomknutý multiplikátor. Po druhé, nováčikovia dobre naberajú nadmorskú výšku: pod tekutým dusíkom starší Buldozér vytvoril nový svetový rekord - 8429 MHz.

Spoločníci

Buldozér beží na zásuvke AM3+. V podstate ide o mierne vylepšenú AM3 s jedným pinom navyše. Čipsety s novou päticou procesora sú tzv 990 FX, 990X A 970 . Líšia sa PCIe 2.0 radičom. Starší model je vybavený 32 líniami, mladší 16. Navyše 990FX a 990X podporujú CrossFireX. Medzi vlastnosti čipových súprav si všimneme šesť portov SATA Rev. 3 a 14 USB konektory 2.0. Nechýba ovládač USB 3.0.

Upozorňujeme, že buldozér môže fungovať aj na starších doskách. Všetko, čo potrebujete, je aktualizovaný systém BIOS. Obmedzenia: Turbo Core a Cool"n"Quiet majú zníženú rýchlosť odozvy a niektoré funkcie na úsporu energie nie sú dostupné.

Zaujímavou sa ukázala architektúra procesora Bulldozer. Konečne sa AMD prestalo kopírovať a prišlo s niečím skutočne novým. Bohužiaľ, existuje len málo jasných výhod oproti konkurentom. Nie je tam deklarovaných osem jadier. V dobrom slova zmysle tu máme štvorjadrové modely so zvýšeným počtom výpočtových jednotiek, niečo ako Intel Hyper-Threading, ale na hardvérovej úrovni. Myšlienka je to dobrá, ale výkon bude závisieť od rýchlosti front-endu. Medzi skutočné výhody Bulldozer patrí iba výkonný FPU pre výpočty s pohyblivou rádovou čiarkou a zvýšené prevádzkové frekvencie v porovnaní s K10.

Poďme to rozbaliť! Poďme to pochovať!

AMD oznámila plány na vydanie nasledujúcich radov procesorov. Spoločnosť očakáva, že bude architektúru aktualizovať ročne, pričom zakaždým dosiahne približne 15-percentné zvýšenie výkonu na watt. Ak sa AMD bude držať svojho plánu, architektúru uvidíme v roku 2012 Piledriver("koper"), o rok neskôr - Parný valec(“parný valec”) a rok 2014 sa bude spomínať na oznámenie Bager. Takto vyzerajú stavebné práce.

Nesprávne okná

Podľa AMD, Windows 7 nedokáže naplno využiť potenciál nového stvorenia: plánovač OS nezohľadňuje vlastnosti Bulldozeru. Napríklad pre nové procesory je dôležité, aby boli prepojené vlákna priradené jednému modulu, inak si jadrá nebudú vymieňať dáta cez rýchlu vyrovnávaciu pamäť L2, ale cez pamäť tretej úrovne. Niektoré rozdelené prúdy sú tiež lepšie spracované podobným spôsobom, aby sa zlepšila účinnosť Turbo Core 2.0. V rovnakom čase konkrétne úlohy vytvárajú väčšie zaťaženie bloku Front End a je lepšie ich rozptýliť do rôznych modulov. Vďaka spolupráci s Microsoft tieto nuansy sa zohľadnia v plánovači Windows 8. Nemali by ste však očakávať výrazný nárast výkonu.

Slovník

Integer Computing Cluster- zaoberá sa operáciami s celými číslami (1, 2, 10).

Front-End- blok predbežného načítania. Prijíma príkazy z programu a prekladá ich do jazyka zrozumiteľného pre procesor.

FPU- zhluk výpočtov údajov s pohyblivou rádovou čiarkou. Vykonáva výpočty so zlomkovými číslami (1,2345) a veľkými hodnotami s mocninami (1,2345E-10).

Blok predikcie vetvy- vopred predpovedá, aké údaje a operácie môže program potrebovať v nasledujúcom okamihu. Neumožňuje nečinnosti procesora.

Príkazový dekodér- rozdelí program na mikrooperácie, ktoré potom využívajú výpočtové klastre.

Mimo prevádzky- blok mimoriadnej exekúcie. Zaoberal sa distribúciou akcií medzi jadrami. Odošle na výpočet len ​​tie príkazy, pre ktoré existujú údaje.

Načítať/vyložiť blok (LSU) - sleduje pohyb dát medzi výstupom z dopravníka a vyrovnávacou pamäťou L1.

Asociatívnosť vyrovnávacej pamäte- prepojenie riadkov a stĺpcov vyrovnávacej pamäte. Čím vyššia je asociativita, tým nižšia je rýchlosť vyhľadávania, no tým vyššia je jeho účinnosť.

MMX- sada blokov na prácu s číslami do 8 bajtov.

Inštrukčné sady- umožňujú jednému príkazu vykonať operáciu s niekoľkými údajmi.

stôl 1

Špecifikácie procesorov AMD Bulldozer

Počet výpočtových jadier

Základná frekvencia

Frekvencia jadra Turbo

Podpora pamäte

Spotreba energie

Technický proces

Cena od novembra 2011

neznámy

Čo tvorí výkon procesora? Predtým sa používal vzorec, ktorý popisoval výkon ako súčin počtu inštrukcií vykonaných za cyklus hodín a frekvencie, s ktorou tento procesor pracuje. Teraz sa v tomto vzorci objavil tretí faktor – počet výpočtových jadier. Vývojár procesorov, ktorý chce vydať rýchly produkt, má preto niekoľko možností, ako to urobiť.

Nie všetko je však také jednoduché. Zvýšenie počtu inštrukcií vykonaných výpočtovým jadrom za hodinový cyklus je pomerne náročná úloha. Klasický x86 programový kód zahŕňa sekvenčné vykonávanie inštrukcií, a preto, aby sa dosiahlo ich paralelné spracovanie, musí byť procesor vybavený vysoko efektívnymi jednotkami na predikciu vetiev a preskupovanie inštrukcií, ktorých implementácia si vyžaduje značné inžinierske úsilie. Komplikácia mikroarchitektúry zároveň ovplyvňuje fyzické rozmery kryštálu a vedie k obmedzeniam pri zvyšovaní počtu jadier. Ak sa teda výrobca chystá vyrobiť procesor s veľkým počtom jadier, potom by sa mikroarchitektúra mala naopak snažiť zjednodušiť. Nie je to ľahké s frekvencia hodín. Stávka na jeho rast bude opäť vyžadovať vykonanie zmien vo vnútorných blokoch procesora a predĺženie jeho vykonávacieho potrubia. Výsledok je nasledujúci: na to, aby procesor získal medailu za výkon, musia jeho vývojári tvrdo pracovať na súčasnej optimalizácii množstva parametrov.

Problém spočíva aj v tom, že ktorýkoľvek zo zvolených spôsobov zlepšenia výkonu procesora môže byť úspešný len v špeciálnych prípadoch. Nie všetky programy dokážu efektívne pracovať s veľkým počtom jadier. Niektoré algoritmy vám neumožňujú správne predpovedať prechody a meniť poradie pokynov. A v niektorých prípadoch sa výkon nezvýši ani so zvýšením taktovacej frekvencie, pretože v systéme sú nejaké ďalšie úzke miesta.

Nájsť optimálnu rovnováhu nie je jednoduché a čo sa považuje za optimálne kritérium? Môžeme len porovnať výkon procesorov v konečnom počte programov a vybrať ten najrýchlejší pre daný konkrétny prípad. To však vôbec nezaručuje, že pri použití inej sady testovacích nástrojov nezískame úplne opačné odhady. Takýto zdĺhavý úvod je tu preto, lebo sa dnes zoznámime s novou sériou procesorov AMD FX - vlajkovým produktom AMD, všeobecne známym pod kódovým označením Zambezi. Tento procesor je založený na veľmi kontroverznej mikroarchitektúre Bulldozer, ktorá už stihla nazbierať značnú kyticu nelichotivých recenzií. Nejde však o to, že táto mikroarchitektúra je úplne zlá. Pri výbere najlepšej rovnováhy charakteristík vývojári nesprávne vyhodnotili potreby väčšiny používateľov a hlavný dôraz kládli na nesprávny faktor v „základnom vzorci“. V dôsledku toho sa počiatočný plán vydať vysokovýkonné riešenie novej generácie pokazil a prívrženci AMD, zaujatí prísľubmi prelomu, dostali niečo úplne iné, ako očakávali. Je to však vážny a objektívny dôvod na sklamanie? Budeme o tom hovoriť v tomto materiáli.

⇡ Počítanie jadier: osem alebo štyri?

Pri práci na novom dizajne výkonných procesorov sa AMD rozhodlo uprednostniť počet výpočtových jadier. Ide o úplne logickú voľbu, ktorá vychádza z faktu, že v priebehu rokov pribúda viacvláknového softvéru a vývoj mikroarchitektúry určenej na mnoho rokov vývoja by mal primárne zohľadňovať nie aktuálny stav trhu, ale pozorované trendy. Osem jadier poskytnutých v základnej verzii nového procesora je to, čo sa AMD chystalo dobyť trh, kde boli doteraz prezentované iba čipy, pričom maximálny počet jadier bol obmedzený na šesť. ( Tu hovoríme len o stolných počítačoch. — približne. vyd. )

Zároveň vývojári nechceli vziať jadrá starej mikroarchitektúry K10. Nielenže sú príliš veľké fyzická veľkosť, ale tiež, ako môže posúdiť Llano, nie sú náchylné na prevádzku na vysokých taktovacích frekvenciách ani po prechode na modernú 32 nm technológiu. Navyše nepodporujú mnohé moderné funkcie, ako napríklad inštrukcie AVX. Preto na zostavenie osemjadrových procesorov AMD vyrobilo novú mikroarchitektúru - Bulldozer. Zástupcovia spoločnosti radšej hovoria, že jej vývoj bol vykonaný od nuly, ale v skutočnosti v jadrách Bulldozer nájdete veľa odkazov na inú mikroarchitektúru predstavenú tento rok - Bobcat, zameranú na použitie v kompaktných a energeticky úsporných zariadeniach. Vzťah medzi Bulldozerom a Bobcatom je však dosť vzdialený a uvádzame ho len preto, aby bola jasná všeobecná myšlienka – Bulldozer v sebe spája mnoho relatívne jednoduchých jadier.

Zároveň nehovoríme o primitívnej kombinácii ôsmich jednoduchých jadier na jednom polovodičovom čipe. V tejto situácii by mal výsledný procesor veľmi nízky jednovláknový výkon a to by sa stalo dosť vážnym problémom, keďže programov, ktoré nerozdelia záťaž do viacerých výpočtových vlákien, nie je až tak málo. Preto boli v prvom rade jadrá optimalizované na prevádzku pri vysokých taktoch. A po druhé, boli spárované do dvojjadrových modulov schopných zdieľať svoje zdroje, aby slúžili jednému vláknu. Výsledkom je pomerne zaujímavý dizajn: vstupná časť vykonávacieho potrubia takéhoto dvojjadrového modulu je spoločná a ďalšie spracovanie inštrukcií je rozdelené medzi dve sady vykonávacích zariadení.

Základom konštrukcie buldozéra je to, čo sa bežne nazýva dvojjadrový modul

Pripomeňme, že proces spracovania údajov v moderný procesor zahŕňa niekoľko etáp: načítanie x86 inštrukcií z vyrovnávacej pamäte, ich dekódovanie - ich preloženie do interných makrooperácií, vykonávanie, zaznamenávanie výsledkov. Prvé dva stupne v module Bulldozér sa vykonávajú pre pár jadier spoločne a potom pre celočíselné inštrukcie je vykonávanie rozdelené medzi dve jadrá klastra alebo v prípade skutočnej aritmetiky sa vykonáva v bloku operácií s pohyblivou rádovou čiarkou. spoločné pre dve jadrá.

Moduly buldozéra sú navrhnuté tak, aby spracovali štyri inštrukcie za cyklus hodín a vďaka technológii zlučovania makier môže procesor považovať niektoré páry x86 inštrukcií za jednu operáciu. To znamená, že vo všeobecnosti je dvojjadrový modul Bulldozer výkonovo podobný jednému jadru moderných procesorov Intel, ktoré dokáže spracovať aj štyri inštrukcie za takt a podporuje aj zlučovanie makier.

Medzi modulom Bulldozer a jadrom Sandy Bridge sú však značné rozdiely, ktoré môžu spochybniť ich približne rovnakú teoretickú rýchlosť. Vďaka tomu, že modul nových procesorov AMD obsahuje zvyšky dvoch rovnakých jadier, dokáže maximálny výkon predviesť len pri spracovaní dvojice vlákien. Ak nesie jednovláknovú záťaž, rýchlosť jej služby bude obmedzená počtom spúšťacích zariadení v rámci jedného takéhoto klastra. A nie je ich tak veľa, vzhľadom na túžbu AMD zjednodušiť jednotlivé jadrá - jeden a pol krát menej ako v procesoroch s mikroarchitektúrou Sandy Bridge alebo K10. To znamená dve aritmetické ALU a dve adresné AGU.

Takto vyzerá funkčná štruktúra modulu postaveného na mikroarchitektúre Bulldozer. Z dvoch jadier zostali iba dve sady celočíselných ovládačov

Blok operácií s pohyblivou rádovou čiarkou spoločný pre modul procesora je tiež relatívne málo zložitý. Obsahuje dve 128-bitové vykonávacie jednotky FMAC, ktoré je možné spojiť do jednej jednotky na spracovanie 256-bitových inštrukcií. Zdalo by sa, že aktuátorov tu nie je až tak veľa, najmä vzhľadom na to, že sú rozdelené do dvojice jadier. Ale sú univerzálnejšie ako v predchádzajúcich a konkurenčných mikroarchitektúrach, ktoré používajú samostatné multiplikátory a sčítačky. A vďaka tomu v určitých prípadoch pri práci s reálnymi číslami dokáže dvojjadrový modul Bulldozer poskytnúť porovnateľné a ešte viac vysoký výkon než napríklad jedno jadro Sandy Bridge.

Podobná myšlienka kombinácie 128-bitových zariadení na prácu s 256-bitovými inštrukciami sa používa v Sandy Bridge

Modul Bulldozer by však mal ukázať svoje najväčšie prednosti pri dvojvláknovej záťaži. Jedno jadro Sandy Bridge je schopné spracovať aj dve výpočtové vlákna, na to má technológiu Hyper-Threading. Všetky inštrukcie sa však posielajú do jednej sady akčných členov, čo v praxi spôsobuje početné kolízie. Modul Bulldozer obsahuje dva nezávislé celočíselné klastre, ktoré dokážu paralelne spúšťať vlákna a celkový počet spúšťacích zariadení v nich jedenapolkrát prevyšuje počet takýchto zariadení v jadre Sandy Bridge.

Vľavo je modul Bulldozer, vpravo nejaké konkurenčné jadro s podporou Hyper-Threadingu. V skutočnosti to nevyzerá ako Sandy Bridge, ale ilustrácia vyjadruje podstatu problému

Výsledkom je, že modul Bulldozer má vyšší špičkový výkon ako jadro Sandy Bridge, ale tento výkon je o niečo ťažšie odblokovať. Jadro Sandy Bridge inteligentne načítava svoje vlastné zdroje vďaka pokročilej logike na čipe, ktorá nezávisle analyzuje jednovláknový kód a paralelne ho spúšťa na celej sade vykonávacích zariadení. V buldozéri sa úloha efektívneho používania ovládačov čiastočne presúva na programátora, ktorý musí rozdeliť svoj kód na dve vlákna - úplné stiahnutie všetkých kapacít modulov bude možné len vtedy.

A to je typické. Pri zvažovaní dvojjadrového procesorového modulu Bulldozer sme ho neustále porovnávali s jedným jadrom Sandy Bridge a zároveň sme dokázali kresliť celkom korektné paralely. To nás núti zaujímať sa: nemala by sa „osemjadrová“ povaha novej mikroarchitektúry považovať za produkt predstavivosti obchodníkov? AMD hovorí, že jadrá by sa mali počítať podľa počtu celočíselných klastrov, pričom tvrdí, že modul môže poskytnúť až 80 % výkonu dvoch nezávislých jadier. Netreba však zabúdať, že jadrá, na ktorých je Bulldozer založený, sú podstatne jednoduchšie ako jadrá iných procesorov. Preto je počet dvojjadrových modulov charakteristikou, ktorá oveľa adekvátnejšie odráža výkon Bulldozéra.

Nájdite maximálny počet procesorových jadier a zamestnajte sa v marketingovom oddelení AMD

⇡ Vyrovnávacia pamäť

Organizácia vyrovnávacej pamäte v procesoroch Bulldozer nie je „viazaná“ ani tak na jednotlivé jadrá, ale na dvojjadrové moduly. V skutočnosti má každé jadro pridelenú iba svoju vlastnú vyrovnávaciu pamäť údajov prvej úrovne; všetky ostatné úrovne vyrovnávacej pamäte sa vzťahujú buď na modul ako celok, alebo na procesor:

  • Každé jadro má svoju vlastnú vyrovnávaciu pamäť L1 pre dáta. Jeho objem je 16 KB a architektúra predpokladá prítomnosť štyroch asociatívnych kanálov. Táto vyrovnávacia pamäť pracuje s algoritmom zápisu, čo znamená, že je inkluzívna.
  • Cache prvej úrovne pre inštrukcie je poskytovaná v jednej kópii pre každý dvojprocesorový modul. Jeho objem je 64 KB a počet asociatívnych kanálov je dva.
  • Cache druhej úrovne je tiež implementovaná v jednej inštancii na modul. Jeho veľkosť je pôsobivých 2 MB, asociativita je 16 kanálov a prevádzkový algoritmus je exkluzívny.
  • Osemjadrový procesor ako celok má navyše 8-megabajtovú vyrovnávaciu pamäť L3 so 64-kanálovou asociativitou. Zvláštnosťou tejto cache je, že pracuje na podstatne nižšej frekvencii v porovnaní so samotným procesorom, čo je asi 2 GHz.

Nasledujúca tabuľka popisuje pomer objemov vyrovnávacej pamäte pre osemjadrové procesory Bulldozer, štvorjadrové procesory Sandy Bridge a Thuban (šesťjadrový Phenom II X6, postavený na mikroarchitektúre K10).

Typ vyrovnávacej pamäte Buldozér (8 jadier/4 moduly) Sandy Bridge (4 jadrá) Thuban (6 jadier)
L1I (návod) 4 x 64 kB 4 x 32 kB 6 x 64 kB
L1D (dáta) 8 x 16 kB 4 x 32 kB 6 x 64 kB
L2 4 x 2 MB 4 x 256 kB 6 x 512 kB
L3 8 MB, 2,0-2,2 GHz 8 MB, beží rýchlosťou procesora 6 MB, 2,0 GHz

Ako môžete vidieť z tabuľky, AMD stavilo na priestranné vyrovnávacie pamäte vyššej úrovne, ktoré môžu byť skutočne užitočné v prípade vážnej viacvláknovej záťaže. Vyrovnávacia pamäť v nových procesoroch je však vo všeobecnosti pomalšia ako u predchádzajúcich a konkurenčných produktov. To sa dá ľahko zistiť pri meraní praktickej latencie.

Veľké oneskorenia pri prístupe k údajom v Bulldozéri môžu byť kompenzované iba vysokou rýchlosťou hodín týchto CPU. S čím sa však pôvodne počítalo – vo frekvenciách mali nové osemjadrové procesory prekonať Phenom II o 30 %. AMD však nikdy nebola schopná navrhnúť polovodičové kryštály schopné stabilne pracovať pri takých vysokých frekvenciách. V dôsledku toho môže vysoká latencia vyrovnávacej pamäte spôsobiť značné poškodenie systémov založených na buldozéroch.