AMD Bulldozer je najnovejša generacija procesorjev AMD. Kdo je sistemski skrbnik?

AMD se je odločil za popolnoma drugačen pristop za novo arhitekturo Bulldozer. Odločeno je bilo ustvariti dvojedrne module, ki si delijo nekatere vire (predpomnilnik L2, modul s plavajočo vejico), vendar niso popolnoma neodvisni drug od drugega. (glej sliko spodaj)
Po mnenju AMD je bilo to storjeno z namenom optimizacije procesorja in hkrati znižanja cene procesorja. Optimizacija je v tem, da so na običajnih večjedrnih procesorjih nekateri moduli lahko v stanju mirovanja in takšne module je mogoče združiti v arhitekturo Bulldozer. In če je modulov manj, bo porabljenega manj materiala, kar bo pozitivno vplivalo na stroške, prihranek energije in zmanjšanje toplote.
Čeprav bo torej AMD svoje nove procesorje Bulldozer imenoval dvojedrni, ti v resnici ne bodo zares dvojedrni, saj ne bodo imeli povsem neodvisnih jeder. In ime " dvojedrni procesor» bodo uporabljeni v marketinške namene.

Za ustvarjanje " štirijedrni procesorji", AMD uporablja dve od teh enot, tako da ima procesor dejansko dva "procesorja" znotraj (dva gradnika sta prikazana na spodnji sliki) namesto štirih. AMD bo nove procesorje še naprej imenoval štirijedrni.


Osemjedrni procesor, ki temelji na arhitekturi Bulldozer.

Zdaj pa si podrobneje oglejmo modula Fetch in Decode, ki se uporabljata v arhitekturi Bulldozer.

Moduli Fetch in Decode

Modul Fetch skrbi za pridobivanje navodil za dekodiranje iz predpomnilnika oz pomnilnik z naključnim dostopom.

Moduli Fetch in Decode.

Kot smo že omenili, moduli za vzorčenje uporabljajo dve "jedri" hkrati. Predpomnilnik ukazov L1 uporabljata tudi dve jedri hkrati, vendar ima vsako jedro procesorja svoj podatkovni predpomnilnik L1.
AMD je že napovedal, da je predpomnilnik ukazov L1, ki se uporablja v arhitekturi Bulldozer, sestavljen iz 64 KB dvosmernega nastavljenega asociativnega predpomnilnika. Ista konfiguracija se uporablja v procesorjih z arhitekturo AMD64, vendar je razlika v tem, da imajo procesorji AMD64 predpomnilnik L1 na jedro, medtem ko bodo procesorji Bulldozer imeli en predpomnilnik L1 na par jeder. Podatkovni predpomnilnik pa bo imel le 16 KB, kar je bistveno manj od 64 KB na jedro, ki se uporablja v procesorjih, ki temeljijo na arhitekturi AMD64.

TLB-ji (Translation Look-aside Buffer- ultra hitri pomnilniški medpomnilnik). Razkrite so bile velikosti TLB-jev. To so medpomnilniki z majhno količino pomnilnika, namenjeni pretvorbi naslovov navideznega pomnilnika v fizične naslove.
Navidezni pomnilnik, bolj znan kot podstranska datoteka, je tehnologija, pri kateri se količina RAM-a "poveča" s posebno datoteko na trdem disku.

Računalniški programi so napisani z uporabo navodil x86, vendar trenutno procesorji razumejo samo izvorna navodila RISC. Modul za dekodiranje je odgovoren za pretvorbo programskih navodil x86 v mikroinstrukcije RISC. Arhitektura Bulldozer ima štiri dekoderje, vendar ta trenutek AMD ne razkriva, katera navodila izvaja posamezen dekoder. Običajno eden od teh dekodirnikov izvaja zapletena, zapletena navodila z uporabo priložene mikrokode ROM (»µcode« ali »microcode«). Dekodiranje kompleksnih ukazov je končano po nekaj taktih, nato pa se pretvorijo v več mikroinstrukcij. Običajno proizvajalci optimizirajo svoje procesorje tako, da se pri dekodiranju najpogostejših navodil izvedejo v samo enem taktu.

Uvod Ni dvoma, da so novi AMD-jevi procesorji, ki temeljijo na mikroarhitekturi Bulldozer, med najbolj pričakovanimi izdelki ne le letošnjega, ampak vsaj tekočega petletja. Razlogov za to je več, pa tudi za obstoj ogromne vojske oboževalcev izdelkov AMD. Nekateri imajo sveže spomine na čase, ko so bili procesorji tega podjetja v vseh pogledih boljši od Intelovih. Nekateri imajo radi izdelke AMD zaradi uravnotežene kombinacije cene in zmogljivosti. Nekateri so bili navdušeni nad AMD-jevimi čustvenimi zgodbami o prednostih mikroarhitekture, ki se razvija v podjetju. Vse to je prispevalo k večletnim dolgočasnim čakanjem na izid procesorjev generacije Bulldozer in tukaj je rezultat - ta članek berete z veliko pozornostjo in neprikritim zanimanjem.

Vendar je očitno vredno. Razmere na trgu procesorjev v naslednjih nekaj letih so odvisne od tega, kako uspešna se bo izkazala mikroarhitektura Bulldozer. Navsezadnje ima le Intel inženirske in proizvodne vire za uvedbo novih mikroarhitekturnih rešitev vsaki dve do tri leta. AMD se je prisiljen držati veliko bolj umirjenega tempa razvoja. Grozljivo se je spominjati, toda mikroarhitektura, ki se uporablja v današnjih procesorjih Phenom II in Athlon II, sega v leto 1999 in od takrat jo AMD le kozmetično spreminja. Zato si ne delamo posebnih utvar, da se bo razvojni cikel z izidom Buldožerja nenadoma aktiviral. Očitno je, da bo Bulldozer v naslednjih nekaj letih jedro AMD-jeve ponudbe zmogljivosti.

Vklopljeno trenutna verzija Načrti podjetja za razvoj te mikroarhitekture so začrtani do leta 2014, a se bodo skoraj zagotovo nadaljevali še naprej.

Dejstvo, da AMD obljublja 10-15-odstotno povečanje zmogljivosti vsako leto, je bolj alarmanten simptom kot spodbuden. Najverjetneje bo takšno povečanje zagotovljeno predvsem s povečanjem taktnih frekvenc in šele nato z nekaterimi novimi mikroarhitekturnimi izboljšavami.

Z drugimi besedami, uspeh mikroarhitekture Bulldozer v sedanji obliki bo odločilno vplival na prihodnji položaj AMD, na konkurenčnost njegovih izdelkov in navsezadnje na celotno situacijo na trgu procesorjev.

Seveda ni mogoče zanikati, da Bulldozer za AMD ni edini ključni izdelek. Ta mikroarhitektura je danes namenjena segmentu visoko zmogljivih namizij in strežnikov. Hkrati ima AMD druge predloge za druge tržne segmente. Na primer, poceni, stroškovno učinkoviti procesorji z mikroarhitekturo Bobcat ali APU družine Llano, ki jih je podjetje izdalo v začetku tega leta, niso nič manj pomembna področja za podjetje. In ti predlogi so, kot smo videli iz rezultatov testiranja, uspešne rešitve, ki lahko ustrezno delujejo tako kot rešitve za netbooke in nettope kot tudi kot osnova za integrirane platforme v srednjem cenovnem razredu.

Vendar ima uspeh ali neuspeh Buldožerja veliko pomembnejše posledice. Prvič, ta mikroarhitektura cilja na tržne segmente z veliko višjimi stopnjami dobička – strežnike in namizne produktivne sisteme. Zato lahko veliko močneje vpliva na finančno stanje AMD. Drugič, uspeh procesorji AMD serije C, E in A - to, odkrito povedano, sploh ni zasluga inženirjev, ki sodelujejo pri razvoju oblikovanja mikroprocesorjev. Tržni uspeh teh CPU-jev (ali APU-jev, če se držimo terminologije AMD) izhaja iz prisotnosti v njih grafičnih jeder družine Radeon HD, ki so se v procesorje AMD znašla zahvaljujoč pravočasnemu nakupu ATI. Buldožer je nekakšen kvalifikacijski izpit za inženirsko ekipo, ki se posebej ukvarja z mikroarhitekturo računalniških jeder. In tretjič, Bulldozer bo na koncu postal osnova celotne linije procesorjev AMD, z izjemo rešitev za energetsko učinkovite platforme. Tako bo navsezadnje ta mikroarhitektura prišla v nižje tržne segmente in izpodrinila K10 skoraj povsod, vključno s procesorji Llano.



Skratka, težko je preceniti pomen uspešnega lansiranja procesorjev z mikroarhitekturo Bulldozer. To je ikonični izdelek tako na čustveni kot materialistični ravni. In zato si resnično želim, da vidimo, figurativno rečeno, novi K7 ali K8 v resnici.

A že pred testiranjem lahko rečemo, da so možnosti za ponovitev takšnega pojava majhne. Intel je zadnjič sam pomagal AMD-ju prevzeti dlan, saj je poskušal promovirati daleč od idealne mikroarhitekture NetBurst. Nato so se Intelovi inženirji osredotočili na povečanje hitrosti ure, kar je sčasoma naletelo na ovire v obliki ogromnih uhajajočih tokov, medtem ko je AMD ponudil bolj uravnoteženo mikroarhitekturo, namenjeno izvajanju več navodil na takt. Toda potem, ko je Intel revidiral svojo doktrino in uvedel novo mikroarhitekturo Core, ki je prav tako namenjena izvajanju največjega števila ukazov na takt, je AMD padel nazaj na položaj zaostanka, kjer je bil do zdaj.

Očitno je, da je po številu ukazov, izvedenih na takt, zelo težko preseči sodobne procesorje Intel. Današnja mikroarhitektura Sandy Bridge je rezultat vsaj treh optimizacijskih ciklov same po sebi učinkovite zasnove, zato od AMD ne moremo pričakovati še večje specifične učinkovitosti jedra. Poleg tega si inženirji AMD sploh niso zastavili takšnega cilja.

Glavna ideja Buldožerja je drugje. Po mnenju razvijalcev naj bi procesorji, zgrajeni na tej mikroarhitekturi, pokazali dobro zmogljivost zaradi visokih taktov in večjega števila računalniških jeder kot njihovi konkurenti in predhodniki. Hkrati bi morali ostati precej dobičkonosni v proizvodnji, to je, da ne bi smeli imeti prevelikega polprevodniškega kristala in ne izkazovati prevelikega odvajanja toplote glede na posamezno jedro.

Skrivnosti oblikovanja večjedrnih AMD

Povsem jasno je, da povečanje števila procesorskih jeder neizogibno pomeni povečanje površine procesorskega čipa. Posledično se povečata tako zahtevnost izdelave kot cena končnih izdelkov. Zato se na primer procesorji z največjim številom računalniških jeder danes uporabljajo samo v tržnem segmentu strežnikov - korporativne stranke so veliko bolj pripravljene odšteti denar kot posamezni uporabniki. Pot, ki jo je izbral AMD za povečanje števila jeder ob ohranjanju sprejemljivih stroškov nastalih procesorjev, mora biti povezana s poenostavitvijo samih jeder. Vendar pa po drugi strani poenostavitev jeder povzroči nezaželen učinek - padec zmogljivosti v aplikacijah s šibko paraleliziranimi obremenitvami, ki jih je trenutno še dovolj.

Zato so inženirji AMD šli svojo pot. Mikroarhitektura posameznih jeder je postala bolj zapletena, kar povečuje število ukazov, izvedenih na uro, kadar koli je to mogoče.



Vendar je bilo odločeno, da se del virov, ki so običajno prisotni v vsakem jedru, a so hkrati pretirano učinkoviti, deli med pari računalniških jeder.



Nastali dvojedrni sklop je postal osnovni gradnik za procesorje Bulldozer. Takšno vozlišče, imenovano modul v terminologiji AMD, ima dva polna niza celih aktuatorjev. Toda istočasno enota s plavajočo vejico, naprave za vnaprejšnje pridobivanje in dekodiranje navodil ter predpomnilnik druge ravni obstajajo v eni sami kopiji za nekaj jeder in si med seboj delijo svoje vire. Po ocenah razvijalcev je moč teh elementov povsem dovolj za dve jedri, saj pri servisiranju enega jedra v resničnem življenju pogosto mirujeta. Poleg tega zamude pri njihovem nemotenem delovanju nimajo resnega vpliva na posledično delovanje.

Po mnenju samega AMD lahko en dvojedrni modul, zasnovan na opisani način, zagotovi do 80% zmogljivosti polnega dvojedrnega procesorja. Hkrati prihranki v proračunu tranzistorja (in s tem na področju polprevodniškega kristala) dosežejo 44%.

Zahvaljujoč temu genialnemu zbijanju jedra je AMD lahko v osnovno zasnovo polprevodniške matrice Bulldozer vključil osemjedrno (ali štirimodulno) zasnovo.



Poleg tega je dokaj pomemben del kristala namenjen predpomnilniku. Predpomnilniki druge ravni, ki si jih delijo pari jeder znotraj vsakega procesorskega modula, imajo kapaciteto 2 MB, skupni predpomnilnik L3 za celoten procesor pa je 8 MB. Tako lahko ob upoštevanju tradicionalne ekskluzivne organizacije AMD predpomnilnikov rečemo, da je njihova skupna prostornina 16 MB na osemjedrni procesor. Hkrati območje polprevodniškega kristala Buldožer ostaja v sprejemljivih mejah, tako da so razvijalci AMD v celoti dosegli svoj cilj.



V absolutnih številkah to pomeni, da bodo imeli osemjedrni Buldožerji manjšo polprevodniško matrico kot na primer šestjedrni procesorji Thuban (Phenom II X6), zgrajeni na mikroarhitekturi K10. Vendar je treba upoštevati, da bo Bulldozer izdelan po naprednejšem tehničnem procesu z 32 nm standardi. V primerjavi s sodobnimi štirijedrnimi procesorji Intel Sandy Bridges bodo imeli AMD-jevi novi osemjedrni procesorji samo 45 % večjo površino.

Vendar pa lahko štirijedrne procesorje Sandy Bridge, zahvaljujoč podpori tehnologije Hyper-Threading, tako kot Bulldozer, operacijskemu sistemu predstavimo kot osemjedrne procesorje. To bo zagotovo povzročilo polemike o zakonitosti imenovanja Buldožerja za polnopravne osemjedrne procesorje. Vendar je treba razumeti, da sta AMD in Intel na različne načine prišla do dopustnosti hkratnega izvajanja osmih računalniških niti. Intelovi razvijalci so se zajebali v svojo mikroarhitekturo dodatne lastnosti, ki omogoča, da se dve niti izvajata znotraj enega jedra, na enem nizu izvršilnih enot. Nasprotno, AMD je iz dveh polnopravnih jeder izrezal "dodatne" dele, vendar sta bila znotraj vsakega modula le dva sklopa aktuatorjev.



Posledično Intelova tehnologija Hyper-Threading poveča večnitno zmogljivost le za 15-20%, medtem ko AMD-jeva rešitev omogoča 80-odstotno povečanje zmogljivosti pri prehodu s 4 na 8 niti.

Čeprav je seveda polprevodniški kristal osemjedrnega Buldožerja zaradi svoje modularne strukture res zelo podoben štirijedrnemu.


Več navodil na cikel?

Samo s povečevanjem števila procesorskih jeder ne boste prišli daleč. To je postalo jasno tudi po izdaji šestjedrnih procesorjev Phenom II X6, ki so po zmogljivosti na splošno slabši od štirijedrnih Sandy Bridge. Zato se razvijalci AMD niso omejili le na obsežne spremembe dizajna. Osnovna mikroarhitektura Bulldozerja je v primerjavi s K10 preoblikovana nekoliko manj kot v celoti, kar daje upanje za pospešitev delovanja sistemov na procesorjih AMD ne le pri večnitnih nalogah, temveč tudi pri aplikacijah z nizko stopnjo vzporednosti. Še več, ti upi temeljijo na povsem objektivnih okoliščinah. Medtem ko so bile prejšnje mikroarhitekture AMD zasnovane za izvajanje treh ukazov na takt (na enem jedru), mikroarhitektura Bulldozer predvideva izvajanje štirih ukazov na takt in je po tej lastnosti bližje konkurenčnim procesorjem z mikroarhitekturo Core.

Kvalitativne spremembe je mogoče zaslediti že od prvih stopenj izvedbenega cevovoda - od stopnje vnaprejšnjega pridobivanja in dekodiranja navodil. Te stopnje so skupne parom jeder znotraj enega modula, zato je AMD še posebej poskrbel, da ne postanejo mikroarhitekturno ozko grlo. Navodila se pridobivajo iz predpomnilnika L1I za dekodiranje v blokih po 32 bajtov - dvakrat večjih kot pri procesorjih z mikroarhitekturo Core (druga generacija). Sam predpomnilnik ukazov prve stopnje ima kapaciteto 64 KB in dvokanalno asociativnost. Navodila, namenjena dekodiranju, se vanj vnaprej naložijo iz predpomnilnika druge stopnje.

Blok za napovedovanje veje, ki je najbolj neposredno vključen v postopek vzorčenja, vsebuje dva niza medpomnilnikov, ki neodvisno spremljata aktivnost različnih jeder. Tako se pri napovedovanju rezultatov logičnih vej Bulldozer ne zmede med nitmi. Ker je cilj nove mikroarhitekture delovati pri visokih taktih, je kakovost enote za napovedovanje veje izrednega pomena. Zato so algoritme, uporabljene v njem, popolnoma preoblikovali in AMD upa, da se bo učinkovitost napovedovanja veje Buldozerja izboljšala.



Bulldozerjev dekoder ukazov x86 prav tako razdeli svoje vire na dve jedri in je sposoben dekodirati do 4 dohodna navodila na takt. Vendar pa je njegova zmogljivost omejena na izdajanje samo štirih makro navodil (ki so rezultat dekodiranja v smislu AMD), medtem ko se navodila x86 lahko razdelijo na 1-2 ali celo več makro navodil. Čeprav je torej dekoder povečal svojo zmogljivost za tretjino v primerjavi s prejšnjo generacijo mikroarhitekture, njegova hitrost morda ne bo zadostovala, glede na to, da je zadolžen za podporo dveh celih in ene realne računalniške gruče.

Opozoriti je treba, da je bil v Buldožerju uporabljen tudi določen analog tehnologije fuzije ukazov makrofuzije. Nekatere skupine ukazov x86 je mogoče združiti v eno samo celoto in jih prenesti skozi dekoder kot eno navodilo - AMD temu pravi Branch Fusion.

Dekodirana makro navodila so porazdeljena v tri računalniške gruče, od katerih sta dve ostanki polnopravnih računalniških jeder, ena pa je realno oštevilčena, deljena med jedri. Vsaka od teh gruč ima lastno logiko preurejanja navodil in svoj razporejevalnik. To očitno pomeni, da AMD ohranja možnost, da v prihodnjih izdelkih popolnoma nadomesti ali dopolni nekatere od teh grozdov.

Preurejanje ukazov v vsakem izmed grozdov temelji na uporabi fizične registrske datoteke, ki hrani reference na vsebino registrov in odpravlja potrebo po nenehnem prenosu podatkov znotraj procesorja pri preurejanju vrstnega reda ukazov. Ta pristop je nadomestil vmesni pomnilnik za preurejanje, saj fizična registrska datoteka ni le učinkovitejša v smislu porabe energije, ampak je tudi ugodnejša za povečanje takta procesorja.

Celoštevilske gruče vsebujejo dve aritmetični izvršilni enoti (ALU) in dve pomnilniški naslovni enoti (AGU). V primerjavi z mikroarhitekturo K10 se je število naprav zmanjšalo za eno ALU in eno AGU, vendar AMD zagotavlja, da to ne bo bistveno zmanjšalo zmogljivosti, bo pa bistveno prihranilo področje jedra. Zlahka verjamemo, da imeti več kot dva ALU-ja in AGU-ja v vsaki celi številski gruči res nima praktičnega smisla, ker iz dekoderja ne morejo prispeti več kot štiri makro navodila na urni cikel za izvedbo v obeh gruči.



Hkrati so aktuatorji postali bolj univerzalni, praktično se ne razlikujejo po svojih funkcijah.

Organizacija podsistema predpomnilnika se je resno spremenila. Predpomnilnik L1D je bil zmanjšan s 64 na 16 KB in je postal vključujoč zapisovanje. Hkrati se je njegova asociativnost povečala na 4 kanale, poleg tega pa je bil dodan "napovedovalec poti". Zmanjšanje velikosti podatkovnega predpomnilnika prve stopnje se kompenzira z znatnim povečanjem njegove prepustnosti; zdaj lahko servisira do tri 128-bitne operacije hkrati: dve branji in eno pisanje.

Očitno so spremembe v pasovni širini predpomnilnika L1D v veliki meri povezane s potrebo po izvajanju 256-bitnih navodil AVX v mikroarhitekturi, podpora za katero se je pojavila v enoti FPU, ki je v skupni rabi med jedri. Vendar to ne pomeni, da so aktuatorji realnih števil postali 256-bitni. Pravzaprav ima modul Bulldozer dve 128-bitni napravi, navodila AVX pa so dekodirana kot povezani pari 128-bitnih navodil. Skladno s tem se za njihovo izvedbo združijo naprave FMAC (floating point multiply-accumulate) in zmogljivost realno oštevilčene gruče se zmanjša na en ukaz AVX na procesorski modul na takt.



FPU nima lastnega predpomnilnika prve ravni, zato ta gruča deluje s podatki prek naprav s celo številom.

Ker so inženirji AMD že prevzeli nalogo izvajanja podpore za navodila AVX, ki jih je predlagal Intel, so bili procesorjem Bulldozer dodani drugi ustrezni sklopi: navodila SSE4.2 in AESNI, namenjena pospeševanju operacij šifriranja. Poleg tega je AMD uvedel nekaj lastnih ukazov: trioperandno množenje-seštevanje FMA4 in lastno vizijo nadaljnjega razvoja AVX - XOP.



Predpomnilnik L2 v Bulldozerju je v skupni rabi znotraj procesorskega modula in med jedri. Njegova zmogljivost je impresivnih 2 MB, asociativnost pa 16 kanalov. Vendar se je zakasnitev predpomnilnika, ki deluje po tej shemi, povečala na 18-20 ciklov, kljub dejstvu, da je širina vodila ostala enaka kot prej - 128-bitna. To pomeni, da predpomnilnik L2 v Bulldozerju, čeprav velik, ni zelo hiter; konkurenčni in prejšnji procesorji ponujajo predpomnilnik L2 s približno polovično zakasnitvijo. Skupaj z majhnim predpomnilnikom L1D z zakasnitvijo 4 ciklov (kar je tudi več kot v mikroarhitekturi K10) vse to ni videti preveč spodbudno. Vendar AMD trdi, da je bila zakasnitev predpomnilnika povečana izključno zato, da bi Bulldozerju omogočili delovanje pri visokih taktih.



Poleg tega so inženirji AMD uvedli učinkovito enoto za vnaprejšnje pridobivanje, ki je zasnovana tako, da vnaprej naloži potrebne podatke v predpomnilnik prve in druge ravni. Učinkovitost teh blokov naj bi bila izboljšana in zdaj lahko celo prepoznajo nepravilne podatkovne strukture.

V teoriji naredi Bulldozer dober vtis. AMD je popolnoma revidiral svoj stari pristop k procesorski mikroarhitekturi in implementiral popolnoma preoblikovan dizajn. Kar je na prvi pogled zelo obetavno, saj je nova mikroarhitektura optimizirana za izvajanje štirih in ne treh ukazov na takt na enem procesorskem jedru. Poleg tega podpira makro združevanje navodil med postopkom dekodiranja, kar dodatno poveča specifično zmogljivost.

A vse je videti tako dobro le, dokler gledamo le eno jedro in ne razmišljamo o tem, da so v resnici takšna jedra združena v pare. In dvojedrni modul Bulldozer ima preveč skupnih delov za par jeder. Zlasti zaradi dejstva, da ima tak modul samo eno enoto za pridobivanje navodil in en dekoder, ostaja največje število ukazov, izvedenih na takt, enako štirim za celoten dvojedrni sklop. To pomeni, da je logični ekvivalent za eno samo jedro Sandy Bridge v smislu teoretične zmogljivosti modul in ne jedro Bulldozer. Sposobnost modula za izvajanje dveh niti je v tem primeru videti kot povsem logičen odgovor AMD na tehnologijo Hyper-Threading.

Seveda bo naše testiranje resničnih procesorjev vse postavilo na svoje mesto, toda že v fazi obravnave mikroarhitekture smo prisiljeni misliti, da je pozicioniranje Buldožerja kot polnopravnih osemjedrnih procesorjev marketinška poteza. Zanesljivejša ocena računalniških zmogljivosti teh procesorjev bi morala temeljiti na številu modulov, ki so z vidika teoretične zmogljivosti popolnoma primerljivi z jedri, zgrajenimi na drugi generaciji mikroarhitekture Intel Core.

Ob tem se postavlja povsem logično vprašanje – zakaj se je AMD sploh potrudil z implementacijo dvonitnega procesiranja znotraj enega samega procesorskega modula? Zakaj ni bilo mogoče združiti aktuatorjev, razporejenih po dveh jedrih, v en sam grozd? Razlogov za to je več.

Prvič, za hkratno obremenitev velikega števila aktuatorjev z delom, v splošnem primeru, je potrebna napredna znotrajprocesorska logika. AMD očitno ni mogel implementirati zelo učinkovitih enot za napovedovanje veje in navodil ter vnaprejšnje pridobivanje podatkov v mikroarhitekturi Bulldozer. Zato je naloga paralelizacije dela in optimalnejše uporabe izvršilnih naprav preložena na proizvajalce programske opreme, ki morajo za Bulldozer dobaviti izdelke z večnitno podporo.

Drugič, povečanje števila sočasno izvedenih niti ni tako slabo. Če za namizne uporabnike in še posebej igralce osem dokaj preprostih jeder Buldožer ne obljublja nobenih posebnih prednosti, potem je treba v strežniških aplikacijah takšno mikroarhitekturo izpolniti zelo ugodno. Torej je povsem možno, da glavni cilj pri razvoju Bulldozerja ni bil zadovoljiti težnje navdušencev, temveč obnoviti položaj AMD na trgu strežnikov.

Turbo Core še bolj Turbo

Energetska učinkovitost je ena od najpomembnejše lastnosti sodobni procesorji. Na primer v njihovem prihodnje mikroarhitekture Intel skoraj v prvi vrsti posveča pozornost zmanjšanju porabe energije. AMD še ni dosegel te točke, inženirji tega podjetja se borijo predvsem za zmogljivost. Toda to ne pomeni, da razvijalci sploh niso skrbeli za toplotne in energetske lastnosti Buldožerja. Nasprotno, po Llanu so v procesorje Bulldozer našli svojo pot bistveno novi pristopi k povečanju energetske učinkovitosti. Vendar pa so v tem primeru inženirji uporabili sproščeni potencial ne toliko za prihranek denarja, ampak za iztiskanje dodatne zmogljivosti s povečanjem taktnih frekvenc.

Seveda je nova proizvodna tehnologija prinesla določene izboljšave na področju porabe energije in odvajanja toplote. Bulldozer uporablja 32nm procesno tehnologijo z visoko dielektričnim materialom, tranzistorji s kovinskimi vrati in tehnologijo SOI. Z drugimi besedami, to je isti tehnični postopek GlobalFoundries, ki proizvaja procesorje Llano. Zahvale gredo nova tehnologija Pri 32 nm standardih delovne napajalne napetosti serijskih osemjedrnih procesorjev Bulldozer ne presegajo 1,4 V.

Vendar pa so glavna novost, ki je iz Llana prešla v Bulldozer, tranzistorji power gate, ki so zasnovani za prekinitev napajanja določenih delov procesorja. V Bulldozerju vam omogočajo neodvisno razbremenitev napetosti iz posameznih dvojedrnih modulov in iz predpomnilnika.



Ko obe računalniški jedri v modulu preideta v stanje varčevanja z energijo C6, je modul brez napajanja. Na žalost te tehnologije ni mogoče uporabiti za procesorska jedra, saj v Bulldozerju preprosto ni namenskih jeder - del virov si delijo s svojimi sosedi modulov.

Stanja varčevanja z energijo jeder C6 so nadzorovana v tehnologiji Bulldozer in Turbo Core. V tistih trenutkih, ko je vsaj polovica modulov procesorja Bulldozer v stanju varčevanja z energijo, poveča svojo napajalno napetost in taktno frekvenco. Ta prisilni način delovanja se imenuje Max Turbo Boost.

Vendar Max Turbo Boost ni nič novega, takšno samodejno overclocking je AMD uvedel v procesorje Thuban, zgrajene na mikroarhitekturi K10. Kar je resnično novo, je način All Core Boost, v katerem se lahko takt poveča nad nominalno vrednost, tudi ko so aktivna vsa procesorska jedra. Izboljšana različica Turbo Core, implementirana v Bulldozer, omogoča procesorju, da z dobro natančnostjo oceni svojo praktično porabo energije in odvajanje toplote na podlagi informacij o delovni obremenitvi določenih blokov. V skladu s tem, če je glede na to oceno trenutno odvajanje toplote in poraba energije znatno pod mejo, lahko procesor poveča svojo napajalno napetost in taktno frekvenco, tudi če nobeno jedro ni v pasivnem stanju.



Tako je delovna frekvenca procesorjev z mikroarhitekturo Bulldozer izjemno spremenljiva vrednost. Odvisno od "resnosti" algoritmov, ki se izvajajo, in števila vključenih jeder se lahko dinamično spreminja v zelo širokem razponu, ki doseže 900 MHz.

Posodobljena namizna platforma

Z uvedbo nove mikroarhitekture AMD ne le da ni spremenil zasnove platforme, ampak je celo ohranil združljivost procesorjev Bulldozer z obstoječo infrastrukturo. V skladu s tem, tako kot njihovi predhodniki, novi procesorji vsebujejo integriran severni most, vključno s predpomnilnikom tretje ravni, krmilnikom pomnilnika in krmilnikom vodila Hyper-Transport. Obenem, kljub temu, da imajo vsi na novo izdani procesorji AMD in Intel v sebi vgrajen tudi krmilnik grafičnega vodila PCI Express, Bulldozer tega nima.



Tako kot pri procesorjih, zgrajenih na mikroarhitekturi K10, vgrajeni severni most v Buldožerju uporablja lastno taktno frekvenco, ki je za različne modele nastavljena na 2,0–2,2 GHz. Upoštevajte, da ima ta frekvenca določen vpliv na zmogljivost, saj neposredno vpliva na hitrost predpomnilnika L3. Ki ima v trenutni različici procesorjev prostornino povečano na 8 MB in ima 64-kanalno asociativnost. V skladu z željami poslovnih uporabnikov so podatki, shranjeni v tem predpomnilniku, zaščiteni s kodo za odpravljanje napak ECC.

Krmilnik pomnilnika, vgrajen v Buldožer, nima bistveno novih zmogljivosti. Kot prej podpira DDR3 SDRAM, uporablja dvokanalno zasnovo in je pravzaprav sestavljen iz dveh neodvisnih enokanalnih krmilnikov, ki lahko delujeta v seznanjenem ali nesklopljenem načinu. AMD je dodal le podporo za tipe hitrejših pomnilnikov, pri čemer je deklariral združljivost z DDR3-1867 ter poskrbel za združljivost z energijsko učinkovitimi moduli z delovno napetostjo 1,25 in 1,35 V.

Ko že govorimo o namizni modifikaciji Bulldozer, ki ima svoje kodno ime Zambezi, je treba opozoriti, da je namenjena novemu Platforma vtičnice AM3+, znan tudi pod kodnim imenom Scorpius. Procesor vtičnica AM3+ ima 942 pinov, en pin več kot vtičnica AM3. Toda kljub temu Zambezi ostaja združljiv s starejšimi ploščami Socket AM3. Pri vgradnji novih procesorjev v stare matične plošče se dejansko izgubijo samo nekatere funkcije upravljanja porabe energije. Tako se hitrost preklopa frekvence zmanjša, ko delujeta tehnologiji Turbo Core in Cool"n"Quiet in Vdrop ne deluje.

Vendar pa so do izida Zambezija AMD in proizvajalci matične plošče so pripravili galaksijo novih izdelkov, ki temeljijo na novih logičnih sklopih serije 900. Struktura tipičnega sistema, ki temelji na procesorju Zambezi in je zgrajen na novem naboru čipov, je prikazana v blokovnem diagramu spodaj.


Razlike med novim naborom čipov AMD 990FX (in njegovima poenostavljenima različicama AMD 990X in AMD 970) so izključno v podpori specifičnim električnim lastnostim Socket AM3+ in s seboj ne prinašajo novih vmesnikov. Tako kot nabori čipov serije 800 ima novi južni most šest vrat SATA 6 Gbps in štirinajst vrat USB 2.0. Ne glede na to, kako zelo si želimo v novih sklopih sistemske logike podporo za specifikacijo PCI Express 3.0 ali, v najslabšem primeru, priključke USB 3.0, tudi tokrat v njih ni nič takega. To je, mimogrede, zelo nenavadno, saj je bila podpora za USB 3.0 uvedena v naborih čipov za platformo Socket FM1 nižje ravni.

Razlike med spremembami nove serije sistemskih logičnih sklopov so izključno v podpori različnih konfiguracij z več GPU.


Obseg procesorjev Zambezi

Izdaja procesorjev Zambezi dopolnjuje posodobitev modelna paleta, ponuja AMD. Namizni procesorji, ki temeljijo na mikroarhitekturi Bulldozer, bodo postali nova paradna ponudba tega proizvajalca in bodo s trga hitro izpodrinili vse vrste modifikacij Phenom II.

S poudarkom na inovativnosti nove mikroarhitekture bo AMD za namizne procesorje Zambezi uporabil novo tržno ime - FX. Po eni strani se odlično prilega novi nomenklaturi, ki vključuje označevanje procesorjev s črkami, po drugi strani pa je referenca na legendarne procesorje Athlon 64 FX, ki so bili pred šestimi ali sedmimi leti najhitrejši namizni procesorji. Vendar so ti dnevi nepreklicno minili, zato poglejmo, kaj nam je AMD pripravljen ponuditi zdaj.

V bližnji prihodnosti bo ponudba procesorjev serije FX vključevala štiri modele.



Kljub temu, da razlika med modeli procesorjev Zambezi ni samo v taktih, ampak tudi v številu aktivnih računalniških jeder, bodo vsi temeljili na istem enotnem polprevodniškem čipu. Tukaj je:



Za pridobitev procesorjev z manj kot osmimi jedri bo AMD nekatere od njih onemogočil na polprevodniškem čipu. Pod vprašajem je še možnost njihovega odklepanja nazaj, kot je bilo to mogoče pri procesorjih z mikroarhitekturo K10. Vendar pa so v BIOS-u matičnih plošč na osnovi logičnih sklopov serije 900, ki so šli skozi naš laboratorij, prisotne ustrezne možnosti, zato obstaja upanje za ugodno rešitev tega vprašanja.

Onemogočanje jeder za pridobitev šestjedrnih in štirijedrnih procesorskih sprememb bo potekalo "modul za modulom". To pomeni, da bodo blokirani celotni dvojedrni moduli in ne "druga" jedra v njih, čeprav bi bila takšna taktika veliko bolj koristna v smislu zmogljivosti. Vendar izdaja šestjedrnih in štirijedrnih procesorjev, zgrajenih na mikroarhitekturi Bulldozer, ni toliko razložena s tržnimi razlogi, kot s potrebo po izvedbi zavrnitve, ki je glede na precej velike dimenzije čipa in nov tehnološki proces bo kar veliko.

Kljub temu, da AMD izostri novo mikroarhitekturo za delovanje pri visokih taktnih frekvencah, doseženih vrednosti še ne moremo imenovati impresiven preboj. Štirigigaherčna meja ostaja nepremagana, nazivna frekvenca starejšega procesorja FX pa je celo nižja kot na primer pri Phenom II X4 980. Upamo, da bodo z izboljšanjem proizvodne tehnologije frekvence Zambezi hitro narasle. . Čeprav, če verjamete trenutni različici načrtov AMD, bo linija pospešena ne prej kot v prvem četrtletju 2012.

Preboja pri sproščanju toplote in porabi energije ni. AMD je dolgo govoril o tem, kako bo mikroarhitektura Bulldozer energetsko učinkovitejša, a v resnici imajo starejši osemjedrni modeli enako raven TDP kot starejši Phenom II. Res je, čez nekaj časa naj bi podjetje svoji ponudbi dodalo 95-vatno različico FX-8120 in procesor FX-8100 z enakim izračunanim odvajanjem toplote.

Toda cene novih procesorjev serije FX so videti več kot privlačne. AMD ne želi odstopati od svoje smeri ponujanja platform po ugodnejši ceni od tekmecev, zato starejši osemjedrni modeli Zambezi nasprotujejo starejšim procesorjem Intel Core i5. Na splošno namerava AMD upoštevati naslednjo shemo pozicioniranja svojih izdelkov:



Z drugimi besedami, AMD ne namerava tekmovati z Intelovimi šestjedrnimi procesorji in obetavno platformo LGA2011, temveč se želi osredotočiti na osvajanje srednjega cenovnega segmenta.

Dobra novica za navdušence bo dejstvo, da v vseh procesorjih serije FX ne bo blokiran noben množitelj. Vseh Zambezijev ni mogoče enostavno overclockati s preprosto spremembo osnovnega množitelja, ampak jih je mogoče tudi podobno preoblikovati s tehnologijo Turbo Core. Na voljo je tudi overclocking pomnilniškega podsistema in frekvence severnega mostu, vgrajenega v procesor.

Testni procesor: AMD FX-8150

AMD je našim urednikom poslal starejši procesor družine Zambezi, FX-8150.



Ima nazivni takt 3,6 GHz in več podrobne informacije Njegove značilnosti lahko dobite na danem posnetku zaslona CPU-Z.



Upoštevajte, da procesor temelji na koraku B2 - in to ni prva različica. Prejšnje modifikacije polprevodniškega kristala je proizvajalec zavrnil, ker niso mogle delovati na prvotno načrtovanih taktnih frekvencah. To je povzročilo nekaj zamude pri objavi, ki je bila sprva načrtovana spomladi, nato poleti, dejansko pa se je zgodila sredi oktobra.

Vendar pa danes dosežena frekvenca 3,6 GHz ne izgleda preveč impresivno. Tako AMD kot Intel imata izdelke, ki delujejo pri višjih hitrostih. Ima pa FX-8150 zelo obetavno tehnologijo Turbo Core, ki lahko ob nizki obremenitvi samodejno poveča frekvenco procesorja do 4,2 GHz.



Omeniti velja, da je frekvenco 3,9 GHz mogoče doseči, tudi če je obremenitev vseh računalniških jeder, hkrati pa pušča prostor za samodejno overclocking, ne da bi presegli meje porabe energije in odvajanja toplote.



V mirovanju tehnologija Cool"n"Quiet zmanjša frekvenco FX-8150 na 1,4 GHz. Napajalna napetost pade na 0,85 V.


Kako smo testirali

Novi osemjedrni procesor AMD FX-8150, zgrajen na mikroarhitekturi Bulldozer, smo primerjali z enim od njegovih predhodnikov, šestjedrnim Phenom II X6, in s konkurenčno (cenovno) Intelovo ponudbo - štirijedrnim Jedrni procesorji i5-2500 in Core i7-2600. Poleg tega so za večjo jasnost rezultatom dodani indikatorji zmogljivosti za šestjedrni procesor Core i7–990X.

Posledično so testni sistemi vključevali naslednje komponente programske in strojne opreme:

procesorji:

AMD FX-8150 (Zambezi, 8 jeder, 3,6 GHz, 8 MB L2 + 8 MB L3);
AMD Phenom II X6 1100T (Thuban, 6 jeder, 3,3 GHz, 3 MB L2 + 6 MB L3);
Intel Core i7-2600K (Sandy Bridge, 4 jedra, 3,4 GHz, 1 MB L2 + 8 MB L3);
Intel Core i5–2500K (Sandy Bridge, 4 jedra, 3,3 GHz, 1 MB L2 + 6 MB L3);
Intel Core i7-990X Extreme Edition(Gulftown, 6 jeder, 3,46 GHz, 1,5 MB L2 + 12 MB L3).

CPU hladilnik: NZXT Havik 140;
Matične plošče:

Gigabyte 990FXA-UD5 (socket AM3+, AMD 990FX + SB950);
ASUS P8Z68-V PRO (LGA1155, Intel Z68 Express);
Gigabyte X58A-UD5 (LGA1366, Intel X58 Express).

Spomin:

2 x 2 GB, DDR3-1600 SDRAM, 9-9-9-27 (Kingston KHX1600C8D3K2/4GX);
3 x 2 GB, DDR3-1600 SDRAM, 9-9-9-27 (Crucial BL3KIT25664TG1608).

Grafične kartice: AMD Radeon HD 6970.
Trdi disk: Kingston SNVP325-S2/128GB.
Napajalnik: Tagan TG880-U33II (880 W).
Operacijski sistem: Microsoft Windows 7 SP1 Ultimate x64.
Vozniki:

Gonilnik Intel Chipset Driver 9.2.0.1030;
Intel Management Engine Driver 7.1.10.1065;
Intel Rapid Storage Technology 10.6.0.1022;
Gonilnik zaslona AMD Catalyst 11.10.

Upoštevajte, da je bilo testiranje izvedeno pod trenutno različico operacijskega sistema Windows 7, vendar AMD navaja, da upravitelj opravil tega OS ne distribuira računalniških niti na najbolj optimalen način. Windows 7 predvsem raje usmerja niti na jedra, ki se nahajajo v različnih modulih. In to resnično zagotavlja večjo specifično zmogljivost, saj zmanjša obremenitev blokov, razdeljenih znotraj modula. Vendar ta strategija preprečuje vključitev turbo načinov, ki bi jih lahko uporabil procesor, če bi bili nekateri dvojedrni moduli v stanju varčevanja z energijo.

Obetavna operacijska dvorana sistem Windows 8 bo sledil drugačni taktiki in tam bodo niti najprej dodeljene jedrom znotraj istega modula. Posledično AMD obljublja, da se lahko v številnih aplikacijah zmogljivost sistemov, ki temeljijo na Zambeziju, poveča za do 10 %.

Izvedba

Predhodna ocena učinkovitosti mikroarhitekture Bulldozer

Preden smo se lotili »pravega« testiranja procesorjev, smo se odločili ugotoviti, kaj lahko načeloma pričakujemo od mikroarhitekture Bulldozer. Da bi to naredili, smo izvedli majhno primerjavo procesorja s to mikroarhitekturo z drugimi procesorji z mikroarhitekturo K10 in Sandy Bridge pod umetno ustvarjenimi enakimi pogoji: pri enaki taktni frekvenci in z enakim številom aktiviranih jeder.

Natančneje, primerjali smo AMD FX-8150, Phenom II X6 1100T in Core i7-2600 pri 3,6 GHz z omogočenima samo dvema procesorskima jedroma. Zaradi čistosti eksperimenta so bile vse tehnologije za varčevanje z energijo in samodejni overclocking naravno deaktivirane. Kot orodja za testiranje je bil izbran niz preprostih sintetičnih meril uspešnosti, vključenih v pripomoček SiSoft Sandra 2011, v katerem smo na silo onemogočili vse nize ukazov, starejše od SSE3, saj niso podprti v mikroarhitekturi K10.



Številke v tabeli povedo več kot vse besede. Zmogljivost mikroarhitekture Bulldozer je postala precej nižja od zmogljivosti prejšnjih procesorjev. Združevanje parov jeder v en modul s skupnimi viri in spremljajoča poenostavitev mikroarhitekture je pripeljala do dejstva, da je pri isti frekvenci specifična zmogljivost Buldožerja na jedro padla za 25-40% v primerjavi s prejšnjo generacijo mikroarhitekture AMD. Posledično so jedra Bulldozer skoraj za polovico počasnejša od jeder Sandy Bridge. Poleg tega je zmogljivost procesorskega modula Bulldozer, ki vključuje dve jedri, celo nižja od hitrosti enega jedra Sandy Bridge z omogočeno tehnologijo Hyper-Threading. Ali naj od procesorja, zgrajenega na takšni mikroarhitekturi, pričakujemo rekordno zmogljivost? Vprašanje je retorično.

Spotoma si poglejmo praktične lastnosti predpomnilniki in pomnilniški podsistemi. Za oceno hitrosti delovanja teh funkcionalnih enot smo izvedli teste v pripomočku Cachemem iz paketa Aida64. V vseh primerih je bil uporabljen pomnilnik DDR3-1600 z zakasnitvami 9-9-9-27-1T. Tako kot v prejšnjem primeru so frekvence procesorja ostale poravnane na 3,6 GHz.



V Zambeziju so se v primerjavi s procesorji Phenom II povečale praktične zakasnitve vseh predpomnilnikov in pomnilniškega podsistema. O tem smo govorili, ko smo razmišljali o mikroarhitekturi Bulldozer. S spremembo logične organizacije predpomnilnika pa se je njegova prepustnost skoraj v vseh primerih povečala.

Hkrati sta v Sandy Bridge implementirana najhitrejši dvokanalni krmilnik pomnilnika in najhitrejši podsistem predpomnilnika. Čeprav je seveda glede na zmogljivost predpomnilnika Intelov procesor nekoliko slabši od medijev mikroarhitekture Bulldozer.

Celotna zmogljivost

Za ocenjevanje zmogljivosti procesorja pri pogostih opravilih tradicionalno uporabljamo test Bapco SYSmark 2012, ki simulira delo uporabnika v običajnih sodobnih pisarniški programi in aplikacije za ustvarjanje in obdelavo digitalnih vsebin. Ideja testa je zelo preprosta: ustvari eno samo metriko, ki označuje tehtano povprečno hitrost računalnika v običajnih aplikacijah.

Spomnimo se, da je AMD pred časom poskušal trolati SYSmark in širil obtožbe, da je pristranski zaradi uporabe "napačnega" nabora resničnih aplikacij. Vendar pa po našem mnenju takšna presoja ni upravičena, saj se za ocenjevanje uspešnosti uporabljajo običajni in zelo priljubljeni programi, od katerih je prispevek vsakega h končnemu rezultatu prikazan na naslednjem diagramu:



Zato nismo opustili uporabe SYSmark 2012 in še naprej uporabljamo njegove meritve za ocenjevanje običajne zmogljivosti.



Prvi test je tako razočaranje. Rezultat osemjedrnega FX-8150 je le za 10% boljši od zmogljivosti šestjedrnega Phenom II X6 1100T in seveda sploh ne dosega zmogljivosti štirijedrnih procesorjev Intel. Torej taktika, ki jo je izbral AMD za implementacijo velikega števila jeder z nizko specifično zmogljivostjo v procesorju namesto zmernega števila kompleksnih, na splošno ne daje pozitivnega rezultata.

Poglobljeno razumevanje rezultatov SYSmark 2012 lahko zagotovi vpogled v ocene zmogljivosti, pridobljene v različnih scenarijih uporabe sistema.

Scenarij Office Productivity simulira tipično pisarniško delo: pripravo besedila, obdelavo preglednic, delo z po elektronski pošti in obisk internetnih strani. Skript uporablja naslednji nabor aplikacij: ABBYY FineReader Pro 10.0, Adobe Acrobat Pro 9, Adobe Flash Igralec 10.1 Microsoft Excel 2010, Microsoft internet Explorer 9, Microsoft Outlook 2010, Microsoft PowerPoint 2010, Microsoft Word 2010 in WinZip Pro 14.5.



Scenarij ustvarjanja medijev simulira ustvarjanje reklame z uporabo vnaprej posnetih digitalnih slik in videoposnetkov. V ta namen se uporabljajo priljubljeni paketi Adobe: Photoshop CS5 Extended, Premiere Pro CS5 in After Effects CS5.



Spletni razvoj je scenarij, znotraj katerega se modelira izdelava spletne strani. Uporabljene aplikacije: Adobe Photoshop CS5 Extended, Adobe Premiere Pro CS5, Adobe Dreamweaver CS5, Mozilla Firefox 3.6.8 in Microsoft Internet Explorer 9.



Scenarij Data/Financial Analysis je namenjen statistični analizi in napovedovanju tržnih trendov, ki se izvaja v programu Microsoft Excel 2010.



Skript 3D Modeling je v celoti namenjen ustvarjanju tridimenzionalnih predmetov in upodabljanju statičnih in dinamičnih prizorov z z uporabo programa Adobe Photoshop CS5 Extended, Autodesk 3ds Max 2011, Autodesk AutoCAD 2011 in Google SketchUp Pro 8.



Zadnji scenarij, upravljanje sistema, vključuje ustvarjanje varnostnih kopij ter namestitev programske opreme in posodobitev. Tu jih je vpletenih več različne različice Namestitveni program Mozilla Firefox in WinZip Pro 14.5.



pri razni modeli Uporaba procesorja z mikroarhitekturo Bulldozer kaže bistveno drugačne rezultate. V nekaterih primerih se izkaže, da je celo počasnejši od Phenom II X6, vendar obstajajo tudi nasprotne situacije. Na splošno je splošno pravilo naslednje: prednost FX-8150 postane še posebej opazna, če je delovna obremenitev večnitna in dobro vzporedna, vendar ni računsko zapletena.

Vendar tudi v najbolj ugodnih razmerah FX-8150 zaostaja za Core i5-2500. Edini scenarij, kjer so ti procesorji primerljivi po hitrosti, je 3D upodabljanje. V povprečju je Intelova ponudba pred AMD-jevim novim izdelkom za impresivnih 25 %. Žalostno.

Igralna zmogljivost

Kot veste, je zmogljivost platform, opremljenih z visoko zmogljivimi procesorji, v veliki večini sodobnih iger odvisna od moči grafičnega podsistema. Zato pri testiranju procesorjev poskušamo izvajati teste tako, da čim bolj razbremenimo grafično kartico: izberemo igre, ki so najbolj odvisne od procesorja, teste pa izvajamo brez vklopa anti -aliasing in z namestitvijo daleč od najbolj visoke ločljivosti. To pomeni, da dobljeni rezultati omogočajo oceno ne toliko ravni fps, ki je dosegljiva v sistemih s sodobnimi grafičnimi karticami, ampak kako dobro procesorji načeloma delujejo z igralno obremenitvijo. Zato je na podlagi predstavljenih rezultatov povsem mogoče ugibati o tem, kako se bodo procesorji obnašali v prihodnosti, ko se bodo na trgu pojavile hitrejše možnosti grafičnih pospeševalnikov.


















Igre ne spadajo v kategorijo nalog, ki ustvarjajo vzporedno večnitno obremenitev. Zato so za današnje igričarske aplikacije bolj primerni procesorji s štirimi jedri in ne tiste večjedrne pošasti, ki jih ponuja AMD. V spodnjih diagramih vidimo jasno ilustracijo te izjave. Novi osemjedrni FX-8150 ni nič hitrejši od svojega šestjedrnega predhodnika Phenom II X6.

Kar zadeva razmerje igralne zmogljivosti med Zambezijem in Sandy Bridgeom, je AMD še vedno veliko bolj pesimističen glede novega izdelka. Trenutna procesorska mikroarhitektura Intel veliko bolje obvladuje tipično delovno obremenitev, ki jo ustvarjajo 3D igre, in ni upanja, da bo AMD kdaj lahko dohitel konkurenčne procesorje v tej kategoriji nalog. Z drugimi besedami, uporaba Bulldozerja v igralnih sistemih je lahko smiselna le, če obstaja zaupanje, da je zmogljivost določenega procesorja zadostna za določen video podsistem v določenem nizu iger. Vendar se morate tudi v tem primeru zavedati, da lahko z naslednjo nadgradnjo video pospeševalnika ostanete v resno slabšem položaju v primerjavi s tistimi uporabniki, ki so sprva imeli raje platformo in sodobne procesorje Intel.

Poleg igralnih testov bomo predstavili tudi rezultate sintetičnega merila Futuremark 3DMark 11, ki je bil predstavljen s profilom Extreme.



Namen dodajanja teh rezultatov je bil prikazati zelo idealno situacijo za FX-8150, ko video podsistem ne omogoča polne realizacije moči procesorja. Tukaj glavna obremenitev pade na video kartico, procesor pa igra le podporno vlogo. V takih primerih lahko govorimo o enaki zmogljivosti procesorjev Bulldozer in Sandy Bridge, čeprav to seveda ne drži povsem.



Vendar pa je FX-8150 videti dobro (v primerjavi s prejšnjimi rezultati) v fizičnem testu 3DMark 11. fizični model AMD-jev novi osemjedrni procesor deluje s hitrostjo, ki je primerljiva s štirijedrnim Core i5-2500.

Testi v aplikacijah

Na splošno sta bila Bulldozerjevo tehtano povprečje in igralna zmogljivost na namizju precej pod našimi pričakovanji. Vendar ne obupajmo in poskusimo poiskati tiste primere, ko je nova mikroarhitektura AMD sposobna pokazati svoje prednosti.

Za merjenje hitrosti procesorjev pri stiskanju informacij uporabljamo WinRAR arhivar, s pomočjo katerega z največjo stopnjo kompresije arhiviramo mapo z različnimi datotekami v skupni prostornini 1,4 GB.



Rezultat FX-8150 je blizu Core i5-2500. WinRAR ni ena od aplikacij, ki lahko vzporedno izvaja svoje izračune v vseh osmih jedrih Bulldozerja, vendar se zdi, da ogromen predpomnilnik reši dan.

Drugi podoben test hitrosti arhiviranja izvedemo v programu 7-zip z uporabo kompresijskega algoritma LZMA2.



V 7-zip je zmogljivost FX-8150 vredna pohvale. Ta osemjedrni procesor se uspe približati hitrosti štirijedrnega Core i7-2600, ki vključuje podporo za Hyper-Threading in ki, tako kot Bulldozer, lahko izvaja osem niti hkrati.

Učinkovitost šifriranja procesorjev se meri z vgrajenim merilom uspešnosti priljubljenega kriptografskega pripomočka TrueCrypt. Opozoriti je treba, da ni sposoben le učinkovito naložiti poljubnega števila jeder z delom, ampak podpira tudi specializiran nabor navodil AES.



Dobro paralelizirani, preprosti celoštevilski algoritmi so tisto, kar potrebuje mikroarhitektura Bulldozer. V takih primerih je, kot vidimo, mogoče doseči zelo izjemno zmogljivost. Predvsem pri šifriranju FX-8150 zaostaja le za šestjedrnim Core i7-990X in je pred vsemi procesorji za platformo LGA1155.

Pri testiranju hitrosti prekodiranja zvoka uporabite pripomoček Apple iTunes, ki pretvori vsebino CD-ja v format AAC. Upoštevajte, da je značilna lastnost tega programa možnost uporabe samo para procesorskih jeder.



Bolje je, da programe, ki ustvarjajo majhno število računalniških niti, držite stran od Bulldozerja. Nekatera jedra tega procesorja so prešibka, da bi v takih primerih pokazala kakršne koli spodobne rezultate.

Učinkovitost v programu Adobe Photoshop merimo z lastnim testom, ki je kreativno predelan Umetniki retuširanja Photoshop Speed ​​​​Test, ki vključuje običajno obdelavo štirih slik z 10 milijoni slikovnih pik, posnetih z digitalnim fotoaparatom.



V Photoshopu zmogljivost FX-8150 ni tako katastrofalna kot pri procesorjih z mikroarhitekturo K10, a vseeno močno zaostaja za Core i5-2500. Očitno je velik predpomnilnik v tem primeru dobra pomoč mikroarhitekturi Bulldozer, a samo s tem ne boste prišli daleč. Učinkovitost in specifična zmogljivost računalniških jeder je še vedno izjemnega pomena.

Testiranje smo izvedli tudi v program Adobe Photoshop Lightroom 3. Testni scenarij vključuje naknadno obdelavo in izvoz JPEG sto slik z 12 milijoni slikovnih pik v formatu RAW.



Lightroom lahko paralelizira obdelavo fotografij v poljubnem številu jeder, zato osemjedrni FX-8150 tu kaže dobre rezultate. Vendar je "ni slabo" v tem primeru relativen pojem; pravzaprav je njegova zmogljivost primerljiva samo z Core i5-2500. To pomeni, da sta dve jedri Bulldozer enaki enemu jedru Sandy Bridge brez podpore za Hyper-Threading.

Zmogljivost v programu Adobe Premiere Pro je preizkušena z merjenjem časa upodabljanja v formatu H.264 Blu-Ray projekta, ki vsebuje video HDV 1080p25 z različnimi uporabljenimi učinki.



Prejšnja generacija procesorjev AMD je prav tako dobro obravnavala video transkodiranje. Mikroarhitektura Bulldozer je omogočila rahlo povečanje zmogljivosti v aplikacijah te vrste in posledično je FX-8150 celo hitrejši od Core i5-2500.

Hitrost urejanja videa s programom Adobe After Effects je bila ocenjena z merjenjem časa izvajanja vnaprej določenega nabora filtrov in učinkov, vključno z zameglitvijo, ustvarjanjem izboklin, mešanjem okvirjev, ustvarjanjem sijaja, dodajanjem defokusiranja gibanja, senčenjem, 2D in 3D manipulacijo, inverzijo, itd.



Kljub temu, da je obremenitev dobro vzporedna, FX-8150 zaostaja za Intelovimi konkurenti v After Effects.

Za merjenje hitrosti prekodiranja videa v format H.264 se uporablja test x264 HD, ki temelji na merjenju časa obdelave izvornega videa v formatu MPEG-2, posnetega v ločljivosti 720p s pretokom 4 Mbit/s. Opozoriti je treba, da so rezultati tega testa velikega praktičnega pomena, saj kodek x264, ki se uporablja v njem, temelji na številnih priljubljenih pripomočkih za prekodiranje, na primer HandBrake, MeGUI, VirtualDub itd.






Pri prekodiranju videa s kodekom x264 so procesorji AMD vedno pokazali dobro zmogljivost. Z izdajo osemjedrne mikroarhitekture so se njihovi rezultati še izboljšali in zdaj FX-8150 celo prekaša Core i7-2600 v drugem, z viri najbolj intenzivnem prehodu kodiranja. Tako smo s precejšnjimi težavami končno našli še drugo aplikacijo, poleg TrueCrypta, kjer si zmogljivost procesorja z mikroarhitekturo Bulldozer zasluži laskave ocene.

Računalniško zmogljivost in hitrost upodabljanja v Autodesk 3ds max 2011 merimo s specializiranim testom SPECapc. S tem testiranjem začnemo uporabljati novo profesionalno različico SPECapc za 3ds Max 2011.






Upodabljanje je tudi ena od nalog, ki je predmet optimizacije za večjedrne mikroarhitekture. Toda kljub temu je FX-8150 še vedno počasnejši od Core i5-2500 in Core i7-2600, da ne omenjam Core i7-990X. Po drugi strani pa ni sramotne situacije, ko novi procesor AMD izgubi svojega predhodnika.

Če izračunamo povprečje rezultatov v posameznih aplikacijah, je bil FX-8150 približno 14 % hitrejši od Phenom II X6 1100T pri našem naboru aplikacij. In to mu je omogočilo, da v malo manj kot polovici primerov deluje nič slabše od Core i5-2500. Vendar pa zaostanek za naslednjim modelom Sandy Bridge, Core i7-2600, ostaja precejšen in znaša več kot 10 %.

Poraba energije

Kljub dejstvu, da smo uspeli najti nabor nalog, pri katerih se lahko zmogljivost Buldožerja imenuje sprejemljiva, procesorji, ki temeljijo na novi mikroarhitekturi, sploh niso videti kot revolucionarni procesorji. Edino upanje ostaja poraba energije, saj so bili prej procesorji AMD v tem parametru več kot bistveno slabši od svojih konkurentov. Zdaj, če verjamete obljubam razvijalcev, je mikroarhitektura postala bolj osredotočena na energetsko učinkovitost, novi 32-nm tehnološki proces pa naj bi prispeval k izboljšanju električne lastnosti. Oglejmo si torej FX-8150 skozi lečo zmogljivosti na vat.

Naslednji grafi, če ni drugače navedeno, prikazujejo skupno porabo energije (brez monitorja), izmerjeno "po" napajanju in predstavljajo vsoto porabe energije vseh komponent, vključenih v sistem. Učinkovitost samega napajalnika v tem primeru ni upoštevana. Med meritvami je obremenitev procesorjev ustvarila 64-bitna različica pripomočka LinX 0.6.4. Poleg tega smo za pravilno oceno porabe energije v mirovanju aktivirali vse razpoložljive tehnologije za varčevanje z energijo: C1E, C6, AMD Cool"n"Quiet in Enhanced Intel SpeedStep.



V mirovanju je poraba sistemov s procesorji, zgrajenimi na mikroarhitekturi Bulldozer, postala nižja kot pri podobnih sistemih s procesorji družine Phenom II. Sodobni sistemi Intel LGA1155 pa v stanju mirovanja porabijo bistveno manj.



V primeru, ko je računalniška obremenitev enonitna, se poraba sistemov Socket AM3+ močno poveča, očitno zaradi visoke agresivnosti tehnologije Turbo Core. Z vgrajenimi sistemi Intel procesorji, tega ni opaziti, spet pa se lahko pohvalijo z bistveno večjo energetsko učinkovitostjo.



Pri polni večnitni obremenitvi situacija ni dosti drugačna. Ali je "prehitel" le sistem s procesorjem LGA1366 Core i7-990X. Sicer pa je vse kot prej. Kar zadeva porabo energije, se FX-8150 ne ponaša s kakšnim posebnim uspehom. Začel je porabiti malo manj kot Phenom II X6 1100T, vendar so procesorji Sandy Bridge vsaj enkrat in pol bolj varčni.

AMD je vso energetsko učinkovitost, pridobljeno z uvedbo nove mikroarhitekture, uporabil za povečanje taktnih frekvenc. In posledično jih ne vidimo nova raven učinkovitosti niti bistveno izboljšane zmogljivosti. V skladu s tem je glede zmogljivosti na vat Bulldozer, tako kot njegovi predhodniki, resno slabši od konkurenčnih Intelovih mikroarhitektur.

Za referenco predstavljamo porabo pri polni obremenitvi, izmerjeno ločeno v napajalnih tokokrogih procesorja in matične plošče.






»Neto« poraba osemjedrnika FX-8150 presega porabo Procesorji Sandy Most približno dvakrat. Glede na to, da sta oba procesorja izdelana po istem tehnološkem postopku in imata podobne napetosti jeder, postane neverjetno zanimivo, kaj je AMD mislil, ko je govoril o energijski učinkovitosti svoje mikroarhitekture Bulldozer.

Overclocking

Platforma Socket AM3+ in procesorji serije FX so sprva postavljeni kot overclockerji. O tem pričajo tako popolna sprostitev vseh množiteljev kot eksperimenti, izvedeni pod okriljem AMD, v katerih je bil postavljen svetovni rekord v overclockingu z enim od procesorjev FX-8150. Obetavne so tudi izjave podjetja, da je nova mikroarhitektura optimizirana za delovanje pri visokih taktnih frekvencah. Bomo od AMD-ja res dobili nov overclocking čudež? Preverimo.

Overclocking katerega koli procesorja FX je zelo preprost; ni zaman, da je "Odklenjeno" napisano neposredno na njihovem logotipu. Frekvenco procesorja je mogoče spremeniti z množiteljem prek nastavitev BIOS-a ali prek specializiranih pripomočkov, ki jih ponujajo AMD (Overdrive Utility) in proizvajalci matičnih plošč. Podobno lahko v sistemih Socket AM3+ overclockirate severni most in pomnilnik, vgrajen v procesor.

Med testiranjem nam je uspelo doseči stabilno delovanje našega FX-8150 pri frekvenci 4,6 GHz. Da bi zagotovili stabilnost v tem stanju, je bilo treba napajalno napetost procesorja povečati na 1,475 V, poleg tega pa je bilo treba omogočiti funkcijo Load-Line Calibration. Med testi stabilnosti temperatura procesorja, ki deluje na tej frekvenci, ni presegla 85 stopinj glede na senzor vtičnice ali 75 stopinj glede na senzor, vgrajen v procesor. Za odvajanje toplote se spomnimo, da je bil uporabljen učinkovit zračni hladilnik NZXT Havik 140.



Upoštevajte, da smo hkrati poskušali overclockati severni most, vgrajen v CPE, saj povečanje njegove frekvence pozitivno vpliva na hitrost predpomnilnika tretje ravni in krmilnika pomnilnika. Vendar pa je na žalost znatno overclocking tega procesorskega vozlišča naletel na nevidno oviro in ni mogel doseči frekvence nad 2,4 GHz, čeprav smo hkrati poskušali povečati njegovo napajalno napetost.

V vsakem primeru je overclocking FX-8150 na 4,6 GHz dober rezultat, zlasti če upoštevamo dejstvo, da so bili procesorji AMD iz družine Phenom II le redko overclockani v zraku nad 4,0 GHz. Z drugimi besedami, mikroarhitektura Bulldozer je dejansko omogočila nekoliko dvig frekvenčne meje višje.

Vendar pa je treba overclocking procesorjev FX primerjati predvsem ne s starim Phenom II, temveč s konkurenčnimi procesorji Core i5 in Core i7 za sisteme LGA1155. Ampak očitno ne pospešijo nič slabše. Na primer, povsem tipičen overclock za Core i5-2500K s povečanjem napetosti za 0,15 V nad nominalno in uporabo zračnega hladilnika je 4,7 GHz. In na tem ozadju se rezultat FX-8150 ne zdi več tako briljanten.

Vtis overclockinga Zambezi se še bolj poslabša, če primerjamo zmogljivost overclocked FX-8150 in overclocked Core i5-2500K (povečanje zmogljivosti glede na nominalni način je navedeno v oklepajih):



Na splošno overclocking ne spremeni kakovosti rezultatov. Toda kjer je bil FX-8150 hitrejši v nominalnem načinu, se je razlika zmanjšala. In tam, kjer je prednjačil Core i5-2500, je svojo prednost še utrdil. Ni presenetljivo: frekvenca FX-8150 se je pri overclockingu povečala za 28%, medtem ko je povečanje frekvence Core i5-2500K znašalo 42%. In na splošno, kot je mogoče oceniti po obsegu povečanja zmogljivosti zaradi overclockinga, se mikroarhitektura Sandy Bridge bolj občutljivo odziva na naraščajoče frekvence. Z drugimi besedami, tudi če upoštevamo overclocking, procesorji z mikroarhitekturo Bulldozer, čeprav se precej dobro overclockirajo, niso videti močnejši od Intelovih tekmecev.

zaključki

Uspeh ali neuspeh? Zagotovo mnogi od vas želijo videti jasno razsodbo na koncu članka. Vendar je v tem primeru vse zelo dvoumno in AMD je s svojim Buldožerjem recenzente spravil v zelo težak položaj.

Dejstvo je, da je AMD pokazal popolnoma nestandarden pristop k razvoju mikroarhitekture. Glede na to, da zmogljivost procesorja sestavljajo tri komponente: število ukazov, izvedenih v jedru procesorja na takt, frekvenca in število jeder, so razvijalci svoje prioritete preusmerili na število jeder. Hkrati se je zmanjšala specifična zmogljivost posameznih jeder, vendar je nastala zasnova odprla pot ustvarjanju poceni osemjedrnih ali celo bolj zapletenih procesorjev. To je zelo močna poteza za trg strežnikov, kjer se uporabljajo večnitne obremenitve in procesorji velik znesek jedra so v resnem povpraševanju. Tako je zelo verjetno, da bo nova mikroarhitektura Bulldozer omogočila AMD-ju, da bistveno izboljša svoj položaj na trgu zmogljivih strežnikov.

Vendar smo se danes seznanili s procesorjem FX, zgrajenim na tej mikroarhitekturi, vendar namenjen namiznim računalnikom. In tu je postalo povsem očitno neskladje med zmožnostmi strojne opreme Bulldozerja in tipičnimi delovnimi obremenitvami namizja. Še posebej razočaranje je, da je bila marketinška kampanja strukturirana tako, da so mnogi verjeli v Bulldozer kot vzhajajočo zvezdo na trgu namiznih računalnikov. Vendar se tem upom ni bilo usojeno uresničiti.


Procesorji FX, ki temeljijo na mikroarhitekturi Bulldozer, so lahko pokazali svoje prednosti le v majhni podskupini nalog, ki jih rešujejo običajni uporabniki. Med običajnimi pogostimi aplikacijami ni veliko primerov, ki ustvarjajo preprosto celoštevilsko večnitno delovno obremenitev, in visoka zmogljivost Bulldozerja se pokaže le v tem primeru. Posledično se je v nekaterih primerih Buldožer izkazal ne le počasnejši od konkurenčnih Intelovih rešitev, ampak celo slabši od procesorja Phenom II X6, zgrajenega na mikroarhitekturi prejšnje generacije. In to pomeni, da AMD ni uspel izdelati revolucionarnega procesorja za namizne računalnike.

Pravzaprav je FX šele naslednji Phenom, ki se zdi že sam po sebi kar dober, sploh v primerjavi s predhodniki. Procesorji FX so praviloma hitrejši od Phenom II, se bistveno bolje overclockirajo in imajo nekoliko manjšo porabo, zato jih lahko štejemo za dobro zamenjavo za nosilce zastarele mikroarhitekture K10.

Vendar naj vas spomnimo, da je AMD v vojni ne samo s seboj, ampak tudi s samim seboj podjetja Intel. Zato smo še vedno prisiljeni izraziti razočaranje, da so procesorji FX resnično smiselni le v tistih namizjih, ki so osredotočeni na obdelavo in prekodiranje videa. V drugih primerih je njihova zmogljivost v primerjavi s procesorji Sandy Bridge le redko videti spodbudna. Enako lahko rečemo za porabo energije in overclocking. Ločeno je treba dodati, da so se procesorji AMD FX, kot je bilo pričakovano, izkazali za slabo možnost za igralne sisteme, saj sodobne 3D igre praktično ne uporabljajo resnično večnitnih algoritmov. S tem pa se bodo ljubitelji izdelkov AMD najbrž lahko sprijaznili, glede na to, da število sličic na sekundo v igrah pogosto omejuje grafika, ne pa procesor.

Z drugimi besedami, tržni obeti za procesorje FX bodo odvisni od dveh dejavnikov: kako velika je armada privržencev AMD; in na to, kako spretno bo proizvajalec upravljal cenovni vzvod. Vendar očitno ni pričakovati, da bodo namizni procesorji z mikroarhitekturo Bulldozer postali široko priljubljeni.

AMD si le redko privošči sveže procesorske arhitekture. Če Intel posodablja strukturo vsaki dve leti, potem je konkurent nazadnje opazil leta 2007, ko je izdal K10, prenovljeno različico starega K8. Tako je pojav novega Buldožerja pomemben dogodek. V naslednjih nekaj letih bo arhitektura postala osnova za vse kristale AMD, pa tudi prva priložnost po dolgem času za tekmovanje z Intelom v tekmi za zmogljivost.

Greva kot par

Inženirji AMD so z ustvarjanjem Buldožerja opustili preizkušeno strategijo izboljšanja in delnega kopiranja starega razvoja. Struktura kamnov je bistveno drugačna od tiste, ki smo je vajeni videti v sistemih x86.

Prva in najpomembnejša novost je originalna postavitev. Vse vrhunske različice Buldožerja so uradno opremljene z osmimi jedri. Vendar pa v resnici obstajajo štirje polnopravni moduli, le vsak z dvema računalniškima enotama. Videti je takole: dve celoštevilski aritmetični gruči (imenujejo se jedra in so neposredno odgovorni za izračune) si delijo Front-End, gručo s plavajočo vejico (FPU) in predpomnilnik druge stopnje, povečan na 2 MB.

Prednost takšnega tandema je prihranek prostora, zmanjšanje porabe energije in proizvodnih stroškov. Slabost - delitev istih sklopov slabo vpliva na končno predstavo. Pod velikimi obremenitvami en sprednji del morda ne bo kos dvema jedroma. AMD ne zanika izgube zmogljivosti: po njegovem mnenju je duo približno 20% šibkejši od polnopravnega dvojedrnega procesorja.

Težave pri komunikaciji

Za odpravo ozkega grla se je moral Front-End naučiti učinkovito deliti vire med dvema jedroma. Da bi to dosegli, sta bila preoblikovana enota za napovedovanje veje in ukazni dekoder, ki je prejel četrti kanal za obdelavo navodil (kot v Sandy Bridge) in tehnologijo Branch Fusion. Slednje vam omogoča, da del navodil zlepite v eno operacijo. Vse to naj bi pospešilo delo Front-Enda in preprečilo mirovanje kristala.

Kar se tiče samih jeder, je to niz Out-of-Order, load/unload, L1 predpomnilnika in dveh računalniških grozdov. Enota za izvajanje zunaj reda ima zdaj fizični register datotek. Tako kot v Sandy Bridgeu so vanj spuščeni naslovi za shranjevanje delovnih podatkov, kar vam omogoča, da razbremenite glavni cevovod, ki ni v redu. Procesor za nalaganje / razkladanje je prejel povečan medpomnilnik, podvojeno zmogljivost in možnost dela virtualni naslovi, kar bi teoretično moralo povečati hitrost dela s podatkovnim predpomnilnikom L1. Slednja je v Buldožerju postala štirikrat manjša: 16 v primerjavi s 64 KB v K10. Izgubo so nadomestili s hitrostjo dela. Asociativnost L1 se je povečala z dveh na štiri kanale, kar pomeni dvakrat O večjo učinkovitost iskanja.

V enem modulu so trije računalniški grozdi: dva celoštevilska in en za delo s podatki s plavajočo vejico. V primerjavi s K10 je prvi par izgubil enega ALU (ki se ukvarja z izračuni) in AGU (ki se ukvarja s pomnilniškimi naslovi). V teoriji to pomeni zmanjšano največjo zmogljivost. V praksi bo sprememba praktično neopazna: težko je v celoti naložiti celoštevilske grozde.

Glavne spremembe so vplivale na FPU, ki je odgovoren za kompleksne izračune s plavajočo vejico. V K10 je postal veliko močnejši: prejel je par MMX in 128-bitnih FMAC naprav za izvajanje operacij seštevanja in množenja. Za razliko od K10 so bili FMAC univerzalni: lahko se medsebojno zamenjajo, kar pozitivno vpliva na hitrost izračuna. Poleg tega so se naučili združevati operacije v enem izrazu, kar je povečalo natančnost izračunov.

Poleg tega je FPU prejel posodobljen nabor navodil. Prvič, procesor zdaj deluje z AVX, ki podpira 256-bitne registre. Za njihove izračune sta, tako kot pri Sandy Bridge, združena dva FMAC. Drugič, Bulldozer lahko deluje z navodili SSE 4.2, AENSI, FMA4 in XOP. Zadnja dva niza sta edinstvena za AMD. Za vas in zame vse te spremembe pomenijo samo eno stvar - ukazi, ki so bili prej narejeni v več taktih, bodo zdaj izračunani v enem, kar neposredno vpliva na zmogljivost. Res je, da bi izkusili povečanje hitrosti, je potrebna podpora za navodila iz programske opreme.

Lepilo in škarje

Posledično je vsak modul Bulldozer sestavljen iz enega predpomnilnika podatkov L2 in L1, dveh celoštevilskih grozdov in bloka za delo s števili s plavajočo vejico. Skupaj lahko en kamen vsebuje do štiri takšne sklope. Hkrati ima vsak od njih dostop do številnih skupnih elementov. Prvi je dvokanalni pomnilniški krmilnik s podporo za DDR3-1866 MHz. Drugi je predpomnilnik L3, katerega obseg se je v primerjavi s K10 povečal s 6 na 8 MB, asociativnost pa s 48 na 64 kanalov. Upoštevajte, da za razliko od Sandy Bridge frekvenca predpomnilnika L3 ne sovpada s hitrostjo jeder. Če najvišji model deluje s hitrostjo 3,6 GHz, je pomnilnik najnovejše stopnje 2,2 GHz. To vodi do opaznih zamud, ki negativno vplivajo na delovanje. Po mnenju AMD je bila ta žrtev narejena zaradi stabilnega delovanja pri visokih frekvencah.

Tadam!

Kljub arhitekturnim trikom in 32nm procesni tehnologiji Bulldozer zavzema impresivnih 315 kvadratnih metrov. milimetrov. To je približno enkrat in pol več kot štirijedrni Sandy Bridge in starejši Llano. Na srečo je bila poraba energije v razumnih mejah - 125 W.

Poleg osemjedrnih modelov obstajajo različice s šestimi in štirimi računalniške enote. Mlajša brata temeljita na enaki osemjedrni zasnovi, vendar imata en ali dva modula onemogočena.

Osnovna frekvenca se giblje od 3,1 do 3,6 GHz. Tako kot Sandy Bridge ima tudi Bulldozer tehnologijo za samodejno overclocking. Poseben čip, ki je odgovoren za Turbo Core 2.0, spremlja trenutno obremenitev jedra in raven TDP ter, takoj ko se pojavi priložnost, poveča frekvenco procesorja. Pri vrhunskem kristalu, ko so uporabljeni vsi moduli, lahko hitrost povečamo za 300 MHz. Če so nekateri viri v stanju mirovanja - pri 600 MHz. Pri nizkih obremenitvah Buldozer preide v način varčevanja z energijo, za to je odgovorna tehnologija Kul"n"Tiho.

Ročno overklokiranje je preprosto. Prvič, celotna linija ima odklenjen množitelj. Drugič, novinci dobro pridobivajo višino: pod tekočim dušikom je starejši Buldožer postavil nov svetovni rekord - 8429 MHz.

Spremljevalci

Bulldozer deluje na Socket AM3+. V bistvu gre za nekoliko izboljšan AM3 z enim dodatnim pinom. Imenujejo se nabori čipov z novo procesorsko vtičnico 990FX, 990X in 970 . Razlikujeta se po krmilniku PCIe 2.0. Starejši model je opremljen z 32 linijami, mlajši - 16. Poleg tega 990FX in 990X podpirata CrossFireX. Med značilnostmi naborov čipov opazimo šest vrat SATA Rev. 3 in 14 USB priključki 2.0. Ni krmilnika USB 3.0.

Upoštevajte, da lahko Bulldozer deluje tudi na starejših ploščah. Vse kar potrebujete je posodobljen BIOS. Omejitve: Turbo Core in Cool"n"Quiet imata zmanjšano odzivno hitrost, nekatere funkcije za varčevanje z energijo pa niso na voljo.

Arhitektura procesorja Bulldozer se je izkazala za zanimivo. Končno je AMD nehal kopirati samega sebe in se domislil nečesa resnično novega. Na žalost je nekaj očitnih prednosti pred konkurenti. Deklariranih osem jeder ni. V dobrem smislu imamo štirijedrne modele s povečanim številom računalniških enot, nekaj takega kot Intel Hyper-Threading, vendar na ravni strojne opreme. Ideja je dobra, vendar bo zmogljivost odvisna od tega, kako hiter je Front-End. Resnične prednosti Bulldozerja vključujejo samo zmogljiv FPU za izračune s plavajočo vejico in povečane delovne frekvence v primerjavi s K10.

Razvaljajmo ga! Pokopajmo ga!

AMD je objavil načrte za izdajo naslednjih linij procesorjev. Podjetje pričakuje, da bo arhitekturo posodabljalo vsako leto in vsakič doseglo približno 15-odstotno povečanje zmogljivosti na vat. Če se bo AMD držal svojega načrta, bomo arhitekturo videli leta 2012 Koliščar(»koper«), leto kasneje - Parni valjak(»parni valjak«), leto 2014 pa si bomo zapomnili po napovedi Bager. Takšna so gradbena dela.

Napačna okna

Po mnenju AMD, Windows 7 ne more sprostiti celotnega potenciala nove kreacije: razporejevalnik operacijskega sistema ne upošteva funkcij Buldožerja. Na primer, za nove procesorje je pomembno, da so med seboj povezane niti dodeljene enemu modulu, sicer si bodo jedra izmenjevala podatke ne prek hitrega predpomnilnika L2, temveč prek pomnilnika tretje ravni. Nekatere razdeljene tokove je tudi bolje obravnavati na podoben način za izboljšanje učinkovitosti Turbo Core 2.0. Istočasno posebne naloge ustvarite večjo obremenitev sprednjega bloka, zato jih je bolje razpršiti po različnih modulih. Zahvaljujoč sodelovanju z Microsoft te nianse bodo upoštevane pri načrtovalcu Windows 8. Vendar ne smete pričakovati znatnega povečanja učinkovitosti.

Slovar

Integer Computing Cluster- obravnava operacije s celimi števili (1, 2, 10).

Front-End- vnaprejšnji blok. Sprejema ukaze iz programa in jih prevaja v procesorju razumljiv jezik.

FPU- grozd izračunov podatkov s plavajočo vejico. Izvaja izračune z delnimi števili (1,2345) in velikimi vrednostmi s potencami (1,2345E-10).

Blok za napovedovanje veje- vnaprej napove, katere podatke in operacije bo program potreboval v naslednjem trenutku. Ne dovoli, da procesor miruje.

Dekoder ukazov- razdeli program na mikrooperacije, ki jih nato uporabljajo računalniške gruče.

Ne deluje- blok izredne izvršitve. Ukvarjal se je s porazdelitvijo dejanj med jedri. Pošlje v izračun samo tiste ukaze, za katere obstajajo podatki.

Nakladanje/razkladanje bloka (LSU) - spremlja gibanje podatkov med izhodom s tekočega traku in predpomnilnikom podatkov L1.

Asociativnost predpomnilnika- povezovanje vrstic in stolpcev predpomnilnika. Večja ko je asociativnost, nižja je hitrost iskanja, a večja je njegova učinkovitost.

MMX- niz blokov za delo s številkami do 8 bajtov.

Kompleti navodil- dovoli en ukaz za izvedbo operacije na več podatkih.

Tabela 1

Specifikacije procesorjev AMD Bulldozer

Število računalniških jeder

Osnovna frekvenca

Frekvenca turbo jedra

Podpora za pomnilnik

Poraba energije

Tehnični proces

Cena od novembra 2011

neznano

Kaj sestavlja zmogljivost procesorja? Prej je bila v uporabi formula, ki je zmogljivost opisovala kot produkt števila ukazov, izvedenih na takt, in frekvence, pri kateri ta procesor deluje. Zdaj se je v tej formuli pojavil še tretji dejavnik - število računalniških jeder. Zato ima razvijalec procesorja, ki želi izdati hiter izdelek, več možnosti za to.

Vendar pa ni vse tako preprosto. Povečanje števila ukazov, ki jih izvede računalniško jedro na takt, je precej težka naloga. Klasični x86 programsko kodo vključuje zaporedno izvajanje ukazov, zato mora biti procesor za doseganje njihove vzporedne obdelave opremljen z visoko učinkovitimi enotami za napovedovanje vej in preurejanje ukazov, katerih izvedba zahteva precejšen inženirski napor. Hkrati zapletenost mikroarhitekture vpliva na fizične dimenzije kristala in vodi do omejitev pri povečevanju števila jeder. Torej, če bo proizvajalec izdelal procesor z velikim številom jeder, bi morala mikroarhitektura, nasprotno, poskušati poenostaviti. Ni lahko z urna frekvenca. Stava na njegovo rast bo spet zahtevala spremembe notranjih blokov procesorja in podaljšanje njegovega izvajalnega cevovoda. Rezultat je naslednji: da bi procesor dobil medaljo za zmogljivost, se morajo njegovi razvijalci potruditi, da hkrati optimizirajo več parametrov.

Težava je tudi v tem, da je kateri koli od izbranih načinov za izboljšanje zmogljivosti procesorja lahko uspešen le v posebnih primerih. Vsi programi ne morejo učinkovito delovati z velikim številom jeder. Nekateri algoritmi vam ne omogočajo pravilnega predvidevanja prehodov in preurejanja navodil. In v nekaterih primerih se zmogljivost ne poveča niti s povečanjem taktne frekvence, ker v sistemu obstajajo nekatera druga ozka grla.

Iskanje optimalnega ravnovesja ni enostavno in kaj velja za optimalni kriterij? Primerjamo lahko samo delovanje procesorjev v končnem številu programov in za določen primer izberemo najhitrejšega. Vendar to nikakor ne zagotavlja, da z drugačnim naborom testnih orodij ne bomo dobili povsem nasprotnih ocen. Tako obsežen uvod je tukaj podan, ker se bomo danes seznanili z novo serijo procesorjev AMD FX - vodilnega izdelka AMD, splošno znanega pod kodnim imenom Zambezi. Ta procesor temelji na zelo kontroverzni mikroarhitekturi Bulldozer, ki je že uspela zbrati precejšen šopek nelaskavih kritik. A bistvo ni v tem, da je ta mikroarhitektura popolnoma slaba. Pri izbiri najboljšega ravnovesja lastnosti so razvijalci napačno ocenili potrebe večine uporabnikov in dali glavni poudarek napačnemu faktorju v »osnovni formuli«. Posledično se je prvotni načrt za izdajo visoko zmogljive rešitve nove generacije ponesrečil in privrženci AMD, ki so bili navdušeni nad obljubami o preboju, so prejeli nekaj povsem drugega od tistega, kar so pričakovali. Vendar, ali je to resen in objektiven razlog za razočaranje? O tem bomo govorili v tem gradivu.

⇡ Štetje jedrc: osem ali štiri?

Med delom na novi zasnovi zmogljivih procesorjev se je AMD odločil dati prednost številu procesorskih jeder. To je povsem logična izbira, ki temelji na dejstvu, da je večnitne programske opreme z leti vse več in da je treba pri razvoju mikroarhitekture, zasnovane za dolgoletni razvoj, upoštevati predvsem ne trenutno stanje na trgu, temveč opažene trende. Osem jeder, predvidenih v osnovni različici novega procesorja, je tisto, kar je AMD nameraval osvojiti trg, kjer so bili doslej predstavljeni samo čipi, katerih največje število jeder je bilo omejeno na šest. ( Tukaj govorimo le o namiznih računalnikih. — pribl. izd. )

Hkrati pa razvijalci niso želeli vzeti jeder stare mikroarhitekture K10. Ne samo, da so prevelike fizična velikost, vendar tudi, kot lahko sodi Llano, niso nagnjeni k delovanju pri visokih taktnih frekvencah tudi po prenosu na sodobno 32 nm tehnologijo. Poleg tega ne podpirajo številnih sodobnih funkcij, kot so navodila AVX. Zato je AMD za sestavljanje osemjedrnih procesorjev naredil novo mikroarhitekturo - Buldožer. Predstavniki podjetja raje pravijo, da je bil njegov razvoj izveden iz nič, v resnici pa je v jedrih Buldožer mogoče najti številne reference na drugo letos predstavljeno mikroarhitekturo - Bobcat, namenjeno uporabi v kompaktnih in energetsko učinkovitih napravah. Vendar pa je razmerje med Bulldozerjem in Bobcatom precej oddaljeno in ga omenjamo le zato, da postane splošna ideja jasna - Bulldozer združuje veliko relativno preprostih jeder.

Hkrati ne govorimo o primitivni kombinaciji osmih preprostih jeder na enem polprevodniškem čipu. V tem primeru bi imel nastali procesor zelo nizko enonitno zmogljivost, kar bi postalo precej resen problem, saj ni tako malo programov, ki ne razdelijo obremenitve na več računskih niti. Zato so bila jedra najprej optimizirana za delovanje pri visokih taktih. In drugič, združeni so bili v dvojedrne module, ki so lahko delili svoje vire, da bi služili eni niti. Rezultat je precej zanimiva zasnova: vhodni del izvajalnega cevovoda takšnega dvojedrnega modula je skupen, nadaljnja obdelava ukazov pa je razdeljena med dva sklopa izvršilnih naprav.

Osnova zasnove Buldožerja je tisto, kar običajno imenujemo dvojedrni modul

Spomnimo, da je postopek obdelave podatkov v sodoben procesor vključuje več stopenj: pridobivanje navodil x86 iz predpomnilnika, njihovo dekodiranje - prevajanje v notranje makro operacije, izvajanje, beleženje rezultatov. Prvi dve stopnji v modulu Bulldozer se izvajata za par jeder skupaj, nato pa je za celoštevilska navodila izvajanje porazdeljeno na dve jedri gruče ali, v primeru realne aritmetike, se izvede v bloku operacij s plavajočo vejico skupno dvema jedroma.

Moduli Bulldozer so zasnovani za obdelavo štirih navodil na takt, zahvaljujoč tehnologiji združevanja makrov pa lahko procesor nekatere pare ukazov x86 obravnava kot eno operacijo. To pomeni, da je na splošno dvojedrni modul Bulldozer po moči podoben enojedrnemu sodobnemu procesorju Intel, ki lahko prav tako obdela štiri ukaze na takt in podpira tudi združevanje makrov.

Vendar pa obstajajo pomembne razlike med modulom Bulldozer in jedrom Sandy Bridge, ki lahko postavijo pod vprašaj njuno približno enako teoretično hitrost. Zaradi dejstva, da modul novih procesorjev AMD vsebuje ostanke dveh enakih jeder, lahko dokaže največjo zmogljivost le pri obdelavi para niti. Če nosi enonitno obremenitev, bo hitrost njegove storitve omejena s številom izvajalnih naprav v eni takšni gruči. In ni jih tako veliko, glede na željo AMD po poenostavitvi posameznih jeder - enkrat in pol manj kot pri procesorjih z mikroarhitekturo Sandy Bridge ali K10. To pomeni dva aritmetična ALU-ja in dva naslovna AGU-ja.

Tako je videti funkcionalna struktura modula, zgrajenega na mikroarhitekturi Bulldozer. Od dveh jeder sta ostala samo dva kompleta celoštevilskih aktuatorjev

Blok operacij s plavajočo vejico, ki je skupen procesorskemu modulu, je tudi razmeroma nizke kompleksnosti. Vključuje dve 128-bitni izvršilni enoti FMAC, ki ju je mogoče združiti v eno enoto za obdelavo 256-bitnih navodil. Zdi se, da tukaj ni toliko aktuatorjev, še posebej glede na to, da so razdeljeni na par jeder. Vendar so bolj univerzalni kot v prejšnjih in konkurenčnih mikroarhitekturah, ki uporabljajo ločene množilnike in seštevalnike. In zahvaljujoč temu lahko v določenih primerih pri delu z realnimi številkami dvojedrni modul Bulldozer zagotovi primerljivo in celo več visokozmogljivo kot na primer eno jedro Sandy Bridge.

Podobna zamisel o združevanju 128-bitnih naprav za delo z 256-bitnimi navodili je uporabljena v Sandy Bridgeu

Vendar bi moral modul Buldožer pokazati največjo moč pri dvonitni obremenitvi. Eno jedro Sandy Bridge je sposobno obdelati tudi dve računalniški niti; za to ima tehnologijo Hyper-Threading. Vendar so vsa navodila poslana enemu kompletu aktuatorjev, kar v praksi povzroči številne kolizije. Modul Bulldozer vsebuje dve neodvisni celi številski gruči, ki lahko vzporedno izvajata niti, skupno število izvajalnih naprav v njih pa enkrat in pol presega število takih naprav v jedru Sandy Bridge.

Na levi je modul Bulldozer, na desni je nekaj konkurenčnega jedra s podporo za Hyper-Threading. Pravzaprav ni videti zelo podobno Peščenemu mostu, a ilustracija pove bistvo problema

Posledično ima modul Bulldozer višjo največjo zmogljivost kot jedro Sandy Bridge, vendar je to zmogljivost nekoliko težje odkleniti. Jedro Sandy Bridge inteligentno nalaga lastne vire zahvaljujoč napredni logiki na čipu, ki neodvisno razčleni enonitno kodo in jo izvaja vzporedno na celotnem naboru izvršilnih naprav. V Bulldozerju je naloga učinkovite uporabe aktuatorjev delno preložena na programerja, ki mora svojo kodo razdeliti na dve niti - celoten prenos vseh kapacitet modulov bo možno šele takrat.

In to je tisto, kar je tipično. Pri obravnavi dvojedrnega procesorskega modula Bulldozer smo ga nenehno primerjali z enim jedrom Sandy Bridge, hkrati pa smo lahko potegnili povsem pravilne vzporednice. Zaradi tega se sprašujemo: ali ne bi smeli »osemjedrne« narave nove mikroarhitekture obravnavati kot produkt domišljije tržnikov? AMD pravi, da je treba jedra šteti po številu celih gruč, pri čemer trdi, da lahko modul zagotovi do 80 % zmogljivosti dveh neodvisnih jeder. Ne smemo pa pozabiti, da so jedra, na katerih temelji Bulldozer, bistveno enostavnejša od jeder drugih procesorjev. Zato je število dvojedrnih modulov značilnost, ki veliko bolj ustrezno odraža zmogljivost Buldožerja.

Poiščite največje število procesorskih jeder in se zaposlite v marketinškem oddelku AMD

⇡ Predpomnilnik

Organizacija predpomnilnika v procesorjih Bulldozer je tudi "vezana" ne toliko na posamezna jedra, temveč na dvojedrne module. Pravzaprav je vsakemu jedru dodeljen samo svoj predpomnilnik podatkov prve stopnje; vse druge ravni predpomnilnika se nanašajo bodisi na modul kot celoto bodisi na procesor:

  • Vsako jedro ima svoj predpomnilnik L1 za podatke. Njegova prostornina je 16 KB, arhitektura pa predvideva prisotnost štirih asociativnih kanalov. Ta predpomnilnik deluje z algoritmom pisanja, kar pomeni, da je vključujoč.
  • Predpomnilnik prve ravni za navodila je na voljo v enem izvodu za vsak dvoprocesorski modul. Njegova prostornina je 64 KB, število asociativnih kanalov pa dva.
  • Predpomnilnik druge ravni je prav tako implementiran v enem primeru na modul. Njegova velikost je impresivnih 2 MB, asociativnost je 16 kanalov, algoritem delovanja pa je ekskluziven.
  • Poleg tega ima osemjedrni procesor kot celota 8-megabajtni predpomnilnik L3 s 64-kanalno asociativnostjo. Posebnost tega predpomnilnika je, da deluje na bistveno nižji frekvenci v primerjavi s samim procesorjem, ki znaša okoli 2 GHz.

Naslednja tabela opisuje razmerje med obsegom predpomnilnika za osemjedrne procesorje Bulldozer, štirijedrne Sandy Bridge in Thuban (šestjedrni Phenom II X6, zgrajen na mikroarhitekturi K10).

Vrsta predpomnilnika Buldožer (8 jeder/4 moduli) Sandy Bridge (4 jedra) Thuban (6 jeder)
L1I (navodila) 4x64 KB 4x32 KB 6x64 KB
L1D (podatki) 8x16 KB 4x32 KB 6x64 KB
L2 4x2 MB 4x256 KB 6x512 KB
L3 8 MB, 2,0–2,2 GHz 8 MB, deluje pri hitrosti procesorja 6 MB, 2,0 GHz

Kot je razvidno iz tabele, se je AMD zanašal na zmogljive predpomnilnike zgornje ravni, kar je lahko zelo koristno v primeru resne večnitne obremenitve. Vendar pa je predpomnilnik v novih procesorjih na splošno počasnejši kot pri prejšnjih in konkurenčnih izdelkih. To je enostavno zaznati pri merjenju praktične zakasnitve.

Velike zamude pri dostopu do podatkov v Bulldozerju je mogoče nadomestiti le z visokim taktom teh procesorjev. Kar pa je bilo prvotno načrtovano – po frekvencah naj bi novi osemjedrni procesorji za 30 % presegli Phenom II. Vendar AMD nikoli ni mogel oblikovati polprevodniških kristalov, ki bi lahko stabilno delovali pri tako visokih frekvencah. Posledično lahko visoka zakasnitev predpomnilnika povzroči znatno škodo sistemom, ki temeljijo na Buldožerju.