AMD Bulldozer je najnovija generacija AMD procesora. Tko je administrator sustava?

AMD je odlučio zauzeti potpuno drugačiji pristup za novu Bulldozer arhitekturu. Odlučeno je stvoriti dvojezgrene module koji dijele neke resurse (L2 predmemorija, modul s pomičnim zarezom), ali nisu potpuno neovisni jedan o drugome. (vidi sliku ispod)
Prema AMD-u, to je učinjeno kako bi se optimizirao procesor i istovremeno smanjila cijena procesora. Optimizacija je u tome što na konvencionalnim višejezgrenim procesorima neki moduli mogu biti u stanju mirovanja, a takvi se moduli mogu kombinirati u Bulldozer arhitekturi. A ako ima manje modula, to znači da će se trošiti manje materijala, a to će zauzvrat imati pozitivan učinak na troškove, uštedu energije i smanjenje topline.
Stoga, iako će AMD svoje nove procesore Bulldozer nazvati dvojezgrenima, oni u stvarnosti neće biti istinski dvojezgreni, budući da neće imati potpuno neovisne jezgre. I ime" dvojezgreni procesor» koristit će se u marketinške svrhe.

Za stvaranje " četverojezgreni procesori", AMD koristi dvije od ovih jedinica, tako da procesor zapravo ima dva "procesora" unutra (dva građevna bloka prikazana su na slici ispod), a ne četiri. AMD će i dalje nove procesore nazivati ​​četverojezgrenima.


Osmojezgreni procesor temeljen na Bulldozer arhitekturi.

Sada pogledajmo pobliže module Fetch i Decode koji se koriste u arhitekturi Bulldozer.

Moduli za dohvaćanje i dekodiranje

Fetch modul je odgovoran za dohvaćanje instrukcija za dekodiranje iz predmemorije odn RAM memorija.

Moduli za dohvaćanje i dekodiranje.

Kao što je već navedeno, moduli uzorkovanja koriste dvije "jezgre" odjednom. L1 predmemoriju instrukcija također koriste dvije jezgre istovremeno, ali svaka procesorska jezgra ima svoju vlastitu L1 predmemoriju podataka.
AMD je već objavio da se L1 predmemorija instrukcija koja se koristi u Bulldozer arhitekturi sastoji od 64 KB dvosmjerne set-asocijativne predmemorije. Ista konfiguracija se koristi u procesorima s AMD64 arhitekturom, ali razlika je u tome što AMD64 procesori imaju L1 predmemoriju po jezgri, dok će Bulldozer procesori imati jednu L1 predmemoriju po paru jezgri. Međutim, predmemorija podataka će imati samo 16 KB, što je znatno manje od 64 KB po jezgri koja se koristi u procesorima temeljenim na AMD64 arhitekturi.

TLB-ovi (Translation Look-aside Buffer- ultrabrzi memorijski međuspremnik). Veličine TLB-ova su otkrivene. To su međuspremnici s malom količinom memorije, dizajnirani za pretvaranje adresa virtualne memorije u fizičke adrese.
Virtualna memorija, poznatija kao datoteka stranice, je tehnologija u kojoj se količina RAM-a "povećava" posebnom datotekom na tvrdom disku.

Računalni programi napisani su pomoću x86 instrukcija, ali trenutno procesori razumiju samo izvorne RISC instrukcije. Modul za dekodiranje odgovoran je za pretvaranje x86 programskih instrukcija u RISC mikroinstrukcije. Bulldozer arhitektura ima četiri dekodera, ali ovaj trenutak AMD ne otkriva koje instrukcije svaki dekoder izvršava. Tipično jedan od ovih dekodera izvršava složene, složene instrukcije pomoću dostavljenog ROM mikrokoda ("µcode" ili "microcode"). Dekodiranje složenih instrukcija dovršava se nakon nekoliko ciklusa takta, nakon čega se one pretvaraju u nekoliko mikroinstrukcija. Proizvođači obično optimiziraju svoje procesore na takav način da se kod dekodiranja najčešćih instrukcija izvršavaju u samo jednom taktu.

Uvod Nema sumnje da su AMD-ovi novi procesori, temeljeni na Bulldozer mikroarhitekturi, jedni od najočekivanijih proizvoda ne samo ove godine, nego barem ovih pet godina. Postoji nekoliko razloga za to, kao i za postojanje ogromne vojske obožavatelja AMD proizvoda. Nekima su svježa sjećanja na vremena kada su procesori ove tvrtke bili bolji od Intelovih u svim pogledima. Neki ljudi vole AMD proizvode zbog njihove uravnotežene kombinacije cijene i performansi. Neki su bili impresionirani AMD-ovim emotivnim pričama o prednostima mikroarhitekture koja se razvija unutar tvrtke. Sve se to pridodalo dugogodišnjem mučnom čekanju izlaska procesora generacije Bulldozer, a evo i rezultata - ovaj članak čitate s velikom pozornošću i neskrivenim zanimanjem.

Međutim, očito se isplati. Situacija na tržištu procesora u sljedećih nekoliko godina ovisi o tome koliko će se mikroarhitektura Bulldozer pokazati uspješnom. Uostalom, samo Intel ima inženjerske i proizvodne resurse za izbacivanje novih mikroarhitektonskih rješenja svake dvije do tri godine. AMD je prisiljen pridržavati se mnogo odmjerenijeg tempa u razvoju. Zastrašujuće je prisjetiti se, ali mikroarhitektura koja se koristi u današnjim Phenom II i Athlon II procesorima datira iz 1999. godine, a od tada AMD na njoj radi samo kozmetičke promjene. Stoga nemamo posebnih iluzija da će razvojni ciklus odjednom postati aktivniji izlaskom Buldožera. Očito je da će Bulldozer biti srž AMD-ove ponude performansi sljedećih nekoliko godina.

Na Trenutna verzija Planovi tvrtke za razvoj ove mikroarhitekture zacrtani su do 2014. godine, ali će se gotovo sigurno nastaviti i dalje.

Činjenica da AMD svake godine obećava povećanje performansi od 10-15 posto više je alarmantan nego ohrabrujući simptom. Najvjerojatnije će takav porast biti osiguran prvenstveno povećanjem taktnih frekvencija, a tek onda nekim novim mikroarhitektonskim poboljšanjima.

Drugim riječima, uspjeh mikroarhitekture Bulldozer u sadašnjem obliku presudno će utjecati na buduću poziciju AMD-a, na konkurentnost njegovih proizvoda, a u konačnici i na cjelokupnu situaciju na tržištu procesora.

Naravno, ne može se poreći da Bulldozer za AMD nije jedini ključni proizvod. Ova mikroarhitektura danas je namijenjena segmentu stolnih računala i poslužitelja visokih performansi. U isto vrijeme, AMD ima druge prijedloge za druge tržišne segmente. Na primjer, jeftini, isplativi procesori s mikroarhitekturom Bobcat ili APU iz obitelji Llano, koje je tvrtka objavila ranije ove godine, nisu manje važna područja za tvrtku. A ovi prijedlozi, kao što smo vidjeli iz rezultata testiranja, uspješna su rješenja koja mogu adekvatno djelovati i kao rješenja za netbooke i nettope, ali i kao osnova za integrirane platforme srednjeg cjenovnog razreda.

Međutim, uspjeh ili neuspjeh Buldožera ima puno značajnije implikacije. Prvo, ova mikroarhitektura cilja na tržišne segmente s mnogo većim profitnim maržama - poslužitelje i sustave produktivnosti stolnih računala. Stoga je sposoban imati puno jači utjecaj na financijsko stanje AMD-a. Drugo, uspjeh AMD procesori serije C, E i A - to, iskreno, uopće nije zasluga inženjera uključenih u razvoj dizajna mikroprocesora. Tržišni uspjeh ovih CPU-ova (ili APU-ova, ako se držimo AMD-ove terminologije) proizlazi iz prisutnosti grafičkih jezgri iz obitelji Radeon HD, koje su pronašle svoj put u AMD procesore zahvaljujući pravovremenoj kupnji ATI-ja. Buldožer je vrsta kvalifikacijskog ispita za inženjerski tim koji radi posebno na mikroarhitekturi računalnih jezgri. I treće, Bulldozer će u konačnici postati temelj cijele linije AMD procesora, s izuzetkom rješenja za energetski učinkovite platforme. Dakle, u konačnici, upravo će ova mikroarhitektura doći u niže tržišne segmente, istisnuvši K10 gotovo posvuda, uključujući Llano procesore.



Ukratko, teško je moguće precijeniti važnost uspješnog lansiranja procesora s mikroarhitekturom Bulldozer. Ovo je kultni proizvod i na emocionalnoj i na materijalističkoj razini. I zato stvarno želim da vidimo, figurativno rečeno, novi K7 ili K8 u stvarnosti.

Ali i prije testiranja možemo reći da su šanse za ponavljanje takve pojave male. Sam Intel pomogao je AMD-u da uhvati dlan prošli put, pokušavajući promovirati daleko od idealne NetBurst mikroarhitekture. Tada su se Intelovi inženjeri usredotočili na povećanje brzine takta, što je na kraju naišlo na prepreke u obliku ogromnih struja curenja, dok je AMD ponudio uravnoteženiju mikroarhitekturu usmjerenu na izvršavanje više instrukcija po taktu. Ali nakon što je Intel revidirao svoju doktrinu i predstavio novu Core mikroarhitekturu, također usmjerenu na izvršavanje maksimalnog broja instrukcija po ciklusu takta, AMD se vratio u poziciju zaostatka, gdje je bio do sada.

Očito je da je vrlo teško nadmašiti moderne Intelove procesore u pogledu broja izvršenih instrukcija po taktu. Današnja mikroarhitektura Sandy Bridge rezultat je najmanje tri ciklusa optimizacije inherentno učinkovitog dizajna, tako da ne možemo očekivati ​​još veću specifičnu učinkovitost jezgre od AMD-a. Štoviše, inženjeri AMD-a nisu ni sebi postavili takav cilj.

Glavna ideja Buldožera je negdje drugdje. Prema programerima, procesori izgrađeni na ovoj mikroarhitekturi trebali bi pokazati dobre performanse zbog visokih brzina takta i većeg broja računalnih jezgri od svojih konkurenata i prethodnika. Istodobno, trebali bi ostati prilično profitabilni u proizvodnji, odnosno ne bi trebali imati preveliki poluvodički kristal i ne pokazivati ​​preveliku disipaciju topline u smislu pojedinačne jezgre.

Tajne AMD višejezgrenog dizajna

Sasvim je jasno da povećanje broja procesorskih jezgri neizbježno povlači za sobom povećanje površine procesorskog čipa. Kao rezultat toga, povećava se i složenost proizvodnje i trošak finalnih proizvoda. Stoga se, primjerice, procesori s maksimalnim brojem računalnih jezgri danas koriste samo u segmentu tržišta poslužitelja - korporativni kupci mnogo su spremniji izdvojiti novac od pojedinačnih korisnika. Smjer koji je odabrao AMD za povećanje broja jezgri uz zadržavanje prihvatljive cijene rezultirajućih procesora mora biti povezan s pojednostavljenjem samih jezgri. No, s druge strane, pojednostavljenje kernela povlači za sobom neželjeni učinak - pad performansi u aplikacijama sa slabo paraleliziranim učitavanjima, kojih u ovom trenutku još uvijek ima dovoljan broj.

Stoga su AMD inženjeri krenuli svojim putem. Mikroarhitektura pojedinačnih jezgri postala je složenija, povećavajući broj instrukcija koje se izvode po taktu kad god je to moguće.



Ali odlučeno je da se dio resursa koji su obično prisutni u svakoj jezgri, ali su u isto vrijeme pretjerano učinkoviti, podijeli između parova računalnih jezgri.



Dobiveni dvojezgreni sklop postao je osnovni građevni blok za Bulldozer procesore. Takav čvor, koji se u AMD terminologiji naziva modul, ima dva kompleta cjelobrojnih aktuatora. Ali u isto vrijeme, jedinica s pomičnim zarezom, uređaji za prethodno dohvaćanje instrukcija i dekodiranje, kao i predmemorija druge razine postoje u jednoj kopiji za nekoliko jezgri i dijele svoje resurse između njih. Prema procjenama programera, snaga ovih elemenata sasvim je dovoljna za dvije jezgre, budući da pri servisiranju jedne jezgre u stvarnom životu često miruju. Osim toga, kašnjenja u njihovom neprekidnom radu nemaju ozbiljan utjecaj na rezultirajuće performanse.

Prema samom AMD-u, jedan dvojezgreni modul dizajniran na opisani način sposoban je isporučiti do 80% performansi potpunog dvojezgrenog procesora. Istodobno, uštede u proračunu tranzistora (i, sukladno tome, u području poluvodičkog kristala) dosežu 44%.

Zahvaljujući ovom genijalnom zbijanju jezgre, AMD je uspio ugraditi dizajn s osam jezgri (ili četverostruki modul) u osnovni dizajn poluvodičke matrice Bulldozer.



Štoviše, prilično značajan dio kristala je predan keš memoriji. Predmemorije druge razine, koje dijele parovi jezgri unutar svakog procesorskog modula, imaju kapacitet od 2 MB, a ukupna L3 predmemorija za cijeli procesor je 8 MB. Stoga, uzimajući u obzir tradicionalnu AMD-ovu ekskluzivnu organizaciju predmemorija, možemo reći da je njihov ukupni volumen 16 MB po procesoru s osam jezgri. U isto vrijeme, područje kristala poluvodiča Bulldozer ostaje unutar prihvatljivih granica, tako da su AMD programeri u potpunosti postigli svoj cilj.



U apsolutnim brojkama to znači da će Buldožeri s osam jezgri imati manju poluvodičku matricu od primjerice šesterojezgrenih Thuban procesora (Phenom II X6), izgrađenih na mikroarhitekturi K10. No, treba imati na umu da će se Bulldozer proizvoditi korištenjem naprednijeg tehničkog procesa s 32 nm standardima. U usporedbi s modernim četverojezgrenim procesorima Intel Sandy Bridges, novi AMD-ovi procesori s osam jezgri imat će samo 45% više površine.

No, četverojezgreni Sandy Bridge procesori, zahvaljujući podršci Hyper-Threading tehnologije, baš kao i Bulldozer, mogu se operativnom sustavu prikazati kao procesori s osam jezgri. To će svakako izazvati kontroverze oko legalnosti naziva Bulldozer punopravnim osmojezgrenim procesorima. Međutim, treba imati na umu da su AMD i Intel do dopuštenosti istovremenog izvođenja osam računalnih niti došli na različite načine. Intelovi programeri su se zajebali u svoju mikroarhitekturu dodatne mogućnosti, dopuštajući da dvije niti rade unutar jedne jezgre, na jednom skupu izvršnih jedinica. AMD je, naprotiv, izrezao "dodatne" dijelove iz dvije punopravne jezgre, ali unutar svakog modula bila su samo dva seta aktuatora.



Kao rezultat toga, Intelova Hyper-Threading tehnologija povećava višenitnu izvedbu za samo 15-20%, dok AMD-ovo rješenje daje 80% povećanje performansi pri prelasku s 4 na 8 niti.

Iako je, naravno, poluvodički kristal osmojezgrenog Buldožera zbog svoje modularne strukture doista vrlo sličan četverojezgrenom.


Više uputa po ciklusu?

Samo povećanjem broja procesorskih jezgri nećete daleko stići. To je postalo jasno čak i nakon izdavanja šesterojezgrenih procesora Phenom II X6, koji su općenito inferiorni u performansama od četverojezgrenih Sandy Bridgea. Stoga se AMD-ovi programeri nisu ograničili samo na opsežne promjene dizajna. Osnovna mikroarhitektura Bulldozera, u usporedbi s K10, redizajnirana je nešto manje nego potpuno, što daje nadu za ubrzanje rada sustava na AMD procesorima ne samo u višenitnim zadacima, već iu aplikacijama s niskom razinom paralelizma. Štoviše, te se nade temelje na posve objektivnim okolnostima. Dok su prijašnje AMD mikroarhitekture bile dizajnirane za izvršavanje tri instrukcije po taktu (na jednoj jezgri), Bulldozer mikroarhitektura pretpostavlja izvođenje četiri instrukcije po taktu i po ovoj je karakteristici bliža konkurentskim procesorima s Core mikroarhitekturom.

Kvalitativne promjene mogu se pratiti počevši od prvih faza izvedbenog cjevovoda - od faze prethodnog dohvaćanja i instrukcija dekodiranja. Ovi su stupnjevi uobičajeni za parove jezgri unutar jednog modula, pa je AMD posebno pazio da ne postanu mikroarhitektonsko usko grlo. Instrukcije se dohvaćaju iz L1I predmemorije za dekodiranje u blokovima od 32 bajta - dvostruko većim nego u procesorima s Core mikroarhitekturom (druga generacija). Sama predmemorija instrukcija prve razine ima kapacitet od 64 KB i dvokanalnu asocijativnost. U njega se unaprijed učitavaju upute namijenjene dekodiranju iz predmemorije druge razine.

Blok predviđanja grananja, koji je najizravnije uključen u proces uzorkovanja, sadrži dva skupa međuspremnika koji neovisno prate aktivnost različitih jezgri. Dakle, prilikom predviđanja rezultata logičkih grana, Bulldozer se ne zbunjuje između niti. Budući da nova mikroarhitektura ima za cilj rad na visokim taktovima, kvaliteta jedinice za predviđanje grananja je od najveće važnosti. Stoga su algoritmi koji se u njemu koriste potpuno redizajnirani, a AMD se nada da će se učinkovitost Bulldozerovog predviđanja grana poboljšati.



Bulldozerov x86 dekoder instrukcija također dijeli svoje resurse na dvije jezgre i sposoban je dekodirati do 4 dolazne instrukcije po taktu. Međutim, njegova izvedba je ograničena na izdavanje samo četiri makro instrukcije (koje proizlaze iz dekodiranja u AMD terminima), dok x86 instrukcije mogu biti podijeljene u 1-2 ili čak više makro instrukcija. Stoga, iako je dekoder povećao svoje performanse za trećinu u usporedbi s prethodnom generacijom mikroarhitekture, njegova brzina možda neće biti dovoljna, s obzirom na to da ima zadatak podržavati dva cjelobrojna i jedan računalni klaster s realnim brojem.

Treba napomenuti da je određeni analog tehnologije fuzije instrukcija makro-fuzije također korišten u Buldožeru. Neke grupe x86 instrukcija mogu se spojiti u jednu cjelinu i proći kroz dekoder kao jedna instrukcija - AMD to naziva Branch Fusion.

Dekodirane makroinstrukcije raspoređene su u tri računalna klastera, od kojih su dva ostaci potpunih računalnih jezgri, a jedna je stvarno numerirana, podijeljena između jezgri. Svaki od ovih klastera ima vlastitu logiku preuređivanja instrukcija i vlastiti planer. To očito znači da AMD zadržava mogućnost da u potpunosti zamijeni ili dopuni neke od ovih klastera u budućim proizvodima.

Preuređivanje instrukcija u svakom od klastera temelji se na korištenju datoteke fizičkog registra, koja pohranjuje reference na sadržaj registara i eliminira potrebu za stalnim prijenosom podataka unutar procesora prilikom preuređivanja redoslijeda instrukcija. Ovaj pristup zamijenio je međuspremnik za ponovno naređivanje, budući da datoteka fizičkog registra nije samo učinkovitija u smislu potrošnje energije, nego je i povoljnija za povećanje takta procesora.

Cjelobrojni klasteri sadrže dvije aritmetičke izvršne jedinice (ALU) i dvije memorijske adresne jedinice (AGU). U usporedbi s K10 mikroarhitekturom, broj uređaja smanjen je za jedan ALU i jedan AGU, no iz AMD-a uvjeravaju da to neće značajno smanjiti performanse, ali će područje jezgre znatno uštedjeti. Spremno vjerujemo da imati više od dva ALU-a i AGU-a u svakom clusteru cjelobrojnih brojeva stvarno nema praktičnog smisla, jer ne više od četiri makro instrukcije po ciklusu takta ne mogu stići iz dekodera za izvođenje od strane oba klastera.



Istodobno, aktuatori su postali univerzalniji, praktički se ne razlikuju u svojim funkcijama.

Organizacija podsustava predmemorije ozbiljno se promijenila. L1D predmemorija smanjena je sa 64 na 16 KB i postala je uključena za pisanje. Istodobno, asocijativnost mu je povećana na 4 kanala, uz koji je dodan i “prediktor puta”. Smanjenje veličine predmemorije podataka prve razine kompenzirano je značajnim povećanjem njegove propusnosti; sada može opsluživati ​​do tri 128-bitne operacije istovremeno: dva čitanja i jedno pisanje.

Očito, promjene u propusnosti L1D predmemorije u velikoj su mjeri povezane s potrebom implementacije 256-bitnih AVX instrukcija u mikroarhitekturi, čija se podrška pojavila u FPU jedinici podijeljenoj između jezgri. Međutim, to ne znači da su aktuatori pravih brojeva postali 256-bitni. Zapravo, modul Bulldozer ima dva 128-bitna uređaja, a AVX upute se dekodiraju kao povezani parovi 128-bitnih instrukcija. U skladu s tim, da bi ih izvršili, FMAC uređaji (floating point multiply-accumulate) se kombiniraju, a izvedba stvarno numeriranog klastera smanjuje se na jednu AVX naredbu po procesorskom modulu po taktu.



FPU nema vlastitu predmemoriju prve razine, tako da ovaj klaster radi s podacima preko cjelobrojnih uređaja.

Budući da su inženjeri AMD-a već preuzeli zadatak implementacije podrške za AVX upute koje je predložio Intel, procesorima Bulldozer dodani su drugi relevantni skupovi: SSE4.2 i AESNI upute usmjerene na ubrzavanje operacija šifriranja. Osim toga, AMD je predstavio nekoliko vlastitih naredbi: tri-operand multiplication-adition FMA4 i vlastitu viziju daljnjeg razvoja AVX-a - XOP.



L2 predmemorija u Bulldozeru dijeli se unutar procesorskog modula i dijeli jezgri. Kapacitet mu je impresivnih 2 MB, a asocijativnost 16 kanala. Međutim, latencija predmemorije koja radi prema ovoj shemi povećala se na 18-20 ciklusa, unatoč činjenici da je širina sabirnice ostala ista kao i prije - 128-bitna. To znači da L2 predmemorija u Bulldozeru, iako velika, nije jako brza; konkurentski i prethodni procesori nude L2 predmemoriju s otprilike upola manjom latencijom. U kombinaciji s malim L1D cacheom s latencijom od 4 ciklusa (što je također više nego kod K10 mikroarhitekture), sve to ne izgleda baš ohrabrujuće. Međutim, AMD tvrdi da je latencija predmemorije povećana isključivo kako bi se Bulldozeru dala mogućnost rada na visokim taktovima.



Osim toga, inženjeri AMD-a implementirali su učinkovitu jedinicu za prethodno dohvaćanje, koja je dizajnirana za učitavanje potrebnih podataka u predmemoriju prve i druge razine unaprijed. Rečeno je da su performanse ovih blokova poboljšane, a sada čak mogu prepoznati i nepravilne strukture podataka.

U teoriji, Buldožer ostavlja dobar dojam. AMD je potpuno revidirao svoj stari pristup mikroarhitekturi procesora i implementirao potpuno redizajniran dizajn. Što na prvi pogled izgleda vrlo obećavajuće, jer je nova mikroarhitektura optimizirana za izvođenje četiri, a ne tri instrukcije po taktu na jednoj procesorskoj jezgri. Osim toga, podržava makro spajanje instrukcija tijekom procesa dekodiranja, što dodatno povećava specifične performanse.

Ali sve izgleda tako dobro samo dok promatramo samo jednu jezgru i ne razmišljamo o tome da su u stvarnosti takve jezgre kombinirane u parovima. A dvojezgreni Bulldozer modul ima previše zajedničkih dijelova za par jezgri. Konkretno, zbog činjenice da takav modul ima samo jednu jedinicu za dohvaćanje instrukcija i jedan dekoder, maksimalni broj instrukcija koje se izvode po ciklusu takta ostaje jednak četirima za cijeli dvojezgreni sklop. To znači da je logički ekvivalent za jednu Sandy Bridge jezgru u smislu teoretskih performansi modul, a ne Bulldozer jezgra. Sposobnost modula da izvršava dvije niti u ovom slučaju izgleda kao sasvim logičan odgovor AMD-a na Hyper-Threading tehnologiju.

Naravno, naše testiranje pravih procesora sve će staviti na svoje mjesto, ali već u fazi razmatranja mikroarhitekture prisiljeni smo misliti da je pozicioniranje Buldozera kao punopravnih osmojezgrenih procesora marketinški trik. Pouzdanija procjena računalnih mogućnosti ovih procesora trebala bi se temeljiti na broju modula, koji su, s gledišta teoretskih performansi, savršeno usporedivi s jezgrama izgrađenih na mikroarhitekturi Intel Core druge generacije.

S tim u vezi nameće se sasvim logično pitanje – zašto se AMD uopće potrudio implementirati dual-threaded procesiranje unutar jednog procesorskog modula? Zašto nije bilo moguće kombinirati aktuatore raspoređene na dvije jezgre u jedan klaster? Nekoliko je razloga za to.

Prvo, kako bi se istovremeno opteretio velikim brojem aktuatora, u općem slučaju, potrebna je napredna intraprocesorska logika. AMD, očito, nije bio u mogućnosti implementirati vrlo učinkovite jedinice za predviđanje grananja i instrukcije i prethodno dohvaćanje podataka u mikroarhitekturi Bulldozer. Stoga je zadatak paraleliziranja rada i optimalnijeg korištenja izvršnih uređaja prebačen na proizvođače softvera, koji moraju isporučivati ​​proizvode s multi-threading podrškom za Bulldozer.

Drugo, povećanje broja istovremeno izvedenih niti nije tako loše. Ako za korisnike stolnih računala, a posebno za igrače, osam prilično jednostavnih Buldožer jezgri ne obećavaju nikakve posebne prednosti, onda bi u poslužiteljskim aplikacijama takva mikroarhitektura trebala biti vrlo povoljna. Dakle, sasvim je moguće da glavni cilj razvoja Bulldozera nije bio zadovoljiti težnje entuzijasta, već vratiti AMD-ovu poziciju na tržištu poslužitelja.

Turbo Core još više Turbo

Energetska učinkovitost je jedan od najvažnije karakteristike moderni procesori. Na primjer, u njihovim buduće mikroarhitekture Intel obraća pozornost na smanjenje potrošnje energije gotovo na prvom mjestu. AMD još nije došao do ove točke, inženjeri ove tvrtke prvenstveno se bore za performanse. Ali to ne znači da programeri uopće nisu marili za toplinske i energetske karakteristike Buldožera. Naprotiv, nakon Llanoa, temeljno novi pristupi povećanju energetske učinkovitosti našli su svoj put u Bulldozer procesore. Međutim, u ovom slučaju inženjeri su iskoristili oslobođeni potencijal ne toliko da uštede novac, već da istisnu dodatne performanse povećanjem frekvencije takta.

Naravno, nova tehnologija proizvodnje donijela je određena poboljšanja u pogledu potrošnje energije i odvođenja topline. Bulldozer koristi 32nm procesnu tehnologiju koristeći materijal visoke dielektričnosti, tranzistore s metalnim vratima i SOI tehnologiju. Drugim riječima, radi se o istom GlobalFoundries tehničkom procesu koji proizvodi Llano procesore. Zahvaljujući nova tehnologija Uz 32 nm standarde, radni naponi napajanja serijskih Bulldozer procesora s osam jezgri ne prelaze 1,4 V.

Međutim, glavna inovacija koja je iz Llana prešla u Bulldozer jesu power gate tranzistori, dizajnirani da isključe napajanje određenih dijelova procesora. U Bulldozeru vam omogućuju neovisno oslobađanje napona od pojedinačnih dvojezgrenih modula i predmemorije.



Kada obje računalne jezgre u modulu uđu u stanje uštede energije C6, modul je bez napona. Nažalost, ova se tehnologija ne može primijeniti na procesorske jezgre, budući da unutar Bulldozera jednostavno nema namjenskih jezgri - one dijele neke resurse sa svojim susjedima modulima.

Stanja uštede energije C6 jezgri kontroliraju se u tehnologiji Bulldozer i Turbo Core. U onim trenucima kada je barem polovica Bulldozer procesorskih modula u isključenom stanju za uštedu energije, on povećava svoj napon napajanja i frekvenciju takta. Ovaj prisilni način rada naziva se Max Turbo Boost.

No, Max Turbo Boost nije ništa novo; takav auto-overclocking AMD je uveo u Thuban procesore izgrađene na mikroarhitekturi K10. Ono što je stvarno novo je način rada All Core Boost, u kojem se radni takt može povećati iznad nominalne vrijednosti čak i kada su sve jezgre procesora aktivne. Poboljšana verzija Turbo Core implementirana u Bulldozeru omogućuje procesoru da s dobrom točnošću procijeni svoju praktičnu potrošnju energije i rasipanje topline, na temelju informacija o radnom opterećenju određenih blokova. U skladu s tim, ako je, prema ovoj procjeni, trenutna disipacija topline i potrošnja energije znatno ispod granice, procesor može povećati svoj napon napajanja i frekvenciju takta čak i ako niti jedna jezgra nije u pasivnom stanju.



Dakle, radna frekvencija procesora s mikroarhitekturom Bulldozer iznimno je promjenjiva vrijednost. Ovisno o "ozbiljnosti" algoritama koji se izvršavaju i broju uključenih jezgri, može se dinamički mijenjati u vrlo širokom rasponu, dosežući 900 MHz.

Ažurirana desktop platforma

Uvođenjem nove mikroarhitekture AMD ne samo da nije promijenio dizajn platforme, već je čak zadržao kompatibilnost Bulldozer procesora s postojećom infrastrukturom. Sukladno tome, baš kao i njihovi prethodnici, novi procesori sadrže integrirani sjeverni most, uključujući predmemoriju treće razine, kontroler memorije i kontroler sabirnice Hyper-Transport. U isto vrijeme, unatoč činjenici da svi novoobjavljeni AMD i Intel procesori također imaju ugrađen kontroler PCI Express grafičke sabirnice, Bulldozer to nema.



Baš kao i kod procesora izgrađenih na mikroarhitekturi K10, ugrađeni sjeverni most u Buldožeru koristi vlastitu frekvenciju takta, koja je postavljena na 2,0-2,2 GHz za različite modele. Imajte na umu da ova frekvencija ima određeni utjecaj na izvedbu, budući da izravno utječe na brzinu L3 predmemorije. Koji u trenutnoj verziji procesora ima volumen povećan na 8 MB i ima 64-kanalnu asocijativnost. Udovoljavajući željama poslovnih korisnika, podaci pohranjeni u ovoj predmemoriji zaštićeni su ECC kodom za ispravljanje pogrešaka.

Kontroler memorije ugrađen u Buldožer nema suštinski nove mogućnosti. Kao i prije, podržava DDR3 SDRAM, koristi dvokanalni dizajn i zapravo se sastoji od dva neovisna jednokanalna kontrolera koji mogu raditi u uparenom ili odvojenom načinu rada. AMD je samo dodao podršku za tipove memorije veće brzine, deklarirajući kompatibilnost s DDR3-1867, te se pobrinuo za kompatibilnost s energetski učinkovitim modulima s radnim naponima od 1,25 i 1,35 V.

Govoreći o desktop modifikaciji Bulldozer, koja ima svoje kodno ime Zambezi, treba napomenuti da je ona usmjerena na novi Platforma za utičnice AM3+, poznat i pod kodnim imenom Scorpius. Procesor utičnica AM3+ ima 942 pina, jedan pin više od utičnice AM3. No, unatoč tome, Zambezi ostaje kompatibilan sa starijim Socket AM3 pločama. Instaliranjem novih procesora u stare matične ploče zapravo se gube samo određene funkcije upravljanja napajanjem. Stoga se brzina promjene frekvencije smanjuje kada su Turbo Core i Cool"n"Quiet tehnologije pokrenute, a Vdrop ne radi.

Međutim, do trenutka kada je Zambezi pušten, AMD i proizvođači matične ploče pripremili su galaksiju novih proizvoda temeljenih na novim logičkim setovima serije 900. Struktura tipičnog sustava temeljenog na Zambezi procesoru i izgrađenog na novom čipsetu prikazana je na blok dijagramu ispod.


Razlike između novog AMD 990FX čipseta (i njegovih pojednostavljenih verzija AMD 990X i AMD 970) leže isključivo u podršci za specifična električna svojstva Socket AM3+ i ne donose sa sobom nikakva nova sučelja. Kao i čipseti serije 800, novi južni most ima šest SATA 6 Gbps portova i četrnaest USB 2.0 portova. Koliko god bismo željeli vidjeti podršku za PCI Express 3.0 specifikaciju ili, u najgorem slučaju, USB 3.0 portove u novim setovima sistemske logike, ni ovoga puta u njima nema ništa od toga. Ovo je, usput, vrlo čudno, jer je podrška za USB 3.0 uvedena u čipsete za Socket FM1 platformu niže razine.

Razlike između modifikacija nove serije skupova sistemske logike sastoje se isključivo u podršci za različite multi-GPU konfiguracije.


Raspon procesora Zambezi

Izdanje Zambezi procesora dovršava ažuriranje asortiman modela, nudi AMD. Desktop procesori temeljeni na Bulldozer mikroarhitekturi postat će nova vodeća ponuda ovog proizvođača i brzo će s tržišta istisnuti sve vrste Phenom II modifikacija.

Naglašavajući inovativnost nove mikroarhitekture, AMD će koristiti novi marketinški naziv za stolne procesore Zambezi - FX. S jedne strane savršeno se uklapa u novu nomenklaturu koja podrazumijeva označavanje procesora slovima, as druge je referenca na legendarne Athlon 64 FX procesore koji su prije šest-sedam godina bili najbrži stolni procesori. No, ti su dani nepovratno prošli, pa da vidimo što nam je AMD sada spreman ponuditi.

U bliskoj budućnosti asortiman procesora FX serije uključivat će četiri modela.



Unatoč činjenici da razlika između modela procesora Zambezi nije samo u brzinama takta, već iu broju aktivnih računalnih jezgri, svi će se temeljiti na istom unificiranom poluvodičkom čipu. Evo ga:



Kako bi dobio procesore s manje od osam jezgri, AMD će onemogućiti neke od njih na poluvodičkom čipu. Mogućnost ponovnog otključavanja, kao što je to bilo moguće kod procesora s K10 mikroarhitekturom, još uvijek je upitna. Međutim, u BIOS-u matičnih ploča temeljenih na logičkim setovima serije 900 koji su prošli kroz naš laboratorij prisutne su odgovarajuće opcije, pa postoji nada za povoljno rješenje ovog problema.

Onemogućavanje jezgri radi dobivanja modifikacija procesora sa šest i četiri jezgre događat će se "modul po modul". Odnosno, bit će blokirani cijeli dvojezgreni moduli, a ne "druge" jezgre unutar njih, iako bi takva taktika bila mnogo korisnija u smislu performansi. Međutim, izdavanje šesterojezgrenih i četverojezgrenih procesora izgrađenih na mikroarhitekturi Bulldozer objašnjava se ne toliko marketinškim razlozima koliko potrebom implementacije odbijanja, što, s obzirom na prilično velike dimenzije čipa i novi tehnološki proces, bit će dosta.

Unatoč činjenici da AMD izoštrava novu mikroarhitekturu za rad na visokim taktnim frekvencijama, postignute vrijednosti još ne možemo nazvati impresivnim pomakom. Granica od četiri gigaherca ostaje neovladana, a nominalna frekvencija starijeg FX procesora čak je niža od, primjerice, Phenom II X4 980. Nadajmo se da će s poboljšanjem tehnologije proizvodnje Zambezi frekvencije brzo ići gore . Iako, ako vjerujete trenutnoj verziji AMD-ovih planova, linija će biti ubrzana ne prije prvog kvartala 2012.

Nema iskoraka u pogledu oslobađanja topline i potrošnje energije. AMD je dugo govorio o tome kako će Bulldozer mikroarhitektura biti energetski učinkovitija, ali zapravo stariji modeli s osam jezgri imaju istu razinu TDP-a kao i stariji Phenom II. Istina, nakon nekog vremena tvrtka bi svojoj ponudi trebala dodati 95-vatnu verziju FX-8120 i FX-8100 procesora s istom izračunatom disipacijom topline.

Ali cijene novih procesora FX-serije izgledaju više nego privlačno. AMD ne želi odstupiti od svog kursa ponude platformi po povoljnijoj cijeni od konkurencije, pa su stariji osmojezgreni Zambezi modeli suprotstavljeni starijim Intel Core i5 procesorima. Općenito, AMD se planira pridržavati sljedeće sheme pozicioniranja za svoje proizvode:



Drugim riječima, AMD nema namjeru konkurirati Intelovim šesterojezgrenim procesorima i obećavajućoj LGA2011 platformi, već se želi fokusirati na osvajanje srednjeg cjenovnog segmenta.

Dobra vijest za entuzijaste bit će činjenica da nijedan množitelj neće biti blokiran u svim procesorima serije FX. Svi Zambezi ne samo da se mogu jednostavno overclockati jednostavnom promjenom osnovnog množitelja, već se također mogu na sličan način rekonfigurirati s Turbo Core tehnologijom. Također, dostupan je overclocking memorijskog podsustava i frekvencije sjevernog mosta ugrađenog u procesor.

Testni procesor: AMD FX-8150

AMD je našim urednicima poslao stariji procesor iz obitelji Zambezi, FX-8150.



Ima nominalni radni takt od 3,6 GHz i više detaljne informacije Njegove karakteristike mogu se dobiti iz danog snimka zaslona CPU-Z-a.



Imajte na umu da se procesor temelji na B2 steppingu – a ovo nije prva verzija. Prethodne modifikacije poluvodičkog kristala proizvođač je odbacio jer nisu mogle raditi na izvorno planiranim taktnim frekvencijama. Zbog toga je došlo do kašnjenja objave, koja je isprva bila planirana u proljeće, zatim u ljeto, a zapravo se dogodila sredinom listopada.

No, danas postignuta frekvencija od 3,6 GHz ne izgleda previše impresivno. I sam AMD i Intel imaju proizvode koji rade na većim brzinama. No, FX-8150 ima vrlo obećavajuću Turbo Core tehnologiju, koja pod malim opterećenjem može automatski povećati frekvenciju procesora do 4,2 GHz.



Važno je napomenuti da se frekvencija od 3,9 GHz može postići čak i ako su sve računalne jezgre opterećene, ali istovremeno ostavlja prostor za automatsko overklokiranje bez prekoračenja ograničenja potrošnje energije i rasipanja topline.



Kada je u stanju mirovanja, Cool"n"Quiet tehnologija smanjuje frekvenciju FX-8150 na 1,4 GHz. Napon napajanja pada na 0,85 V.


Kako smo testirali

Usporedili smo novi procesor AMD FX-8150 s osam jezgri, izgrađen na mikroarhitekturi Bulldozer, s jednim od njegovih prethodnika, Phenom II X6 sa šest jezgri, te s konkurentskim (cjenovno) Intelovim ponudama - četverojezgrenim Core procesori i5-2500 i Core i7-2600. Osim toga, radi veće jasnoće, rezultatima su dodani pokazatelji performansi za procesor Core i7-990X sa šest jezgri.

Kao rezultat toga, testni sustavi uključivali su sljedeće softverske i hardverske komponente:

Procesori:

AMD FX-8150 (Zambezi, 8 jezgri, 3,6 GHz, 8 MB L2 + 8 MB L3);
AMD Phenom II X6 1100T (Thuban, 6 jezgri, 3,3 GHz, 3 MB L2 + 6 MB L3);
Intel Core i7-2600K (Sandy Bridge, 4 jezgre, 3,4 GHz, 1 MB L2 + 8 MB L3);
Intel Core i5-2500K (Sandy Bridge, 4 jezgre, 3,3 GHz, 1 MB L2 + 6 MB L3);
Intel Core i7-990X Ekstremno izdanje(Gulftown, 6 jezgri, 3,46 GHz, 1,5 MB L2 + 12 MB L3).

CPU hladnjak: NZXT Havik 140;
Matične ploče:

Gigabyte 990FXA-UD5 (Socket AM3+, AMD 990FX + SB950);
ASUS P8Z68-V PRO (LGA1155, Intel Z68 Express);
Gigabyte X58A-UD5 (LGA1366, Intel X58 Express).

Memorija:

2 x 2 GB, DDR3-1600 SDRAM, 9-9-9-27 (Kingston KHX1600C8D3K2/4GX);
3 x 2 GB, DDR3-1600 SDRAM, 9-9-9-27 (Crucial BL3KIT25664TG1608).

Grafička kartica: AMD Radeon HD 6970.
Tvrdi disk: Kingston SNVP325-S2/128GB.
Napajanje: Tagan TG880-U33II (880 W).
Operacijski sustav: Microsoft Windows 7 SP1 Ultimate x64.
Vozači:

Intelov upravljački program za skup čipova 9.2.0.1030;
Upravljački program Intel Management Engine 7.1.10.1065;
Intel Rapid Storage Technology 10.6.0.1022;
Upravljački program za zaslon AMD Catalyst 11.10.

Imajte na umu da je testiranje provedeno pod trenutnom verzijom operativnog sustava Windows 7, ali AMD ukazuje da upravitelj zadataka ovog OS-a ne distribuira računalne niti na najoptimalniji način. Windows 7 primarno preferira usmjeravanje niti na kernele koji se nalaze u različitim modulima. I ovo stvarno pruža veću specifičnu izvedbu, budući da smanjuje opterećenje blokova podijeljenih unutar modula. Međutim, ova strategija sprječava uključivanje turbo načina rada, koje bi mogao koristiti procesor ako su neki od dvojezgrenih modula bili u stanju uštede energije.

Operacijska sala koja obećava Windows sustav 8 će slijediti drugačiju taktiku i tamo će se niti prvo dodijeliti jezgrama unutar istog modula. Kao rezultat toga, AMD obećava da se u brojnim aplikacijama performanse sustava temeljenih na Zambeziju mogu povećati do 10%.

Izvođenje

Preliminarna procjena učinkovitosti mikroarhitekture Buldožera

Prije nego što smo krenuli u “pravo” testiranje procesora, odlučili smo dokučiti što u načelu možemo očekivati ​​od mikroarhitekture Bulldozer. Da bismo to učinili, proveli smo malu usporedbu procesora s ovom mikroarhitekturom s drugim CPU-ima s mikroarhitekturama K10 i Sandy Bridge pod umjetno stvorenim jednakim uvjetima: na istoj frekvenciji takta i s istim brojem aktiviranih jezgri.

Točnije, usporedili smo AMD FX-8150, Phenom II X6 1100T i Core i7-2600 na 3,6 GHz sa samo dvije omogućene procesorske jezgre. Radi čistoće eksperimenta, sve tehnologije za uštedu energije i automatsko overklokiranje prirodno su deaktivirane. Skup jednostavnih sintetičkih mjerila uključenih u pomoćni program odabran je kao alat za testiranje SiSoft Sandra 2011, u kojem smo prisilno onemogućili sve skupove instrukcija starije od SSE3, budući da nisu podržani u mikroarhitekturi K10.



Brojke u tablici govore više od bilo koje riječi. Performanse mikroarhitekture Bulldozer postale su znatno niže od performansi prethodnih procesora. Kombiniranje parova jezgri u jedan modul sa zajedničkim resursima i popratno pojednostavljenje mikroarhitekture doveli su do činjenice da je pri istoj frekvenciji specifična izvedba Buldožera po jezgri pala za 25-40% u usporedbi s prethodnom generacijom AMD mikroarhitekture. Kao rezultat toga, Bulldozer jezgre su gotovo upola sporije od Sandy Bridge jezgri. Štoviše, performanse procesorskog modula Bulldozer, koji uključuje dvije jezgre, čak su niže od brzine jedne Sandy Bridge jezgre s omogućenom Hyper-Threading tehnologijom. Trebamo li očekivati ​​rekordne performanse od procesora izgrađenog na takvoj mikroarhitekturi? Pitanje je retoričko.

Usput, pogledajmo praktične karakteristike predmemorije i memorijski podsustavi. Kako bismo procijenili brzinu rada ovih funkcionalnih jedinica, proveli smo testove u uslužnom programu Cachemem iz paketa Aida64. U svim slučajevima korištena je DDR3-1600 memorija s latencijama od 9-9-9-27-1T. Kao iu prethodnom slučaju, frekvencije procesora ostale su usklađene na 3,6 GHz.



U Zambeziju, u usporedbi s procesorima Phenom II, povećane su praktične latencije svih predmemorija i memorijskog podsustava. Razgovarali smo o tome kada smo razmatrali mikroarhitekturu Bulldozer. Međutim, promjenom logičke organizacije cache memorije, njezina se propusnost povećala u gotovo svim slučajevima.

U isto vrijeme, najbrži dvokanalni memorijski kontroler i najbrži podsustav predmemorije implementirani su u Sandy Bridge. Iako je, naravno, u pogledu kapaciteta predmemorije Intelov procesor donekle inferioran u odnosu na medije mikroarhitekture Bulldozer.

Ukupna izvedba

Za procjenu performansi procesora u uobičajenim zadacima, tradicionalno koristimo test Bapco SYSmark 2012, koji simulira rad korisnika u uobičajenim modernim uredski programi te aplikacije za stvaranje i obradu digitalnog sadržaja. Ideja testa je vrlo jednostavna: proizvodi jednu metriku koja karakterizira ponderiranu prosječnu brzinu računala u uobičajenim aplikacijama.

Prisjetimo se da je prije nekog vremena AMD pokušao trolirati SYSmark, šireći tvrdnje da je pristran zbog korištenja “pogrešnog” skupa pravih aplikacija. Međutim, po našem mišljenju, takva prosudba nije opravdana, jer su uobičajeni i vrlo popularni programi koji se koriste za ocjenu performansi, čiji je doprinos konačnom rezultatu prikazan na sljedećem dijagramu:



Stoga nismo napustili korištenje SYSmark 2012 i nastavljamo koristiti njegove metrike za procjenu uobičajene izvedbe.



Prvi test je takvo razočaranje. Rezultat osmojezgrenog FX-8150 samo je 10% bolji od performansi šesterojezgrenog Phenom II X6 1100T i, naravno, uopće ne dostiže performanse četverojezgrenih Intelovih procesora. Dakle, taktika koju je izabrao AMD za implementaciju velikog broja jezgri s niskim specifičnim performansama u procesoru umjesto umjerenog broja složenih, općenito ne daje pozitivan rezultat.

Dublje razumijevanje rezultata SYSmark 2012 može pružiti uvid u rezultate performansi dobivene u različitim scenarijima korištenja sustava.

Scenarij Office Productivity simulira tipičan uredski rad: priprema teksta, obrada proračunskih tablica, rad s e-poštom i posjećivanje internetskih stranica. Skripta koristi sljedeći skup aplikacija: ABBYY FineReader Pro 10.0, Adobe Acrobat Pro 9, Adobe Flash Igrač 10.1 Microsoft Excel 2010, Microsoft Internet Explorer 9, Microsoft Outlook 2010, Microsoft PowerPoint 2010, Microsoft Word 2010 i WinZip Pro 14.5.



Scenarij stvaranja medija simulira stvaranje reklame korištenjem unaprijed snimljenih digitalnih slika i videa. U tu svrhu koriste se popularni Adobe paketi: Photoshop CS5 Extended, Premiere Pro CS5 i After Effects CS5.



Web Development je scenarij unutar kojeg se modelira izrada web stranice. Korištene aplikacije: Adobe Photoshop CS5 Extended, Adobe Premiere Pro CS5, Adobe Dreamweaver CS5, Mozilla Firefox 3.6.8 i Microsoft Internet Explorer 9.



Scenarij Data/Financial Analysis posvećen je statističkoj analizi i predviđanju tržišnih trendova, koja se izvodi u programu Microsoft Excel 2010.



Skripta za 3D modeliranje u potpunosti je posvećena stvaranju trodimenzionalnih objekata i prikazivanju statičnih i dinamičkih scena s koristeći Adobe Photoshop CS5 Extended, Autodesk 3ds Max 2011, Autodesk AutoCAD 2011 i Google SketchUp Pro 8.



Posljednji scenarij, Upravljanje sustavom, uključuje stvaranje sigurnosnih kopija i instaliranje softvera i ažuriranja. Ovdje ih je nekoliko različite verzije Instalacijski program Mozilla Firefox i WinZip Pro 14.5.



Na razni modeli Korištenje procesora s mikroarhitekturom Bulldozer pokazuje bitno drugačije rezultate. U nekim slučajevima ispadne čak i sporiji od Phenoma II X6, ali ima i suprotnih situacija. Općenito, opće pravilo je sljedeće: prednost FX-8150 postaje posebno uočljiva tamo gdje je radno opterećenje višenitno i dobro paralelizirano, ali nije računalno složeno.

No, i u najpovoljnijim situacijama FX-8150 zaostaje za Core i5-2500. Jedini scenarij u kojem su ovi procesori usporedivi u brzini je 3D renderiranje. U prosjeku, Intelova ponuda je ispred AMD-ovog novog proizvoda za impresivnih 25%. Nažalost.

Izvedba igranja

Kao što znate, izvedba platformi opremljenih procesorima visokih performansi u velikoj većini modernih igara određena je snagom grafičkog podsustava. Zato pri testiranju procesora nastojimo provoditi testove na takav način da u što većoj mjeri uklonimo opterećenje s video kartice: odabiru se igre koje najviše ovise o procesoru, a testovi se provode bez uključivanja anti -aliasing i s instalacijom daleko od najviše visoke rezolucije. Odnosno, dobiveni rezultati omogućuju procjenu ne toliko razine fps-a koja se može postići u sustavima s modernim video karticama, već koliko dobro procesori rade s opterećenjem igara u načelu. Stoga je na temelju prikazanih rezultata sasvim moguće nagađati kako će se procesori ponašati u budućnosti, kada se na tržištu pojave brže opcije grafičkih akceleratora.


















Igre ne pripadaju kategoriji zadataka koji generiraju paralelizirano višenitno opterećenje. Stoga su za današnje gaming aplikacije prikladniji procesori s četiri jezgre, a ne ona višejezgrena čudovišta kakva nudi AMD. Vidimo jasnu ilustraciju ove izjave u dijagramima ispod. Novi osmojezgreni FX-8150 nije ništa brži od svog šesterojezgrenog prethodnika, Phenom II X6.

Što se tiče omjera igračkih performansi između Zambezija i Sandy Bridgea, AMD je ipak puno pesimističniji za novi proizvod. Trenutna procesorska mikroarhitektura Intela mnogo se bolje nosi s tipičnim radnim opterećenjem koje generiraju 3D igre i nema nade da će AMD ikada moći sustići konkurentske procesore u ovoj kategoriji zadataka. Drugim riječima, korištenje Bulldozera u sustavima za igranje može imati smisla samo kada postoji povjerenje da je izvedba određenog procesora dovoljna za određeni video podsustav u određenom skupu igara. Međutim, čak iu ovom slučaju, morate shvatiti da sa sljedećom nadogradnjom video akceleratora možete ostati u ozbiljno nepovoljnom položaju u usporedbi s onim korisnicima koji su u početku preferirali platformu i moderne Intel procesore.

Osim gaming testova, predstavit ćemo i rezultate sintetičkog benchmarka Futuremark 3DMark 11, lansiranog s Extreme profilom.



Svrha dodavanja ovih rezultata bila je pokazati vrlo idealnu situaciju za FX-8150, kada video podsustav ne dopušta da se snaga procesora u potpunosti realizira. Ovdje glavno opterećenje pada na video karticu, a procesor igra samo pomoćnu ulogu. U takvim slučajevima možemo govoriti o podjednakim performansama Bulldozer i Sandy Bridge procesora, iako to, naravno, nije sasvim točno.



Međutim, FX-8150 također izgleda dobro (u usporedbi s prethodnim rezultatima) u 3DMark 11 fizičkom testu. fizički model AMD-ov novi osmojezgreni procesor radi brzinama usporedivim s četverojezgrenim Core i5-2500.

Testovi u aplikacijama

Sveukupno, Bulldozerov ponderirani prosjek i performanse igranja na stolnom računalu bili su znatno ispod naših očekivanja. Međutim, nemojmo očajavati i pokušajmo pronaći one slučajeve kada nova AMD mikroarhitektura može pokazati svoje snage.

Za mjerenje brzine procesora pri sažimanju informacija koristimo WinRAR arhivator, uz pomoć kojeg arhiviramo mapu s raznim datotekama ukupnog volumena 1,4 GB uz maksimalni stupanj kompresije.



Rezultat FX-8150 je blizak Core i5-2500. WinRAR nije jedna od aplikacija koja može paralelizirati svoje izračune u svih osam Bulldozer jezgri, ali čini se da gigantska predmemorija spašava stvar.

Drugi sličan test brzine arhiviranja provodi se u programu 7-zip, koristeći LZMA2 algoritam kompresije.



U 7-zipu, performanse FX-8150 su pohvalne. Ovaj osmojezgreni procesor uspijeva se približiti brzini četverojezgrenog Core i7-2600, koji uključuje podršku za Hyper-Threading i koji, poput Bulldozera, može izvršavati osam dretvi istovremeno.

Učinkovitost šifriranja procesora mjeri se pomoću ugrađenog mjerila popularnog kriptografskog uslužnog programa TrueCrypt. Treba napomenuti da ne samo da je sposoban učinkovito učitati bilo koji broj jezgri radom, već također podržava specijalizirani skup AES instrukcija.



Dobro paralelizirani, jednostavni cjelobrojni algoritmi ono su što treba mikroarhitektura Bulldozera. U takvim slučajevima, kao što vidimo, mogu se postići vrlo izvanredne performanse. Konkretno, kada je enkripcija u pitanju, FX-8150 zaostaje samo za šesterojezgrenim Core i7-990X i ispred je svih procesora za LGA1155 platformu.

Prilikom testiranja brzine audio transkodiranja, koristite uslužni program Apple iTunes, koji pretvara sadržaj CD-a u AAC format. Imajte na umu da je karakteristična značajka ovog programa mogućnost korištenja samo par procesorskih jezgri.



Bolje je programe koji generiraju mali broj računalnih niti držati dalje od Bulldozera. Neke jezgre ovog CPU-a su preslabe da bi pokazale bilo kakve pristojne rezultate u takvim slučajevima.

Učinkovitost u Adobe Photoshopu mjerimo pomoću vlastitog testa koji je kreativno prerađen Umjetnici retuširanja Photoshop Speed ​​​​Test, što uključuje tipičnu obradu četiri slike od 10 megapiksela snimljene digitalnom kamerom.



U Photoshopu performanse FX-8150 nisu tako katastrofalne kao kod procesora s K10 mikroarhitekturom, ali svejedno daleko zaostaje za Core i5-2500. Očito, velika predmemorija je dobra pomoć za Bulldozer mikroarhitekturu u ovom slučaju, ali sama po sebi nećete daleko stići. Učinkovitost i specifične performanse računalnih jezgri i dalje su od najveće važnosti.

Također smo proveli testiranje u Adobe program Photoshop Lightroom 3. Testni scenarij uključuje naknadnu obradu i izvoz u JPEG stotinjak slika od 12 megapiksela u RAW formatu.



Lightroom može paralelizirati obradu fotografija kroz bilo koji broj jezgri, pa stoga osmojezgreni FX-8150 ovdje pokazuje dobre rezultate. Međutim, "nije loše" je relativan koncept u ovom slučaju; zapravo, njegove performanse su usporedive samo s Core i5-2500. To znači da su dvije Bulldozer jezgre jednake jednoj Sandy Bridge jezgri bez podrške za Hyper-Threading.

Performanse u programu Adobe Premiere Pro testirane su mjerenjem vremena renderiranja u H.264 Blu-Ray formatu projekta koji sadrži HDV 1080p25 video s različitim primijenjenim efektima.



Prethodna generacija AMD procesora također je dobro nosila video transkodiranje. Mikroarhitektura Bulldozer omogućila je blago povećanje performansi u aplikacijama ove prirode i, kao rezultat toga, FX-8150 je čak brži od Core i5-2500.

Brzina uređivanja videozapisa pomoću programa Adobe After Effects procijenjena je mjerenjem vremena izvođenja unaprijed definiranog skupa filtara i efekata, uključujući zamućenje, stvaranje neravnina, stapanje okvira, stvaranje sjaja, dodavanje defokusiranja kretanja, sjenčanje, 2D i 3D manipulaciju, inverziju, itd.



Unatoč činjenici da je opterećenje dobro paralelizirano, FX-8150 zaostaje za Intelovim konkurentima u After Effectsu.

Za mjerenje brzine transkodiranja videa u H.264 format koristi se x264 HD test koji se temelji na mjerenju vremena obrade izvornog videa u MPEG-2 formatu, snimljenog u 720p rezoluciji uz stream od 4 Mbit/s. Treba napomenuti da su rezultati ovog testa od velike praktične važnosti, budući da se kodek x264 koji se u njemu koristi nalazi u osnovi brojnih popularnih uslužnih programa za transkodiranje, na primjer, HandBrake, MeGUI, VirtualDub itd.






Kod transkodiranja videa s kodekom x264, AMD procesori su uvijek pokazivali dobre performanse. Izlaskom mikroarhitekture s osam jezgri, njihovi su rezultati dodatno porasli, a sada FX-8150 čak nadmašuje Core i7-2600 u drugom prolazu kodiranja koji zahtijeva najviše resursa. Tako smo uz poprilične poteškoće konačno pronašli drugu aplikaciju, uz TrueCrypt, gdje performanse procesora s mikroarhitekturom Bulldozer zaslužuju laskave ocjene.

Mjerimo performanse računala i brzinu renderiranja u Autodesk 3ds max 2011 pomoću specijaliziranog SPECapc testa. Počevši od ovog testiranja, počinjemo koristiti novu profesionalnu verziju SPECapca za 3ds Max 2011.






Renderiranje je također jedan od zadataka koji podliježu optimizaciji za višejezgrene mikroarhitekture. Ali unatoč tome, FX-8150 je još uvijek sporiji od Core i5-2500 i Core i7-2600, a da ne spominjemo Core i7-990X. S druge strane, ne postoji sramotna situacija kada novi AMD procesor izgubi od svog prethodnika.

Usrednjavajući rezultate za pojedinačne aplikacije, FX-8150 je bio oko 14% brži od Phenom II X6 1100T na našem skupu aplikacija. A to mu je omogućilo da radi ništa manje od Core i5-2500 u nešto manje od polovice slučajeva. Međutim, razlika u odnosu na sljedeći Sandy Bridge model, Core i7-2600, ostaje značajan i iznosi više od 10%.

Potrošnja energije

Unatoč činjenici da smo uspjeli pronaći niz zadataka u kojima se performanse Bulldozera mogu nazvati prihvatljivima, procesori temeljeni na novoj mikroarhitekturi uopće ne izgledaju kao revolucionarni procesori. Jedina nada ostaje za potrošnju energije, jer su prethodno AMD procesori bili više nego značajno inferiorniji od svojih konkurenata u ovom parametru. Sada, ako vjerujete obećanjima programera, mikroarhitektura je postala više usredotočena na energetsku učinkovitost, a novi 32-nm tehnološki proces trebao je pridonijeti poboljšanju električne karakteristike. Dakle, pogledajmo FX-8150 kroz objektiv performansi po vatu.

Sljedeći grafikoni, osim ako nije drugačije navedeno, prikazuju ukupnu potrošnju sustava (bez monitora), mjerenu "nakon" napajanja i predstavljaju zbroj potrošnje energije svih komponenti uključenih u sustav. Učinkovitost samog napajanja se u ovom slučaju ne uzima u obzir. Tijekom mjerenja, opterećenje procesora stvarala je 64-bitna verzija uslužnog programa LinX 0.6.4. Osim toga, kako bismo ispravno procijenili potrošnju energije u mirovanju, aktivirali smo sve dostupne tehnologije za uštedu energije: C1E, C6, AMD Cool"n"Quiet i Enhanced Intel SpeedStep.



U mirovanju, potrošnja sustava s procesorima izgrađenim na mikroarhitekturi Bulldozer postala je manja od potrošnje sličnih sustava s procesorima obitelji Phenom II. Međutim, moderni Intel LGA1155 sustavi troše znatno manje u stanju mirovanja.



U slučaju kada je računalno opterećenje jednonitno, potrošnja Socket AM3+ sustava naglo raste, očito zbog visoke agresivnosti Turbo Core tehnologije. S izgrađenim sustavima Intel procesori, to se ne poštuje, a opet se mogu pohvaliti znatno većom energetskom učinkovitošću.



S punim multi-threaded opterećenjem, situacija nije puno drugačija. Da li je samo sustav s LGA1366 Core i7-990X procesorom “odmakao”. Inače je sve kao prije. Što se tiče potrošnje energije, FX-8150 se ne može pohvaliti nekim posebnim uspjehom. Počeo je trošiti nešto manje od Phenom II X6 1100T, ali procesori Sandy Bridge su barem jedan i pol puta ekonomičniji.

AMD je iskoristio svu energetsku učinkovitost dobivenu uvođenjem nove mikroarhitekture za povećanje frekvencije takta. I, kao rezultat toga, ne vidimo ništa nova razina učinkovitosti, niti bitno poboljšane performanse. Sukladno tome, u pogledu performansi po vatu, Bulldozer je, kao i njegovi prethodnici, ozbiljno inferioran u odnosu na konkurentske Intelove mikroarhitekture.

Za referencu predstavljamo potrošnju pri punom opterećenju, odvojeno izmjerenu u krugovima napajanja procesora i matične ploče.






“Neto” potrošnja osmojezgrenog FX-8150 premašuje potrošnju Procesori Sandy Most otprilike dva puta. S obzirom da su oba procesora proizvedena istim tehnološkim procesom i imaju slične napone jezgri, postaje nevjerojatno zanimljivo na što je AMD mislio kada je govorio o energetskoj učinkovitosti svoje Bulldozer mikroarhitekture.

Overclocking

Platforma Socket AM3+ i procesori serije FX u početku su pozicionirani kao overclockeri. O tome svjedoče kako potpuno otključavanje svih multiplikatora, tako i eksperimenti provedeni pod pokroviteljstvom AMD-a, u kojima je postavljen svjetski overclocking rekord pomoću jednog od procesora FX-8150. Izjave tvrtke da je nova mikroarhitektura optimizirana za rad na visokim taktnim frekvencijama također izgledaju obećavajuće. Hoćemo li doista dobiti novo overclocking čudo od AMD-a? Provjerimo.

Overclocking bilo kojeg FX procesora vrlo je jednostavan; nije uzalud "Unlocked" napisano izravno na njihovom logotipu. Frekvencija procesora može se promijeniti pomoću multiplikatora bilo kroz BIOS Setup ili putem specijaliziranih uslužnih programa koje osigurava sam AMD (Overdrive Utility) i proizvođači matičnih ploča. Slično, u Socket AM3+ sustavima, možete overclockati sjeverni most i memoriju ugrađenu u procesor.

Tijekom testiranja uspjeli smo postići stabilan rad našeg FX-8150 na frekvenciji od 4,6 GHz. Kako bi se osigurala stabilnost u ovom stanju, napon napajanja procesora je trebalo povećati na 1,475 V, a uz to je bilo potrebno omogućiti funkciju Load-Line Calibration. Tijekom testova stabilnosti temperatura procesora koji radi na ovoj frekvenciji nije prelazila 85 stupnjeva prema senzoru utičnice ili 75 stupnjeva prema senzoru ugrađenom u procesor. Za uklanjanje topline, podsjećamo da je korišten učinkovit hladnjak zraka NZXT Havik 140.



Imajte na umu da smo u isto vrijeme pokušali overclockati sjeverni most ugrađen u CPU, jer povećanje njegove frekvencije pozitivno utječe na brzinu predmemorije treće razine i memorijskog kontrolera. No, nažalost, značajno overklokiranje ovog procesorskog čvora naišlo je na nevidljivu barijeru, te nije mogao doseći frekvenciju iznad 2,4 GHz, iako smo mu istovremeno pokušali povećati napon napajanja.

U svakom slučaju, overclockanje FX-8150 na 4,6 GHz je dobar rezultat, pogotovo ako se uzme u obzir činjenica da su AMD procesori Phenom II obitelji rijetko bili overclockani u zraku iznad 4,0 GHz. Drugim riječima, mikroarhitektura Bulldozera zapravo je omogućila malo pomicanje granice frekvencije više.

No, overclocking FX procesora treba uspoređivati, prije svega, ne sa starim Phenom II, već s konkurentskim Core i5 i Core i7 procesorima za LGA1155 sustave. Ali očito ne ubrzavaju gore. Na primjer, sasvim tipičan overclock za Core i5-2500K s povećanjem napona od 0,15 V iznad nominalnog i korištenjem zračnog hladnjaka je 4,7 GHz. I na ovoj pozadini, rezultat FX-8150 više se ne čini tako briljantnim.

Dojam overklokiranja Zambezija pogoršava se još više ako usporedimo performanse overklokiranog FX-8150 i overklokiranog Core i5-2500K (povećanje performansi u odnosu na nominalni način rada navedeno je u zagradama):



Općenito, overclocking ne mijenja kvalitetu rezultata. No tamo gdje je FX-8150 bio brži u nominalnom načinu rada, razlika se smanjila. I tamo gdje je Core i5-2500 prednjačio, učvrstio je svoju prednost. Nije iznenađujuće: frekvencija FX-8150 kada je overclockana porasla je za 28%, dok je povećanje frekvencije Core i5-2500K bilo 42%. I općenito, kao što se može suditi po veličini povećanja performansi od overclockinga, mikroarhitektura Sandy Bridgea osjetljivije reagira na povećanje frekvencija. Drugim riječima, čak i ako uzmemo u obzir overclocking, procesori s Bulldozer mikroarhitekturom, iako se dosta dobro overclockiraju, ne izgledaju jače od Intelove konkurencije.

zaključke

Uspjeh ili neuspjeh? Sigurno mnogi od vas žele vidjeti jasnu presudu na kraju članka. Međutim, u ovom slučaju sve je vrlo dvosmisleno, a AMD je svojim Buldožerom recenzente doveo u vrlo tešku poziciju.

Činjenica je da je AMD pokazao potpuno nestandardan pristup razvoju mikroarhitekture. S obzirom da se performanse procesora sastoje od tri komponente: broja instrukcija koje se izvršavaju u jezgri procesora po ciklusu takta, frekvencije i broja jezgri, programeri su svoje prioritete prebacili na broj jezgri. Istodobno, smanjena je specifična izvedba pojedinačnih jezgri, ali je rezultirajući dizajn otvorio put stvaranju jeftinih osmojezgrenih ili čak složenijih procesora. Ovo je vrlo snažan potez za tržište poslužitelja, gdje se učitavaju više niti i procesori veliki iznos jezgre su u ozbiljnoj potražnji. Dakle, vrlo je vjerojatno da će nova Bulldozer mikroarhitektura omogućiti AMD-u da značajno poboljša svoju poziciju na tržištu performansi servera.

Međutim, danas smo se upoznali s FX procesorom, izgrađenim na ovoj mikroarhitekturi, ali namijenjenoj stolnim računalima. I tu je neusklađenost između hardverskih mogućnosti Bulldozera i tipičnih radnih opterećenja stolnih računala postala potpuno očita. Posebno je razočaravajuće što je marketinška kampanja bila strukturirana na način da su mnogi povjerovali u Bulldozer kao zvijezdu u usponu na tržištu stolnih računala. Međutim, tim nadama nije bilo suđeno da se ostvare.


FX procesori, koji se temelje na mikroarhitekturi Bulldozer, uspjeli su pokazati svoju snagu samo u malom podskupu zadataka koje rješavaju obični korisnici. Među tipičnim uobičajenim aplikacijama, nema mnogo primjera koji generiraju jednostavno cjelobrojno višenitno radno opterećenje, a Bulldozerova visoka izvedba se otkriva samo u ovom slučaju. Kao rezultat toga, u nekim slučajevima Bulldozer se pokazao ne samo sporijim od konkurentskih rješenja iz Intela, već čak i lošijim od procesora Phenom II X6, izgrađenog na mikroarhitekturi prethodne generacije. A to znači da AMD nije uspio proizvesti revolucionarni desktop procesor.

Zapravo, FX je samo sljedeći Phenom, koji se čini prilično dobrim sam po sebi, pogotovo u usporedbi sa svojim prethodnicima. FX procesori su općenito brži od Phenom II, znatno bolji overclockani i imaju nešto manju potrošnju pa se mogu smatrati dobrom zamjenom za nositelje zastarjele K10 mikroarhitekture.

No, podsjetimo, AMD je u ratu ne samo sa samim sobom, već i sa samim sobom od strane Intela. Stoga smo još uvijek prisiljeni izraziti razočaravajući zaključak da FX procesori imaju pravog smisla samo u onim stolnim računalima koja su fokusirana na video obradu i transkodiranje. U drugim slučajevima, u usporedbi s procesorima Sandy Bridge, njihova izvedba rijetko izgleda ohrabrujuće. Isto se može reći i za potrošnju energije i overclocking. Zasebno treba dodati da su se AMD FX procesori, očekivano, pokazali kao loša opcija za sustave za igranje, budući da moderne 3D igre praktički ne koriste istinski multi-threaded algoritme. No, ljubitelji AMD-ovih proizvoda će se s time vjerojatno moći pomiriti, s obzirom da je broj sličica u sekundi u igrama često ograničen grafikom, a ne procesorom.

Drugim riječima, tržišni izgledi za FX procesore ovisit će o dva čimbenika: koliko je velika vojska pristaša AMD-a; te o tome koliko će vješto proizvođač upravljati polugom cijene. Međutim, očito se ne očekuje da će stolni procesori s mikroarhitekturom Bulldozer postati široko popularni.

AMD se rijetko prepušta svježim procesorskim arhitekturama. Ako Intel ažurira strukturu svake dvije godine, onda je konkurent posljednji put primijetio 2007., izdajući K10, redizajniranu verziju starog K8. Stoga je pojava novog Buldožera značajan događaj. Sljedećih nekoliko godina arhitektura će postati osnova za sve AMD kristale, kao i prva prilika nakon dugo vremena za natjecanje s Intelom u utrci za performanse.

Idemo kao par

Stvaranjem Buldožera, inženjeri AMD-a napustili su dokazanu strategiju poboljšanja i djelomičnog kopiranja starih razvoja. Struktura kamenja bitno se razlikuje od onoga što smo navikli vidjeti u x86 sustavima.

Prva i najvažnija novost je izvorni izgled. Sve vrhunske verzije Buldožera službeno su opremljene s osam jezgri. Međutim, u stvarnosti postoje četiri puna modula, samo svaki s dvije računalne jedinice. To izgleda ovako: dva cjelobrojna aritmetička klastera (nazivaju se jezgre i izravno su odgovorni za izračune) dijele Front-End, klaster s pomičnim zarezom (FPU) i predmemoriju druge razine povećanu na 2 MB.

Prednost takvog tandema je ušteda prostora, smanjenje potrošnje energije i troškova proizvodnje. Nedostatak - dijeljenje istih setova loše utječe na konačnu izvedbu. Pod velikim opterećenjem, jedan Front-End možda neće moći nositi se s dvije jezgre. AMD ne poriče gubitak performansi: prema njemu, duo je oko 20% slabiji od punopravnog dvojezgrenog procesora.

Komunikacijske poteškoće

Kako bi uklonio usko grlo, Front-End je morao naučiti kako učinkovito dijeliti resurse između dvije jezgre. Da bi se to postiglo, redizajnirana je jedinica za predviđanje grananja i dekoder naredbi, koji su dobili četvrti kanal za obradu instrukcija (kao u Sandy Bridgeu) i tehnologiju Fuzija grana. Potonji vam omogućuje lijepljenje dijela uputa u jednu operaciju. Sve bi to trebalo ubrzati rad Front-Enda i spriječiti mirovanje kristala.

Što se tiče samih jezgri, ovo je skup Out-of-Order, load/unload, L1 cache i dva računalna klastera. Jedinica za izvršavanje izvan reda sada ima fizički registar datoteka. Kao iu Sandy Bridgeu, adrese za pohranjivanje radnih podataka ispuštaju se u njega, što vam omogućuje da ispraznite glavni cjevovod izvan reda. Procesor za učitavanje/istovar dobio je povećani međuspremnik, udvostručen kapacitet i mogućnost rada virtualne adrese, što bi teoretski trebalo povećati brzinu rada s L1 predmemorije podataka. Potonji u Buldožeru postao je četiri puta manji: 16 naspram 64 KB u K10. Gubitak je nadoknađen brzinom rada. L1 asocijativnost se povećala s dva na četiri kanala, što znači dvostruko O veća učinkovitost pretraživanja.

U jednom modulu nalaze se tri računalna klastera: dva cjelobrojna i jedan za rad s podacima s pomičnim zarezom. U usporedbi s K10, prvi par je izgubio jedan ALU (koji se bavi izračunima) i AGU (koji se bavi memorijskim adresama). U teoriji, to znači smanjenu vršnu izvedbu. U praksi će promjena biti praktički neprimjetna: teško je u potpunosti učitati cjelobrojne klastere.

Glavne promjene utjecale su na FPU, koji je odgovoran za složene izračune s pomičnim zarezom. U K10 je postao puno moćniji: dobio je par MMX i 128-bitnih FMAC uređaja za izvođenje operacija zbrajanja i množenja. Za razliku od K10, FMAC-ovi su univerzalni: mogu se međusobno zamijeniti, što pozitivno utječe na brzinu izračuna. Osim toga, naučili su kombinirati operacije u jednom izrazu, što je povećalo točnost izračuna.

Osim toga, FPU je primio ažurirani set uputa. Prvo, procesor sada radi s AVX-om, koji podržava 256-bitne registre. Za njihove izračune, kao iu Sandy Bridgeu, kombiniraju se dva FMAC-a. Drugo, Bulldozer može raditi sa SSE 4.2, AENSI, FMA4 i XOP uputama. Zadnja dva skupa su jedinstvena za AMD. Za vas i mene, sve ove promjene znače samo jednu stvar - naredbe koje su prethodno bile napravljene u nekoliko ciklusa sata sada će se izračunati u jednom, a to izravno utječe na performanse. Istina, da bi se osjetilo povećanje brzine potrebna je podrška za upute iz softvera.

Ljepilo i škare

Kao rezultat toga, svaki Bulldozer modul sastoji se od jednog Front-End, L2 i L1 predmemorije podataka, dva cjelobrojna klastera i bloka za rad s brojevima s pomičnim zarezom. Ukupno, jedan kamen može sadržavati do četiri takva seta. U isto vrijeme, svaki od njih ima pristup nizu zajedničkih elemenata. Prvi je dvokanalni memorijski kontroler s podrškom za DDR3-1866 MHz. Drugi je L3 predmemorija, čiji se volumen, u usporedbi s K10, povećao sa 6 na 8 MB, a asocijativnost - s 48 na 64 kanala. Imajte na umu da se, za razliku od Sandy Bridgea, frekvencija L3 predmemorije ne poklapa s brzinom jezgri. Ako vrhunski model radi na brzini od 3,6 GHz, tada je memorija najnovije razine na 2,2 GHz. To dovodi do primjetnih kašnjenja koja negativno utječu na performanse. Prema AMD-u, ova žrtva je napravljena zarad stabilnog rada na visokim frekvencijama.

Tadam!

Unatoč arhitektonskim trikovima i 32nm procesnoj tehnologiji, Bulldozer zauzima impresivnih 315 četvornih metara. milimetara. To je oko jedan i pol puta više od četverojezgrenog Sandy Bridgea i starijih Llano. Srećom, potrošnja energije je bila u razumnim granicama - 125 W.

Osim modela s osam jezgri, postoje verzije sa šest i četiri jezgre računske jedinice. Mlađa braća temelje se na istom dizajnu s osam jezgri, ali imaju jedan ili dva modula onemogućena.

Osnovna frekvencija varira od 3,1 do 3,6 GHz. Kao i Sandy Bridge, Bulldozer ima tehnologiju automatskog overclockinga. Poseban čip odgovoran za Turbo Core 2.0, prati trenutno opterećenje jezgre i razinu TDP-a i, čim se ukaže prilika, povećava frekvenciju procesora. U slučaju vrhunskog kristala, kada se koriste svi moduli, brzina se može povećati za 300 MHz. Ako su neki od resursa u stanju mirovanja - na 600 MHz. Pri niskim opterećenjima Bulldozer prelazi u način rada za uštedu energije, za što je zaslužna tehnologija Cool"n"Tiho.

Ručno overklokiranje je jednostavno. Prvo, cijela linija ima otključan množitelj. Drugo, pridošlice dobro dobivaju na visini: pod tekućim dušikom, stariji Buldožer postavio je novi svjetski rekord - 8429 MHz.

Pratioci

Buldožer radi na utičnici AM3+. U biti, radi se o malo poboljšanom AM3 s jednim dodatnim pinom. Zovu se skupovi čipova s ​​novom procesorskom utičnicom 990FX, 990X I 970 . Razlikuju se po PCIe 2.0 kontroleru. Stariji model opremljen je s 32 linije, mlađi - 16. Štoviše, 990FX i 990X podržavaju CrossFireX. Među značajkama čipseta bilježimo šest SATA Rev portova. 3 i 14 USB konektori 2.0. Ne postoji USB 3.0 kontroler.

Imajte na umu da Bulldozer također može raditi na starijim pločama. Sve što trebate je ažurirani BIOS. Ograničenja: Turbo Core i Cool"n"Quiet imaju smanjenu brzinu odziva, a neke funkcije za uštedu energije nisu dostupne.

Arhitektura Bulldozer procesora pokazala se zanimljivom. Konačno, AMD je prestao kopirati sam sebe i osmislio nešto uistinu novo. Nažalost, postoji nekoliko jasnih prednosti u odnosu na konkurente. Nema deklariranih osam jezgri. U dobrom smislu, imamo četverojezgrene modele s povećanim brojem računalnih jedinica, nešto poput Intel Hyper-Threadinga, ali na hardverskoj razini. Ideja je dobra, ali performanse će ovisiti o brzini Front-Enda. Prave prednosti Bulldozera uključuju samo snažan FPU za izračune s pomičnim zarezom i povećane radne frekvencije u usporedbi s K10.

Izbacimo ga! Zakopajmo ga!

AMD je najavio planove za izdavanje sljedećih linija procesora. Tvrtka očekuje godišnje ažuriranje arhitekture, postižući približno 15 posto povećanja performansi po vatu svaki put. Ako se AMD drži svog plana, arhitekturu ćemo vidjeti 2012. godine Piledriver(“koper”), godinu dana kasnije - Parni valjak(“parni valjak”), a 2014. ostat će zapamćena po najavi Bager. Ovako izgledaju građevinski radovi.

Pogrešni prozori

Prema AMD-u, Windows 7 ne može osloboditi puni potencijal nove kreacije: OS planer ne uzima u obzir značajke Buldožera. Na primjer, za nove procesore važno je da se međusobno povezane niti dodijele jednom modulu, inače će jezgre razmjenjivati ​​podatke ne kroz brzu L2 predmemoriju, već kroz memoriju treće razine. Neke podijeljene tokove također je bolje tretirati na sličan način kako bi se poboljšala učinkovitost Turbo Core 2.0. U isto vrijeme specifične zadatke stvaraju veće opterećenje na prednjem dijelu bloka i bolje ih je raspršiti po različitim modulima. Zahvaljujući suradnji sa Microsoft ove nijanse će se uzeti u obzir u planeru Windows 8. Međutim, ne biste trebali očekivati ​​značajno povećanje performansi.

Rječnik

Cjelobrojni računalni klaster- bavi se operacijama s cijelim brojevima (1, 2, 10).

Front-End- blok prethodnog dohvaćanja. Prima naredbe iz programa i prevodi ih na jezik razumljiv procesoru.

FPU- klaster proračuna podataka s pomičnim zarezom. Izvodi izračune s razlomačkim brojevima (1.2345) i velikim vrijednostima s potencijama (1.2345E-10).

Blok predviđanja grananja- unaprijed predviđa koje podatke i operacije program može trebati u sljedećem trenutku. Ne dopušta procesoru mirovanje.

Dekoder naredbi- rastavlja program na mikrooperacije, koje zatim koriste računalni klasteri.

Izvanredan- blok izvanredne ovrhe. Bavio se raspodjelom radnji između jezgri. Šalje na izračun samo one naredbe za koje postoje podaci.

Blok za utovar/istovar (LSU) - prati kretanje podataka između izlaza s pokretne trake i L1 predmemorije podataka.

Asocijativnost predmemorije- povezivanje redaka i stupaca predmemorije. Što je veća asocijativnost, to je manja brzina pretraživanja, ali veća njegova učinkovitost.

MMX- skup blokova za rad s brojevima do 8 bajtova.

Setovi instrukcija- dopustiti da jedna naredba izvrši operaciju na nekoliko podataka.

stol 1

Specifikacije AMD Bulldozer procesora

Broj računalnih jezgri

Osnovna frekvencija

Frekvencija turbo jezgre

Podrška za memoriju

Potrošnja energije

Tehnički proces

Cijena od studenog 2011

nepoznato

Što čini performanse procesora? Ranije je u uporabi bila formula koja je opisivala performanse kao umnožak broja instrukcija izvedenih po taktu i frekvencije na kojoj ovaj procesor radi. Sada se u ovoj formuli pojavio i treći faktor - broj računalnih jezgri. Stoga, programer procesora koji želi izdati brz proizvod ima nekoliko mogućnosti za to.

Međutim, nije sve tako jednostavno. Povećanje broja instrukcija koje izvršava računalna jezgra po taktu prilično je težak zadatak. Klasični x86 programski kod uključuje sekvencijalno izvršavanje instrukcija, pa stoga, da bi se postigla njihova paralelna obrada, procesor mora biti opremljen visoko učinkovitim jedinicama za predviđanje grananja i redoslijed instrukcija, čija implementacija zahtijeva znatne inženjerske napore. Istodobno, kompliciranost mikroarhitekture utječe na fizičke dimenzije kristala i dovodi do ograničenja pri povećanju broja jezgri. Dakle, ako će proizvođač napraviti procesor s velikim brojem jezgri, tada bi se mikroarhitektura trebala, naprotiv, pokušati pojednostaviti. Nije lako s taktna frekvencija. Oklada na njegov rast ponovno će zahtijevati izmjene unutarnjih blokova procesora i produljenje njegovog izvršnog cjevovoda. Rezultat je sljedeći: da bi procesor dobio medalju za performanse, njegovi programeri moraju naporno raditi na istovremenoj optimizaciji niza parametara.

Problem također leži u činjenici da bilo koji od odabranih načina poboljšanja performansi procesora može biti uspješan samo u posebnim slučajevima. Ne mogu svi programi učinkovito raditi s velikim brojem jezgri. Neki algoritmi ne dopuštaju točno predviđanje prijelaza i uputa za promjenu redoslijeda. A u nekim slučajevima, performanse se ne povećavaju čak ni s povećanjem frekvencije takta, jer postoje neka druga uska grla u sustavu.

Pronaći optimalan balans nije lako, a što se smatra optimalnim kriterijem? Možemo samo usporediti performanse procesora u konačnom broju programa i odabrati najbrži za određeni slučaj. Međutim, to uopće ne jamči da korištenjem drugačijeg skupa testnih alata nećemo dobiti potpuno suprotne procjene. Ovako dugačak uvod je ovdje dat jer ćemo se danas upoznati s novom serijom AMD FX procesora - vodećim proizvodom AMD-a, nadaleko poznatim pod kodnim imenom Zambezi. Ovaj procesor se temelji na vrlo kontroverznoj Bulldozer mikroarhitekturi, koja je već uspjela prikupiti popriličan buket nimalo laskavih recenzija. Ali poanta nije u tome da je ova mikroarhitektura potpuno loša. Prilikom odabira najbolje ravnoteže karakteristika, programeri su pogrešno procijenili potrebe većine korisnika i glavni naglasak stavili na pogrešan faktor u “osnovnoj formuli”. Kao rezultat toga, početni plan za izdavanje visokoučinkovitog rješenja nove generacije pošao je po krivu, a AMD-ovi pristaše, zaintrigirani obećanjima o proboju, dobili su nešto potpuno drugačije od onoga što su očekivali. No, je li to ozbiljan i objektivan razlog za razočaranje? O tome ćemo govoriti u ovom materijalu.

⇡ Brojimo zrna: osam ili četiri?

Dok je radio na novom dizajnu za procesore performansi, AMD je odlučio dati prioritet broju procesorskih jezgri. Ovo je sasvim logičan izbor, temeljen na činjenici da je s godinama sve više multithreaded softvera i razvoj mikroarhitekture dizajnirane za višegodišnji razvoj prvenstveno treba uzeti u obzir ne trenutno stanje na tržištu, već uočenih trendova. Osam jezgri, predviđenih u osnovnoj verziji novog procesora, ono je što je AMD namjeravao osvojiti tržište, gdje su do sada bili predstavljeni samo čipovi, čiji je maksimalan broj jezgri bio ograničen na šest. ( Ovdje govorimo samo o stolnim računalima. — cca. izd. )

Istovremeno, programeri nisu htjeli uzeti jezgre stare mikroarhitekture K10. Ne samo da su preveliki fizička veličina, ali isto tako, kao što se može procijeniti po Llanu, nisu skloni radu na visokim taktnim frekvencijama čak ni nakon prelaska na modernu 32 nm tehnologiju. Osim toga, ne podržavaju mnoge moderne značajke, poput AVX uputa. Stoga je AMD za sastavljanje procesora s osam jezgri napravio novu mikroarhitekturu - Buldožer. Predstavnici tvrtke radije kažu da je njegov razvoj izveden od nule, ali zapravo, u jezgrama Buldožera možete pronaći mnoge reference na drugu mikroarhitekturu predstavljenu ove godine - Bobcat, namijenjenu uporabi u kompaktnim i energetski učinkovitim uređajima. Međutim, veza između Bulldozera i Bobcata prilično je daleka, a spominjemo je samo kako bi opća ideja postala jasna - Bulldozer kombinira mnoge relativno jednostavne jezgre.

U isto vrijeme, ne govorimo o primitivnoj kombinaciji osam jednostavnih jezgri na jednom poluvodičkom čipu. U ovoj situaciji, rezultirajući procesor bi imao vrlo niske performanse jedne niti, a to bi postao prilično ozbiljan problem, budući da nema tako malo programa koji ne dijele opterećenje u nekoliko računalnih niti. Stoga su, prvo, jezgre optimizirane za rad na visokim brzinama takta. I drugo, bili su upareni u dvojezgrene module koji su mogli dijeliti svoje resurse za opsluživanje jedne niti. Rezultat je prilično zanimljiv dizajn: ulazni dio izvršnog cjevovoda takvog dvojezgrenog modula je zajednički, a daljnja obrada instrukcija podijeljena je između dva seta izvršnih uređaja.

Osnova dizajna Buldožera je ono što se konvencionalno naziva dvojezgreni modul

Podsjetimo, proces obrade podataka u moderan procesor uključuje nekoliko faza: dohvaćanje x86 instrukcija iz predmemorije, njihovo dekodiranje - prevođenje u interne makro operacije, izvršenje, snimanje rezultata. Prve dvije faze u modulu Bulldozer izvode se za par jezgri zajedno, a zatim se za cjelobrojne instrukcije izvršavanje raspoređuje na dvije jezgre klastera ili se, u slučaju stvarne aritmetike, provodi u bloku operacija s pomičnim zarezom zajednički za dvije jezgre.

Buldožerski moduli dizajnirani su za obradu četiri instrukcije po taktu, a zahvaljujući tehnologiji makro spajanja, neke parove x86 instrukcija procesor može smatrati jednom operacijom. To znači da je, općenito, dvojezgreni modul Bulldozer sličan po snazi ​​jednoj jezgri modernih Intelovih procesora, koji također mogu obraditi četiri instrukcije po taktu i također podržavaju makro spajanja.

Međutim, postoje značajne razlike između modula Bulldozer i jezgre Sandy Bridgea koje mogu dovesti u pitanje njihovu približno istu teoretsku brzinu. Zbog činjenice da modul novih AMD procesora sadrži ostatke dviju jednakih jezgri, može pokazati maksimalnu izvedbu samo pri obradi para niti. Ako nosi opterećenje s jednom niti, tada će brzina njegove usluge biti ograničena brojem izvršnih uređaja unutar jednog takvog klastera. I nema ih toliko, s obzirom na želju AMD-a da pojednostavi pojedinačne jezgre - jedan i pol puta manje nego u procesorima s mikroarhitekturom Sandy Bridge ili K10. To jest, dvije aritmetičke ALU i dvije adresne AGU.

Ovako izgleda funkcionalna struktura modula izgrađenog na mikroarhitekturi Bulldozer. Od dvije jezgre ostala su samo dva kompleta cjelobrojnih aktuatora

Blok operacija s pomičnim zarezom koji je zajednički procesorskom modulu također je relativno niske složenosti. Uključuje dvije 128-bitne FMAC izvršne jedinice, koje se mogu kombinirati u jednu jedinicu za obradu 256-bitnih instrukcija. Čini se da ovdje nema toliko aktuatora, pogotovo s obzirom na to da su podijeljeni u par jezgri. Ali oni su univerzalniji nego u prethodnim i konkurentskim mikroarhitekturama, koje koriste zasebne množitelje i zbrajače. I zahvaljujući tome, u određenim slučajevima kada radite sa stvarnim brojevima, dvojezgreni modul Bulldozer može pružiti usporedivo i čak više visoke performanse nego npr. jedna Sandy Bridge jezgra.

Slična ideja kombiniranja 128-bitnih uređaja za rad s 256-bitnim uputama koristi se u Sandy Bridgeu

Međutim, modul Buldožer trebao bi pokazati svoje najveće snage pod dvostrukim opterećenjem. Jedna Sandy Bridge jezgra također može obraditi dvije računske niti; za to ima Hyper-Threading tehnologiju. Međutim, sve se upute šalju jednom skupu aktuatora, što u praksi uzrokuje brojne kolizije. Modul Bulldozer sadrži dva neovisna cjelobrojna klastera koji mogu paralelno izvršavati niti, a ukupan broj izvršnih uređaja u njima premašuje broj takvih uređaja u jezgri Sandy Bridge za jedan i pol puta.

Lijevo je modul Bulldozer, desno je neka konkurentska jezgra s podrškom za Hyper-Threading. Zapravo, ne liči previše na Sandy Bridge, ali ilustracija dočarava bit problema

Kao rezultat toga, modul Bulldozer ima veću vršnu izvedbu od jezgre Sandy Bridge, ali ovu je izvedbu nešto teže otključati. Jezgra Sandy Bridgea inteligentno učitava vlastite resurse zahvaljujući naprednoj logici na čipu koja neovisno analizira jednonitni kod i izvršava ga paralelno na punom skupu izvršnih uređaja. U Bulldozeru je zadatak učinkovite upotrebe aktuatora djelomično prebačen na programera, koji mora podijeliti svoj kod u dvije niti - potpuno preuzimanje svih kapaciteta modula bit će moguće tek tada.

I to je ono što je tipično. Kada smo razmatrali dvojezgreni procesorski modul Bulldozer, stalno smo ga uspoređivali s jednom jezgrom Sandy Bridgea, a istovremeno smo mogli izvući sasvim točne paralele. Zbog toga se pitamo: ne bi li se "osmojezgrena" priroda nove mikroarhitekture trebala smatrati proizvodom mašte trgovaca? AMD kaže da jezgre treba računati prema broju cjelobrojnih klastera, tvrdeći da modul može pružiti do 80% performansi dviju neovisnih jezgri. Ipak, ne treba zaboraviti da su jezgre na kojima se temelji Bulldozer znatno jednostavnije od jezgri ostalih procesora. Stoga je broj dvojezgrenih modula karakteristika koja mnogo adekvatnije odražava performanse Buldožera.

Pronađite maksimalan broj procesorskih jezgri i zaposlite se u marketinškom odjelu AMD-a

⇡ Predmemorija

Organizacija predmemorije u Bulldozer procesorima također je "vezana" ne toliko za pojedinačne jezgre, već za dvojezgrene module. Zapravo, svakoj je jezgri dodijeljena samo vlastita predmemorija podataka prve razine; sve ostale razine predmemorije odnose se ili na modul kao cjelinu ili na procesor:

  • Svaka jezgra ima vlastitu L1 predmemoriju za podatke. Njegov volumen je 16 KB, a arhitektura pretpostavlja prisutnost četiri asocijativna kanala. Ova predmemorija radi s algoritmom za upisivanje, što znači da je uključiva.
  • Predmemorija prve razine za upute dostupna je u jednoj kopiji za svaki dvoprocesorski modul. Njegov volumen je 64 KB, a broj kanala asocijativnosti je dva.
  • Predmemorija druge razine također je implementirana u jednoj instanci po modulu. Veličina mu je impresivnih 2 MB, asocijativnost 16 kanala, a algoritam rada je ekskluzivan.
  • Osim toga, osmojezgreni procesor kao cjelina ima 8-megabajtnu L3 predmemoriju sa 64-kanalnom asocijativnošću. Posebnost ovog cachea je da radi na znatno nižoj frekvenciji u odnosu na sam procesor, a to je oko 2 GHz.

Sljedeća tablica opisuje omjer volumena predmemorije za osmojezgrene Bulldozer, četverojezgrene Sandy Bridge i Thuban procesore (šestojezgreni Phenom II X6, izgrađen na mikroarhitekturi K10).

Vrsta predmemorije Buldožer (8 jezgri/4 modula) Sandy Bridge (4 jezgre) Thuban (6 jezgri)
L1I (upute) 4x64 KB 4x32 KB 6x64 KB
L1D (podaci) 8x16 KB 4x32 KB 6x64 KB
L2 4x2 MB 4x256 KB 6x512 KB
L3 8 MB, 2,0-2,2 GHz 8 MB, radi na brzini procesora 6 MB, 2,0 GHz

Kao što možete vidjeti iz tablice, AMD se oslanjao na prostrane predmemorije gornje razine, što može biti stvarno korisno u slučaju ozbiljnog višenitnog opterećenja. Međutim, predmemorija u novim procesorima općenito je sporija od prethodne i konkurentskih proizvoda. To se lako otkriva kada se mjeri praktična latencija.

Velika kašnjenja pri pristupu podacima u Bulldozeru mogu se kompenzirati samo visokim taktom ovih CPU-a. Što je, doduše, bilo prvotno planirano - po pitanju frekvencija novi procesori s osam jezgri trebali su nadmašiti Phenom II za 30%. Međutim, AMD nikada nije uspio dizajnirati poluvodičke kristale koji bi mogli stabilno raditi na tako visokim frekvencijama. Kao rezultat toga, visoka latencija predmemorije može uzrokovati značajnu štetu sustavima koji se temelje na Buldožeru.