AMD Buldozer - bu AMD protsessorlarining so'nggi avlodi. Tizim administratori kim?

AMD yangi Buldozer arxitekturasi uchun butunlay boshqacha yondashuvni qo'llashga qaror qildi. Ba'zi resurslarni (L2 kesh, suzuvchi nuqta moduli), lekin bir-biridan butunlay mustaqil bo'lmagan ikki yadroli modullarni yaratishga qaror qilindi. (quyidagi rasmga qarang)
AMD ma'lumotlariga ko'ra, bu protsessorni optimallashtirish va shu bilan birga protsessor narxini pasaytirish maqsadida qilingan. Optimallashtirish shundan iboratki, an'anaviy ko'p yadroli protsessorlarda ba'zi modullar ishlamay qolishi mumkin va bunday modullar Buldozer arxitekturasida birlashtirilishi mumkin. Va agar modullar kamroq bo'lsa, bu kamroq material isrof qilinishini anglatadi va bu, o'z navbatida, xarajatlar, energiya tejash va issiqlikni kamaytirishga ijobiy ta'sir qiladi.
Shu sababli, AMD o'zining yangi Buldozer protsessorlarini ikki yadroli deb atasa ham, aslida ular ikki yadroli bo'lmaydi, chunki ular butunlay mustaqil yadrolarga ega bo'lmaydi. Va nomi " ikki yadroli protsessor» marketing maqsadlarida foydalaniladi.

yaratish uchun" to'rt yadroli protsessorlar", AMD ushbu birliklardan ikkitasini ishlatadi, shuning uchun protsessorning ichida to'rtta emas, balki ikkita "protsessor" mavjud (ikkita qurilish bloklari quyidagi rasmda ko'rsatilgan). AMD yangi protsessorlarni to'rt yadroli deb atashda davom etadi.


Buldozer arxitekturasiga asoslangan sakkiz yadroli protsessor.

Keling, Buldozer arxitekturasida ishlatiladigan Fetch va Decode modullarini batafsil ko'rib chiqaylik.

Olib olish va dekodlash modullari

Fetch moduli keshdan yoki dekodlash uchun ko'rsatmalarni olish uchun javobgardir tasodifiy kirish xotirasi.

Olib olish va dekodlash modullari.

Yuqorida aytib o'tilganidek, namuna olish modullari bir vaqtning o'zida ikkita "yadro" dan foydalanadi. L1 yo'riqnoma keshi ham bir vaqtning o'zida ikkita yadro tomonidan ishlatiladi, lekin har bir protsessor yadrosi o'z L1 ma'lumotlar keshiga ega.
AMD allaqachon Buldozer arxitekturasida ishlatiladigan L1 ko'rsatmalar keshi 64 KB ikki tomonlama to'plam-assotsiativ keshdan iborat ekanligini e'lon qildi. Xuddi shu konfiguratsiya AMD64 arxitekturali protsessorlarda qo'llaniladi, biroq farq shundaki, AMD64 protsessorlari yadro uchun L1 keshga ega, Buldozer protsessorlarida esa bir juft yadro uchun bitta L1 kesh bo'ladi. Biroq, ma'lumotlar keshi faqat 16 KB bo'ladi, bu AMD64 arxitekturasiga asoslangan protsessorlarda ishlatiladigan yadro uchun 64 KBdan sezilarli darajada kamroq.

TLBlar (Tarjima bir chetga qarashli bufer- ultra tez xotira buferi). TLBlarning o'lchamlari aniqlandi. Bu virtual xotira manzillarini jismoniy manzillarga aylantirish uchun mo'ljallangan, kichik hajmdagi xotiraga ega buferlardir.
Sahifa fayli sifatida yaxshi ma'lum bo'lgan virtual xotira - bu qattiq diskdagi maxsus fayl tomonidan RAM miqdori "ko'paytiriladigan" texnologiya.

Kompyuter dasturlari x86 ko'rsatmalari yordamida yoziladi, ammo hozirda protsessorlar faqat mahalliy RISC ko'rsatmalarini tushunadilar. Dekodlash moduli x86 dastur ko'rsatmalarini RISC mikroko'rsatmalariga aylantirish uchun javobgardir. Buldozer arxitekturasida to'rtta dekoder mavjud, ammo bu daqiqa AMD har bir dekoder qaysi ko'rsatmalarni bajarishini oshkor qilmaydi. Odatda, ushbu dekoderlardan biri taqdim etilgan ROM mikrokodi (“µkod” yoki “mikrokod”) yordamida murakkab, murakkab ko‘rsatmalarni bajaradi. Murakkab ko'rsatmalarni dekodlash bir necha soat siklidan so'ng yakunlanadi, shundan so'ng ular bir nechta mikroko'rsatmalarga aylanadi. Odatda, ishlab chiqaruvchilar o'zlarining protsessorlarini shunday optimallashtiradilarki, eng keng tarqalgan ko'rsatmalarni dekodlashda ular faqat bir soat siklida bajariladi.

Kirish AMD ning Buldozer mikroarxitekturasiga asoslangan yangi protsessorlari nafaqat joriy yilning, balki kamida joriy besh yillikning eng kutilgan mahsulotlaridan biri ekanligiga shubha yo'q. Buning bir qancha sabablari bor, shuningdek, AMD mahsulotlari uchun muxlislarning katta armiyasi mavjudligi. Ba'zi odamlar ushbu kompaniyaning protsessorlari barcha jihatlari bo'yicha Intel protsessorlaridan yaxshiroq bo'lgan vaqtlarni yangi xotiralarga ega. Ba'zi odamlar AMD mahsulotlarini narx va ishlashning muvozanatli kombinatsiyasi uchun yaxshi ko'radilar. Va ba'zilar AMDning kompaniyada ishlab chiqilayotgan mikroarxitekturaning afzalliklari haqidagi hissiy hikoyalaridan taassurot qoldirdi. Bularning barchasi Buldozer avlod protsessorlarining chiqarilishini ko'p yillik zerikarli kutishni qo'shdi va mana natija - siz ushbu maqolani katta e'tibor va qiziqish bilan o'qiyapsiz.

Biroq, bunga arziydiganligi aniq. Kelgusi bir necha yil ichida protsessorlar bozoridagi vaziyat Buldozer mikroarxitekturasi qanchalik muvaffaqiyatli bo'lishiga bog'liq. Axir, faqat Intel har ikki-uch yilda yangi mikroarxitektura yechimlarini ishlab chiqarish uchun muhandislik va ishlab chiqarish resurslariga ega. AMD rivojlanishda ancha o'lchangan sur'atlarga rioya qilishga majbur. Buni eslash qo'rqinchli, ammo bugungi Phenom II va Athlon II protsessorlarida qo'llaniladigan mikroarxitektura 1999 yilga borib taqaladi va o'shandan beri AMD unga faqat kosmetik o'zgarishlar kiritmoqda. Shuning uchun, bizda Buldozerning chiqarilishi bilan rivojlanish tsikli to'satdan faollashishi haqida hech qanday maxsus illyuziya yo'q. Shubhasiz, Buldozer keyingi bir necha yil davomida AMD ning ishlash takliflarining asosini tashkil qiladi.

Yoniq joriy versiya Kompaniyaning ushbu mikroarxitekturani rivojlantirish bo'yicha rejalari 2014 yilgacha tuzilgan, ammo u deyarli davom etadi.

AMD har yili unumdorlikni 10-15 foizga oshirishni va'da qilgani dalda beruvchidan ko'ra ko'proq tashvish beruvchi alomatdir. Ehtimol, bunday o'sish, birinchi navbatda, soat chastotalarining ko'payishi va shundan keyingina ba'zi yangi mikroarxitektura yaxshilanishlari bilan ta'minlanadi.

Boshqacha qilib aytganda, Buldozer mikroarxitekturasining hozirgi ko'rinishidagi muvaffaqiyati AMD ning kelajakdagi mavqeiga, uning mahsulotlarining raqobatbardoshligiga va pirovardida protsessorlar bozoridagi umumiy vaziyatga hal qiluvchi ta'sir ko'rsatadi.

Albatta, AMD uchun Buldozer yagona asosiy mahsulot emasligini inkor etib bo'lmaydi. Ushbu mikroarxitektura bugungi kunda yuqori samarali ish stoli va server segmentiga qaratilgan. Shu bilan birga, AMD bozorning boshqa segmentlari uchun boshqa takliflarga ega. Masalan, kompaniya tomonidan joriy yil boshida chiqarilgan Bobcat mikroarxitekturasi yoki Llano oilasining APU-lariga ega arzon, tejamkor protsessorlar kompaniya uchun bundan kam muhim sohalar hisoblanadi. Va bu takliflar, biz sinov natijalaridan ko'rganimizdek, muvaffaqiyatli echimlar bo'lib, ular netbuklar va nettoplar uchun yechim sifatida ham, o'rtacha narx oralig'idagi integratsiyalashgan platformalar uchun asos bo'lib xizmat qilishi mumkin.

Biroq, Buldozerning muvaffaqiyati yoki muvaffaqiyatsizligi ancha muhimroq ta'sirga ega. Birinchidan, bu mikroarxitektura ancha yuqori daromadli bozor segmentlarini - serverlar va ish stoli ishlab chiqarish tizimlarini maqsad qilib qo'yadi. Shuning uchun u AMD ning moliyaviy holatiga ancha kuchli ta'sir ko'rsatishga qodir. Ikkinchidan, muvaffaqiyat AMD protsessorlari C, E va A seriyalari - bu, ochig'ini aytganda, mikroprotsessor dizaynini ishlab chiqishda ishtirok etgan muhandislarning xizmati emas. Ushbu protsessorlarning (yoki AMD terminologiyasiga rioya qilsak) bozordagi muvaffaqiyati ularda ATI-ni o'z vaqtida sotib olish tufayli AMD protsessorlariga yo'l topgan Radeon HD oilasining grafik yadrolari mavjudligi bilan bog'liq. Buldozer - bu hisoblash yadrolarining mikroarxitekturasi ustida ishlaydigan muhandislik guruhi uchun o'ziga xos malaka imtihonidir. Uchinchidan, Buldozer oxir-oqibat energiya tejaydigan platformalar uchun echimlar bundan mustasno, AMD protsessorlarining butun liniyasining asosiga aylanadi. Shunday qilib, oxir-oqibat, K10-ni deyarli hamma joyda, shu jumladan Llano protsessorlarini almashtirib, bozorning pastki segmentlariga tushadigan ushbu mikroarxitektura.



Muxtasar qilib aytganda, Buldozer mikroarxitekturasi bilan protsessorlarni muvaffaqiyatli ishga tushirish muhimligini ortiqcha baholash qiyin. Bu hissiy va moddiy darajadagi ramziy mahsulot. Va shuning uchun men, majoziy ma'noda, haqiqatda yangi K7 yoki K8 ni ko'rishimizni xohlayman.

Ammo sinovdan oldin ham, bunday hodisaning takrorlanish ehtimoli kichik ekanligini aytishimiz mumkin. Intelning o'zi so'nggi marta AMDga kaftni egallab olishga yordam berdi va idealdan uzoqda bo'lgan NetBurst mikroarxitekturasini targ'ib qilishga harakat qildi. Keyin Intel muhandislari soat tezligini oshirishga e'tibor qaratdilar, bu oxir-oqibat ulkan oqish oqimlari ko'rinishidagi to'siqlarga duch keldi, AMD esa har bir soat siklida ko'proq ko'rsatmalarni bajarishga qaratilgan yanada muvozanatli mikroarxitekturani taklif qildi. Ammo Intel o'z ta'limotini qayta ko'rib chiqib, yangi Core mikroarxitekturasini taqdim etganidan so'ng, shuningdek, har bir soat siklida maksimal ko'rsatmalarni bajarishga qaratilgan, AMD shu paytgacha bo'lgan orqada qolgan pozitsiyaga qaytdi.

Ko'rinib turibdiki, har bir soat siklida bajariladigan ko'rsatmalar soni bo'yicha zamonaviy Intel protsessorlaridan o'zib ketish juda qiyin. Bugungi Sandy Bridge mikroarxitekturasi tabiatan samarali dizaynning kamida uchta optimallashtirish tsiklining natijasidir, shuning uchun biz AMD-dan yanada yuqori o'ziga xos yadro samaradorligini kuta olmaymiz. Bundan tashqari, AMD muhandislari o'zlariga bunday maqsadni ham qo'yishmagan.

Buldozerning asosiy g'oyasi boshqa joyda yotadi. Ishlab chiquvchilarning fikriga ko'ra, ushbu mikroarxitektura asosida qurilgan protsessorlar yuqori soat tezligi va raqobatchilar va o'tmishdoshlariga qaraganda ko'proq hisoblash yadrolari tufayli yaxshi ishlash ko'rsatishi kerak. Shu bilan birga, ular ishlab chiqarishda juda foydali bo'lib qolishi kerak, ya'ni ular juda katta yarim o'tkazgich kristaliga ega bo'lmasligi va alohida yadro nuqtai nazaridan juda yuqori issiqlik tarqalishini namoyish etmasligi kerak.

AMD ko'p yadroli dizayn sirlari

Protsessor yadrolari sonining ko'payishi muqarrar ravishda protsessor chipi maydonining oshishiga olib kelishi aniq. Natijada ishlab chiqarishning murakkabligi ham, yakuniy mahsulot tannarxi ham oshadi. Shuning uchun, masalan, maksimal miqdordagi hisoblash yadrolari bo'lgan protsessorlar bugungi kunda faqat server bozori segmentida qo'llaniladi - korporativ mijozlar individual foydalanuvchilarga qaraganda pul sarflashga ko'proq tayyor. AMD tomonidan olingan protsessorlarning maqbul narxini saqlab, yadrolar sonini ko'paytirish uchun tanlangan kurs yadrolarning o'zini soddalashtirish bilan birlashtirilishi kerak. Biroq, boshqa tomondan, yadrolarni soddalashtirish istalmagan ta'sirga olib keladi - zaif parallellashtirilgan yuklarga ega bo'lgan ilovalarda ishlashning pasayishi, hozirda ularning soni hali ham etarli.

Shuning uchun AMD muhandislari o'z yo'lidan borishdi. Alohida yadrolarning mikroarxitekturasi yanada murakkablashdi, imkon qadar har soatda bajariladigan ko'rsatmalar sonini oshirdi.



Ammo odatda har bir yadroda mavjud bo'lgan, lekin ayni paytda haddan tashqari samarali bo'lgan, hisoblash yadrolari juftlari o'rtasida taqsimlanadigan resurslarning bir qismini yaratishga qaror qilindi.



Olingan ikki yadroli yig'ish Buldozer protsessorlari uchun asosiy qurilish blokiga aylandi. AMD terminologiyasida modul deb ataladigan bunday tugun butun sonli aktuatorlarning ikkita to'liq to'plamiga ega. Shu bilan birga, suzuvchi nuqta bloki, ko'rsatmalarni oldindan olish va dekodlash qurilmalari, shuningdek, ikkinchi darajali kesh bir nechta yadrolar uchun bitta nusxada mavjud bo'lib, ular o'rtasida o'z resurslarini almashadilar. Ishlab chiquvchilarning hisob-kitoblariga ko'ra, ushbu elementlarning kuchi ikkita yadro uchun etarli, chunki haqiqiy hayotda bitta yadroga xizmat ko'rsatishda ular ko'pincha ishlamaydi. Bundan tashqari, ularning uzluksiz ishlashidagi kechikishlar natijada ishlashga jiddiy ta'sir ko'rsatmaydi.

AMD ma'lumotlariga ko'ra, tavsiflangan tarzda ishlab chiqilgan ikkita yadroli modul to'liq ikki yadroli protsessorning 80% gacha ishlashini ta'minlashga qodir. Shu bilan birga, tranzistorlar byudjetida (va shunga mos ravishda yarimo'tkazgich kristali sohasida) tejash 44% ga etadi.

Ushbu mohir yadro siqilishi tufayli AMD sakkiz yadroli (yoki to'rt modulli) dizaynni Buldozer yarimo'tkazgichli matritsaning asosiy dizayniga qo'shishga muvaffaq bo'ldi.



Bundan tashqari, kristalning sezilarli qismi kesh xotirasiga beriladi. Har bir protsessor modulidagi yadro juftlari o'rtasida taqsimlangan ikkinchi darajali keshlar 2 MB sig'imga ega va butun protsessor uchun umumiy L3 kesh xotirasi 8 MB ni tashkil qiladi. Shunday qilib, keshlarning an'anaviy AMD eksklyuziv tashkil etilishini hisobga olsak, ularning umumiy hajmi sakkiz yadroli protsessor uchun 16 MB ni tashkil qiladi, deb aytishimiz mumkin. Shu bilan birga, Buldozer yarimo'tkazgich kristalining maydoni maqbul chegaralar ichida qolmoqda, shuning uchun AMD ishlab chiquvchilari o'z maqsadlariga to'liq erishdilar.



Mutlaq raqamlar bilan aytganda, bu sakkiz yadroli Buldozerlar, masalan, K10 mikroarxitekturasida qurilgan olti yadroli Thuban protsessorlariga (Phenom II X6) qaraganda kichikroq yarimo'tkazgichli matritsaga ega bo'lishini anglatadi. Biroq, buldozer 32 nm standartlarga ega bo'lgan yanada ilg'or texnik jarayon yordamida ishlab chiqarilishini yodda tutish kerak. Zamonaviy to'rt yadroli Intel Sandy Bridges bilan solishtirganda, AMD ning yangi sakkiz yadroli protsessorlari faqat 45% ko'proq o'lim maydoniga ega bo'ladi.

Biroq, to'rt yadroli Sandy Bridge protsessorlari, Hyper-Threading texnologiyasini qo'llab-quvvatlash tufayli, xuddi Buldozer kabi, operatsion tizimga sakkiz yadroli protsessorlar sifatida taqdim etilishi mumkin. Bu, albatta, Buldozerning sakkiz yadroli to'liq huquqli protsessorlarini chaqirishning qonuniyligi haqida tortishuvlarga sabab bo'ladi. Biroq, shuni tushunish kerakki, AMD va Intel bir vaqtning o'zida sakkizta hisoblash iplarini turli yo'llar bilan bajarishga ruxsat berishgan. Intel ishlab chiquvchilari o'zlarining mikroarxitekturasiga kirishdi qo'shimcha funktsiyalar, ikkita ipni bitta yadro ichida, bitta ijro birliklari to'plamida ishlashiga imkon beradi. AMD, aksincha, ikkita to'liq yadrodan "qo'shimcha" qismlarni kesib tashladi, ammo har bir modul ichida faqat ikkita aktuator to'plami mavjud edi.



Natijada, Intelning Hyper-Threading texnologiyasi ko'p tarmoqli ish faoliyatini atigi 15-20% ga oshiradi, AMD yechimi esa 4 dan 8 ta ipga o'tishda unumdorlikni 80% ga oshiradi.

Albatta, sakkiz yadroli Buldozerning yarimo'tkazgichli kristalli modulli tuzilishi tufayli to'rt yadroliga juda o'xshash.


Har bir tsikl uchun ko'proq ko'rsatmalar?

Protsessor yadrolari sonini ko'paytirishning o'zi sizni uzoqqa olib bormaydi. Bu, umuman olganda, to'rt yadroli Sandy Bridgedan past bo'lgan olti yadroli Phenom II X6 protsessorlari chiqarilgandan keyin ham aniq bo'ldi. Shuning uchun, AMD ishlab chiquvchilari faqat keng dizayndagi o'zgarishlar bilan cheklanib qolmadi. Buldozerning asosiy mikroarxitekturasi, K10 bilan solishtirganda, butunlay kamroq qayta ishlandi, bu AMD protsessorlaridagi tizimlarning ishlashini nafaqat ko'p bosqichli vazifalarda, balki parallellik darajasi past bo'lgan ilovalarda ham tezlashtirishga umid beradi. Bundan tashqari, bu umidlar butunlay ob'ektiv holatlarga asoslanadi. Oldingi AMD mikroarxitekturalari soatiga uchta ko'rsatmalarni (bir yadroda) bajarish uchun mo'ljallangan bo'lsa-da, Buldozer mikroarxitekturasi soatiga to'rtta ko'rsatmalarning bajarilishini o'z zimmasiga oladi va bu xususiyat bo'yicha Core mikroarxitekturasi bilan raqobatchi protsessorlarga yaqinroqdir.

Sifatli o'zgarishlarni quvur liniyasini bajarishning birinchi bosqichlaridan boshlab - ko'rsatmalarni oldindan olish va dekodlash bosqichidan kuzatish mumkin. Ushbu bosqichlar bitta modul ichidagi juft yadrolar uchun umumiydir, shuning uchun AMD ular mikroarxitektura to'siqlari bo'lib qolmasligiga alohida e'tibor qaratdi. Ko'rsatmalar L1I keshidan 32 baytli bloklarda dekodlash uchun olinadi - Core mikroarxitekturasi (ikkinchi avlod) protsessorlariga qaraganda ikki baravar katta. Birinchi darajadagi ko'rsatmalar keshining o'zi 64 KB sig'imga va ikki kanalli assotsiativlikka ega. Dekodlash uchun mo'ljallangan ko'rsatmalar unga ikkinchi darajali keshdan oldindan yuklanadi.

Namuna olish jarayonida bevosita ishtirok etadigan filialni bashorat qilish bloki turli yadrolarning faolligini mustaqil ravishda kuzatadigan ikkita tampon to'plamini o'z ichiga oladi. Shunday qilib, mantiqiy novdalar natijalarini bashorat qilishda, Buldozer iplar orasida chalkashmaydi. Yangi mikroarxitektura yuqori soat tezligida ishlashni maqsad qilganligi sababli, filialni bashorat qilish birligining sifati juda muhim. Shu sababli, unda qo'llaniladigan algoritmlar butunlay qayta ishlab chiqilgan va AMD Buldozer filiali prognozining samaradorligi yaxshilanishiga umid qilmoqda.



Buldozerning x86 ko'rsatmalar dekoderi ham o'z resurslarini ikkita yadroga ajratadi va har bir soat siklida 4 tagacha kiruvchi ko'rsatmalarni dekodlash imkoniyatiga ega. Biroq, uning ishlashi faqat to'rtta so'l ko'rsatmalarni chiqarish bilan cheklangan (AMD shartlarida dekodlash natijasida), x86 ko'rsatmalari esa 1-2 yoki undan ko'p so'l ko'rsatmalarga bo'linishi mumkin. Shunday qilib, dekoder mikroarxitekturaning oldingi avlodiga nisbatan o'z ish faoliyatini uchdan bir qismga oshirgan bo'lsa-da, ikkita butun va bitta haqiqiy sonli hisoblash klasterlarini qo'llab-quvvatlash vazifasi yuklanganligini hisobga olsak, uning tezligi etarli bo'lmasligi mumkin.

Shuni ta'kidlash kerakki, buldozerda makro termoyadroviy yo'riqnomaning termoyadroviy texnologiyasining ma'lum bir analogi ham qo'llanilgan. X86 ko'rsatmalarining ba'zi guruhlari bir butunga birlashtirilishi va dekoder orqali bitta ko'rsatma sifatida o'tkazilishi mumkin - AMD buni Branch Fusion deb ataydi.

Dekodlangan makro-ko'rsatmalar uchta hisoblash klasteriga taqsimlanadi, ulardan ikkitasi to'liq hisoblash yadrolarining qoldiqlari va bittasi yadrolar o'rtasida taqsimlangan haqiqiy sonli. Ushbu klasterlarning har biri o'z ko'rsatmalarini qayta tartiblash mantig'iga va o'z rejalashtiruvchisiga ega. Bu shuni anglatadiki, AMD kelajakdagi mahsulotlarda ushbu klasterlarning ba'zilarini to'liq almashtirish yoki to'ldirish qobiliyatini saqlab qoladi.

Klasterlarning har birida ko'rsatmalarni qayta tartiblash registrlar tarkibiga havolalarni saqlaydigan va ko'rsatmalar tartibini qayta tartibga solishda protsessor ichida doimiy ma'lumotlarni uzatish zaruratini bartaraf etadigan jismoniy registr faylidan foydalanishga asoslangan. Ushbu yondashuv o'z o'rniga qayta tartiblash buferini almashtirdi, chunki jismoniy registr fayli nafaqat energiya iste'moli nuqtai nazaridan samaraliroq, balki protsessorning soat tezligini oshirish uchun ham qulayroqdir.

Butun sonli klasterlar ikkita arifmetik bajarish birligi (ALU) va ikkita xotira manzili birligini (AGU) o'z ichiga oladi. K10 mikroarxitekturasi bilan solishtirganda, qurilmalar soni bitta ALU va bitta AGU ga kamaydi, ammo AMD bu ish faoliyatini sezilarli darajada pasaytirmasligiga ishontirmoqda, lekin yadro maydoni sezilarli darajada tejaydi. Biz ishonamizki, har bir butun sonli klasterda ikkitadan ortiq ALU va AGU boʻlishi haqiqatdan ham amaliy maʼnoga ega emas, chunki har bir soat siklida toʻrttadan ortiq soʻl koʻrsatmalari ikkala klaster tomonidan bajarilishi uchun dekoderdan kelishi mumkin emas.



Shu bilan birga, aktuatorlar yanada universal bo'lib qoldi, ular amalda o'z vazifalarida farq qilmaydi.

Kesh xotira quyi tizimini tashkil etish jiddiy o'zgardi. L1D keshi 64 dan 16 KB gacha qisqartirildi va yozishni qamrab oldi. Shu bilan birga, uning assotsiativligi 4 ta kanalga ko'tarildi, bunga qo'shimcha ravishda "yo'l bashoratchisi" qo'shildi. Birinchi darajadagi ma'lumotlar keshi hajmining qisqarishi uning o'tkazuvchanligini sezilarli darajada oshirish bilan qoplanadi; endi u bir vaqtning o'zida uchta 128 bitli operatsiyalarga xizmat ko'rsatishi mumkin: ikkita o'qish va bitta yozish.

Shubhasiz, L1D keshining tarmoqli kengligidagi o'zgarishlar asosan mikroarxitekturada 256 bitli AVX ko'rsatmalarini amalga oshirish zarurati bilan bog'liq bo'lib, uni qo'llab-quvvatlash yadrolar o'rtasida taqsimlangan FPU blokida paydo bo'lgan. Biroq, bu haqiqiy sonli aktuatorlar 256-bitga aylangan degani emas. Aslida, Buldozer modulida ikkita 128 bitli qurilma mavjud va AVX ko'rsatmalari 128 bitli ko'rsatmalarning bog'langan juftlari sifatida dekodlanadi. Shunga ko'ra, ularni bajarish uchun FMAC qurilmalari (suzuvchi nuqta ko'paytiriladi-to'planadi) birlashtiriladi va real raqamlangan klasterning ishlashi har bir soat siklida protsessor moduliga bitta AVX buyrug'iga kamayadi.



FPU o'zining birinchi darajali keshiga ega emas, shuning uchun bu klaster butun sonli qurilmalar orqali ma'lumotlar bilan ishlaydi.

AMD muhandislari Intel tomonidan taklif qilingan AVX ko'rsatmalarini qo'llab-quvvatlash vazifasini allaqachon o'z zimmalariga olishganligi sababli, Buldozer protsessorlariga boshqa tegishli to'plamlar qo'shildi: shifrlash operatsiyalarini tezlashtirishga qaratilgan SSE4.2 va AESNI ko'rsatmalari. Bundan tashqari, AMD o'zining bir nechta buyruqlarini taqdim etdi: uchta operandli ko'paytirish-qo'shish FMA4 va AVX - XOP ning keyingi rivojlanishi bo'yicha o'z qarashlari.



Buldozerdagi L2 keshi protsessor modulida taqsimlanadi va yadrolar o'rtasida taqsimlanadi. Uning sig'imi ta'sirchan 2 MB, assotsiativligi esa 16 kanal. Shu bilan birga, ushbu sxema bo'yicha ishlaydigan keshning kechikishi 18-20 tsiklgacha oshdi, garchi avtobus kengligi avvalgidek - 128-bit bo'lib qolgan. Bu Buldozerdagi L2 keshi, garchi katta bo'lsa-da, unchalik tez emasligini anglatadi; raqobatdosh va oldingi protsessorlar L2 keshini taxminan yarim kechikish bilan taklif qilishadi. 4 tsiklning kechikishiga ega bo'lgan kichik L1D keshi bilan birgalikda (bu K10 mikroarxitekturasidan ham ko'proq), bularning barchasi unchalik dalda beruvchi ko'rinmaydi. Biroq, AMD ta'kidlashicha, kesh kechikishi faqat Buldozerga yuqori soat tezligida ishlash qobiliyatini berish uchun oshirilgan.



Bundan tashqari, AMD muhandislari kerakli ma'lumotlarni birinchi va ikkinchi darajali keshlarga muddatidan oldin yuklash uchun mo'ljallangan samarali prefetch blokini joriy qildilar. Ushbu bloklarning ishlashi yaxshilangani aytiladi va ular endi tartibsiz ma'lumotlar tuzilmalarini taniy oladilar.

Nazariy jihatdan, Buldozer yaxshi taassurot qoldiradi. AMD protsessor mikroarxitekturasiga eski yondashuvini butunlay qayta ko'rib chiqdi va butunlay qayta ishlangan dizaynni amalga oshirdi. Bu, birinchi qarashda, juda istiqbolli ko'rinadi, chunki yangi mikroarxitektura bitta protsessor yadrosida soat siklida uchta emas, to'rtta ko'rsatmalarni bajarish uchun optimallashtirilgan. Bundan tashqari, u dekodlash jarayonida ko'rsatmalarni so'l bilan birlashtirishni qo'llab-quvvatlaydi, bu esa aniq ishlashni yanada oshiradi.

Ammo biz faqat bitta yadroga qarasak va aslida bunday yadrolar juft bo'lib birlashtirilganligi haqida o'ylamasak, hamma narsa juda yaxshi ko'rinadi. Ikki yadroli Buldozer modulida bir nechta yadrolar uchun juda ko'p umumiy qismlar mavjud. Xususan, bunday modulda faqat bitta ko'rsatmalarni qabul qilish bloki va bitta dekoder mavjud bo'lganligi sababli, soat siklida bajariladigan ko'rsatmalarning maksimal soni butun ikki yadroli yig'ilish uchun to'rttaga teng bo'lib qoladi. Bu shuni anglatadiki, bitta Sandy Bridge yadrosi uchun nazariy ko'rsatkichlar bo'yicha mantiqiy ekvivalent Buldozer yadrosi emas, balki moduldir. Bu holda modulning ikkita ipni bajarish qobiliyati AMD dan Hyper-Threading texnologiyasiga to'liq mantiqiy javob kabi ko'rinadi.

Albatta, bizning haqiqiy protsessorlarni sinab ko'rishimiz hamma narsani o'z o'rniga qo'yadi, ammo mikroarxitekturani ko'rib chiqish bosqichida biz Buldozerni to'liq sakkiz yadroli protsessor sifatida joylashtirish marketing hiylasi deb o'ylashga majburmiz. Ushbu protsessorlarning hisoblash imkoniyatlarini ishonchliroq baholash, nazariy ko'rsatkichlar nuqtai nazaridan ikkinchi avlod Intel Core mikroarxitekturasida qurilgan yadrolar bilan mukammal taqqoslanadigan modullar soniga asoslanishi kerak.

Shu munosabat bilan, mutlaqo mantiqiy savol tug'iladi - nega AMD bitta protsessor moduli doirasida ikki torli ishlov berishni amalga oshirish bilan bezovta qildi? Nega ikkita yadro bo'ylab taqsimlangan aktuatorlarni bitta klasterga birlashtirib bo'lmadi? Buning bir qancha sabablari bor.

Birinchidan, bir vaqtning o'zida ko'p sonli aktuatorlarni ish bilan yuklash uchun, umumiy holda, ilg'or protsessor ichidagi mantiq talab qilinadi. Shubhasiz, AMD Buldozer mikroarxitekturasida yuqori samarali tarmoqlarni bashorat qilish va ko'rsatmalar va ma'lumotlarni oldindan olish birliklarini amalga oshira olmadi. Shu sababli, ishni parallellashtirish va bajaruvchi qurilmalardan yanada maqbul foydalanish vazifasi dasturiy ta'minot ishlab chiqaruvchilariga o'tkaziladi, ular Buldozer uchun ko'p tarmoqli qo'llab-quvvatlanadigan mahsulotlarni etkazib berishlari kerak.

Ikkinchidan, bir vaqtning o'zida bajariladigan iplar sonini ko'paytirish unchalik yomon emas. Agar ish stoli foydalanuvchilari va ayniqsa geymerlar uchun sakkizta oddiy Buldozer yadrolari hech qanday afzalliklarni va'da qilmasa, server ilovalarida bunday mikroarxitektura juda qulay bo'lishi kerak. Demak, Buldozerni yaratishda asosiy maqsad ishqibozlarning intilishlarini qondirish emas, balki AMD ning serverlar bozoridagi mavqeini tiklash bo'lishi mumkin.

Turbo Core yanada Turbo

Energiya samaradorligi quyidagilardan biridir eng muhim xususiyatlar zamonaviy protsessorlar. Masalan, ularning ichida kelajakdagi mikroarxitekturalar Intel deyarli birinchi navbatda energiya sarfini kamaytirishga e'tibor beradi. AMD hali bu nuqtaga etib bormadi, bu kompaniyaning muhandislari birinchi navbatda ishlash uchun kurashmoqda. Ammo bu ishlab chiquvchilar Buldozerning issiqlik va energiya xususiyatlariga umuman e'tibor bermaganligini anglatmaydi. Aksincha, Llanodan so'ng energiya samaradorligini oshirishning tubdan yangi yondashuvlari Buldozer protsessorlarida o'z yo'lini topdi. Biroq, bu holda, muhandislar bo'shatilgan potentsialdan pulni tejash uchun emas, balki soat chastotalarini oshirish orqali qo'shimcha ishlashni siqish uchun ishlatishdi.

Albatta, yangi ishlab chiqarish texnologiyasi energiya iste'moli va issiqlik tarqalishi nuqtai nazaridan ma'lum yaxshilanishlarni keltirdi. Buldozer yuqori dielektrik material, metall eshik tranzistorlari va SOI texnologiyasidan foydalangan holda 32nm texnologik texnologiyadan foydalanadi. Boshqacha qilib aytganda, bu Llano protsessorlarini ishlab chiqaradigan bir xil GlobalFoundries texnik jarayoni. Rahmat yangi texnologiya 32 nm standartlari bilan ketma-ket sakkiz yadroli Buldozer protsessorlarining ish kuchlanishlari 1,4 V dan oshmaydi.

Biroq, Llano'dan Buldozerga o'tgan asosiy yangilik protsessorning ma'lum qismlaridan quvvatni uzib qo'yish uchun mo'ljallangan quvvat eshikli tranzistorlardir. Buldozerda ular alohida ikki yadroli modullardan va kesh xotirasidan kuchlanishni mustaqil ravishda olib tashlashga imkon beradi.



Moduldagi ikkala hisoblash yadrosi C6 quvvatni tejash holatiga kirganda, modul quvvatsizlanadi. Afsuski, bu texnologiyani protsessor yadrolariga tatbiq etib bo‘lmaydi, chunki Buldozer ichida maxsus yadrolar yo‘q – ular resurslarning bir qismini modul qo‘shnilari bilan bo‘lishadi.

C6 yadrolarining energiya tejovchi holatlari Buldozer va Turbo Core texnologiyasida nazorat qilinadi. Buldozer protsessor modullarining kamida yarmi quvvatni tejovchi holatda bo'lgan paytlarda u ta'minot kuchlanishini va soat chastotasini oshiradi. Ushbu majburiy ish rejimi Max Turbo Boost deb ataladi.

Biroq, Max Turbo Boost yangilik emas; bunday avtomatik overclocking AMD tomonidan K10 mikroarxitekturasida qurilgan Thuban protsessorlarida joriy qilingan. Haqiqatan ham yangilik All Core Boost rejimi bo‘lib, unda barcha protsessor yadrolari faol bo‘lganda ham soat tezligi nominal qiymatdan oshishi mumkin. Buldozerda joriy qilingan Turbo Core-ning takomillashtirilgan versiyasi protsessorga ma'lum bloklarning ish yuki haqidagi ma'lumotlarga asoslanib, uning amaliy quvvat sarfi va issiqlik tarqalishini yaxshi aniqlik bilan baholash imkonini beradi. Shunga ko'ra, agar ushbu baholashga ko'ra, joriy issiqlik tarqalishi va quvvat iste'moli chegaradan sezilarli darajada past bo'lsa, protsessor bitta yadro passiv holatda bo'lmasa ham, ta'minot kuchlanishini va soat chastotasini oshirishi mumkin.



Shunday qilib, Buldozer mikroarxitekturasi bilan protsessorlarning ishlash chastotasi juda o'zgaruvchan qiymatdir. Amalga oshirilayotgan algoritmlarning "jiddiyligi" va jalb qilingan yadrolar soniga qarab, u juda keng diapazonda dinamik ravishda o'zgarishi mumkin, 900 MGts ga etadi.

Yangilangan ish stoli platformasi

Yangi mikroarxitekturaning joriy etilishi bilan AMD nafaqat platforma dizaynini o'zgartirmadi, balki Buldozer protsessorlarining mavjud infratuzilma bilan mosligini saqlab qoldi. Shunga ko'ra, avvalgilari singari, yangi protsessorlar ham uchinchi darajali kesh, xotira kontrolleri va Hyper-Transport avtobus boshqaruvchisini o'z ichiga olgan integratsiyalashgan shimoliy ko'prikni o'z ichiga oladi. Shu bilan birga, barcha yangi chiqarilgan AMD va Intel protsessorlarida PCI Express grafik shinasi boshqaruvchisi o'rnatilgan bo'lishiga qaramay, Buldozerda bunday yo'q.



Xuddi K10 mikroarxitekturasida qurilgan protsessorlarda bo'lgani kabi, Buldozerdagi o'rnatilgan shimoliy ko'prik ham turli modellar uchun 2,0-2,2 GGts ga o'rnatilgan o'z soat chastotasidan foydalanadi. E'tibor bering, ushbu chastota ishlashga ma'lum ta'sir ko'rsatadi, chunki u L3 keshining tezligiga bevosita ta'sir qiladi. Protsessorlarning joriy versiyasida hajmi 8 MB ga ko'tarilgan va 64 kanalli assotsiativlikka ega. Korxona foydalanuvchilarining istaklarini qondirish uchun ushbu keshda saqlangan ma'lumotlar ECC xatolarni tuzatish kodi bilan himoyalangan.

Buldozerga o'rnatilgan xotira boshqaruvchisi hech qanday yangi imkoniyatlarga ega emas. Avvalgidek, u DDR3 SDRAM-ni qo'llab-quvvatlaydi, ikki kanalli dizayndan foydalanadi va aslida ikkita mustaqil bitta kanalli kontrollerlardan iborat bo'lib, ular juftlangan yoki bog'lanmagan rejimda ishlaydi. AMD faqat yuqori tezlikdagi xotira turlarini qo'llab-quvvatladi, DDR3-1867 bilan mosligini e'lon qildi va 1,25 va 1,35 V kuchlanishli energiya tejovchi modullar bilan mos kelishi haqida g'amxo'rlik qildi.

Zambezi o'zining kod nomiga ega Buldozer ish stoli modifikatsiyasi haqida gapirganda, u yangi maqsadlarga qaratilganligini ta'kidlash kerak. Soket platformasi AM3+, shuningdek, Scorpius kod nomi bilan ham tanilgan. Protsessor rozetka AM3+ da 942 pin bor, bu Socket AM3 ga qaraganda bir pin ko‘proq. Ammo, shunga qaramay, Zambezi eski Socket AM3 platalari bilan mos keladi. Eski anakartlarga yangi protsessorlarni o'rnatishda, aslida, faqat quvvatni boshqarishning ma'lum funktsiyalari yo'qoladi. Shunday qilib, Turbo Core va Cool"n"Quiet texnologiyalari ishlayotganda va Vdrop ishlamasa, chastotani almashtirish tezligi pasayadi.

Biroq, Zambezi chiqarilgan vaqtga kelib, AMD va ishlab chiqaruvchilar anakartlar yangi 900 seriyali mantiqiy to'plamlar asosida yangi mahsulotlar galaktikasini tayyorladilar. Zambezi protsessoriga asoslangan va yangi chipset asosida qurilgan odatiy tizimning tuzilishi quyidagi blok-sxemada ko'rsatilgan.


Yangi AMD 990FX chipsetlari (va uning soddalashtirilgan versiyalari AMD 990X va AMD 970) o'rtasidagi farqlar faqat Socket AM3+ ning o'ziga xos elektr xususiyatlarini qo'llab-quvvatlashda yotadi va ular o'zlari bilan yangi interfeyslarni olib kelmaydi. 800 seriyali chipsetlar singari, yangi janubiy ko'prikda oltita SATA 6 Gbps portlari va o'n to'rtta USB 2.0 portlari mavjud. Biz PCI Express 3.0 spetsifikatsiyasini yoki eng yomoni, yangi tizim mantiqiy to'plamlarida USB 3.0 portlarini qo'llab-quvvatlashni qanchalik xohlamasak ham, bu safar ham ularda bunday narsa yo'q. Aytgancha, bu juda g'alati, chunki USB 3.0 qo'llab-quvvatlashi pastki darajadagi Socket FM1 platformasi uchun chipsetlarda joriy qilingan.

Tizim mantiqiy to'plamlarining yangi seriyasining modifikatsiyalari o'rtasidagi farqlar faqat turli xil ko'p GPU konfiguratsiyalarini qo'llab-quvvatlashdan iborat.


Zambezi protsessorlari diapazoni

Zambezi protsessorlarining chiqarilishi yangilanishni yakunlaydi model oralig'i, AMD tomonidan taklif qilingan. Buldozer mikroarxitekturasiga asoslangan ish stoli protsessorlari ushbu ishlab chiqaruvchining yangi flagman taklifiga aylanadi va bozordan barcha turdagi Phenom II modifikatsiyalarini tezda siqib chiqaradi.

Yangi mikroarxitektura innovatsiyasini ta'kidlagan holda, AMD Zambezi ish stoli protsessorlari uchun yangi marketing nomi - FX dan foydalanadi. Bir tomondan, u protsessorlarni harflar bilan belgilashni o'z ichiga olgan yangi nomenklaturaga juda mos keladi, boshqa tomondan, bu olti yoki etti yil oldin eng tez ish stoli protsessorlari bo'lgan afsonaviy Athlon 64 FX protsessorlariga havola. Biroq, o'sha kunlar qaytarib bo'lmaydigan darajada o'tdi, shuning uchun keling, AMD bizga hozir nimani taklif qilishga tayyorligini ko'rib chiqaylik.

Yaqin kelajakda FX seriyali protsessorlar qatoriga to'rtta model kiradi.



Zambezi protsessor modellari o'rtasidagi farq nafaqat soat tezligida, balki faol hisoblash yadrolari sonida ham bo'lishiga qaramay, ularning barchasi bir xil yarimo'tkazgich chipiga asoslanadi. Mana:



Sakkiz yadrodan kam bo'lgan protsessorlarni olish uchun AMD ularning ba'zilarini yarimo'tkazgich chipida o'chirib qo'yadi. K10 mikroarxitekturali protsessorlarda bo'lgani kabi, ularni qayta qulfdan chiqarish imkoniyati hali ham so'roq ostida. Biroq, bizning laboratoriyamizdan o'tgan 900 seriyali mantiqiy to'plamlarga asoslangan anakartlarning BIOS-da tegishli variantlar mavjud, shuning uchun bu masalani ijobiy hal qilish uchun umid bor.

Olti yadroli va to'rt yadroli protsessor modifikatsiyalarini olish uchun yadrolarni o'chirish "modul bo'yicha" sodir bo'ladi. Ya'ni, ular ichidagi "ikkinchi" yadrolar emas, balki butun ikki yadroli modullar bloklanadi, garchi bunday taktika ishlash nuqtai nazaridan ancha foydali bo'ladi. Biroq, Buldozer mikroarxitekturasida qurilgan olti yadroli va to'rt yadroli protsessorlarning chiqarilishi marketing nuqtai nazaridan emas, balki rad etishni amalga oshirish zarurati bilan izohlanadi, bu chipning juda katta o'lchamlari va yangi texnologik jarayonni hisobga olgan holda, juda ko'p bo'ladi.

AMD yuqori soat chastotalarida ishlash uchun yangi mikroarxitekturani keskinlashtirganiga qaramay, biz erishilgan qiymatlarni ta'sirchan yutuq deb atay olmaymiz. To'rt gigagertsli to'siq engib bo'lmas bo'lib qolmoqda va eski FX protsessorining nominal chastotasi, masalan, Phenom II X4 980 dan ham past. Ishlab chiqarish texnologiyasining takomillashtirilishi bilan Zambezi chastotalari tezda ko'tariladi deb umid qilmoqchimiz. . Garchi, agar siz AMD rejalarining joriy versiyasiga ishonsangiz, chiziq 2012 yilning birinchi choragidan oldin tezlashadi.

Issiqlik chiqarish va energiya iste'moli nuqtai nazaridan hech qanday yutuq yo'q. AMD uzoq vaqtdan beri Buldozer mikroarxitekturasi energiya tejamkorligi haqida gapirgan, ammo aslida sakkiz yadroli eski modellar eski Phenom II bilan bir xil TDP darajasiga ega. To'g'ri, bir muncha vaqt o'tgach, kompaniya o'z takliflariga FX-8120 ning 95 vattli versiyasini va bir xil hisoblangan issiqlik tarqalishiga ega FX-8100 protsessorini qo'shishi kerak.

Ammo yangi FX-seriyali protsessorlarning narxi jozibadorroq ko'rinadi. AMD o'z raqobatchilariga qaraganda qulayroq narxda platformalarni taklif qilish kursidan chetga chiqmoqchi emas, shuning uchun eski sakkiz yadroli Zambezi modellari eski Intel Core i5 protsessorlariga qarshi. Umuman olganda, AMD o'z mahsulotlari uchun quyidagi joylashtirish sxemasiga rioya qilishni rejalashtirmoqda:



Boshqacha qilib aytganda, AMD Intelning olti yadroli protsessorlari va istiqbolli LGA2011 platformasi bilan raqobatlashmoqchi emas, balki o'rta narx segmentini zabt etishga e'tibor qaratmoqchi.

Ishqibozlar uchun yaxshi yangilik barcha FX seriyali protsessorlarda hech qanday multiplikator bloklanmasligi bo'ladi. Barcha Zambezi nafaqat baza multiplikatorini o'zgartirish orqali osonlikcha overclock qilinishi mumkin, balki Turbo Core texnologiyasi bilan ham xuddi shunday qayta konfiguratsiya qilinishi mumkin. Shuningdek, xotira quyi tizimini overclock qilish va protsessorga o'rnatilgan shimoliy ko'prikning chastotasi mavjud.

Sinov protsessori: AMD FX-8150

AMD bizning muharrirlarimizga Zambezi oilasining FX-8150 katta protsessorini yubordi.



Uning nominal soat tezligi 3,6 gigagertsli va undan ko'p batafsil ma'lumot Uning xarakteristikalarini CPU-Z ning berilgan skrinshotidan olish mumkin.



E'tibor bering, protsessor B2 qadamiga asoslangan - va bu birinchi versiya emas. Yarimo'tkazgich kristalining oldingi modifikatsiyalari ishlab chiqaruvchi tomonidan rad etildi, chunki ular dastlab rejalashtirilgan soat chastotalarida ishlay olmadilar. Avvaliga bahorda, keyin yozda rejalashtirilgan, lekin aslida oktyabr oyi o'rtalarida sodir bo'lgan e'lonning biroz kechikishiga aynan shu sabab bo'ldi.

Biroq, bugungi kunda erishilgan 3,6 gigagertsli chastota juda ta'sirli ko'rinmaydi. AMD ham, Intel ham yuqori tezlikda ishlaydigan mahsulotlarga ega. Biroq, FX-8150 juda istiqbolli Turbo Core texnologiyasiga ega, u past yuk ostida protsessor chastotasini avtomatik ravishda 4,2 gigagertsgacha oshirishi mumkin.



Shunisi e'tiborga loyiqki, agar yuk barcha hisoblash yadrolarida bo'lsa ham, 3,9 gigagertsli chastotaga erishish mumkin, lekin ayni paytda quvvat sarfi va issiqlik tarqalishi chegaralaridan tashqariga chiqmasdan avtomatik overclocking uchun joy qoldiradi.



Bo'sh turganda Cool"n"Quiet texnologiyasi FX-8150 chastotasini 1,4 gigagertsgacha pasaytiradi. Ta'minot kuchlanishi 0,85 V ga tushadi.


Biz qanday sinovdan o'tdik

Biz Buldozer mikroarxitekturasida qurilgan yangi sakkiz yadroli AMD FX-8150 protsessorini oʻzidan oldingi olti yadroli Phenom II X6 va raqobatdosh (narxli) Intel takliflari bilan toʻrt yadroli bilan solishtirdik. Yadro protsessorlari i5-2500 va Core i7-2600. Bundan tashqari, aniqroq bo'lishi uchun natijalarga olti yadroli Core i7-990X protsessorining ishlash ko'rsatkichlari qo'shildi.

Natijada test tizimlari quyidagi dasturiy ta'minot va apparat komponentlarini o'z ichiga oldi:

Protsessorlar:

AMD FX-8150 (Zambezi, 8 yadro, 3,6 GGts, 8 MB L2 + 8 MB L3);
AMD Phenom II X6 1100T (Thuban, 6 yadro, 3,3 GGts, 3 MB L2 + 6 MB L3);
Intel Core i7-2600K (Sandy Bridge, 4 yadroli, 3,4 GHz, 1 MB L2 + 8 MB L3);
Intel Core i5-2500K (Sandy Bridge, 4 yadroli, 3,3 GGs, 1 MB L2 + 6 MB L3);
Intel Core i7-990X Ekstremal nashr(Gulftown, 6 yadroli, 3,46 gigagertsli, 1,5 MB L2 + 12 MB L3).

CPU sovutgichi: NZXT Havik 140;
Ana platalar:

Gigabyte 990FXA-UD5 (Socket AM3+, AMD 990FX + SB950);
ASUS P8Z68-V PRO (LGA1155, Intel Z68 Express);
Gigabyte X58A-UD5 (LGA1366, Intel X58 Express).

Xotira:

2 x 2 GB, DDR3-1600 SDRAM, 9-9-9-27 (Kingston KHX1600C8D3K2/4GX);
3 x 2 GB, DDR3-1600 SDRAM, 9-9-9-27 (Muhim BL3KIT25664TG1608).

Grafik karta: AMD Radeon HD 6970.
Qattiq disk: Kingston SNVP325-S2/128 GB.
Quvvat manbai: Tagan TG880-U33II (880 Vt).
Operatsion tizim: Microsoft Windows 7 SP1 Ultimate x64.
Haydovchilar:

Intel chipset drayveri 9.2.0.1030;
Intel boshqaruv mexanizmi drayveri 7.1.10.1065;
Intel Rapid Storage Technology 10.6.0.1022;
AMD Catalyst 11.10 Displey drayveri.

E'tibor bering, sinov Windows 7 operatsion tizimining joriy versiyasida o'tkazildi, ammo AMD shuni ko'rsatadiki, ushbu operatsion tizimning vazifa menejeri hisoblash iplarini eng maqbul tarzda tarqatmaydi. Windows 7 birinchi navbatda iplarni turli modullarda joylashgan yadrolarga yo'naltirishni afzal ko'radi. Va bu haqiqatan ham yuqori aniq ishlashni ta'minlaydi, chunki modul ichida bo'lingan bloklarga yukni kamaytiradi. Biroq, bu strategiya, agar ba'zi ikki yadroli modullar energiya tejovchi holatda bo'lsa, protsessor tomonidan ishlatilishi mumkin bo'lgan turbo rejimlarni kiritishga to'sqinlik qiladi.

Istiqbolli operatsiya xonasi Windows tizimi 8 boshqa taktikaga amal qiladi va u erda iplar birinchi navbatda bir xil modul ichidagi yadrolarga tayinlanadi. Natijada, AMD bir qator ilovalarda Zambezi asosidagi tizimlarning ishlashi 10% gacha oshishi mumkinligini va'da qilmoqda.

Ishlash

Buldozer mikroarxitekturasining samaradorligini dastlabki baholash

Protsessorlarni "haqiqiy" sinovdan o'tkazishni boshlashdan oldin, biz Buldozer mikroarxitekturasidan nimani kutishimiz mumkinligini aniqlashga qaror qildik. Buning uchun biz ushbu mikroarxitekturaga ega protsessorni sun'iy ravishda yaratilgan teng sharoitlarda K10 va Sandy Bridge mikroarxitekturali boshqa protsessorlar bilan kichik taqqoslashni o'tkazdik: bir xil soat chastotasida va bir xil miqdordagi faollashtirilgan yadrolar bilan.

Aniqroq aytganda, biz AMD FX-8150, Phenom II X6 1100T va Core i7-2600 ni 3,6 gigagertsli chastotada faqat ikkita ishlov berish yadrosi yoqilgan holda solishtirdik. Tajribaning tozaligi uchun barcha energiya tejash va avtomatik overclocking texnologiyalari tabiiy ravishda o'chirildi. Sinov vositalari sifatida yordamchi dasturga kiritilgan oddiy sintetik ko'rsatkichlar to'plami tanlangan SiSoft Sandra 2011 yilda biz SSE3 dan eski barcha ko'rsatmalar to'plamlarini majburan o'chirib qo'ydik, chunki ular K10 mikroarxitekturasida qo'llab-quvvatlanmaydi.



Jadvaldagi raqamlar har qanday so'zlardan ko'ra balandroq gapiradi. Buldozer mikroarxitekturasining ishlashi avvalgi protsessorlarga qaraganda ancha past bo'ldi. Yadro juftlarini umumiy manbalar bilan bitta modulga birlashtirish va mikroarxitekturani soddalashtirish bir xil chastotada buldozerning o'ziga xos ishlashi oldingi avlod AMD mikroarxitekturasiga nisbatan 25-40% ga pasayishiga olib keldi. Natijada, buldozer yadrolari Sandy Bridge yadrolariga qaraganda deyarli yarmi sekinroq. Bundan tashqari, ikkita yadroni o'z ichiga olgan Buldozer protsessor modulining ishlashi Hyper-Threading texnologiyasi yoqilgan bitta Sandy Bridge yadrosi tezligidan ham pastroq. Bunday mikroarxitekturada qurilgan protsessordan ishlash rekordlarini kutishimiz kerakmi? Savol ritorikdir.

Yo'l davomida, keling, bir ko'rib chiqaylik amaliy xususiyatlar keshlar va xotira quyi tizimlari. Ushbu funktsional birliklarning ishlash tezligini baholash uchun biz Aida64 to'plamidan Cachemem yordam dasturida sinovlarni o'tkazdik. Barcha holatlarda DDR3-1600 xotirasi 9-9-9-27-1T kechikishlar bilan ishlatilgan. Xuddi oldingi holatda bo'lgani kabi, protsessor chastotalari 3,6 gigagertsli chastotada saqlanib qoldi.



Zambezi-da, Phenom II protsessorlari bilan solishtirganda, barcha keshlar va xotira quyi tizimining amaliy kechikishlari oshdi. Buldozer mikroarxitekturasini ko'rib chiqayotganda bu haqda gaplashdik. Biroq, kesh xotirasining mantiqiy tashkil etilishini o'zgartirib, uning o'tkazish qobiliyati deyarli barcha holatlarda oshdi.

Shu bilan birga, Sandy Bridge-da eng tez ikki kanalli xotira kontrolleri va eng tezkor kesh quyi tizimi amalga oshiriladi. Albatta, kesh hajmi bo'yicha Intel protsessori Buldozer mikroarxitektura vositalaridan biroz pastroq.

Umumiy ishlash

Umumiy vazifalarda protsessorning ishlashini baholash uchun biz an'anaviy ravishda Bapco SYSmark 2012 testidan foydalanamiz, u umumiy zamonaviy foydalanuvchi ishini taqlid qiladi. ofis dasturlari va raqamli kontentni yaratish va qayta ishlash uchun ilovalar. Sinov g'oyasi juda oddiy: u umumiy ilovalarda kompyuterning o'rtacha vaznli tezligini tavsiflovchi yagona ko'rsatkichni ishlab chiqaradi.

Eslatib o'tamiz, bir muncha vaqt oldin AMD SYSmark-ni "noto'g'ri" haqiqiy ilovalar to'plamidan foydalanganligi sababli noxolis bo'lganligi haqidagi da'volarni tarqatib, troll qilishga urindi. Biroq, bizning fikrimizcha, bunday qaror asosli emas, chunki bu umumiy va haqiqatan ham mashhur dasturlar bo'lib, ular ishlashni baholash uchun ishlatiladi, ularning har birining yakuniy natijaga qo'shgan hissasi quyidagi diagrammada ko'rsatilgan:



Shuning uchun biz SYSmark 2012 dan foydalanishni to'xtatmadik va umumiy ish faoliyatini baholash uchun uning ko'rsatkichlaridan foydalanishda davom etamiz.



Birinchi sinov bunday umidsizlikdir. Sakkiz yadroli FX-8150 ning natijasi olti yadroli Phenom II X6 1100T ishlashidan atigi 10 foizga yaxshiroq va tabiiyki, to'rt yadroli Intel protsessorlarining ishlashiga umuman erisha olmaydi. Shunday qilib, AMD tomonidan o'rtacha miqdordagi murakkablar o'rniga protsessorda o'ziga xos ko'rsatkichlari past bo'lgan ko'p sonli yadrolarni amalga oshirish uchun tanlangan taktika, umuman olganda, ijobiy natija bermaydi.

SYSmark 2012 natijalarini chuqurroq tushunish tizimdan foydalanishning turli stsenariylarida olingan samaradorlik ballari haqida tushuncha berishi mumkin.

Office mahsuldorligi stsenariysi odatdagi ofis ishini taqlid qiladi: matn tayyorlash, elektron jadvallarni qayta ishlash, ular bilan ishlash elektron pochta orqali va Internet saytlariga tashrif buyurish. Skript quyidagi ilovalar to‘plamidan foydalanadi: ABBYY FineReader Pro 10.0, Adobe Acrobat Pro 9, Adobe Flash O'yinchi 10.1 Microsoft Excel 2010 yil, Microsoft Internet Explorer 9, Microsoft Outlook 2010, Microsoft PowerPoint 2010, Microsoft Word 2010 va WinZip Pro 14.5.



Media yaratish stsenariysi oldindan suratga olingan raqamli tasvirlar va videolardan foydalangan holda reklama roligini yaratishga taqlid qiladi. Shu maqsadda mashhur Adobe paketlaridan foydalaniladi: Photoshop CS5 Extended, Premiere Pro CS5 va After Effects CS5.



Veb-ishlab chiqish - bu veb-sayt yaratish modellashtirilgan stsenariy. Amaldagi ilovalar: Adobe Photoshop CS5 Kengaytirilgan, Adobe Premiere Pro CS5, Adobe Dreamweaver CS5, Mozilla Firefox 3.6.8 va Microsoft Internet Explorer 9.



Ma'lumotlar/moliyaviy tahlil stsenariysi Microsoft Excel 2010 da amalga oshiriladigan statistik tahlil va bozor tendentsiyalarini prognoz qilishga bag'ishlangan.



3D modellashtirish skripti butunlay uch o'lchamli ob'ektlarni yaratishga va statik va dinamik sahnalarni ko'rsatishga bag'ishlangan. Adobe yordamida Photoshop CS5 Extended, Autodesk 3ds Max 2011, Autodesk AutoCAD 2011 va Google SketchUp Pro 8.



Oxirgi stsenariy, Tizim boshqaruvi, zaxira nusxalarini yaratish va dasturiy ta'minot va yangilanishlarni o'rnatishni o'z ichiga oladi. Bu erda bir necha kishi ishtirok etadi turli versiyalar Mozilla Firefox Installer va WinZip Pro 14.5.



Da turli modellar Buldozer mikroarxitekturasi bilan protsessordan foydalanish tubdan boshqacha natijalarni ko'rsatadi. Ba'zi hollarda u Phenom II X6 dan ham sekinroq bo'lib chiqadi, ammo qarama-qarshi vaziyatlar ham mavjud. Umuman olganda, umumiy qoida quyidagicha: FX-8150 ning afzalligi, ayniqsa, ish yuki ko'p tarmoqli va yaxshi parallellashtirilgan, ammo hisoblash murakkab bo'lmagan joyda sezilarli bo'ladi.

Biroq, hatto eng qulay vaziyatlarda ham FX-8150 Core i5-2500 dan orqada qoladi. Ushbu protsessorlarni tezlik bilan solishtirish mumkin bo'lgan yagona stsenariy 3D renderlashdir. O'rtacha, Intel taklifi AMD ning yangi mahsulotidan ta'sirchan 25% ga oldinda. Afsuski.

Oʻyin samaradorligi

Ma'lumki, zamonaviy o'yinlarning aksariyatida yuqori samarali protsessorlar bilan jihozlangan platformalarning ishlashi grafik quyi tizimning kuchi bilan belgilanadi. Shuning uchun protsessorlarni sinovdan o'tkazishda biz video kartadan yukni iloji boricha olib tashlash uchun sinovlarni o'tkazishga harakat qilamiz: eng ko'p protsessorga bog'liq o'yinlar tanlanadi va sinovlar anti-ni yoqmasdan amalga oshiriladi. -aliasing va eng uzoq o'rnatish bilan yuqori ruxsatlar. Ya'ni, olingan natijalar zamonaviy video kartalari bo'lgan tizimlarda erishish mumkin bo'lgan fps darajasini emas, balki protsessorlarning o'yin yuki bilan qanchalik yaxshi ishlashini baholashga imkon beradi. Shu sababli, taqdim etilgan natijalarga asoslanib, bozorda grafik tezlatgichlarning tezroq variantlari paydo bo'lganda, protsessorlar kelajakda o'zini qanday tutishi haqida taxmin qilish mumkin.


















O'yinlar parallellashtirilgan ko'p tarmoqli yukni yaratadigan vazifalar toifasiga kirmaydi. Shuning uchun, bugungi o'yin ilovalari uchun AMD taklif qiladigan ko'p yadroli yirtqich hayvonlar emas, balki to'rt yadroli protsessorlar ko'proq mos keladi. Ushbu bayonotning aniq tasvirini quyidagi diagrammalarda ko'ramiz. Sakkiz yadroli yangi FX-8150 olti yadroli oldingi Phenom II X6 dan tezroq emas.

Zambezi va Sandy Bridge o'rtasidagi o'yin samaradorligi nisbatiga kelsak, AMD hali ham yangi mahsulot uchun ancha pessimistik. Hozirgi Intel protsessor mikroarxitekturasi 3D o'yinlar tomonidan yaratilgan odatiy ish yukini ancha yaxshi boshqaradi va AMD bu toifadagi vazifalarda raqobatchi protsessorlarga yetib olishiga umid yo'q. Boshqacha qilib aytganda, o'yin tizimlarida Buldozerdan foydalanish faqat ma'lum bir protsessorning ishlashi ma'lum bir o'yinlar to'plamidagi ma'lum bir video quyi tizimi uchun etarli ekanligiga ishonch mavjud bo'lganda mantiqiy bo'lishi mumkin. Biroq, bu holatda ham, video tezlatgichning keyingi yangilanishi bilan siz dastlab platforma va zamonaviy Intel protsessorlarini afzal ko'rgan foydalanuvchilarga nisbatan jiddiy ahvolga tushib qolishingiz mumkinligini tushunishingiz kerak.

O'yin sinovlaridan tashqari, biz Extreme profili bilan ishga tushirilgan Futuremark 3DMark 11 sintetik benchmarkining natijalarini ham taqdim etamiz.



Ushbu natijalarni qo'shishdan maqsad, video quyi tizimi protsessor quvvatini to'liq amalga oshirishga imkon bermagan FX-8150 uchun juda ideal vaziyatni ko'rsatish edi. Bu erda asosiy yuk video kartaga tushadi va protsessor faqat yordamchi rol o'ynaydi. Bunday hollarda, biz Buldozer va Sandy Bridge protsessorlarining teng ishlashi haqida gapirishimiz mumkin, garchi, albatta, bu mutlaqo to'g'ri emas.



Biroq, FX-8150 3DMark 11 jismoniy testida ham yaxshi ko'rinadi (oldingi natijalar bilan solishtirganda). jismoniy model AMD ning yangi sakkiz yadroli protsessori to'rt yadroli Core i5-2500 bilan taqqoslanadigan tezlikda ishlaydi.

Ilovalarda testlar

Umuman olganda, Buldozerning o'rtacha og'irligi va ish stolidagi o'yin ko'rsatkichlari biz kutganimizdan ancha past edi. Biroq, keling, umidsizlikka tushmaylik va yangi AMD mikroarxitekturasi o'zini ko'rsatishga qodir bo'lgan holatlarni topishga harakat qilaylik. kuchli tomonlari.

Ma'lumotni siqish paytida protsessorlarning tezligini o'lchash uchun biz foydalanamiz WinRAR arxivi, uning yordamida biz maksimal siqilish darajasi bilan umumiy hajmi 1,4 GB bo'lgan turli xil fayllarga ega papkani arxivlaymiz.



FX-8150 natijasi Core i5-2500 ga yaqin. WinRAR barcha sakkizta Buldozer yadrolarida hisob-kitoblarni parallellashtira oladigan ilovalardan biri emas, ammo ulkan kesh xotirasi kunni saqlab qolganga o'xshaydi.

Arxivlash tezligi uchun ikkinchi shunga o'xshash sinov LZMA2 siqish algoritmidan foydalangan holda 7-zip dasturida amalga oshiriladi.



7-zip formatida FX-8150 ning ishlashi maqtovga sazovor. Ushbu sakkiz yadroli protsessor to'rt yadroli Core i7-2600 tezligiga yaqinlasha oladi, u Hyper-Threading-ni qo'llab-quvvatlaydi va Buldozer kabi bir vaqtning o'zida sakkizta ipni bajara oladi.

Protsessorlarning shifrlash samaradorligi mashhur TrueCrypt kriptografik yordam dasturining o'rnatilgan benchmarki bilan o'lchanadi. Shuni ta'kidlash kerakki, u nafaqat ish bilan har qanday miqdordagi yadrolarni samarali yuklashga qodir, balki AES ixtisoslashtirilgan ko'rsatmalar to'plamini ham qo'llab-quvvatlaydi.



Yaxshi parallellashtirilgan, oddiy butun son algoritmlari Buldozer mikroarxitekturasiga kerak bo'lgan narsadir. Bunday hollarda, biz ko'rib turganimizdek, juda ajoyib ishlashga erishish mumkin. Xususan, shifrlash haqida gap ketganda, FX-8150 faqat olti yadroli Core i7-990X dan ortda qolmoqda va LGA1155 platformasi uchun barcha protsessorlardan oldinda.

Ovozni transkodlash tezligini sinab ko'rayotganda, yordamchi dasturdan foydalaning Apple iTunes, bu CD tarkibini AAC formatiga aylantiradi. E'tibor bering, ushbu dasturning xarakterli xususiyati faqat bir juft protsessor yadrosidan foydalanish qobiliyatidir.



Kichik miqdordagi hisoblash iplarini yaratadigan dasturlarni Buldozerdan uzoqroq tutgan ma'qul. Ushbu protsessorning ba'zi yadrolari bunday holatlarda munosib natijalarni ko'rsatish uchun juda zaif.

Biz Adobe Photoshop-da ishlashni o'zimizning testimiz yordamida o'lchaymiz, bu ijodiy qayta ishlangan Rötuş rassomlarining Photoshop tezligi testi, bu raqamli kamera bilan olingan to'rtta 10 megapikselli tasvirni odatiy qayta ishlashni o'z ichiga oladi.



Photoshop-da FX-8150-ning ishlashi K10 mikroarxitekturali protsessorlar kabi halokatli emas, lekin u hali ham Core i5-2500-dan ancha past. Shubhasiz, katta kesh xotirasi bu holda Buldozer mikroarxitekturasi uchun yaxshi yordamdir, ammo buning o'zi sizni uzoqqa olib bormaydi. Hisoblash yadrolarining samaradorligi va o'ziga xos ishlashi hali ham muhim ahamiyatga ega.

Biz ham test sinovlarini o'tkazdik Adobe dasturi Photoshop Lightroom 3. Sinov stsenariysi RAW formatidagi 12 megapikselli yuzta tasvirni keyingi qayta ishlash va JPEG formatida eksport qilishni o'z ichiga oladi.



Lightroom har qanday miqdordagi yadrolarda fotosuratlarni qayta ishlashni parallellashtirishi mumkin va shuning uchun sakkiz yadroli FX-8150 bu erda yaxshi natijalarni ko'rsatadi. Biroq, bu holatda "yomon emas" nisbiy tushunchadir, aslida uning ishlashi faqat Core i5-2500 bilan solishtirish mumkin. Bu shuni anglatadiki, ikkita Buldozer yadrosi Hyper-Threading qo'llab-quvvatlanmasdan bitta Sandy Bridge yadrosiga teng.

Adobe Premiere Pro-da ishlash turli effektlar qo'llanilgan HDV 1080p25 videoni o'z ichiga olgan loyihaning H.264 Blu-Ray formatida ko'rsatish vaqtini o'lchash orqali tekshiriladi.



Oldingi avlod AMD protsessorlari ham video transkodlashni yaxshi bajargan. Buldozer mikroarxitekturasi bunday xarakterdagi ilovalarda unumdorlikni biroz oshirishga imkon berdi va natijada FX-8150 Core i5-2500 dan ham tezroq.

Adobe After Effects-dan foydalangan holda videoni tahrirlash tezligi oldindan belgilangan filtrlar va effektlar to'plamining ishlash vaqtini o'lchash yo'li bilan baholandi, jumladan loyqalik, burma yaratish, ramkani aralashtirish, porlashni yaratish, harakatni defokuslash, soyalash, 2D va 3D manipulyatsiyasi, inversiya, va boshqalar.



Yuk yaxshi parallellashtirilganiga qaramay, FX-8150 After Effects bo'yicha Intel raqobatchilaridan ortda qolmoqda.

H.264 formatiga video transkodlash tezligini o'lchash uchun 4 Mbit/sek oqim bilan 720p ruxsatda yozilgan MPEG-2 formatidagi manba videoni qayta ishlash vaqtini o'lchashga asoslangan x264 HD testi qo'llaniladi. Shuni ta'kidlash kerakki, ushbu test natijalari katta amaliy ahamiyatga ega, chunki unda ishlatiladigan x264 kodek ko'plab mashhur transkodlash yordam dasturlari, masalan, HandBrake, MeGUI, VirtualDub va boshqalar asosida ishlaydi.






Videoni x264 kodek bilan transkod qilishda AMD protsessorlari har doim yaxshi ishlash ko'rsatdi. Sakkiz yadroli mikroarxitekturaning chiqarilishi bilan ularning natijalari yanada oshdi va endi FX-8150 hatto ikkinchi, eng ko'p resurs talab qiladigan kodlash o'tish bosqichida Core i7-2600 dan ham oshib ketdi. Shunday qilib, katta qiyinchilik bilan biz nihoyat TrueCrypt-dan tashqari ikkinchi dasturni topdik, bu erda Buldozer mikroarxitekturasiga ega protsessorning ishlashi xushomadgo'y baholashga loyiqdir.

Biz Autodesk 3ds max 2011 da ixtisoslashtirilgan SPECapc testi yordamida hisoblash unumdorligi va renderlash tezligini o'lchaymiz. Ushbu testdan boshlab biz 3ds Max 2011 uchun SPECapc ning yangi professional versiyasidan foydalanishni boshlaymiz.






Renderlash, shuningdek, ko'p yadroli mikroarxitekturalar uchun optimallashtirish kerak bo'lgan vazifalardan biridir. Ammo shunga qaramay, FX-8150 hali ham Core i5-2500 va Core i7-2600 dan sekinroq, Core i7-990X haqida gapirmasa ham bo'ladi. Boshqa tomondan, yangi AMD protsessori o'zidan oldingi protsessorga yutqazganda, hech qanday sharmandali holat yo'q.

Shaxsiy ilovalar bo'yicha o'rtacha natijalar, FX-8150 bizning ilovalar to'plamimizdagi Phenom II X6 1100Tga qaraganda taxminan 14% tezroq edi. Va bu uning yarmidan bir oz kamroq hollarda Core i5-2500 dan yomon ishlashiga imkon berdi. Biroq, navbatdagi Sandy Bridge modeli, Core i7-2600 bilan farq muhimligicha qolmoqda va 10% dan ortiqni tashkil qiladi.

Energiya iste'moli

Buldozerning ishlashini maqbul deb atash mumkin bo'lgan vazifalar to'plamini topa olganimizga qaramay, yangi mikroarxitekturaga asoslangan protsessorlar umuman inqilobiy protsessorlarga o'xshamaydi. Yagona umid energiya iste'moli uchun qolmoqda, chunki ilgari AMD protsessorlari ushbu parametr bo'yicha raqobatchilardan ancha past edi. Endi, agar siz ishlab chiquvchilarning va'dalariga ishonsangiz, mikroarxitektura energiya samaradorligiga ko'proq e'tibor qaratdi va yangi 32 nm texnologik jarayon takomillashtirishga hissa qo'shishi kerak edi. elektr xususiyatlari. Shunday qilib, keling, FX-8150 ni vatt uchun ishlash ob'ektivi orqali ko'rib chiqaylik.

Quyidagi grafiklar, agar boshqacha ko'rsatilmagan bo'lsa, elektr ta'minotidan "keyin" o'lchangan va tizimga jalb qilingan barcha komponentlarning energiya iste'moli yig'indisini ifodalovchi umumiy tizim iste'molini (monitorsiz) ko'rsatadi. Elektr ta'minotining samaradorligi bu holatda hisobga olinmaydi. O'lchovlar paytida protsessorlardagi yuk LinX 0.6.4 yordam dasturining 64 bitli versiyasi tomonidan yaratilgan. Bundan tashqari, bo'sh quvvat sarfini to'g'ri baholash uchun biz barcha mavjud energiya tejovchi texnologiyalarni faollashtirdik: C1E, C6, AMD Cool"n"Sokin va Kengaytirilgan Intel SpeedStep.



Bo'sh turganda, Buldozer mikroarxitekturasida qurilgan protsessorli tizimlarning iste'moli Phenom II oilasi protsessorlari bilan o'xshash tizimlarga qaraganda kamroq bo'ldi. Biroq, zamonaviy Intel LGA1155 tizimlari bo'sh rejimda sezilarli darajada kamroq iste'mol qiladi.



Hisoblash yuki bitta ipli bo'lsa, Turbo Core texnologiyasining yuqori agressivligi tufayli Socket AM3+ tizimlarining iste'moli keskin oshadi. O'rnatilgan tizimlar bilan Intel protsessorlari, bu kuzatilmaydi va ular yana sezilarli darajada yuqori energiya samaradorligi bilan maqtanishlari mumkin.



To'liq ko'p tarmoqli yuk bilan vaziyat unchalik farq qilmaydi. Faqat LGA1366 Core i7-990X protsessorli tizim "oldinga o'tdi". Aks holda, hamma narsa avvalgidek. Quvvat iste'moli nuqtai nazaridan, FX-8150 hech qanday muvaffaqiyat bilan maqtanmaydi. U Phenom II X6 1100T ga qaraganda bir oz kamroq iste'mol qila boshladi, ammo Sandy Bridge protsessorlari kamida bir yarim baravar tejamkor.

AMD soat chastotalarini oshirish uchun yangi mikroarxitekturani joriy etish orqali olingan barcha energiya samaradorligidan foydalangan. Va, natijada, biz hech narsani ko'rmayapmiz yangi daraja samaradorlik yoki tubdan yaxshilangan ishlash. Shunga ko'ra, vatt uchun ishlash jihatidan Buldozer, o'zidan oldingi kabi, Intelning raqobatdosh mikroarxitekturalaridan ancha past.

Malumot uchun, biz protsessor va anakartning elektr ta'minoti sxemalarida alohida o'lchangan to'liq yukda iste'molni taqdim etamiz.






Sakkiz yadroli FX-8150 ning "aniq" iste'moli iste'moldan oshadi Qumli protsessorlar Taxminan ikki marta ko'prik. Ikkala protsessor ham bir xil texnologik jarayondan foydalangan holda ishlab chiqarilganligini va o'xshash yadro kuchlanishiga ega ekanligini hisobga olsak, AMD Buldozer mikroarxitekturasining energiya samaradorligi haqida gapirganda nimani nazarda tutgani juda qiziq bo'ladi.

Overclocking

Socket AM3+ platformasi va FX seriyali protsessorlari dastlab overclockerlar sifatida joylashtirilgan. Buni barcha multiplikatorlarning to'liq qulfdan chiqarilishi va FX-8150 protsessorlaridan biri yordamida overclock bo'yicha jahon rekordi o'rnatilgan AMD homiyligida o'tkazilgan tajribalar tasdiqlaydi. Kompaniyaning yangi mikroarxitektura yuqori soat chastotalarida ishlash uchun optimallashtirilgani haqidagi bayonotlari ham istiqbolli ko'rinadi. Biz haqiqatan ham AMD-dan yangi overclock mo''jizasini olamizmi? Keling, tekshiramiz.

Har qanday FX protsessorlarini overclock qilish juda oddiy, ularning logotipida "Unlocked" so'zi bejiz emas. Protsessor chastotasini multiplikator yoki BIOS Setup orqali yoki AMD (Overdrive Utility) va anakart ishlab chiqaruvchilari tomonidan taqdim etilgan maxsus yordam dasturlari orqali o'zgartirish mumkin. Xuddi shunday, Socket AM3+ tizimlarida siz protsessorga o'rnatilgan shimoliy ko'prik va xotirani overclock qilishingiz mumkin.

Sinov paytida biz FX-8150 ning 4,6 gigagertsli chastotada barqaror ishlashiga erishdik. Ushbu holatda barqarorlikni ta'minlash uchun protsessorning kuchlanish kuchlanishini 1,475 V ga oshirish kerak edi va qo'shimcha ravishda Load-Line Calibration funksiyasini yoqish kerak edi. Barqarorlik sinovlari davomida ushbu chastotada ishlaydigan protsessorning harorati soket sensori bo'yicha 85 darajadan yoki protsessorga o'rnatilgan sensorga ko'ra 75 darajadan oshmadi. Issiqlikni olib tashlash uchun NZXT Havik 140 samarali havo sovutgichi ishlatilganini eslaymiz.



E'tibor bering, bir vaqtning o'zida biz protsessorga o'rnatilgan shimoliy ko'prikni overclock qilishga harakat qildik, chunki uning chastotasini oshirish uchinchi darajadagi kesh va xotira kontrolleri tezligiga ijobiy ta'sir qiladi. Ammo, afsuski, ushbu protsessor tugunini sezilarli darajada oshirib yuborish ko'rinmas to'siqga duch keldi va biz bir vaqtning o'zida uning ta'minot kuchlanishini oshirishga harakat qilgan bo'lsak ham, u 2,4 GGts dan yuqori chastotaga erisha olmadi.

Qanday bo'lmasin, FX-8150 ni 4,6 gigagertsgacha oshirib yuborish yaxshi natijadir, ayniqsa Phenom II oilasining AMD protsessorlari 4,0 gigagertsdan ortiq havoda kamdan-kam hollarda overclock qilinganligini hisobga olsak. Boshqacha qilib aytadigan bo'lsak, Buldozer mikroarxitekturasi haqiqatda chastota chegarasini biroz yuqoriga ko'tarish imkonini berdi.

Biroq, FX protsessorlarining overclockingni, birinchi navbatda, eski Phenom II bilan emas, balki LGA1155 tizimlari uchun raqobatdosh Core i5 va Core i7 protsessorlari bilan solishtirish kerak. Ammo ular aniq tezlashmaydi. Masalan, Core i5-2500K uchun kuchlanish nominaldan 0,15 V ga ko'tarilgan va havo sovutgichidan foydalangan holda odatiy overclock 4,7 gigagertsni tashkil qiladi. Va bu fonda, FX-8150 natijasi endi unchalik ajoyib ko'rinmaydi.

Overclocked FX-8150 va overclocked Core i5-2500K ning ishlashini solishtirsak, Zambezi-ni overclock qilish taassurotlari yanada yomonlashadi (nominal rejimga nisbatan unumdorlikning oshishi qavs ichida ko'rsatilgan):



Umuman olganda, overclocking natijalar sifatini o'zgartirmaydi. Ammo FX-8150 nominal rejimda tezroq bo'lgan joyda bo'shliq toraydi. Va Core i5-2500 yetakchi bo'lgan joyda, u o'z ustunligini mustahkamladi. Buning ajablanarli joyi yo'q: overclock paytida FX-8150 chastotasi 28% ga oshdi, Core i5-2500K chastotasi esa 42% ga oshdi. Umuman olganda, haddan tashqari oshirib yuborishdan olingan samaradorlikning kattaligi bilan baholanishi mumkin bo'lganidek, Sandy Bridge mikroarxitekturasi ortib borayotgan chastotalarga nisbatan sezgirroq munosabatda bo'ladi. Boshqacha qilib aytganda, agar biz overclockingni hisobga olsak ham, Buldozer mikroarxitekturasiga ega protsessorlar, ular juda yaxshi overclock bo'lishiga qaramay, Intel raqobatchilaridan kuchliroq ko'rinmaydi.

xulosalar

Muvaffaqiyat yoki muvaffaqiyatsizlik? Albatta, ko'pchiligingiz maqolaning oxirida aniq hukmni ko'rishni xohlaysiz. Biroq, bu holatda, hamma narsa juda noaniq va AMD o'zining Buldozer bilan sharhlovchilarni juda qiyin ahvolga solib qo'ydi.

Gap shundaki, AMD mikroarxitekturani rivojlantirishga mutlaqo nostandart yondashuvni namoyish etdi. Protsessor unumdorligi uchta komponentdan iboratligini hisobga olib: protsessor yadrosida bir takt siklida bajariladigan ko'rsatmalar soni, yadrolar chastotasi va soni, ishlab chiquvchilar o'zlarining ustuvorliklarini yadrolar soniga o'tkazdilar. Shu bilan birga, alohida yadrolarning o'ziga xos ishlashi kamaydi, ammo natijada olingan dizayn arzon sakkiz yadroli yoki undan ham murakkab protsessorlarni yaratishga yo'l ochdi. Bu ko'p tarmoqli yuk va protsessorlar bilan ishlaydigan server bozori uchun juda kuchli harakatdir katta miqdor yadrolari jiddiy talabga ega. Shunday qilib, yangi Buldozer mikroarxitekturasi AMD-ga serverlar bozorida o'z mavqeini sezilarli darajada yaxshilashga imkon beradi.

Biroq, bugun biz ushbu mikroarxitektura asosida qurilgan, ammo ish stoli kompyuterlariga mo'ljallangan FX protsessor bilan tanishdik. Va bu erda Buldozerning apparat imkoniyatlari va odatdagi ish stoli ish yuklari o'rtasidagi tafovut to'liq aniq bo'ldi. Ayniqsa, marketing kampaniyasi shunday tuzilganki, ko'pchilik Buldozerga ish stoli bozorida o'sib borayotgan yulduz sifatida ishonganligi achinarli. Biroq, bu umidlar amalga oshmadi.


Buldozer mikroarxitekturasiga asoslangan FX protsessorlari o'zlarining kuchli tomonlarini faqat oddiy foydalanuvchilar tomonidan hal qilinadigan kichik vazifalar to'plamida namoyish eta oldilar. Oddiy keng tarqalgan ilovalar orasida oddiy butun sonli ko'p tarmoqli ish yukini yaratadigan misollar ko'p emas va Buldozerning yuqori ishlashi faqat shu holatda namoyon bo'ladi. Natijada, ba'zi hollarda Buldozer nafaqat Intelning raqobatdosh echimlaridan sekinroq, balki oldingi avlod mikroarxitekturasida qurilgan Phenom II X6 protsessoridan ham yomonroq bo'lib chiqdi. Va bu shuni anglatadiki, AMD inqilobiy ish stoli protsessorini ishlab chiqara olmadi.

Aslida, FX faqat keyingi Phenom bo'lib, u o'zidan ancha yaxshi ko'rinadi, ayniqsa o'zidan oldingilariga nisbatan. FX protsessorlari odatda Phenom II ga qaraganda tezroq, overclock sezilarli darajada yaxshi va biroz kamroq iste'molga ega, shuning uchun ularni eskirgan K10 mikroarxitekturasining tashuvchilari uchun yaxshi o'rinbosar deb hisoblash mumkin.

Biroq, shuni eslatib o'tamizki, AMD nafaqat o'zi bilan, balki u bilan ham urushmoqda Intel tomonidan. Shu sababli, biz hali ham FX protsessorlari faqat videoni qayta ishlash va transkodlashga yo'naltirilgan ish stollarida haqiqiy ma'noga ega degan umidsizlikni keltirib chiqaradigan xulosani aytishga majburmiz. Boshqa hollarda, Sandy Bridge protsessorlari bilan solishtirganda, ularning ishlashi kamdan-kam hollarda dalda beruvchi ko'rinadi. Xuddi shu narsani quvvat sarfi va overclocking haqida ham aytish mumkin. Alohida ta'kidlash kerakki, AMD FX protsessorlari, kutilganidek, o'yin tizimlari uchun yomon variant bo'lib chiqdi, chunki zamonaviy 3D o'yinlar haqiqatan ham ko'p bosqichli algoritmlardan deyarli foydalanmaydi. Biroq, o'yinlarda soniyasiga kadrlar soni ko'pincha protsessor emas, balki grafiklar bilan cheklanishini hisobga olsak, AMD mahsulotlarining muxlislari bunga chidashlari mumkin.

Boshqacha qilib aytganda, FX protsessorlarining bozor istiqbollari ikki omilga bog'liq bo'ladi: AMD tarafdorlari armiyasi qanchalik katta; ishlab chiqaruvchining narx dastagini qanchalik mohirona boshqarishi haqida. Biroq, Buldozer mikroarxitekturasiga ega ish stoli protsessorlari keng ommalasha olmaydi.

AMD kamdan-kam hollarda yangi protsessor arxitekturasini qo'llab-quvvatlaydi. Agar Intel strukturani har ikki yilda bir marta yangilasa, raqobatchi oxirgi marta 2007 yilda eski K8 ning qayta ishlangan versiyasi K10 ni chiqarganini qayd etgan. Shunday qilib, yangi buldozerning paydo bo'lishi muhim voqeadir. Keyingi bir necha yil davomida arxitektura barcha AMD kristallari uchun asos bo'ladi, shuningdek, ishlash uchun poygada Intel bilan raqobat qilish uchun uzoq vaqt davomida birinchi imkoniyat bo'ladi.

Biz er-xotin sifatida boramiz

Buldozerni yaratish orqali AMD muhandislari eski ishlanmalarni takomillashtirish va qisman nusxalashning tasdiqlangan strategiyasidan voz kechishdi. Toshlarning tuzilishi biz x86 tizimlarida ko'rganimizdan tubdan farq qiladi.

Birinchi va eng muhim yangilik - bu asl tartib. Buldozerning barcha yuqori versiyalari rasmiy ravishda sakkiz yadro bilan jihozlangan. Biroq, aslida to'rtta to'liq modul mavjud, ularning har biri ikkita hisoblash blokiga ega. Bu shunday ko'rinadi: ikkita butun sonli arifmetik klasterlar (ular yadro deb ataladi va hisoblar uchun bevosita javobgardir) Front-End, suzuvchi nuqtali klaster (FPU) va ikkinchi darajali keshni 2 MB ga oshirdi.

Bunday tandemning foydasi joyni tejash, energiya sarfini va ishlab chiqarish xarajatlarini kamaytirishdir. Kamchilik - bir xil to'plamlarni almashish yakuniy ishlashga yomon ta'sir qiladi. Og'ir yuk ostida bitta Front-End ikkita yadro bilan bardosh bera olmasligi mumkin. AMD unumdorlikni yo'qotishini inkor etmaydi: unga ko'ra, duet to'liq ikki yadroli protsessordan taxminan 20% zaifroq.

Muloqotdagi qiyinchiliklar

To'siqni bartaraf etish uchun Front-End resurslarni ikkita yadro o'rtasida qanday qilib samarali taqsimlashni o'rganishi kerak edi. Bunga erishish uchun filialni bashorat qilish birligi va buyruq dekoderi qayta ishlab chiqilgan bo'lib, u ko'rsatmalarni (Sendi ko'prigidagi kabi) va texnologiyani qayta ishlash uchun to'rtinchi kanalni oldi. Filial Fusion. Ikkinchisi ko'rsatmalarning bir qismini bitta operatsiyaga yopishtirish imkonini beradi. Bularning barchasi Front-End ishini tezlashtirishi va kristallning bo'sh turishiga yo'l qo'ymasligi kerak.

Yadrolarning o'ziga kelsak, bu tartibsiz, yuklash/tushirish, L1 kesh va ikkita hisoblash klasterlari to'plami. Tartibdan tashqari ijro birligi endi jismoniy fayllar registriga ega. Sandy Bridge-da bo'lgani kabi, unga ishchi ma'lumotlarni saqlash uchun manzillar tushiriladi, bu sizga asosiy "Buyurtmasiz" quvur liniyasini tushirishga imkon beradi. Yuklash/tushirish protsessori ortib bufer, ikki baravar oshirilgan sig'im va u bilan ishlash qobiliyatini oldi virtual manzillar, bu nazariy jihatdan L1 ma'lumotlar keshi bilan ishlash tezligini oshirishi kerak. Buldozerdagi ikkinchisi to'rt baravar kichikroq bo'ldi: K10da 64 KBga nisbatan 16 KB. Yo'qotish ish tezligi bilan qoplandi. L1 assotsiativligi ikki kanaldan to'rttagacha oshdi, bu ikki baravar ko'p degani O kattaroq qidiruv samaradorligi.

Bitta modulda uchta hisoblash klasteri mavjud: ikkita butun son va bitta suzuvchi nuqta ma'lumotlari bilan ishlash uchun. K10 bilan taqqoslaganda, birinchi juftlik bitta ALU (hisob-kitoblar bilan shug'ullanadi) va AGU (xotira manzillari bilan shug'ullanadi) yo'qotdi. Nazariy jihatdan, bu eng yuqori ko'rsatkichlarning pasayishini anglatadi. Amalda, o'zgarish deyarli sezilmaydi: butun sonli klasterlarni to'liq yuklash qiyin.

Asosiy o'zgarishlar murakkab suzuvchi nuqta hisob-kitoblari uchun mas'ul bo'lgan FPUga ta'sir qildi. K10-da u ancha kuchliroq bo'ldi: qo'shish va ko'paytirish amallarini bajarish uchun bir juft MMX va 128-bitli FMAC qurilmalarini oldi. K10 dan farqli o'laroq, FMAClar universal holga keltirildi: ular bir-birini almashtirishi mumkin, bu esa hisoblash tezligiga ijobiy ta'sir qiladi. Bundan tashqari, ular operatsiyalarni bitta ifodada birlashtirishni o'rganishdi, bu esa hisob-kitoblarning aniqligini oshirdi.

Bundan tashqari, FPU yangilangan ko'rsatmalar to'plamini oldi. Birinchidan, protsessor endi 256 bitli registrlarni qo'llab-quvvatlaydigan AVX bilan ishlaydi. Ularning hisob-kitoblari uchun Sandy Bridge-da bo'lgani kabi, ikkita FMAC birlashtirilgan. Ikkinchidan, Buldozer SSE 4.2, AENSI, FMA4 va XOP ko'rsatmalari bilan ishlashi mumkin. Oxirgi ikkita to'plam faqat AMD uchundir. Siz va men uchun bu o'zgarishlarning barchasi faqat bitta narsani anglatadi - ilgari bir necha soat siklida qilingan buyruqlar endi bittada hisoblab chiqiladi va bu ishlashga bevosita ta'sir qiladi. To'g'ri, tezlikni oshirish uchun dasturiy ta'minotdan ko'rsatmalarni qo'llab-quvvatlash kerak.

Yelim va qaychi

Natijada, har bir Buldozer moduli bitta Front-End, L2 va L1 ma'lumotlar keshlaridan, ikkita butun sonli klasterlardan va suzuvchi nuqta raqamlari bilan ishlash uchun blokdan iborat. Hammasi bo'lib, bitta toshda to'rttagacha shunday to'plam bo'lishi mumkin. Shu bilan birga, ularning har biri bir qator umumiy elementlarga kirish huquqiga ega. Birinchisi, DDR3-1866 MGts ni qo'llab-quvvatlaydigan ikki kanalli xotira kontrolleri. Ikkinchisi L3 keshi bo'lib, uning hajmi K10 bilan solishtirganda 6 dan 8 MB gacha, assotsiativlik esa 48 dan 64 kanalgacha oshdi. E'tibor bering, Sandy Bridgedan farqli o'laroq, L3 keshining chastotasi yadro tezligiga to'g'ri kelmaydi. Agar top model 3,6 gigagertsli tezlikda ishlayotgan bo'lsa, u holda oxirgi darajadagi xotira 2,2 gigagertsli. Bu ishlashga salbiy ta'sir ko'rsatadigan sezilarli kechikishlarga olib keladi. AMD ma'lumotlariga ko'ra, bu qurbonlik yuqori chastotalarda barqaror ishlash uchun qilingan.

Tadam!

Arxitektura nayranglari va 32 nm texnologik texnologiyaga qaramay, Buldozer ta'sirchan 315 kvadrat metr maydonni egallaydi. millimetr. Bu to'rt yadroli Sandy Bridge va undan kattaroq ko'prikdan taxminan bir yarim baravar ko'p Llano. Yaxshiyamki, quvvat iste'moli maqbul chegaralarda - 125 Vt ushlab turildi.

Sakkiz yadroli modellarga qo'shimcha ravishda oltita va to'rtta versiyalar mavjud hisoblash birliklari. Kichik birodarlar bir xil sakkiz yadroli dizaynga asoslangan, ammo ularda bir yoki ikkita modul o'chirilgan.

Asosiy chastota 3,1 dan 3,6 gigagertsgacha o'zgarib turadi. Sandy Bridge singari, Buldozer ham avtomatik overclocking texnologiyasiga ega. Mas'ul bo'lgan maxsus chip Turbo Core 2.0, joriy yadro yukini va TDP darajasini kuzatib boradi va imkoniyat paydo bo'lishi bilanoq protsessor chastotasini oshiradi. Yuqori kristalli bo'lsa, barcha modullar ishlatilganda tezlikni 300 MGts ga oshirish mumkin. Agar resurslarning bir qismi bo'sh bo'lsa - 600 MGts da. Kam yuklarda Buldozer energiya tejash rejimiga o'tadi, texnologiya buning uchun javobgardir Salqin va jim.

Qo'lda overclock qilish juda oddiy. Birinchidan, butun chiziq qulflanmagan multiplikatorga ega. Ikkinchidan, yangi kelganlar yaxshi balandlikka erishadilar: suyuq azot ostida eski Buldozer yangi jahon rekordini o'rnatdi - 8429 MGts.

Hamrohlar

Buldozer Socket AM3+ da ishlaydi. Aslida, bu bitta qo'shimcha pin bilan biroz yaxshilangan AM3. Yangi protsessor soketiga ega chipsetlar chaqiriladi 990FX, 990X Va 970 . Ular PCIe 2.0 kontrollerida farqlanadi. Eski model 32 liniya bilan jihozlangan, kichiklari - 16. Bundan tashqari, 990FX va 990X CrossFireX-ni qo'llab-quvvatlaydi. Chipsetlarning xususiyatlari orasida biz oltita SATA Rev portini ta'kidlaymiz. 3 va 14 USB ulagichlari 2.0. USB 3.0 boshqaruvchisi yo'q.

E'tibor bering, buldozer eski taxtalarda ham ishlashi mumkin. Sizga kerak bo'lgan yagona narsa yangilangan BIOS. Cheklovlar: Turbo Core va Cool"n"Quiet javob tezligini pasaytirdi va ba'zi energiya tejovchi funksiyalar mavjud emas.

Buldozer protsessorining arxitekturasi qiziqarli bo'lib chiqdi. Nihoyat, AMD o'zini nusxalashni to'xtatdi va haqiqatan ham yangi narsalarni o'ylab topdi. Afsuski, raqobatchilarga nisbatan bir nechta aniq afzalliklar mavjud. E'lon qilingan sakkizta yadro yo'q. Yaxshi ma'noda, bizda Intel Hyper-Threading kabi hisoblash birliklari soni ko'paygan to'rt yadroli modellar mavjud, ammo apparat darajasida. G'oya yaxshi, lekin ishlash Front-End qanchalik tezligiga bog'liq bo'ladi. Buldozerning haqiqiy afzalliklari orasida faqat suzuvchi nuqta hisob-kitoblari uchun kuchli FPU va K10 bilan solishtirganda ish chastotalari ortdi.

Keling, uni tarqatamiz! Keling, uni dafn qilaylik!

AMD protsessorlarning quyidagi qatorlarini chiqarish rejalarini e'lon qildi. Kompaniya har yili arxitekturani yangilashni kutmoqda va har safar vatt uchun taxminan 15 foiz ishlashga erishadi. Agar AMD o'z rejasiga sodiq qolsa, biz arxitekturani 2012 yilda ko'ramiz Piledriver("koper"), bir yildan keyin - Buxoriy rolik("bug 'roller") va 2014 yil e'lon uchun esda qoladi Ekskavator. Qurilish ishlari mana shunday.

Noto'g'ri derazalar

AMD ma'lumotlariga ko'ra, Windows 7 yangi yaratilishning to'liq imkoniyatlarini ochib bera olmaydi: OS rejalashtiruvchisi Buldozerning xususiyatlarini hisobga olmaydi. Masalan, yangi protsessorlar uchun bir modulga o'zaro bog'langan iplar tayinlanishi muhim, aks holda yadrolar tezkor L2 keshi orqali emas, balki uchinchi darajali xotira orqali ma'lumot almashadi. Turbo Core 2.0 samaradorligini oshirish uchun ba'zi ajratilgan oqimlar ham shunga o'xshash tarzda yaxshiroq ishlanadi. Xuddi shu vaqtda aniq vazifalar Front End blokida ko'proq yuk hosil qiling va ularni turli modullar bo'ylab tarqatish yaxshiroqdir. bilan hamkorlik uchun rahmat Microsoft bu nuanslar rejalashtiruvchida hisobga olinadi Windows 8. Biroq, unumdorlikning sezilarli o'sishini kutmasligingiz kerak.

Lug'at

Butun sonli hisoblash klasteri- butun sonlar (1, 2, 10) bilan amallar bilan shug'ullanadi.

Foydalanuvchi interfeysi- oldindan yuklash bloki. Dasturdan buyruqlar qabul qiladi va ularni protsessorga tushunarli tilga tarjima qiladi.

FPU- suzuvchi nuqta ma'lumotlarini hisoblash klasteri. Kasr raqamlari (1.2345) va katta qiymatlar (1.2345E-10) bilan hisob-kitoblarni amalga oshiradi.

Filialni bashorat qilish bloki- keyingi vaqtda dasturga qanday ma'lumotlar va operatsiyalar kerak bo'lishi mumkinligini oldindan bashorat qiladi. Protsessorning ishlamay qolishiga yo'l qo'ymaydi.

Buyruq dekoderi- dasturni mikrooperatsiyalarga ajratadi, keyinchalik ular hisoblash klasterlari tomonidan qo'llaniladi.

Buyurtmasiz- favqulodda ijro bloki. Yadrolar orasidagi harakatlarning taqsimlanishi bilan shug'ullangan. Hisoblash uchun faqat ma'lumotlar mavjud bo'lgan buyruqlarni yuboradi.

Blokni yuklash/tushirish (LSU) - konveyerdan chiqish va L1 ma'lumotlar keshi o'rtasidagi ma'lumotlarning harakatini nazorat qiladi.

Kesh assotsiativligi- kesh satrlari va ustunlarini bog'lash. Assotsiativlik qanchalik yuqori bo'lsa, qidiruv tezligi shunchalik past bo'ladi, lekin uning samaradorligi shunchalik yuqori bo'ladi.

MMX- 8 baytgacha bo'lgan raqamlar bilan ishlash uchun bloklar to'plami.

Ko'rsatmalar to'plami- bitta buyruqqa bir nechta ma'lumotlar ustida amalni bajarishga ruxsat berish.

1-jadval

AMD Buldozer protsessorlarining texnik xususiyatlari

Hisoblash yadrolari soni

Asosiy chastota

Turbo yadro chastotasi

Xotirani qo'llab-quvvatlash

Energiya iste'moli

Texnik jarayon

2011 yil noyabr oyidagi narx

noma'lum

Protsessor unumdorligini nima tashkil qiladi? Ilgari, ishlashni soat siklida bajariladigan ko'rsatmalar soni va ushbu protsessorning ishlash chastotasi mahsuloti sifatida tavsiflovchi formuladan foydalanilgan. Endi bu formulada uchinchi omil paydo bo'ldi - hisoblash yadrolari soni. Shuning uchun, tezkor mahsulotni chiqarmoqchi bo'lgan protsessor ishlab chiqaruvchisi buni amalga oshirish uchun bir nechta variantga ega.

Biroq, hammasi ham oddiy emas. Bir soat siklida hisoblash yadrosi tomonidan bajariladigan ko'rsatmalar sonini ko'paytirish juda qiyin vazifadir. Klassik x86 dastur kodi ko'rsatmalarning ketma-ket bajarilishini o'z ichiga oladi va shuning uchun ularni parallel qayta ishlashga erishish uchun protsessor yuqori samarali tarmoqni bashorat qilish va ko'rsatmalarni qayta tartiblash birliklari bilan jihozlangan bo'lishi kerak, ularni amalga oshirish katta muhandislik kuchini talab qiladi. Shu bilan birga, mikroarxitekturaning murakkabligi kristallning jismoniy o'lchamlariga ta'sir qiladi va yadrolar sonini ko'paytirishda cheklovlarga olib keladi. Shunday qilib, agar ishlab chiqaruvchi ko'p sonli yadroli protsessor yaratmoqchi bo'lsa, u holda mikroarxitektura, aksincha, soddalashtirishga harakat qilishi kerak. Bu bilan oson emas soat chastotasi. Uning o'sishiga tikish yana protsessorning ichki bloklariga o'zgartirishlar kiritishni va uning ishlash quvurini uzaytirishni talab qiladi. Natija quyidagicha: protsessor ishlash uchun medalni qo'lga kiritishi uchun uni ishlab chiquvchilari bir vaqtning o'zida bir qator parametrlarni optimallashtirish uchun ko'p mehnat qilishlari kerak.

Muammo shundaki, protsessorning ishlashini yaxshilashning har qanday tanlangan usullari faqat alohida holatlarda muvaffaqiyatli bo'lishi mumkin. Hamma dasturlar ham ko'p sonli yadrolar bilan samarali ishlay olmaydi. Ba'zi algoritmlar o'tishlarni to'g'ri bashorat qilishga va ko'rsatmalarni qayta tartiblashga imkon bermaydi. Va ba'zi hollarda, ishlash tezligi soat chastotasining ortishi bilan ham oshmaydi, chunki tizimda boshqa to'siqlar mavjud.

Optimal muvozanatni topish oson emas va optimal mezon nima deb hisoblanadi? Biz faqat cheklangan miqdordagi dasturlardagi protsessorlarning ishlashini solishtirishimiz va ma'lum bir holat uchun eng tezkorini tanlashimiz mumkin. Biroq, bu boshqa test vositalari to'plamidan foydalangan holda, biz mutlaqo qarama-qarshi baholarni ololmasligimizga kafolat bermaydi. Bu yerda shunday uzoq muqaddima berilgan, chunki bugun biz AMD FX protsessorlarining yangi seriyasi - Zambezi kod nomi ostida keng tarqalgan AMD flagman mahsuloti bilan tanishamiz. Ushbu protsessor juda munozarali Buldozer mikroarxitekturasiga asoslangan bo'lib, u allaqachon ko'plab nomaqbul sharhlarni to'plashga muvaffaq bo'lgan. Ammo gap shundaki, bu mikroarxitektura butunlay yomon. Xususiyatlarning eng yaxshi muvozanatini tanlashda ishlab chiquvchilar ko'pchilik foydalanuvchilarning ehtiyojlarini noto'g'ri baholadilar va asosiy e'tiborni "asosiy formulada" noto'g'ri omilga qaratdilar. Natijada, yangi avlodning yuqori samarali yechimini chiqarish bo'yicha dastlabki reja noto'g'ri ketdi va yutuq va'dalari bilan qiziqqan AMD tarafdorlari ular kutganidan butunlay boshqacha narsani olishdi. Biroq, bu umidsizlik uchun jiddiy va ob'ektiv sababmi? Bu haqda ushbu materialda gaplashamiz.

⇡ Yadrolarni sanash: sakkizmi yoki to'rtmi?

Ishlash protsessorlari uchun yangi dizayn ustida ishlayotgan AMD qayta ishlash yadrolari soniga ustuvor ahamiyat berishga qaror qildi. Bu butunlay mantiqiy tanlov bo'lib, yillar davomida ko'p bosqichli dasturiy ta'minot tobora ko'payib bormoqda va ko'p yillik rivojlanish uchun mo'ljallangan mikroarxitekturani ishlab chiqish, birinchi navbatda, bozorning hozirgi holatini emas, balki hisobga olinishi kerak. kuzatilgan tendentsiyalar. Yangi protsessorning asosiy versiyasida taqdim etilgan sakkiz yadro, AMD bozorni zabt etmoqchi bo'lgan narsa bo'lib, u erda hozirgacha faqat chiplar taqdim etilgan, yadrolarning maksimal soni oltita bilan cheklangan edi. ( Bu erda biz faqat ish stoli kompyuterlari haqida gapiramiz. — taxminan. ed. )

Shu bilan birga, ishlab chiquvchilar eski K10 mikroarxitekturasining yadrolarini olishni xohlamadilar. Ular nafaqat juda katta jismoniy o'lcham, shuningdek, Llano tomonidan baholanishi mumkin bo'lganidek, ular zamonaviy 32 nm texnologiyasiga o'tkazilgandan keyin ham yuqori soat chastotalarida ishlashga moyil emas. Bundan tashqari, ular AVX ko'rsatmalari kabi ko'plab zamonaviy xususiyatlarni qo'llab-quvvatlamaydi. Shu sababli, sakkiz yadroli protsessorlarni yig'ish uchun AMD yangi mikroarxitektura - Buldozerni yaratdi. Kompaniya vakillari uni ishlab chiqish noldan amalga oshirilganligini aytishni afzal ko'rishadi, ammo aslida Buldozer yadrolarida siz bu yil taqdim etilgan boshqa mikroarxitektura - Bobcat ixcham va energiya tejovchi qurilmalarda foydalanishga qaratilgan ko'plab havolalarni topishingiz mumkin. Biroq, Buldozer va Bobcat o'rtasidagi munosabatlar juda uzoq va biz buni faqat umumiy fikr aniq bo'lishi uchun eslatib o'tamiz - Buldozer ko'plab nisbatan oddiy yadrolarni birlashtiradi.

Shu bilan birga, biz bitta yarimo'tkazgich chipida sakkizta oddiy yadroning ibtidoiy birikmasi haqida gapirmayapmiz. Bunday holatda, hosil bo'lgan protsessor juda past bir torli ishlashga ega bo'ladi va bu juda jiddiy muammoga aylanadi, chunki yukni bir nechta hisoblash iplariga ajratmaydigan dasturlar unchalik kam emas. Shuning uchun, birinchi navbatda, yadrolar yuqori soat tezligida ishlash uchun optimallashtirilgan. Ikkinchidan, ular bitta tarmoqqa xizmat qilish uchun o'z resurslarini almashishga qodir bo'lgan ikki yadroli modullarga birlashtirilgan. Natija juda qiziqarli dizayndir: bunday ikki yadroli modulning ijro trubkasining kirish qismi keng tarqalgan va keyingi ko'rsatmalarni qayta ishlash ikkita ijro qurilmalar to'plami o'rtasida bo'linadi.

Buldozer dizaynining asosi an'anaviy ravishda ikki yadroli modul deb ataladi

Eslatib o'tamiz, ma'lumotlarni qayta ishlash jarayoni zamonaviy protsessor bir necha bosqichlarni o'z ichiga oladi: kesh xotiradan x86 ko'rsatmalarini olish, ularni dekodlash - ularni ichki makrooperatsiyalarga o'tkazish, bajarish, natijalarni qayd etish. Buldozer modulidagi dastlabki ikki bosqich bir juft yadro uchun birgalikda amalga oshiriladi, so'ngra butun sonli ko'rsatmalar uchun bajarish ikkita klaster yadrosi bo'ylab taqsimlanadi yoki haqiqiy arifmetika bo'lsa, u suzuvchi nuqta operatsiyalari blokida amalga oshiriladi. ikkita yadro uchun umumiy.

Buldozer modullari har bir soat siklida to'rtta ko'rsatmalarni qayta ishlash uchun mo'ljallangan va makro birlashtirish texnologiyasi tufayli x86 ko'rsatmalarining ba'zi juftlari protsessor tomonidan bitta operatsiya sifatida ko'rib chiqilishi mumkin. Bu shuni anglatadiki, umuman olganda, ikki yadroli Buldozer moduli quvvat jihatidan zamonaviy Intel protsessorlarining bir yadrosiga o'xshaydi, u ham soat siklida to'rtta ko'rsatmalarni qayta ishlay oladi, shuningdek, makro birlashmalarni qo'llab-quvvatlaydi.

Biroq, Buldozer moduli va Sandy Bridge yadrosi o'rtasida sezilarli farqlar mavjud, bu ularning taxminan bir xil nazariy tezligini shubha ostiga qo'yishi mumkin. Yangi AMD protsessorlarining moduli ikkita teng yadro qoldiqlarini o'z ichiga olganligi sababli, u faqat bir juft ipni qayta ishlashda maksimal ishlashni namoyish qilishi mumkin. Agar u bitta ipli yukni ko'tarsa, u holda uning xizmat ko'rsatish tezligi bitta klaster ichidagi bajaruvchi qurilmalar soni bilan cheklanadi. AMD-ning individual yadrolarni soddalashtirish istagini hisobga olsak, ularning soni unchalik ko'p emas - Sandy Bridge yoki K10 mikroarxitekturali protsessorlarga qaraganda bir yarim baravar kam. Ya'ni, ikkita arifmetik ALU va ikkita manzil AGU.

Buldozer mikroarxitekturasida qurilgan modulning funktsional tuzilishi shunday ko'rinadi. Ikki yadrodan faqat ikkita butun sonli aktuatorlar to'plami qolgan

Protsessor moduli uchun umumiy bo'lgan suzuvchi nuqta operatsiyalari bloki ham murakkabligi jihatidan nisbatan past. U ikkita 128 bitli FMAC ijro birligini o'z ichiga oladi, ular 256 bitli ko'rsatmalarni qayta ishlash uchun bitta blokga birlashtirilishi mumkin. Bu erda aktuatorlar unchalik ko'p emasdek tuyuladi, ayniqsa ular bir juft yadroga bo'linganligini hisobga olsak. Ammo ular oldingi va raqobatdosh mikroarxitekturalarga qaraganda ko'proq universaldir, ular alohida ko'paytirgichlar va qo'shimchalardan foydalanadilar. Va shu tufayli, ba'zi hollarda haqiqiy raqamlar bilan ishlashda, ikki yadroli Buldozer moduli taqqoslanadigan va undan ham ko'proq narsani ta'minlaydi. yuqori ishlash ko'ra, masalan, bir Sandy Bridge yadrosi.

256 bitli ko'rsatmalar bilan ishlash uchun 128 bitli qurilmalarni birlashtirishning shunga o'xshash g'oyasi Sandy Bridgeda qo'llaniladi.

Biroq, Buldozer moduli ikki ipli yuk ostida o'zining eng kuchli tomonlarini ko'rsatishi kerak. Bitta Sandy Bridge yadrosi ikkita hisoblash iplarini qayta ishlashga qodir; buning uchun u Hyper-Threading texnologiyasiga ega. Biroq, barcha ko'rsatmalar amalda ko'plab to'qnashuvlarga olib keladigan aktuatorlarning bir to'plamiga yuboriladi. Buldozer moduli ikkita mustaqil butun sonli klasterni o'z ichiga oladi, ular iplarni parallel ravishda bajara oladi va ulardagi ijro qurilmalarining umumiy soni Sandy Bridge yadrosidagi bunday qurilmalar sonidan bir yarim baravar ko'pdir.

Chap tomonda Buldozer moduli, o'ng tomonda Hyper-Threading qo'llab-quvvatlovchi raqobatdosh yadro joylashgan. Aslida, u Sandy ko'prigiga unchalik o'xshamaydi, lekin rasm muammoning mohiyatini ko'rsatadi.

Natijada, Buldozer moduli Sandy Bridge yadrosiga qaraganda yuqori samaradorlikka ega, ammo bu unumdorlikni ochish biroz qiyinroq. Sandy Bridge yadrosi bitta oqimli kodni mustaqil ravishda tahlil qiluvchi va uni o'zining to'liq bajaruvchi qurilmalar to'plamida parallel ravishda bajaradigan ilg'or chipdagi mantiq tufayli o'z resurslarini oqilona yuklaydi. Buldozerda aktuatorlardan samarali foydalanish vazifasi qisman dasturchiga o'tadi, u o'z kodini ikkita ipga bo'lishi kerak - to'liq yuklab olish Barcha modul sig'imlari shundan keyingina mumkin bo'ladi.

Va bu odatiy holdir. Ikki yadroli Buldozer protsessor modulini ko'rib chiqayotganda, biz uni doimiy ravishda bitta Sandy Bridge yadrosi bilan taqqosladik va shu bilan birga biz juda to'g'ri parallelliklarni chizishga muvaffaq bo'ldik. Bu bizni hayratga soladi: yangi mikroarxitekturaning “sakkiz yadroli” xususiyatini marketologlar tasavvurining mahsuli deb hisoblash kerak emasmi? AMD yadrolarni butun sonli klasterlar soniga qarab hisoblash kerakligini aytadi va modul ikkita mustaqil yadroning ishlashining 80% gacha ta'minlay olishini ta'kidlaydi. Shu bilan birga, Buldozer asosidagi yadrolar boshqa protsessorlarning yadrolariga qaraganda ancha sodda ekanligini unutmasligimiz kerak. Shu sababli, ikki yadroli modullarning soni Buldozerning ish faoliyatini ancha mos ravishda aks ettiruvchi xususiyatdir.

Protsessor yadrolarining maksimal sonini toping va AMD marketing bo'limida ish toping

⇡ Kesh xotira

Buldozer protsessorlarida kesh xotirasini tashkil etish ham alohida yadrolarga emas, balki ikki yadroli modullarga ham "bog'langan". Aslida, har bir yadro faqat o'zining birinchi darajali ma'lumotlar keshini ajratadi; kesh xotirasining barcha boshqa darajalari umuman modulga yoki protsessorga tegishli:

  • Har bir yadro ma'lumotlar uchun o'z L1 keshiga ega. Uning hajmi 16 KB bo'lib, arxitektura to'rtta assotsiativ kanal mavjudligini taxmin qiladi. Ushbu kesh yozish algoritmi bilan ishlaydi, ya'ni u o'z ichiga oladi.
  • Ko'rsatmalar uchun birinchi darajali kesh har bir ikki protsessorli modul uchun bitta nusxada taqdim etiladi. Uning hajmi 64 KB, assotsiativ kanallar soni esa ikkita.
  • Ikkinchi darajali kesh ham har bir modul uchun bitta nusxada amalga oshiriladi. Uning o'lchami ta'sirchan 2 MB, assotsiativlik 16 kanal va ishlash algoritmi eksklyuzivdir.
  • Bundan tashqari, sakkiz yadroli protsessor umuman olganda 64 kanalli assotsiativlikka ega 8 megabaytli L3 keshiga ega. Ushbu keshning o'ziga xosligi shundaki, u protsessorning o'ziga nisbatan sezilarli darajada past chastotada ishlaydi, bu taxminan 2 gigagertsli.

Quyidagi jadvalda sakkiz yadroli Buldozer, to‘rt yadroli Sandy Bridge va Thuban protsessorlari (K10 mikroarxitekturasida qurilgan olti yadroli Phenom II X6) uchun kesh xotira hajmlarining nisbati tasvirlangan.

Kesh turi Buldozer (8 yadro/4 modul) Qumli ko'prik (4 yadroli) Thuban (6 yadro)
L1I (ko'rsatmalar) 4x64 KB 4x32 KB 6x64 KB
L1D (ma'lumotlar) 8x16 KB 4x32 KB 6x64 KB
L2 4x2 MB 4x256 KB 6x512 KB
L3 8 MB, 2,0-2,2 gigagertsli 8 MB, protsessor tezligida ishlaydi 6 MB, 2,0 gigagertsli

Jadvaldan ko'rinib turibdiki, AMD yuqori darajadagi sig'imli keshlarga tayangan, bu jiddiy ko'p tarmoqli yuk bo'lganda foydali bo'lishi mumkin. Biroq, yangi protsessorlardagi kesh xotirasi odatda oldingi va raqobatdosh mahsulotlarga qaraganda sekinroq. Bu amaliy kechikishni o'lchashda osongina aniqlanadi.

Buldozerda ma'lumotlarga kirishda katta kechikishlar faqat ushbu protsessorlarning yuqori soat tezligi bilan qoplanishi mumkin. Biroq, bu dastlab rejalashtirilgan edi - chastotalar nuqtai nazaridan, yangi sakkiz yadroli protsessorlar Phenom II-dan 30% ga oshib ketishi kerak edi. Biroq, AMD hech qachon bunday yuqori chastotalarda barqaror ishlay oladigan yarimo'tkazgich kristallarini loyihalashtira olmadi. Natijada, keshning yuqori kechikishi Buldozerga asoslangan tizimlarga sezilarli zarar etkazishi mumkin.