AMD Бульдозер бол хамгийн сүүлийн үеийн AMD процессор юм. Системийн администратор гэж хэн бэ?

AMD нь Бульдозерын шинэ архитектурын хувьд огт өөр арга барилаар шийджээ. Зарим нөөцийг (L2 кэш, хөвөгч цэгийн модуль) хуваалцдаг, гэхдээ бие биенээсээ бүрэн хамааралгүй хоёр цөмт модулиудыг бий болгохоор шийдсэн. (доорх зургийг үзнэ үү)
AMD-ийн мэдээлснээр энэ нь процессорыг оновчтой болгохын зэрэгцээ процессорын үнийг бууруулах зорилгоор хийгдсэн. Оновчлол нь ердийн олон цөмт процессорууд дээр зарим модулиуд идэвхгүй байж болох бөгөөд ийм модулиудыг Бульдозерын архитектурт нэгтгэж болно. Хэрэв модулиуд цөөхөн байвал энэ нь бага материал үрэх болно гэсэн үг бөгөөд энэ нь эргээд зардал, эрчим хүчний хэмнэлт, дулааныг бууруулахад эерэгээр нөлөөлнө.
Тиймээс, AMD шинэ Бульдозер процессоруудаа хоёр цөмт гэж нэрлэх боловч бодит байдал дээр тэдгээр нь бүрэн бие даасан цөмгүй тул үнэхээр хоёр цөмт биш байх болно. Мөн нэр " хоёр цөмт процессор» маркетингийн зорилгоор ашиглах болно.

үүсгэхийн тулд" дөрвөлсөн цөмт процессорууд", AMD нь эдгээр нэгжийн хоёрыг ашигладаг тул процессор нь үнэндээ дөрөв биш хоёр "процессортой" (хоёр барилгын блокыг доорх зурагт үзүүлэв). AMD шинэ процессоруудыг дөрвөлсөн цөмт гэж нэрлэсээр байх болно.


Бульдозерын архитектурт суурилсан найман цөмт процессор.

Одоо Бульдозерын архитектурт ашигладаг Fetch болон Decode модулиудыг нарийвчлан авч үзье.

Татаж авах ба код тайлах модулиуд

Fetch модуль нь кэш эсвэл кодыг тайлах зааварчилгааг татах үүрэгтэй санамсаргүй хандалт санах ой.

Татаж авах ба код тайлах модулиуд.

Өмнө дурьдсанчлан дээж авах модулиуд нь нэг дор хоёр "цөм" ашигладаг. L1 зааврын кэшийг хоёр цөм нэгэн зэрэг ашигладаг боловч процессорын цөм бүр өөрийн L1 мэдээллийн кэштэй.
Бульдозерын архитектурт ашигладаг L1 зааврын кэш нь 64 KB хоёр талт багц-ассоциатив кэшээс бүрддэг гэдгийг AMD аль хэдийн зарласан. Үүнтэй ижил тохиргоог AMD64 архитектуртай процессоруудад ашигладаг боловч ялгаа нь AMD64 процессорууд нь нэг цөмд L1 кэштэй байдаг бол Bulldozer процессорууд нь хос цөм бүрт нэг L1 кэштэй байх болно. Гэсэн хэдий ч өгөгдлийн кэш нь зөвхөн 16 KB байх бөгөөд энэ нь AMD64 архитектурт суурилсан процессоруудад ашигладаг нэг цөмд 64 КБ-аас хамаагүй бага юм.

TLBs (Translation Look-side Buffer- хэт хурдан санах ойн буфер). TLB-ийн хэмжээ тодорхой болсон. Эдгээр нь виртуал санах ойн хаягийг физик хаяг болгон хувиргах зориулалттай бага хэмжээний санах ойтой буфер юм.
Виртуал санах ойг хуудасны файл гэж нэрлэдэг бөгөөд энэ нь хатуу диск дээрх тусгай файлын тусламжтайгаар RAM-ийн хэмжээг "нэмэгдүүлдэг" технологи юм.

Компьютерийн программууд нь x86 зааврыг ашиглан бичигдсэн байдаг боловч одоогоор процессорууд зөвхөн эх RISC зааврыг ойлгодог. Код тайлах модуль нь x86 программын зааврыг RISC бичил заавар болгон хувиргах үүрэгтэй. Бульдозерын архитектур нь дөрвөн декодертой боловч Энэ мөчДекодер бүр ямар зааварчилгааг гүйцэтгэдэг болохыг AMD тодруулдаггүй. Эдгээр декодчилогчдын аль нэг нь өгөгдсөн ROM бичил кодыг ("μкод" эсвэл "микро код") ашиглан нарийн төвөгтэй, нарийн төвөгтэй заавруудыг гүйцэтгэдэг. Нарийн төвөгтэй зааврын кодыг тайлах нь хэдэн цагийн мөчлөгийн дараа дуусч, дараа нь тэдгээрийг хэд хэдэн бичил заавар болгон хувиргадаг. Ихэвчлэн үйлдвэрлэгчид процессоруудаа оновчтой болгодог бөгөөд ингэснээр хамгийн түгээмэл зааврыг тайлахдаа тэдгээрийг зөвхөн нэг цагийн мөчлөгөөр гүйцэтгэдэг.

Танилцуулга Бульдозерын бичил архитектурт суурилсан AMD-ийн шинэ процессорууд нь зөвхөн энэ оны төдийгүй, одоогийн таван жилийн хамгийн их хүлээгдэж буй бүтээгдэхүүнүүдийн нэг гэдэгт эргэлзэх зүйл алга. Үүнд хэд хэдэн шалтгаан бий, мөн AMD-ийн бүтээгдэхүүний фенүүдийн асар том арми бий. Зарим хүмүүс энэ компанийн процессорууд Intel-ээс бүх талаараа илүү байсан үеийг шинэхэн дурсамжтай байдаг. Зарим хүмүүс үнэ, гүйцэтгэлийн тэнцвэртэй хослолын хувьд AMD-ийн бүтээгдэхүүнд дуртай байдаг. Мөн заримд нь AMD-н компанид хөгжүүлж буй бичил архитектурын давуу талуудын тухай сэтгэл хөдлөм түүхүүд сэтгэгдэл төрүүлсэн. Энэ бүхэн нь Бульдозерын үеийн процессоруудыг гаргахыг олон жилийн уйтгартай хүлээсэн үр дүнд хүргэсэн бөгөөд үр дүн нь энд байна - та энэ нийтлэлийг маш их анхаарал, сонирхолгүй уншиж байна.

Гэсэн хэдий ч энэ нь үнэ цэнэтэй нь тодорхой юм. Ирэх хэдэн жилийн процессорын зах зээлийн нөхцөл байдал нь Бульдозерын бичил архитектур хэр амжилттай болохоос хамаарна. Эцсийн эцэст, зөвхөн Intel-д хоёроос гурван жил тутамд шинэ бичил архитектурын шийдлүүдийг гаргах инженерийн болон үйлдвэрлэлийн нөөц бий. AMD нь хөгжлийн явцад илүү хэмжсэн хурдыг дагаж мөрдөхөөс өөр аргагүй болсон. Үүнийг санахад аймшигтай боловч өнөөгийн Phenom II болон Athlon II процессоруудад ашиглагдаж байгаа бичил архитектур нь 1999 оноос эхэлсэн бөгөөд түүнээс хойш AMD зөвхөн гоо сайхны өөрчлөлтийг хийж байна. Тиймээс бид Бульдозерыг гаргаснаар хөгжлийн мөчлөг гэнэт идэвхжинэ гэсэн онцгой хуурмаг зүйл байхгүй. Бульдозер нь ойрын хэдэн жилийн турш AMD-ийн гүйцэтгэлийн саналуудын гол цөм байх нь ойлгомжтой.

Асаалттай одоогийн хувилбарЭнэхүү бичил архитектурыг хөгжүүлэх компанийн төлөвлөгөөг 2014 он хүртэл боловсруулсан боловч цаашид үргэлжлэх нь гарцаагүй.

AMD жил бүр гүйцэтгэлийг 10-15 хувиар нэмэгдүүлнэ гэж амлаж байгаа нь урам зориг өгөхөөс илүү түгшүүртэй шинж тэмдэг юм. Ийм өсөлтийг голчлон цагийн давтамжийн өсөлт, зөвхөн дараа нь бичил архитектурын шинэ сайжруулалтаар хангах болно.

Өөрөөр хэлбэл, Бульдозерын бичил архитектурын амжилт нь одоогийн байдлаараа AMD-ийн ирээдүйн байр суурь, бүтээгдэхүүний өрсөлдөх чадвар, эцэст нь процессорын зах зээлийн ерөнхий нөхцөл байдалд шийдвэрлэх нөлөө үзүүлнэ.

Мэдээжийн хэрэг, AMD-д зориулсан Бульдозер нь цорын ганц гол бүтээгдэхүүн биш гэдгийг үгүйсгэх аргагүй юм. Энэхүү бичил архитектур нь өнөөдөр өндөр гүйцэтгэлтэй ширээний компьютер болон серверийн сегментэд чиглэгддэг. Үүний зэрэгцээ, AMD нь зах зээлийн бусад сегментүүдэд зориулсан өөр саналуудтай байдаг. Жишээлбэл, энэ оны эхээр тус компаниас гаргасан Бобкат микроархитектур буюу Llano гэр бүлийн APU-тай хямд, хэмнэлттэй процессорууд нь компанийн хувьд чухал ач холбогдолтой зүйл биш юм. Туршилтын үр дүнгээс харахад эдгээр саналууд нь нэтбүүк болон нэттопуудын шийдэл болж, дунд үнийн түвшинд нэгдсэн платформуудын үндэс суурь болж чадах амжилттай шийдэл юм.

Гэсэн хэдий ч Бульдозерын амжилт эсвэл бүтэлгүйтэл нь илүү чухал үр дагавартай байдаг. Нэгдүгээрт, энэхүү бичил архитектур нь илүү өндөр ашгийн түвшинтэй зах зээлийн сегментүүдэд чиглэгддэг - servers and desktop productivity systems. Тиймээс энэ нь AMD-ийн санхүүгийн байдалд илүү хүчтэй нөлөө үзүүлэх чадвартай. Хоёрдугаарт, амжилт AMD процессорууд C, E, A цувралууд - энэ нь микропроцессорын дизайныг боловсруулахад оролцсон инженерүүдийн гавьяа биш юм. Эдгээр CPU-ийн зах зээлийн амжилт нь (эсвэл AMD-ийн нэр томьёог дагаж мөрдвөл) тэдгээрт Radeon HD гэр бүлийн график цөм байгаа нь ATI-г цаг тухайд нь худалдаж авсны ачаар AMD процессоруудад нэвтэрсэнтэй холбоотой юм. Бульдозер бол тооцоолох цөмийн бичил архитектур дээр тусгайлан ажилладаг инженерийн багт зориулсан нэг төрлийн шалгалт юм. Гуравдугаарт, Бульдозер нь эрчим хүчний хэмнэлттэй платформуудын шийдлүүдийг эс тооцвол эцэст нь AMD процессоруудын бүх шугамын үндэс суурь болно. Тиймээс эцэст нь энэ бичил архитектур нь зах зээлийн доод сегментүүдэд хүрч, K10-ийг бараг хаа сайгүй, тэр дундаа Llano процессоруудыг орлуулна.



Товчхондоо, Бульдозерын бичил архитектур бүхий процессоруудыг амжилттай эхлүүлэхийн ач холбогдлыг хэт үнэлэх боломжгүй юм. Энэ бол сэтгэл хөдлөлийн болон материаллаг байдлын хувьд гайхалтай бүтээгдэхүүн юм. Тиймээс бид шинэ K7 эсвэл K8-ийг бодитоор хараасай гэж би үнэхээр хүсч байна.

Гэхдээ туршилт хийхээс өмнө ийм үзэгдлийг давтах магадлал бага гэж хэлж болно. Intel өөрөө AMD-д хамгийн сүүлд NetBurst бичил архитектурыг сурталчлахыг хичээж, далдуу модыг барьж авахад тусалсан. Дараа нь Intel-ийн инженерүүд цагийн хурдыг нэмэгдүүлэхэд анхаарлаа хандуулж, улмаар асар их алдагдалтай гүйдэл хэлбэрээр саад тотгор учруулсан бол AMD нь цагийн мөчлөг бүрт илүү олон зааврыг гүйцэтгэхэд чиглэсэн илүү тэнцвэртэй бичил архитектурыг санал болгов. Гэвч Intel сургаалаа шинэчилж, нэг цагийн мөчлөгт хамгийн их тооны зааврыг гүйцэтгэх зорилготой шинэ Core бичил архитектурыг нэвтрүүлсний дараа AMD өнөөг хүртэл хоцрогдсон байр сууриндаа буцаж ирэв.

Цагийн мөчлөгт гүйцэтгэсэн зааврын тоогоор орчин үеийн Intel процессоруудыг гүйцэх нь маш хэцүү гэдэг нь ойлгомжтой. Өнөөгийн Сэнди гүүрийн бичил архитектур нь угаасаа үр ашигтай дизайны дор хаяж гурван оновчтой болгох циклийн үр дүнд бий болсон тул AMD-ээс илүү өндөр тодорхой үндсэн үр ашгийг хүлээж чадахгүй. Түүгээр ч барахгүй AMD-ийн инженерүүд өөрсдөө ийм зорилго тавиагүй.

Бульдозерын гол санаа өөр газар оршдог. Хөгжүүлэгчдийн үзэж байгаагаар энэхүү бичил архитектур дээр бүтээгдсэн процессорууд нь өрсөлдөгч болон өмнөх үеийнхээсээ өндөр цагийн хурд, илүү олон тооны тооцоолох цөмтэй учир сайн гүйцэтгэлтэй байх ёстой. Үүний зэрэгцээ тэдгээр нь үйлдвэрлэлд нэлээд ашигтай хэвээр байх ёстой, өөрөөр хэлбэл тэд хэт том хагас дамжуулагч болоргүй байх ёстой бөгөөд бие даасан цөмийн хувьд хэт өндөр дулаан ялгаруулалтыг харуулахгүй байх ёстой.

AMD-н олон цөмт дизайны нууцууд

Процессорын цөмийн тоо нэмэгдэх нь процессорын чипийн талбайн хэмжээг нэмэгдүүлэхэд хүргэдэг нь тодорхой юм. Үүний үр дүнд үйлдвэрлэлийн нарийн төвөгтэй байдал, эцсийн бүтээгдэхүүний өртөг хоёулаа нэмэгддэг. Тиймээс, жишээлбэл, хамгийн их тооны тооцоолох цөм бүхий процессоруудыг өнөөдөр зөвхөн серверийн зах зээлийн сегментэд ашигладаг - корпорацийн үйлчлүүлэгчид хувь хүнээс илүү мөнгө гаргахад бэлэн байдаг. AMD-ийн сонгосон процессоруудын хүлээн зөвшөөрөгдсөн өртөгийг хадгалахын зэрэгцээ цөмийн тоог нэмэгдүүлэхийн тулд цөмийг хялбаршуулсан байх ёстой. Гэсэн хэдий ч нөгөө талаас цөмийг хялбарчлах нь хүсээгүй үр дагаварт хүргэдэг - сул зэрэгцээ ачаалалтай програмуудын гүйцэтгэл буурч байгаа бөгөөд одоогоор хангалттай тоо байгаа.

Тиймээс AMD-ийн инженерүүд өөрсдийн замаар явсан. Бие даасан цөмийн микроархитектур нь илүү төвөгтэй болж, боломжтой бол цагт гүйцэтгэх зааврын тоог нэмэгдүүлсэн.



Гэхдээ цөм бүрт байдаг нөөцийн нэг хэсгийг тооцоолохын зэрэгцээ хэт үр ашигтай, хос тооцоолох цөм хооронд хуваалцахаар шийдсэн.



Үүний үр дүнд хоёр цөмт угсралт нь Бульдозерын процессоруудын үндсэн барилгын материал болсон. AMD нэр томъёонд модуль гэж нэрлэгддэг ийм зангилаа нь бүхэл тоон идэвхжүүлэгчийн хоёр бүрэн багцтай. Гэхдээ үүнтэй зэрэгцэн хөвөгч цэгийн нэгж, зааврыг урьдчилан татах, код тайлах төхөөрөмж, мөн хоёр дахь түвшний кэш нь хэд хэдэн цөмд зориулж нэг хуулбарт байрладаг бөгөөд тэдгээрийн хооронд нөөцөө хуваалцдаг. Хөгжүүлэгчдийн тооцоолсноор эдгээр элементүүдийн хүч нь хоёр цөмд хангалттай байдаг, учир нь бодит амьдрал дээр нэг цөмд үйлчлэх үед тэдгээр нь ихэвчлэн сул зогсдог. Нэмж дурдахад, тэдгээрийн тасалдалгүй үйл ажиллагааны саатал нь үр дүнгийн гүйцэтгэлд ноцтой нөлөө үзүүлэхгүй.

AMD-ийн өөрийнх нь хэлснээр, тайлбарласан байдлаар зохион бүтээсэн нэг хоёр цөмт модуль нь бүрэн хэмжээний хоёр цөмт процессорын гүйцэтгэлийн 80 хүртэлх хувийг хангах чадвартай. Үүний зэрэгцээ транзисторын төсөв (мөн үүний дагуу хагас дамжуулагч болор) хэмнэлт 44% хүрдэг.

Энэхүү ухаалаг цөмийн нягтаршлын ачаар AMD нь найман цөмт (эсвэл дөрвөлсөн модуль) загварыг Бульдозерын хагас дамжуулагчийн үндсэн загварт оруулах боломжтой болсон.



Түүнээс гадна болорын нэлээд хэсэг нь кэш санах ойд өгдөг. Процессорын модуль бүрийн хос цөм хооронд хуваалцсан хоёр дахь түвшний кэш нь 2 МБ багтаамжтай бөгөөд бүх процессорын нийт L3 кэш санах ой нь 8 МБ байна. Тиймээс, уламжлалт AMD-н кэшийн онцгой зохион байгуулалтыг харгалзан үзэхэд тэдний нийт хэмжээ нь найман цөмт процессор тутамд 16 МБ байна гэж хэлж болно. Үүний зэрэгцээ, Бульдозерын хагас дамжуулагч болорын талбай нь зөвшөөрөгдөх хязгаарт хэвээр байгаа тул AMD-ийн хөгжүүлэгчид зорилгодоо бүрэн хүрсэн байна.



Үнэмлэхүй тоогоор энэ нь найман цөмт бульдозерууд нь жишээлбэл, K10 бичил архитектур дээр бүтээгдсэн зургаан цөмт Тубан процессороос (Phenom II X6) илүү жижиг хагас дамжуулагчтай байх болно гэсэн үг юм. Гэхдээ Бульдозерыг 32 нм стандарттай илүү дэвшилтэт техникийн процессоор үйлдвэрлэх болно гэдгийг санах нь зүйтэй. Орчин үеийн дөрвөлсөн цөмт Intel Sandy Bridges-тэй харьцуулахад AMD-н шинэ найман цөмт процессорууд нь зөвхөн 45% илүү үхэх талбайтай байх болно.

Гэсэн хэдий ч дөрвөлсөн цөмт Sandy Bridge процессорууд нь Hyper-Threading технологийн дэмжлэгийн ачаар Булдозерын нэгэн адил найман цөмт процессоруудыг үйлдлийн системд танилцуулж болно. Энэ нь Бульдозерыг найман цөмт процессор гэж нэрлэх хууль ёсны талаар маргаан үүсгэх нь гарцаагүй. Гэсэн хэдий ч AMD болон Intel нь найман тооцоолох хэлхээг өөр өөр аргаар нэгэн зэрэг гүйцэтгэхийг зөвшөөрсөн гэдгийг ойлгох хэрэгтэй. Intel-ийн хөгжүүлэгчид өөрсдийн бичил архитектурт нэвтэрсэн нэмэлт функцууд, хоёр урсгалыг нэг цөм дотор, нэг багц гүйцэтгэх нэгж дээр ажиллуулах боломжийг олгодог. AMD нь эсрэгээрээ хоёр бүрэн цөмөөс "нэмэлт" хэсгүүдийг хайчилж авсан боловч модуль бүрийн дотор зөвхөн хоёр багц идэвхжүүлэгч байсан.



Үүний үр дүнд Intel-ийн Hyper-Threading технологи нь олон урсгалтай гүйцэтгэлийг ердөө 15-20% -иар нэмэгдүүлдэг бол AMD-ийн шийдэл нь 4-ээс 8 утас руу шилжих үед гүйцэтгэлийг 80% нэмэгдүүлдэг.

Мэдээжийн хэрэг, найман цөмт бульдозерын хагас дамжуулагч болор нь модульчлагдсан бүтэцээрээ дөрвөлсөн цөмттэй маш төстэй юм.


Цикл бүрт илүү олон заавар?

Зөвхөн процессорын цөмийн тоог нэмэгдүүлэх нь таныг хол авчрахгүй. Энэ нь дөрвөлсөн цөмт Sandy Bridge-ээс ерөнхийдөө доогуур үзүүлэлттэй зургаан цөмт Phenom II X6 процессоруудыг гаргасны дараа ч тодорхой болсон. Тиймээс AMD-ийн хөгжүүлэгчид зөвхөн дизайны өргөн хүрээний өөрчлөлтөөр өөрсдийгөө хязгаарлаагүй. Бульдозерын үндсэн бичил архитектурыг K10-тай харьцуулахад арай бага хэмжээгээр шинэчилсэн бөгөөд энэ нь AMD процессор дээрх системийн ажиллагааг зөвхөн олон урсгалтай ажлуудад төдийгүй параллелизм багатай програмуудад хурдасгах найдвар төрүүлж байна. Түүнээс гадна эдгээр итгэл найдвар нь бүрэн объектив нөхцөл байдалд тулгуурладаг. Өмнөх AMD микро архитектурууд нь цагт гурван заавар (нэг цөм дээр) гүйцэтгэхээр бүтээгдсэн байсан бол Бульдозерын бичил архитектур нь нэг цагт дөрвөн зааврыг гүйцэтгэдэг бөгөөд энэ шинж чанараараа Core микроархитектуртай өрсөлдөгч процессоруудтай илүү ойр байдаг.

Чанарын өөрчлөлтийг гүйцэтгэлийн эхний үе шатуудаас - зааварчилгааг урьдчилан татаж авах, тайлах үе шатаас эхлэн ажиглаж болно. Эдгээр үе шатууд нь нэг модуль доторх хос цөмд нийтлэг байдаг тул AMD тэдгээрийг бичил архитектурын гацаа болгохгүйн тулд онцгой анхаарал хандуулсан. L1I кэшээс 32 байт блокоор код тайлах зааврыг авчирсан бөгөөд энэ нь Core микроархитектуртай (хоёр дахь үеийн) процессоруудаас хоёр дахин том хэмжээтэй байна. Эхний түвшний зааврын кэш нь өөрөө 64 KB багтаамжтай, хоёр сувгийн холболттой. Код тайлахад зориулагдсан зааврыг хоёрдугаар түвшний кэшээс урьдчилан ачаалдаг.

Дээж авах үйл явцад хамгийн шууд оролцдог салбар таамаглах блок нь өөр өөр цөмийн үйл ажиллагааг бие даан хянадаг буферийн хоёр багцыг агуулдаг. Тиймээс логик салбаруудын үр дүнг урьдчилан таамаглахдаа Бульдозер утаснуудын хооронд андуурдаггүй. Шинэ бичил архитектур нь өндөр цагийн хурдтай ажиллах зорилготой тул салбарыг урьдчилан таамаглах нэгжийн чанар хамгийн чухал юм. Тиймээс үүнд ашигласан алгоритмууд бүрэн шинэчлэгдсэн бөгөөд AMD нь Бульдозерын салбарын таамаглалын үр ашиг сайжирна гэж найдаж байна.



Бульдозерын x86 заавар тайлагч нь мөн нөөцөө хоёр цөмд хуваадаг бөгөөд нэг цагийн мөчлөгт 4 хүртэлх ирж буй зааврыг тайлах чадвартай. Гэсэн хэдий ч түүний гүйцэтгэл нь зөвхөн дөрвөн макро заавар өгөхөөр хязгаарлагддаг (AMD-ийн нэр томъёоны кодыг тайлсны үр дүнд), x86 зааврыг 1-2 эсвэл түүнээс дээш макро зааварчилгаанд хувааж болно. Тиймээс, декодчилогч нь өмнөх үеийн бичил архитектуртай харьцуулахад гүйцэтгэлээ гуравны нэгээр нэмэгдүүлсэн ч хоёр бүхэл тоо, нэг бодит тоо тооцоолох кластерийг дэмжих үүрэгтэй учраас хурд нь хангалтгүй байж магадгүй юм.

Макро хайлуулах зааврын хайлуулах технологийн тодорхой аналогийг Бульдозерт бас ашигласан гэдгийг тэмдэглэх нь зүйтэй. X86 зааврын зарим бүлгийг нэг бүтнээр нэгтгэж, декодчилогчоор нэг заавар болгон дамжуулж болно - AMD үүнийг салбар Fusion гэж нэрлэдэг.

Шифрлэгдсэн макро заавар нь гурван тооцооллын кластерт хуваарилагдсан бөгөөд тэдгээрийн хоёр нь бүрэн хэмжээний тооцоолох цөмүүдийн үлдэгдэл, нэг нь бодит дугаарлагдсан бөгөөд цөмд хуваагдана. Эдгээр кластер бүр өөрийн гэсэн зааварчилгааг өөрчлөх логик, өөрийн хуваарьтай байдаг. Энэ нь AMD нь ирээдүйн бүтээгдэхүүнүүдэд эдгээр кластеруудын заримыг бүрэн орлуулах эсвэл нөхөх чадварыг хадгалсаар байгаа гэсэн үг юм.

Кластер бүр дэх зааврын дарааллыг өөрчлөх нь регистрүүдийн агуулгын лавлагааг хадгалж, зааврын дарааллыг өөрчлөх үед процессор дотор тогтмол өгөгдөл дамжуулах хэрэгцээг арилгадаг физик бүртгэлийн файлыг ашиглахад суурилдаг. Физик бүртгэлийн файл нь эрчим хүчний хэрэглээний хувьд илүү үр дүнтэй төдийгүй процессорын цагийн хурдыг нэмэгдүүлэхэд илүү таатай байдаг тул энэ арга нь дахин эрэмбэлэх буферийг орлуулсан.

Бүхэл тоон кластерууд нь хоёр арифметик гүйцэтгэлийн нэгж (ALU) ба санах ойн хаягийн хоёр нэгжийг (AGU) агуулдаг. K10 микроархитектуртай харьцуулахад төхөөрөмжүүдийн тоо нэг ALU болон нэг AGU-аар буурсан боловч AMD энэ нь гүйцэтгэлийг мэдэгдэхүйц бууруулахгүй, харин үндсэн хэсэг нь ихээхэн хэмнэлт гаргах болно гэж AMD баталж байна. Бүхэл тоон кластер бүрт хоёроос илүү ALU болон AGU байх нь практик утгагүй гэдэгт бид бэлэн итгэж байна, учир нь нэг цагийн мөчлөгт дөрвөөс илүүгүй макро заавар декодчилогчоос хоёуланд нь гүйцэтгэхэд хүрч чадахгүй.



Үүний зэрэгцээ идэвхжүүлэгчид илүү түгээмэл болсон бөгөөд тэдгээр нь чиг үүргээрээ бараг ялгаатай биш юм.

Кэш санах ойн дэд системийн зохион байгуулалт ноцтой өөрчлөгдсөн. L1D кэш нь 64-аас 16 КБ болж буурч, бичих боломжтой болсон. Үүний зэрэгцээ түүний холбоо 4 суваг болж нэмэгдсэн бөгөөд үүнээс гадна "замын урьдчилан таамаглагч" нэмэгдсэн. Эхний түвшний өгөгдлийн кэшийн хэмжээ багассан нь түүний дамжуулах чадвар мэдэгдэхүйц нэмэгдсэнээр нөхөгддөг; одоо энэ нь 128 битийн гурван үйлдлийг нэгэн зэрэг гүйцэтгэх боломжтой: хоёр унших, нэг бичих.

Мэдээжийн хэрэг, L1D кэшийн зурвасын өргөний өөрчлөлт нь микроархитектурт 256 битийн AVX зааврыг хэрэгжүүлэх хэрэгцээтэй холбоотой бөгөөд үүний дэмжлэг нь цөмийн хооронд хуваалцсан FPU нэгжид гарч ирсэн. Гэсэн хэдий ч энэ нь бодит тооны идэвхжүүлэгчид 256 бит болсон гэсэн үг биш юм. Үнэн хэрэгтээ, Бульдозерын модуль нь 128 битийн хоёр төхөөрөмжтэй бөгөөд AVX заавар нь 128 битийн зааврын хос хосоороо тайлагдсан байдаг. Үүний дагуу тэдгээрийг гүйцэтгэхийн тулд FMAC төхөөрөмжүүдийг (хөвөгч цэгийг үржүүлэх-хуримтлуулах) нэгтгэж, бодит дугаарлагдсан кластерын гүйцэтгэлийг нэг цагийн мөчлөгт процессорын модуль тутамд нэг AVX команд болгон бууруулдаг.



FPU нь өөрийн анхны түвшний кэшгүй тул энэ кластер нь бүхэл тоон төхөөрөмжүүдээр дамжуулан өгөгдөлтэй ажилладаг.

AMD-ийн инженерүүд Intel-ээс санал болгож буй AVX зааврын дэмжлэгийг хэрэгжүүлэх ажлыг аль хэдийн эхлүүлсэн тул бусад холбогдох багцуудыг Бульдозерын процессоруудад нэмсэн: шифрлэлтийн ажиллагааг хурдасгахад чиглэсэн SSE4.2 болон AESNI заавар. Нэмж дурдахад, AMD нь өөрийн хэд хэдэн тушаалуудыг нэвтрүүлсэн: гурван операнд үржүүлэх-нэмэлт FMA4 болон AVX - XOP-ийн цаашдын хөгжлийн талаархи өөрийн үзэл баримтлал.



Бульдозер дахь L2 кэшийг процессорын модуль дотор хувааж, цөм хооронд хуваалцдаг. Түүний багтаамж нь гайхалтай 2 МБ, нэгдэл нь 16 суваг юм. Гэсэн хэдий ч автобусны өргөн өмнөх шигээ 128 бит байсан ч энэ схемийн дагуу ажилладаг кэшийн хоцролт нь 18-20 цикл болж нэмэгдсэн. Энэ нь Бульдозер дахь L2 кэш хэдий том боловч тийм ч хурдан биш гэсэн үг юм; өрсөлдөгч болон өмнөх процессорууд L2 кэшийг ойролцоогоор хагас сааталтай санал болгодог. 4 мөчлөгийн хоцрогдолтой жижиг L1D кэштэй (энэ нь K10 бичил архитектураас ч илүү) энэ бүхэн тийм ч урам зоригтой харагдахгүй байна. Гэсэн хэдий ч AMD нь кэшийн хоцролтыг зөвхөн Булдозерт өндөр цагийн хурдтай ажиллах боломжийг олгохын тулд нэмэгдүүлсэн гэж мэдэгджээ.



Нэмж дурдахад, AMD-ийн инженерүүд шаардлагатай өгөгдлийг эхний болон хоёрдугаар түвшний кэш рүү ачаалах зориулалттай үр ашигтай урьдчилан ачаалах нэгжийг нэвтрүүлсэн. Эдгээр блокуудын гүйцэтгэл сайжирсан гэж байгаа бөгөөд тэд одоо бүр жигд бус өгөгдлийн бүтцийг таних боломжтой болсон.

Онолын хувьд Бульдозер сайн сэтгэгдэл төрүүлдэг. AMD нь процессорын бичил архитектурт хандах хуучин арга барилаа бүрэн шинэчилж, бүрэн шинэчилсэн загварыг хэрэгжүүлсэн. Энэ нь эхлээд харахад маш ирээдүйтэй харагдаж байна, учир нь шинэ микроархитектур нь нэг процессорын цөм дээр цагийн мөчлөгт гурваас илүү дөрвөн зааврыг гүйцэтгэхэд оновчтой болсон. Нэмж дурдахад, энэ нь код тайлах явцад зааврыг макро нэгтгэхийг дэмждэг бөгөөд энэ нь тодорхой гүйцэтгэлийг улам нэмэгдүүлдэг.

Гэхдээ бид зөвхөн нэг цөмийг харж, бодит байдал дээр ийм цөмүүд хос хосоороо нийлдэг гэдгийг бодохгүй байвал бүх зүйл маш сайхан харагдаж байна. Хоёр цөмт бульдозерын модуль нь хэд хэдэн цөмд хэтэрхий олон нийтлэг хэсгүүдтэй байдаг. Ялангуяа ийм модуль нь зөвхөн нэг заавар татах нэгж, нэг декодлогчтой байдаг тул нэг цагийн мөчлөгт гүйцэтгэсэн зааврын дээд тоо нь бүхэл бүтэн хоёр цөмт угсралтын хувьд дөрөвтэй тэнцүү хэвээр байна. Энэ нь онолын гүйцэтгэлийн хувьд Сэнди гүүрийн нэг цөмтэй логик тэнцүү байх нь Бульдозерын цөм биш харин модуль гэсэн үг юм. Энэ тохиолдолд модулийн хоёр урсгалыг гүйцэтгэх чадвар нь AMD-ээс Hyper-Threading технологид бүрэн логик хариулт шиг харагдаж байна.

Мэдээжийн хэрэг, бидний жинхэнэ процессоруудыг турших нь бүх зүйлийг байранд нь оруулах болно, гэхдээ бичил архитектурыг авч үзэх үе шатанд бид Бульдозерыг найман цөмт бүрэн процессор болгон байрлуулах нь маркетингийн арга заль гэж бодохоос өөр аргагүй болсон. Эдгээр процессоруудын тооцоолох чадварыг илүү найдвартай үнэлэх нь онолын гүйцэтгэлийн үүднээс хоёр дахь үеийн Intel Core бичил архитектур дээр бүтээгдсэн цөмтэй төгс харьцуулах боломжтой модулиудын тоонд үндэслэсэн байх ёстой.

Үүнтэй холбогдуулан бүрэн логик асуулт гарч ирж байна - яагаад AMD нэг процессорын модулийн хүрээнд хос урсгалтай боловсруулалтыг хэрэгжүүлэхэд санаа зовсон бэ? Яагаад хоёр цөмд хуваарилагдсан идэвхжүүлэгчийг нэг кластерт нэгтгэж болохгүй гэж? Үүнд хэд хэдэн шалтгаан бий.

Нэгдүгээрт, олон тооны идэвхжүүлэгчийг нэгэн зэрэг ачаалахын тулд ерөнхий тохиолдолд процессор доторх дэвшилтэт логик шаардлагатай. AMD нь Бульдозерын бичил архитектурт өндөр үр ашигтай салбарыг урьдчилан таамаглах, зааварчилгаа, өгөгдлийг урьдчилан татах нэгжийг хэрэгжүүлэх боломжгүй байсан нь ойлгомжтой. Тиймээс ажлыг параллель болгох, гүйцэтгэх төхөөрөмжийг илүү оновчтой ашиглах ажлыг програм хангамж үйлдвэрлэгчдэд шилжүүлж, тэд Бульдозерын олон урсгалтай дэмжлэг бүхий бүтээгдэхүүн нийлүүлэх ёстой.

Хоёрдугаарт, нэгэн зэрэг гүйцэтгэсэн хэлхээний тоог нэмэгдүүлэх нь тийм ч муу биш юм. Хэрэв ширээний хэрэглэгчид, ялангуяа тоглоомчдын хувьд найман энгийн бульдозерын цөм нь ямар ч давуу талыг амладаггүй бол серверийн програмуудад ийм бичил архитектурыг маш сайн хангасан байх ёстой. Тиймээс Бульдозерыг хөгжүүлэх гол зорилго нь сонирхогчдын хүсэл тэмүүллийг хангах биш, харин AMD-ийн серверийн зах зээл дэх байр суурийг сэргээх явдал байсан байж магадгүй юм.

Turbo Core бүр илүү Turbo

Үүний нэг нь эрчим хүчний хэмнэлт юм хамгийн чухал шинж чанаруудорчин үеийн процессорууд. Жишээлбэл, тэдний дотор ирээдүйн бичил архитектурууд Intel бараг эхний ээлжинд эрчим хүчний хэрэглээг багасгахад анхаарлаа хандуулдаг. AMD хараахан энэ цэгт хүрээгүй байгаа тул энэ компанийн инженерүүд гүйцэтгэлийн төлөө тэмцэж байна. Гэхдээ энэ нь хөгжүүлэгчид Бульдозерын дулааны болон эрчим хүчний шинж чанарыг огт тоодоггүй гэсэн үг биш юм. Үүний эсрэгээр, Лланогийн дараа эрчим хүчний үр ашгийг нэмэгдүүлэх цоо шинэ арга замууд Бульдозерын процессоруудад нэвтэрч байна. Гэсэн хэдий ч энэ тохиолдолд инженерүүд чөлөөлөгдсөн боломжоо мөнгө хэмнэхийн тулд бус харин цагийн давтамжийг нэмэгдүүлэх замаар нэмэлт гүйцэтгэлийг шахах зорилгоор ашигласан.

Мэдээжийн хэрэг, шинэ үйлдвэрлэлийн технологи нь эрчим хүчний зарцуулалт, дулааны зарцуулалтын хувьд тодорхой сайжруулалтыг авчирсан. Бульдозер нь өндөр диэлектрик материал, металл хаалганы транзистор, SOI технологи ашиглан 32 нм процессын технологийг ашигладаг. Өөрөөр хэлбэл, энэ нь Llano процессор үйлдвэрлэдэг GlobalFoundries-ийн техникийн процесс юм. Баярлалаа шинэ технологи 32 нм стандартын дагуу цуваа найман цөмт Бульдозер процессоруудын ажиллах тэжээлийн хүчдэл 1.4 В-оос хэтрэхгүй байна.

Гэсэн хэдий ч Llano-аас Бульдозер руу шилжсэн гол шинэлэг зүйл бол процессорын тодорхой хэсгүүдийн хүчийг таслах зориулалттай цахилгаан хаалганы транзисторууд юм. Бульдозер дээр тэд бие даасан хоёр цөмт модулиуд болон кэш санах ойноос хүчдэлийг бие даан арилгах боломжийг олгодог.



Модуль дахь тооцоолох цөм хоёулаа эрчим хүч хэмнэх C6 төлөвт орох үед модуль хүчдэлгүй болно. Харамсалтай нь, энэ технологийг процессорын цөмд ашиглах боломжгүй, учир нь Бульдозер дотор тусгайлан зориулсан цөм байхгүй - тэд модулийн хөршүүдтэйгээ зарим нөөцийг хуваалцдаг.

C6 цөмийн эрчим хүчний хэмнэлтийн төлөвийг Бульдозер болон Турбо Цөмийн технологиор хянадаг. Бульдозерын процессорын модулиудын дор хаяж тал хувь нь эрчим хүч хэмнэх горимд байх үед энэ нь тэжээлийн хүчдэл болон цагийн давтамжийг нэмэгдүүлдэг. Энэхүү албадан үйлдлийн горимыг Max Turbo Boost гэж нэрлэдэг.

Гэсэн хэдий ч Max Turbo Boost нь шинэ зүйл биш бөгөөд K10 микроархитектур дээр бүтээгдсэн Thuban процессоруудад ийм автомат overclocking-ийг AMD нэвтрүүлсэн. Үнэхээр шинэ зүйл бол бүх процессорын цөм идэвхтэй байсан ч цагийн хурд нь нэрлэсэн хэмжээнээс дээш өсөх боломжтой All Core Boost горим юм. Бульдозерт хэрэгжсэн Turbo Core-ийн сайжруулсан хувилбар нь процессорыг тодорхой блокуудын ажлын ачааллын талаарх мэдээлэлд үндэслэн практик эрчим хүчний зарцуулалт, дулааны зарцуулалтыг сайн нарийвчлалтайгаар дүгнэх боломжийг олгодог. Үүний дагуу, хэрэв энэ үнэлгээний дагуу одоогийн дулааны алдагдал болон эрчим хүчний хэрэглээ хязгаараас хамаагүй доогуур байвал процессор нь нэг ч цөм идэвхгүй байдалд байгаа ч гэсэн тэжээлийн хүчдэл болон цагийн давтамжийг нэмэгдүүлэх боломжтой.



Тиймээс Бульдозерын микроархитектур бүхий процессоруудын ажиллах давтамж нь маш их хувьсах утга юм. Гүйцэтгэж буй алгоритмуудын "хүнд байдал" болон холбогдох цөмийн тооноос хамааран энэ нь маш өргөн хүрээнд динамикаар өөрчлөгдөж, 900 МГц хүрдэг.

Шинэчлэгдсэн ширээний платформ

Шинэ бичил архитектурыг нэвтрүүлснээр AMD платформын дизайныг өөрчлөөгүй төдийгүй Бульдозер процессоруудын одоо байгаа дэд бүтэцтэй нийцтэй байдлыг хадгалсан. Үүний дагуу, өмнөх үеийнхтэй адил шинэ процессорууд нь гурав дахь түвшний кэш, санах ойн хянагч, Hyper-Transport автобусны хянагч зэрэг нэгдсэн хойд гүүрийг агуулдаг. Үүний зэрэгцээ, шинээр гарсан бүх AMD болон Intel процессорууд дотор нь суурилуулсан PCI Express график автобусны хянагчтай байсан ч Бульдозерт ийм зүйл байдаггүй.



K10 микроархитектур дээр баригдсан процессоруудын нэгэн адил Бульдозер дахь хойд гүүр нь өөр өөр загваруудад зориулж 2.0-2.2 ГГц давтамжтайгаар тохируулагдсан өөрийн цагийн давтамжийг ашигладаг. Энэ давтамж нь L3 кэшийн хурдад шууд нөлөөлдөг тул гүйцэтгэлд тодорхой нөлөө үзүүлдэг болохыг анхаарна уу. Процессоруудын одоогийн хувилбарт эзлэхүүн нь 8 МБ хүртэл нэмэгдэж, 64 сувгийн холболттой байдаг. Байгууллагын хэрэглэгчдийн хүсэлд нийцүүлэн энэ кэшэд хадгалагдсан өгөгдлийг ECC алдаа засах кодоор хамгаалдаг.

Бульдозерт суурилуулсан санах ойн хянагч нь цоо шинэ боломжуудтай байдаггүй. Энэ нь өмнөх шигээ DDR3 SDRAM-г дэмждэг, хос сувгийн загварыг ашигладаг бөгөөд үнэндээ хосолсон болон холбоогүй горимд ажиллах боломжтой хоёр бие даасан нэг сувгийн хянагчаас бүрддэг. AMD нь зөвхөн өндөр хурдны санах ойн төрлүүдэд дэмжлэг үзүүлж, DDR3-1867-тэй нийцэж байгааг зарлаж, 1.25 ба 1.35 В хүчдэлтэй эрчим хүчний хэмнэлттэй модулиудтай нийцтэй байхыг анхаарч үзсэн.

Замбези өөрийн гэсэн кодтой Бульдозерын ширээний өөрчлөлтийн талаар ярихад энэ нь шинэ загварт зориулагдсан гэдгийг тэмдэглэх нь зүйтэй. Сокет платформ AM3+, мөн Scorpius код нэрээр алдартай. Процессор залгуур AM3+ нь 942 тээглүүртэй бөгөөд энэ нь Socket AM3-аас нэг зүү илүү. Гэсэн хэдий ч Замбези нь хуучин Socket AM3 хавтангуудтай нийцтэй хэвээр байна. Хуучин эх хавтан дээр шинэ процессор суулгах үед зөвхөн тэжээлийн удирдлагын тодорхой функцүүд алга болдог. Тиймээс Turbo Core болон Cool"n"Quiet технологи ажиллаж, Vdrop ажиллахгүй үед давтамж солих хурд буурдаг.

Гэсэн хэдий ч Замбези гарах үед AMD болон үйлдвэрлэгчид эх хавтан 900 цувралын шинэ логик багц дээр суурилсан шинэ бүтээгдэхүүний галактикийг бэлтгэсэн. Zambezi процессор дээр суурилсан, шинэ чипсет дээр суурилсан ердийн системийн бүтцийг доорх блок диаграммд харуулав.


Шинэ AMD 990FX чипсет (мөн түүний хялбаршуулсан хувилбарууд AMD 990X ба AMD 970) хоорондын ялгаа нь зөвхөн Socket AM3+-ийн тодорхой цахилгаан шинж чанарыг дэмжихэд оршдог бөгөөд тэдгээр нь ямар ч шинэ интерфейс авчрахгүй. 800 цуврал чипсетүүдийн нэгэн адил шинэ урд гүүр нь зургаан SATA 6 Gbps порт, арван дөрвөн USB 2.0 порттой. Бид PCI Express 3.0 техникийн үзүүлэлтүүд эсвэл хамгийн муу нь USB 3.0 портуудыг системийн шинэ логик багцад дэмжлэг үзүүлэхийг хичнээн их хүсч байгаагаас үл хамааран энэ удаад ийм төрлийн зүйл алга. Дашрамд хэлэхэд энэ нь маш хачирхалтай, учир нь USB 3.0 дэмжлэгийг доод түвшний Socket FM1 платформд зориулсан чипсетүүдэд нэвтрүүлсэн.

Системийн логик багцын шинэ цувралын өөрчлөлтүүдийн хоорондох ялгаа нь зөвхөн олон GPU-ийн янз бүрийн тохиргоонуудын дэмжлэгээс бүрддэг.


Zambezi процессорын хүрээ

Zambezi процессоруудыг гаргасан нь шинэчлэлтийг дуусгаж байна загварын хүрээ, AMD-аас санал болгож байна. Бульдозерын бичил архитектурт суурилсан ширээний процессорууд нь энэ үйлдвэрлэгчийн шинэ тэргүүлэх санал болж, Phenom II-ийн бүх төрлийн өөрчлөлтийг зах зээлээс хурдан гаргах болно.

Шинэ бичил архитектурын шинэчлэлийг онцлон тэмдэглэснээр AMD нь Zambezi ширээний процессоруудад зориулсан маркетингийн шинэ нэрийг ашиглах болно - FX. Энэ нь нэг талаас процессоруудыг үсгээр тэмдэглэдэг шинэ нэршилд бүрэн нийцэж байгаа бол нөгөө талаас зургаа, долоон жилийн өмнө хамгийн хурдан ширээний процессорууд байсан домогт Athlon 64 FX процессоруудын лавлагаа юм. Гэсэн хэдий ч тэр өдрүүд эргэлт буцалтгүй өнгөрсөн тул AMD одоо бидэнд юу санал болгоход бэлэн байгааг харцгаая.

Ойрын ирээдүйд FX цуврал процессоруудын төрөлд дөрвөн загвар багтах болно.



Zambezi процессорын загваруудын ялгаа нь зөвхөн цагийн хурдаар зогсохгүй идэвхтэй тооцоолох цөмүүдийн тоогоор ялгаатай хэдий ч тэдгээр нь бүгд ижил хагас дамжуулагч чип дээр суурилдаг. Энэ байна:



Наймаас цөөн цөмтэй процессор авахын тулд AMD нь хагас дамжуулагч чип дээр тэдгээрийн заримыг идэвхгүй болгоно. K10 микроархитектуртай процессоруудтай адил тэдгээрийг буцааж тайлах боломж эргэлзээтэй хэвээр байна. Гэсэн хэдий ч манай лабораториор дамжсан 900 цуврал логик багц дээр суурилсан эх хавтангийн BIOS-д холбогдох сонголтууд байгаа тул энэ асуудлыг нааштай шийдвэрлэх найдвар бий.

Зургаан цөмт болон дөрвөлсөн цөмт процессорын өөрчлөлтийг авахын тулд цөмүүдийг идэвхгүй болгох нь "модуль тус бүрээр" явагдана. Өөрөөр хэлбэл, тэдгээрийн доторх "хоёр дахь" цөм биш харин хоёр цөмт модулиудыг бүхэлд нь хаах болно, гэхдээ ийм тактик нь гүйцэтгэлийн хувьд илүү ашигтай байх болно. Гэсэн хэдий ч Бульдозерын бичил архитектур дээр бүтээгдсэн зургаан цөмт ба дөрвөлсөн цөмт процессоруудыг гаргах нь маркетингийн үүднээс биш харин чипийн нэлээд том хэмжээс, шинэ технологийн процессыг харгалзан татгалзахаас татгалзах шаардлагатай гэж тайлбарлаж байна. нэлээд их байх болно.

Хэдийгээр AMD нь өндөр давтамжтайгаар ажиллах шинэ бичил архитектурыг сайжруулж байгаа хэдий ч бид хүрсэн үнэ цэнийг гайхалтай нээлт гэж нэрлэх боломжгүй байна. Дөрвөн гигагерцийн саад бэрхшээлийг даван туулж чадаагүй хэвээр байгаа бөгөөд хуучин FX процессорын нэрлэсэн давтамж нь жишээлбэл Phenom II X4 980-аас ч доогуур байна. Үйлдвэрлэлийн технологийг сайжруулснаар Замбези давтамж хурдан өснө гэж найдаж байна. . Гэсэн хэдий ч, хэрэв та AMD-ийн төлөвлөгөөний одоогийн хувилбарт итгэж байгаа бол 2012 оны эхний улирлаас өмнө шугамыг хурдасгах болно.

Дулаан ялгаруулалт, эрчим хүчний хэрэглээний хувьд ахиц дэвшил алга. AMD нь Бульдозерын бичил архитектур нь эрчим хүчний хэмнэлттэй байх талаар удаан хугацаанд ярьж байсан боловч үнэн хэрэгтээ хуучин найман цөмт загварууд нь хуучин Phenom II-тэй ижил TDP түвшинтэй байдаг. Үнэн бол хэсэг хугацааны дараа компани нь FX-8120-ийн 95 ваттын хувилбар болон ижил тооцоолсон дулаан ялгаруулалт бүхий FX-8100 процессорыг санал болгох ёстой.

Гэхдээ FX цувралын шинэ процессоруудын үнэ сонирхол татахуйц биш юм. AMD нь платформуудыг өрсөлдөгчдөөсөө илүү хямд үнээр санал болгох чиглэлээсээ хазайхыг хүсэхгүй байгаа тул хуучин найман цөмт Zambezi загварууд нь хуучин Intel Core i5 процессоруудыг эсэргүүцдэг. Ерөнхийдөө AMD нь бүтээгдэхүүнийхээ дараах байршлын схемийг баримтлахаар төлөвлөж байна.



Өөрөөр хэлбэл, AMD нь Intel-ийн зургаан цөмт процессорууд болон ирээдүйтэй LGA2011 платформтой өрсөлдөх бодолгүй байгаа боловч дундаж үнийн сегментийг эзлэхэд анхаарлаа хандуулахыг хүсч байна.

Сонирхогчдын хувьд сайн мэдээ бол бүх FX цуврал процессоруудад үржүүлэгчийг хаахгүй байх болно. Бүх Zambezi-г зөвхөн үндсэн үржүүлэгчийг өөрчлөх замаар хялбархан overclock хийхээс гадна Turbo Core технологийн тусламжтайгаар дахин тохируулах боломжтой. Мөн санах ойн дэд системийн overclocking болон процессорт суурилуулсан хойд гүүрний давтамжийг ашиглах боломжтой.

Туршилтын процессор: AMD FX-8150

AMD нь манай редакторуудад Замбези гэр бүлийн ахлах процессор FX-8150-г илгээсэн.



Энэ нь 3.6 GHz ба түүнээс дээш нэрлэсэн цагийн хурдтай дэлгэрэнгүй мэдээлэлТүүний шинж чанарыг CPU-Z-ийн өгөгдсөн дэлгэцийн зургаас олж авч болно.



Процессор нь B2 алхам дээр суурилсан бөгөөд энэ нь анхны хувилбар биш гэдгийг анхаарна уу. Хагас дамжуулагч болорын өмнөх өөрчлөлтүүд нь анх төлөвлөсөн цагийн давтамж дээр ажиллах боломжгүй байсан тул үйлдвэрлэгчээс татгалзсан. Анх хавар, дараа нь зун хийхээр төлөвлөж байсан ч үнэн хэрэгтээ 10-р сарын дундуур болсон мэдэгдлийг хойшлуулсан нь энэ юм.

Гэсэн хэдий ч өнөөдөр хүрсэн 3.6 GHz давтамж нь тийм ч гайхалтай харагдахгүй байна. AMD өөрөө болон Intel хоёулаа илүү өндөр хурдтай ажилладаг бүтээгдэхүүнтэй. Гэсэн хэдий ч FX-8150 нь маш ирээдүйтэй Turbo Core технологитой бөгөөд бага ачаалалтай үед процессорын давтамжийг 4.2 GHz хүртэл автоматаар нэмэгдүүлэх боломжтой.



Ачаалал нь бүх тооцоолох цөмд байсан ч 3.9 GHz давтамжийг олж авах боломжтой боловч цахилгаан зарцуулалт, дулааны тархалтын хязгаараас хэтрүүлэхгүйгээр автоматаар overclock хийх боломжийг олгодог.



Сул зогсолттой үед Cool"n"Quiet технологи нь FX-8150-ийн давтамжийг 1.4 GHz хүртэл бууруулдаг. Нийлүүлэлтийн хүчдэл 0.85 В хүртэл буурдаг.


Бид хэрхэн туршиж үзсэн

Бид Бульдозерын бичил архитектур дээр бүтээгдсэн шинэ найман цөмт AMD FX-8150 процессорыг өмнөх үеийнх нь нэг болох зургаан цөмт Phenom II X6 болон дөрвөлсөн цөмт Intel-ийн санал болгож буй (үнэтэй) харьцуулсан. Үндсэн процессорууд i5-2500 болон Core i7-2600. Нэмж дурдахад, илүү тодорхой болгохын тулд зургаан цөмт Core i7-990X процессорын гүйцэтгэлийн үзүүлэлтүүдийг үр дүнд нэмсэн.

Үүний үр дүнд туршилтын системд дараахь програм хангамж, техник хангамжийн бүрэлдэхүүн хэсгүүд багтсан болно.

Процессорууд:

AMD FX-8150 (Zambezi, 8 цөм, 3.6 GHz, 8 MB L2 + 8 MB L3);
AMD Phenom II X6 1100T (Thuban, 6 цөм, 3.3 GHz, 3 MB L2 + 6 MB L3);
Intel Core i7-2600K (Sandy Bridge, 4 цөм, 3.4 GHz, 1 MB L2 + 8 MB L3);
Intel Core i5-2500K (Sandy Bridge, 4 цөм, 3.3 GHz, 1 MB L2 + 6 MB L3);
Intel Core i7-990X Extreme Edition(Гулфтаун, 6 цөм, 3.46 GHz, 1.5 MB L2 + 12 MB L3).

CPU хөргөгч: NZXT Havik 140;
Эх хавтан:

Гигабайт 990FXA-UD5 (Socket AM3+, AMD 990FX + SB950);
ASUS P8Z68-V PRO (LGA1155, Intel Z68 Express);
Гигабайт X58A-UD5 (LGA1366, Intel X58 Express).

Санах ой:

2 х 2 ГБ, DDR3-1600 SDRAM, 9-9-9-27 (Kingston KHX1600C8D3K2/4GX);
3 х 2 ГБ, DDR3-1600 SDRAM, 9-9-9-27 (Чухал BL3KIT25664TG1608).

График карт: AMD Radeon HD 6970.
Хатуу диск: Kingston SNVP325-S2/128GB.
Цахилгаан хангамж: Tagan TG880-U33II (880 Вт).
Үйлдлийн систем: Microsoft Windows 7 SP1 Ultimate x64.
Жолооч нар:

Intel чипсетийн драйвер 9.2.0.1030;
Intel удирдлагын хөдөлгүүрийн драйвер 7.1.10.1065;
Intel Rapid Storage Technology 10.6.0.1022;
AMD Catalyst 11.10 дэлгэцийн драйвер.

Туршилтыг Windows 7 үйлдлийн системийн одоогийн хувилбарын дагуу явуулсан боловч AMD нь энэхүү үйлдлийн системийн ажлын менежер нь тооцоолох хэлхээг хамгийн оновчтой байдлаар түгээдэггүй болохыг анхаарна уу. Windows 7 нь үндсэндээ өөр өөр модулиудад байрлах цөм рүү урсгалыг чиглүүлэхийг илүүд үздэг. Энэ нь модулийн дотор хуваагдсан блокуудын ачааллыг бууруулдаг тул илүү өндөр гүйцэтгэлийг өгдөг. Гэсэн хэдий ч энэхүү стратеги нь хоёр цөмт модулиудын зарим нь эрчим хүч хэмнэх төлөвт байсан бол процессор ашиглаж болох турбо горимуудыг оруулахаас сэргийлдэг.

Ирээдүйтэй мэс заслын өрөө Windows систем 8 нь өөр тактик баримтлах бөгөөд нэг модуль доторх цөмд утаснууд эхлээд хуваарилагдах болно. Үүний үр дүнд AMD нь хэд хэдэн програмуудад Замбези дээр суурилсан системийн гүйцэтгэл 10% хүртэл нэмэгдэх болно гэж амлаж байна.

Гүйцэтгэл

Бульдозерын бичил архитектурын үр ашгийн урьдчилсан үнэлгээ

Процессорын "бодит" туршилтыг эхлүүлэхийн өмнө бид Бульдозерын бичил архитектураас юу хүлээж болохыг олж мэдэхээр шийдсэн. Үүнийг хийхийн тулд бид энэхүү бичил архитектуртай процессорыг K10 болон Sandy Bridge микроархитектур бүхий бусад CPU-уудтай ижил цагийн давтамжтай, ижил тооны идэвхжүүлсэн цөмтэй ижил төстэй нөхцөлд зохиомлоор хийсэн жижиг харьцуулалтыг хийсэн.

Тодруулбал, бид AMD FX-8150, Phenom II X6 1100T болон Core i7-2600-г 3.6 GHz давтамжтайгаар зөвхөн хоёр боловсруулах цөм идэвхжүүлсэн байхад харьцуулсан. Туршилтын цэвэр байдлыг хангахын тулд эрчим хүч хэмнэх, автоматаар overclock хийх бүх технологийг байгалийн жамаар идэвхгүй болгосон. Хэрэгсэлд багтсан энгийн синтетик жишиг үзүүлэлтүүдийг туршилтын хэрэгсэл болгон сонгосон SiSoft Сандра 2011 онд бид SSE3-аас өмнөх бүх зааврын багцыг K10 бичил архитектурт дэмждэггүй тул албадан идэвхгүй болгосон.



Хүснэгтэнд байгаа тоонууд ямар ч үгнээс илүү чанга ярьдаг. Бульдозерын бичил архитектурын гүйцэтгэл өмнөх процессоруудаас хамаагүй бага болсон. Хос цөмүүдийг нэг модуль болгон хуваалцсан нөөцөөр нэгтгэж, бичил архитектурыг хялбарчлах нь ижил давтамжтайгаар нэг цөмд бульдозерын тодорхой гүйцэтгэл өмнөх үеийн AMD микро архитектуртай харьцуулахад 25-40% -иар буурахад хүргэсэн. Үүний үр дүнд бульдозерын цөм нь Сэнди гүүрний цөмөөс бараг хагас дахин удаан байдаг. Түүгээр ч зогсохгүй, хоёр цөм агуулсан Бульдозер процессорын модулийн гүйцэтгэл нь Hyper-Threading технологийг идэвхжүүлсэн ганц Sandy Bridge цөмийн хурдаас ч бага юм. Ийм бичил архитектур дээр бүтээгдсэн процессороос гүйцэтгэлийн бүртгэл хүлээх ёстой юу? Асуулт нь риторик юм.

Замдаа нэг харцгаая практик шинж чанаруудкэш ба санах ойн дэд системүүд. Эдгээр функциональ нэгжүүдийн ажиллах хурдыг үнэлэхийн тулд бид Aida64 багцаас Cachemem хэрэгсэлд туршилт хийсэн. Бүх тохиолдолд DDR3-1600 санах ойг 9-9-9-27-1T хоцролттой ашигласан. Өмнөх тохиолдлын нэгэн адил процессорын давтамжууд 3.6 GHz-т нийцсэн хэвээр байна.



Zambezi-д Phenom II процессортой харьцуулахад бүх кэш болон санах ойн дэд системийн практик хоцрогдол нэмэгдсэн байна. Бульдозерын бичил архитектурыг авч үзэхдээ бид энэ тухай ярьсан. Гэсэн хэдий ч кэш санах ойн логик зохион байгуулалтыг өөрчилснөөр түүний дамжуулах чадвар бараг бүх тохиолдолд нэмэгдсэн.

Үүний зэрэгцээ хамгийн хурдан хос сувгийн санах ойн хянагч, хамгийн хурдан кэшийн дэд системийг Sandy Bridge-д нэвтрүүлсэн. Мэдээжийн хэрэг кэшийн багтаамжийн хувьд Intel процессор нь Бульдозерын микроархитектурын зөөвөрлөгчөөс арай доогуур байдаг.

Ерөнхий гүйцэтгэл

Нийтлэг ажлуудад процессорын гүйцэтгэлийг үнэлэхийн тулд бид уламжлалт орчин үеийн хэрэглэгчийн ажлыг дуурайдаг Bapco SYSmark 2012 тестийг ашигладаг. оффисын програмууддижитал контент үүсгэх, боловсруулах програмууд. Туршилтын санаа нь маш энгийн: энэ нь нийтлэг хэрэглээний компьютерийн жигнэсэн дундаж хурдыг тодорхойлдог нэг хэмжигдэхүүнийг гаргадаг.

Хэсэг хугацааны өмнө AMD нь SYSmark-ийг троллейх гэж оролдсон бөгөөд энэ нь бодит хэрэглээний "буруу" багцыг ашигласнаас болж өрөөсгөл гэсэн мэдэгдлийг тарааж байсныг санацгаая. Гэсэн хэдий ч бидний бодлоор ийм дүгнэлт үндэслэлгүй, учир нь гүйцэтгэлийг үнэлэхэд ашигладаг нийтлэг бөгөөд үнэхээр алдартай програмууд бөгөөд тэдгээрийн эцсийн үр дүнд оруулсан хувь нэмрийг дараах диаграммд харуулав.



Тиймээс бид SYSmark 2012-ийн хэрэглээг орхиогүй бөгөөд нийтлэг гүйцэтгэлийг үнэлэхийн тулд түүний хэмжүүрүүдийг үргэлжлүүлэн ашигладаг.



Эхний шалгалт бол үнэхээр сэтгэл дундуур байна. Найман цөмт FX-8150-ийн үр дүн нь зургаан цөмт Phenom II X6 1100T-ийн гүйцэтгэлээс ердөө 10% илүү бөгөөд мэдээжийн хэрэг дөрвөлсөн цөмт Intel процессоруудын гүйцэтгэлд огт хүрэхгүй. Тиймээс AMD-ийн сонгосон тактик нь дунд зэргийн нарийн төвөгтэй цөмүүдийн оронд процессор дээр тодорхой үзүүлэлт багатай олон тооны цөмүүдийг хэрэгжүүлэхэд ерөнхийдөө эерэг үр дүнг өгдөггүй.

SYSmark 2012 үр дүнг илүү гүнзгий ойлгох нь системийн ашиглалтын янз бүрийн хувилбаруудад олж авсан гүйцэтгэлийн онооны талаархи ойлголтыг өгөх боломжтой.

Оффисын бүтээмжийн хувилбар нь ердийн оффисын ажлыг дуурайдаг: текст бэлтгэх, хүснэгт боловсруулах, түүнтэй ажиллах имэйлээрмөн интернет сайтуудаар зочлох. Скрипт нь дараах програмуудыг ашигладаг: ABBYY FineReader Pro 10.0, Adobe Acrobat Pro 9, Adobe FlashТоглогч 10.1 Microsoft Excel 2010, Microsoft Internet Explorer 9, Microsoft Outlook 2010, Microsoft PowerPoint 2010, Microsoft Word 2010 болон WinZip Pro 14.5.



Медиа үүсгэх хувилбар нь дижитал зураг, видео бичлэгийг ашиглан сурталчилгааны зураг үүсгэхийг дуурайдаг. Энэ зорилгоор Adobe-ийн алдартай багцуудыг ашигладаг: Photoshop CS5 Extended, Premiere Pro CS5, After Effects CS5.



Вэб хөгжүүлэлт гэдэг нь вэб сайтыг бий болгох загварчилсан хувилбар юм. Ашигласан програмууд: Adobe Photoshop CS5 Extended, Adobe Premiere Pro CS5, Adobe Dreamweaver CS5, Mozilla Firefox 3.6.8 болон Microsoft Internet Explorer 9.



Мэдээлэл/Санхүүгийн шинжилгээний хувилбар нь Microsoft Excel 2010 дээр хийгдсэн статистик дүн шинжилгээ, зах зээлийн чиг хандлагыг урьдчилан таамаглахад зориулагдсан.



3D загварчлалын скрипт нь бүхэлдээ гурван хэмжээст объект үүсгэх, статик болон динамик үзэгдлүүдийг үзүүлэхэд зориулагдсан болно. Adobe ашиглан Photoshop CS5 Extended, Autodesk 3ds Max 2011, Autodesk AutoCAD 2011 болон Google SketchUp Pro 8.



Сүүлчийн хувилбар болох Системийн менежмент нь нөөцлөлт үүсгэх, програм хангамж, шинэчлэлтүүдийг суулгах явдал юм. Энд хэд хэдэн хүн оролцож байна өөр өөр хувилбарууд Mozilla Firefox суулгагч ба WinZip Pro 14.5.



At янз бүрийн загваруудБульдозерын микроархитектуртай процессор ашиглах нь үндсэндээ өөр үр дүнг харуулж байна. Зарим тохиолдолд энэ нь Phenom II X6-аас ч удаан байдаг ч эсрэгээрээ ч бас байдаг. Ерөнхийдөө ерөнхий дүрэм бол: FX-8150-ийн давуу тал нь ажлын ачаалал олон урсгалтай, сайн зэрэгцсэн боловч тооцооллын хувьд төвөгтэй биш тохиолдолд мэдэгдэхүйц болдог.

Гэсэн хэдий ч хамгийн таатай нөхцөлд ч FX-8150 нь Core i5-2500-ийн ард хоцордог. Эдгээр процессоруудыг хурдаар харьцуулж болох цорын ганц хувилбар бол 3D дүрслэл юм. Дунджаар Intel-ийн санал нь AMD-ийн шинэ бүтээгдэхүүнээс гайхалтай 25%-иар илүү байна. Харамсалтай нь.

Тоглоомын гүйцэтгэл

Орчин үеийн тоглоомуудын дийлэнх нь өндөр хүчин чадалтай процессороор тоноглогдсон платформуудын гүйцэтгэлийг график дэд системийн хүчээр тодорхойлдог гэдгийг та мэдэж байгаа. Тийм ч учраас процессоруудыг туршихдаа бид видео картын ачааллыг аль болох арилгахын тулд туршилтыг хийхийг хичээдэг: процессороос хамгийн их хамааралтай тоглоомуудыг сонгож, туршилтыг эсрэг асаахгүйгээр хийдэг. -алиасинг болон хамгийн хол суулгалттай өндөр нарийвчлалтай. Өөрөөр хэлбэл, олж авсан үр дүн нь орчин үеийн видео карт бүхий системд хүрч болох fps-ийн түвшинг бус харин процессорууд зарчмын хувьд тоглоомын ачаалалтай хэр сайн ажиллаж байгааг үнэлэх боломжийг олгодог. Тиймээс танилцуулсан үр дүнд үндэслэн график хурдасгуурын илүү хурдан сонголтууд зах зээл дээр гарч ирэх үед процессорууд хэрхэн ажиллах талаар таамаглах бүрэн боломжтой юм.


















Тоглоомууд нь олон урсгалтай зэрэгцээ ачааллыг үүсгэдэг даалгаврын ангилалд хамаарахгүй. Тиймээс өнөөдрийн тоглоомын програмуудын хувьд AMD-ийн санал болгож буй олон цөмт мангас биш харин дөрвөн цөмт процессорууд илүү тохиромжтой. Энэ мэдэгдлийн тод жишээг бид доорх диаграммуудаас харж байна. Шинэ найман цөмт FX-8150 нь зургаан цөмт өмнөх Phenom II X6-аас хурдан биш юм.

Замбези болон Сэнди гүүрийн хоорондох тоглоомын гүйцэтгэлийн харьцааны хувьд AMD шинэ бүтээгдэхүүний талаар илүү гутранги үзэлтэй хэвээр байна. Одоогийн Intel процессорын микроархитектур нь 3D тоглоомоор үүсгэгддэг ердийн ажлын ачааллыг илүү сайн зохицуулдаг бөгөөд AMD энэ ангиллын даалгаврын хувьд өрсөлдөгч процессоруудыг гүйцэж чадна гэсэн найдвар алга. Өөрөөр хэлбэл, тоглоомын системд Бульдозер ашиглах нь тодорхой процессорын гүйцэтгэл нь тодорхой тоглоомын тодорхой видео дэд системд хангалттай гэдэгт итгэлтэй байгаа тохиолдолд л утга учиртай болно. Гэсэн хэдий ч энэ тохиолдолд та дараагийн видео хурдасгуурын шинэчлэлтийг хийснээр платформ болон орчин үеийн Intel процессорыг илүүд үздэг байсан хэрэглэгчидтэй харьцуулахад ноцтой сул талтай хэвээр үлдэж магадгүй гэдгийг ойлгох хэрэгтэй.

Тоглоомын туршилтаас гадна бид Extreme профайлтай хамтран гаргасан нийлэг жишиг Futuremark 3DMark 11-ийн үр дүнг танилцуулах болно.



Эдгээр үр дүнг нэмэх зорилго нь видео дэд систем нь процессорын хүчийг бүрэн ашиглахыг зөвшөөрдөггүй FX-8150-ийн хамгийн тохиромжтой нөхцөл байдлыг харуулах явдал байв. Энд гол ачаалал нь видео карт дээр унадаг бөгөөд процессор нь зөвхөн туслах үүрэг гүйцэтгэдэг. Ийм тохиолдолд бид Бульдозер ба Сэнди гүүрийн процессоруудын ижил гүйцэтгэлийн талаар ярьж болно, гэхдээ мэдээжийн хэрэг энэ нь тийм ч үнэн биш юм.



Гэсэн хэдий ч FX-8150 нь 3DMark 11-ийн физик туршилтанд (өмнөх үр дүнтэй харьцуулахад) сайн харагдаж байна. физик загвар AMD-н шинэ найман цөмт процессор нь дөрвөлсөн цөмт Core i5-2500-тай ижил хурдтай ажилладаг.

Хэрэглээний тестүүд

Ерөнхийдөө, Бульдозерын жигнэсэн дундаж болон ширээний компьютер дээрх тоглоомын гүйцэтгэл бидний хүлээлтээс хамаагүй доогуур байв. Гэсэн хэдий ч цөхрөлгүй байж, AMD-ийн шинэ бичил архитектур нь өөрийн онцлогийг харуулах боломжтой тохиолдлуудыг олохыг хичээцгээе. давуу тал.

Мэдээллийг шахах үед процессоруудын хурдыг хэмжихийн тулд бид ашигладаг WinRAR архивлагч, үүний тусламжтайгаар бид хамгийн их шахалтын зэрэгтэй нийт 1.4 ГБ хэмжээтэй янз бүрийн файл бүхий хавтсыг архивлаж байна.



FX-8150-ийн үр дүн нь Core i5-2500-тэй ойролцоо байна. WinRAR нь Бульдозерын бүх найман цөмд тооцоолол хийх боломжтой програмуудын нэг биш боловч асар том кэш санах ой нь өдрийг авардаг бололтой.

Архивлах хурдны хоёр дахь ижил төстэй туршилтыг LZMA2 шахалтын алгоритмыг ашиглан 7-zip програм дээр гүйцэтгэдэг.



7-zip-д FX-8150-ийн гүйцэтгэл сайшаалтай. Энэхүү найман цөмт процессор нь дөрвөлсөн цөмт Core i7-2600-ийн хурдтай ойртож чаддаг бөгөөд үүнд Hyper-Threading-ийн дэмжлэг багтсан бөгөөд Бульдозер шиг найман урсгалыг нэгэн зэрэг гүйцэтгэх боломжтой.

Процессоруудын шифрлэлтийн гүйцэтгэлийг TrueCrypt хэмээх алдартай криптографийн хэрэглүүрийн суурилагдсан жишиг үзүүлэлтээр хэмждэг. Энэ нь зөвхөн ажилтай ямар ч тооны цөмийг үр дүнтэй ачаалах чадвартай төдийгүй AES-ийн тусгай зааварчилгааг дэмждэг гэдгийг тэмдэглэх нь зүйтэй.



Сайн зэрэгцсэн, энгийн бүхэл тоон алгоритмууд нь Бульдозерын бичил архитектурт хэрэгтэй зүйл юм. Ийм тохиолдолд бидний харж байгаагаар маш сайн гүйцэтгэлийг олж авах боломжтой. Ялангуяа шифрлэлтийн тухайд FX-8150 нь зургаан цөмт Core i7-990X-ийн ард хоцорч, LGA1155 платформын бүх процессоруудаас түрүүлж байна.

Аудио кодчиллын хурдыг шалгахдаа уг хэрэгслийг ашиглана уу Apple iTunes, энэ нь CD-ийн агуулгыг AAC формат руу хөрвүүлдэг. Энэ програмын онцлог шинж чанар нь зөвхөн хос процессорын цөм ашиглах чадвар гэдгийг анхаарна уу.



Цөөн тооны тооцооллын утас үүсгэдэг програмуудыг Бульдозероос хол байлгах нь дээр. Энэ CPU-ийн зарим цөм нь ийм тохиолдолд зохих үр дүнг харуулахад хэтэрхий сул байна.

Бид Adobe Photoshop програмын гүйцэтгэлийг бүтээлч байдлаар дахин боловсруулсан өөрийн тестийг ашиглан хэмждэг Retouch Artists Photoshop Speed ​​Test, энэ нь дижитал камераар авсан 10 мегапикселийн дөрвөн зургийн ердийн боловсруулалтыг багтаадаг.



Photoshop дээр FX-8150-ийн гүйцэтгэл нь K10 бичил архитектуртай процессоруудынх шиг сүйрэлтэй биш боловч Core i5-2500-аас хамаагүй доогуур хэвээр байна. Мэдээжийн хэрэг, том кэш санах ой нь энэ тохиолдолд Бульдозерын бичил архитектурт сайн туслах болно, гэхдээ энэ нь дангаараа таныг хол авчрахгүй. Тооцооллын цөмүүдийн үр ашиг, тодорхой гүйцэтгэл нь хамгийн чухал хэвээр байна.

Бид мөн туршилтыг явуулсан Adobe програм Photoshop Lightroom 3. Туршилтын хувилбарт RAW форматтай 12 мегапикселийн зуун зургийг дараах боловсруулалт болон JPEG форматаар экспортлох зэрэг орно.



Lightroom нь зураг боловсруулалтыг хэдэн ч цөмд зэрэгцүүлж чаддаг тул найман цөмт FX-8150 нь энд сайн үр дүнг харуулж байна. Гэсэн хэдий ч "муу биш" гэдэг нь энэ тохиолдолд харьцангуй ойлголт бөгөөд үнэн хэрэгтээ түүний гүйцэтгэлийг зөвхөн Core i5-2500-тай харьцуулж болно. Энэ нь хоёр бульдозерын цөм нь Hyper-Threading-ийн дэмжлэггүй нэг Сэнди гүүрний цөмтэй тэнцүү гэсэн үг юм.

Adobe Premiere Pro-ийн гүйцэтгэлийг янз бүрийн эффект бүхий HDV 1080p25 видео агуулсан төслийн H.264 Blu-Ray форматаар үзүүлэх хугацааг хэмжих замаар шалгадаг.



Өмнөх үеийн AMD процессорууд видео кодчилолд сайн ажиллаж байсан. Бульдозерын бичил архитектур нь ийм төрлийн хэрэглээний гүйцэтгэлийг бага зэрэг нэмэгдүүлэх боломжийг олгосон бөгөөд үүний үр дүнд FX-8150 нь Core i5-2500-аас ч хурдан юм.

Adobe After Effects-ийг ашиглан видео засварлах хурдыг бүдгэрүүлэх, овойлт үүсгэх, хүрээ холих, гэрэлтүүлэх, хөдөлгөөнийг задлах, сүүдэрлэх, 2D болон 3D хувиргах, урвуу оруулах, өөрчлөх гэх мэт урьдчилан тодорхойлсон шүүлтүүр, эффектүүдийн ажиллах хугацааг хэмжих замаар үнэлэв. гэх мэт.



Ачаалал нь сайн зэрэгцсэн хэдий ч FX-8150 нь After Effects дээр Intel-ийн өрсөлдөгчдөөс хоцорч байна.

H.264 формат руу видео хөрвүүлэх хурдыг хэмжихийн тулд 4 Мбит/сек урсгалтай 720p нягтаршилтай MPEG-2 форматтай эх видеог боловсруулах хугацааг хэмжихэд үндэслэсэн x264 HD тестийг ашигладаг. Энэхүү туршилтын үр дүн нь маш их практик ач холбогдолтой гэдгийг тэмдэглэх нь зүйтэй, учир нь үүнд ашигласан x264 кодлогч нь HandBrake, MeGUI, VirtualDub гэх мэт олон алдартай хувиргах хэрэгслүүдийн үндэс суурь болдог.






X264 кодек ашиглан видеог хөрвүүлэхэд AMD процессорууд үргэлж сайн гүйцэтгэлтэй байсан. Найман цөмт бичил архитектурыг гаргаснаар тэдний үр дүн улам нэмэгдэж, одоо FX-8150 нь хоёр дахь, хамгийн их нөөц шаардсан кодчилолд Core i7-2600-аас ч давж байна. Тиймээс бид маш их бэрхшээлтэй тулгарсны эцэст TrueCrypt-ээс гадна хоёр дахь програмыг олсон бөгөөд энэ нь Бульдозерын бичил архитектур бүхий процессорын гүйцэтгэлийг сайшаах ёстой.

Бид тусгайлсан SPECapc тестийг ашиглан Autodesk 3ds max 2011 дээр тооцоолох гүйцэтгэл болон дүрслэх хурдыг хэмждэг. Энэхүү туршилтаас эхлэн бид 3ds Max 2011-д зориулсан SPECapc-ийн шинэ мэргэжлийн хувилбарыг ашиглаж эхэлж байна.






Олон цөмт бичил архитектурын оновчлолд хамаарах ажлуудын нэг нь дүрслэл юм. Гэсэн хэдий ч FX-8150 нь Core i5-2500 болон Core i7-2600-аас удаан, Core i7-990X-ээс илүү удаан байна. Нөгөөтэйгүүр, шинэ AMD процессор өмнөхөөсөө хожигдох ичгүүртэй нөхцөл байдал байхгүй.

Тус бүрийн хэрэглээний үр дүнгийн дундажийг авч үзвэл, FX-8150 нь бидний багц програмууд дээр Phenom II X6 1100T-ээс 14%-иар хурдан байсан. Энэ нь тохиолдлын талаас бага хувь нь Core i5-2500-аас муугүй ажиллах боломжийг олгосон. Гэсэн хэдий ч Sandy Bridge-ийн дараагийн загвар болох Core i7-2600-ийн ялгаа мэдэгдэхүйц хэвээр байгаа бөгөөд 10% -иас илүү байна.

Энерги зарцуулалт

Бид Бульдозерын гүйцэтгэлийг хүлээн зөвшөөрч болохуйц олон даалгавруудыг олж чадсан ч шинэ бичил архитектур дээр суурилсан процессорууд нь хувьсгалт процессортой огт адилгүй юм. Өмнө нь AMD процессорууд энэ параметрийн хувьд өрсөлдөгчдөөсөө хамаагүй доогуур байсан тул цахилгаан зарцуулалтын цорын ганц найдвар хэвээр байна. Одоо, хэрэв та хөгжүүлэгчдийн амлалтад итгэж байгаа бол бичил архитектур нь эрчим хүчний хэмнэлтэд илүү анхаарч, 32 нм технологийн шинэ процесс нь сайжруулалтад хувь нэмэр оруулах ёстой байсан. цахилгаан шинж чанар. Тиймээс FX-8150-г нэг ватт дахь гүйцэтгэлийн линзээр харцгаая.

Дараах графикууд, өөрөөр заагаагүй бол эрчим хүчний хангамжийн "дараа" хэмжсэн системийн нийт хэрэглээг (мониторгүй) харуулж, системд хамаарах бүх бүрэлдэхүүн хэсгүүдийн эрчим хүчний хэрэглээний нийлбэрийг харуулав. Энэ тохиолдолд цахилгаан хангамжийн үр ашгийг тооцохгүй. Хэмжилт хийх явцад процессор дээрх ачааллыг LinX 0.6.4 хэрэгслийн 64 битийн хувилбар үүсгэсэн. Нэмж дурдахад бид сул зогсолтын эрчим хүчний хэрэглээг зөв тооцоолохын тулд эрчим хүч хэмнэх боломжтой бүх технологийг идэвхжүүлсэн: C1E, C6, AMD Cool"n"Чимээгүй, сайжруулсан Intel SpeedStep.



Сул зогсолттой үед Бульдозерын микроархитектур дээр суурилуулсан процессортой системүүдийн хэрэглээ Phenom II гэр бүлийн CPU-тэй ижил төстэй системүүдийн хэрэглээнээс бага болсон. Гэсэн хэдий ч орчин үеийн Intel LGA1155 системүүд идэвхгүй горимд бага зарцуулдаг.



Тооцооллын ачаалал нэг урсгалтай үед Socket AM3+ системийн хэрэглээ огцом нэмэгддэг нь Turbo Core технологийн өндөр түрэмгий байдлаас шалтгаалж байгаа нь ойлгомжтой. Баригдсан системүүдтэй Intel процессорууд, энэ нь ажиглагдаагүй бөгөөд тэд эрчим хүчний хэмнэлттэй гэдгээрээ дахин сайрхаж чадна.



Бүрэн олон урсгалтай ачаалалтай үед нөхцөл байдал тийм ч их ялгаатай биш юм. Зөвхөн LGA1366 Core i7-990X процессортой систем л "түрүүлээд" байна уу. Тэгэхгүй бол бүх зүйл өмнөх шигээ. Эрчим хүчний хэрэглээний хувьд FX-8150 нь ямар ч амжилтаар бахархдаггүй. Энэ нь Phenom II X6 1100T-ээс арай бага хэрэглэж эхэлсэн боловч Sandy Bridge процессорууд дор хаяж нэг хагас дахин хэмнэлттэй байдаг.

AMD нь цагийн давтамжийг нэмэгдүүлэхийн тулд шинэ бичил архитектурыг нэвтрүүлснээр олж авсан бүх эрчим хүчний үр ашгийг ашигласан. Үүний үр дүнд бид харагдахгүй байна шинэ түвшинүр ашиг, үндсэндээ сайжруулсан гүйцэтгэл. Үүний дагуу нэг ваттын гүйцэтгэлийн хувьд Бульдозер нь өмнөх үеийнх шигээ Intel-ийн өрсөлдөгч бичил архитектураас хамаагүй доогуур юм.

Лавлагааны хувьд бид процессор болон эх хавтангийн тэжээлийн хэлхээнд тусад нь хэмжсэн бүрэн ачаалалтай хэрэглээг танилцуулж байна.






Найман цөмт FX-8150-ийн "цэвэр" хэрэглээ нь хэрэглээнээс давсан байна Элстэй процессоруудГүүр ойролцоогоор хоёр удаа. Хоёр процессор хоёулаа ижил технологийн процессоор үйлдвэрлэгдэж, ижил хүчдэлтэй байдаг тул AMD Бульдозерын бичил архитектурын эрчим хүчний үр ашгийн талаар ярихдаа юу гэсэн үг байсан нь үнэхээр сонирхолтой юм.

Overclocking

Socket AM3+ платформ болон FX цуврал процессорууд нь эхлээд overclocker байдлаар байршдаг. Үүнийг бүх үржүүлэгчийн түгжээг бүрэн тайлж, AMD-ийн ивээл дор явуулсан туршилтууд нотолж байгаа бөгөөд FX-8150 процессоруудын аль нэгийг ашиглан overclock хийх дэлхийн дээд амжилтыг тогтоожээ. Шинэ бичил архитектурыг өндөр давтамжтай ажиллахад оновчтой болгосон гэсэн компанийн мэдэгдэл нь бас ирээдүйтэй харагдаж байна. Бид үнэхээр AMD-ээс шинэ overclocking гайхамшгийг авах гэж байна уу? Шалгацгаая.

Ямар ч FX процессорыг overclock хийх нь маш энгийн бөгөөд тэдний лого дээр "Unlocked" гэж шууд бичсэн байдаг. Процессорын давтамжийг BIOS Setup-ээр эсвэл AMD өөрөө (Overdrive Utility) болон эх хавтангийн үйлдвэрлэгчээс олгодог тусгай хэрэгслүүдээр дамжуулан үржүүлэгчээр өөрчилж болно. Үүний нэгэн адил Socket AM3+ системд хойд гүүр болон процессорт суулгасан санах ойг overclock хийх боломжтой.

Туршилтын явцад бид 4.6 GHz давтамжтайгаар FX-8150-ийн тогтвортой ажиллагааг хангаж чадсан. Энэ төлөвт тогтвортой байдлыг хангахын тулд процессорын тэжээлийн хүчдэлийг 1.475 В хүртэл нэмэгдүүлэх шаардлагатай байсан бөгөөд үүнээс гадна ачааллын шугамын тохируулгын функцийг идэвхжүүлэх шаардлагатай байв. Тогтвортой байдлын туршилтын явцад энэ давтамж дээр ажиллаж байгаа процессорын температур сокет мэдрэгчийн дагуу 85 хэмээс хэтрээгүй эсвэл процессорт суурилуулсан мэдрэгчийн дагуу 75 хэмээс хэтрэхгүй байна. Дулааныг арилгахын тулд NZXT Havik 140 үр ашигтай агаар хөргөгчийг ашигласан гэдгийг бид санаж байна.



Үүний зэрэгцээ бид CPU-д суурилуулсан хойд гүүрийг overclock хийхийг оролдсон гэдгийг анхаарна уу, учир нь түүний давтамжийг нэмэгдүүлэх нь гурав дахь түвшний кэш болон санах ойн хянагчийн хурдад эерэг нөлөө үзүүлдэг. Гэвч харамсалтай нь энэхүү процессорын зангилааны мэдэгдэхүйц overclock нь үл үзэгдэх саадтай тулгарсан бөгөөд бид нэгэн зэрэг түүний тэжээлийн хүчдэлийг нэмэгдүүлэхийг оролдсон ч 2.4 GHz-ээс дээш давтамжтай хүрч чадаагүй юм.

Ямар ч тохиолдолд FX-8150-ийг 4.6 GHz-ээс хэтрүүлэх нь сайн үр дүн юм, ялангуяа Phenom II гэр бүлийн AMD процессорууд агаарт 4.0 GHz-ээс хэтрүүлэх нь ховор байдаг. Өөрөөр хэлбэл, Бульдозерын бичил архитектур нь давтамжийн хязгаарыг бага зэрэг нэмэгдүүлэх боломжтой болгосон.

Гэсэн хэдий ч, FX процессоруудын overclocking нь юуны түрүүнд хуучин Phenom II-тэй биш, харин LGA1155 системүүдийн өрсөлдөх Core i5 болон Core i7 процессоруудтай харьцуулах хэрэгтэй. Гэхдээ тэд үүнээс дордохгүй нь тодорхой байна. Жишээлбэл, Core i5-2500K-ийн ердийн overclock нь нэрлэсэн хэмжээнээс 0.15 В-оор нэмэгдэж, агаар хөргөгч ашиглан 4.7 GHz юм. Үүний цаана FX-8150-ийн үр дүн тийм ч гайхалтай харагдахаа больсон.

Overclocked FX-8150 ба Core i5-2500K-ийн гүйцэтгэлийг харьцуулж үзвэл Замбези хэтрүүлсэн сэтгэгдэл улам дордох болно (нэрлэсэн горимтой харьцуулахад гүйцэтгэлийн өсөлтийг хаалтанд зааж өгсөн болно):



Ерөнхийдөө overclocking нь үр дүнгийн чанарыг өөрчилдөггүй. Гэхдээ FX-8150 нэрлэсэн горимд илүү хурдан байсан бол ялгаа багассан. Core i5-2500 тэргүүлж байсан бол давуу талаа нэгтгэсэн. Энэ нь гайхах зүйл биш юм: Overclock хийх үед FX-8150-ийн давтамж 28% -иар өссөн бол Core i5-2500K давтамжийн өсөлт 42% байв. Ерөнхийдөө, overclocking-ийн гүйцэтгэлийн ашиг тусын хэмжээнээс харахад Сэнди гүүрний бичил архитектур нь давтамж нэмэгдэхэд илүү мэдрэмтгий хариу үйлдэл үзүүлдэг. Өөрөөр хэлбэл, overclocking-ыг тооцсон ч гэсэн Бульдозерын микроархитектур бүхий процессорууд нь нэлээд сайн overclock хийдэг ч Intel-ийн өрсөлдөгчдөөс илүү хүчтэй харагддаггүй.

дүгнэлт

Амжилт эсвэл бүтэлгүйтэл? Та нарын олонхи нь нийтлэлийн төгсгөлд тодорхой шийдвэр гаргахыг хүсч байгаа нь гарцаагүй. Гэсэн хэдий ч, энэ тохиолдолд бүх зүйл маш хоёрдмол утгатай бөгөөд AMD нь өөрийн Бульдозерын тусламжтайгаар тоймчдыг маш хүнд байдалд оруулав.

Баримт нь AMD микроархитектурыг хөгжүүлэхэд огт стандарт бус хандлагыг харуулсан явдал юм. Процессорын гүйцэтгэл нь нэг цагийн мөчлөгт процессорын цөмд гүйцэтгэсэн зааврын тоо, давтамж, цөмийн тоо гэсэн гурван бүрэлдэхүүн хэсгээс бүрддэгийг харгалзан хөгжүүлэгчид тэргүүлэх чиглэлээ цөмийн тоо руу шилжүүлсэн. Үүний зэрэгцээ, бие даасан цөмийн тодорхой гүйцэтгэл буурсан боловч үр дүнд бий болсон загвар нь хямд найман цөмт эсвэл бүр илүү төвөгтэй процессоруудыг бий болгох замыг нээсэн. Энэ нь олон урсгалтай ачаалал, процессортой серверийн зах зээлийн хувьд маш хүчтэй алхам юм их хэмжээнийцөм нь ноцтой эрэлт хэрэгцээтэй байна. Тиймээс, шинэ Бульдозерын бичил архитектур нь AMD-д гүйцэтгэлийн серверийн зах зээл дэх байр сууриа мэдэгдэхүйц сайжруулах боломжийг олгоно.

Гэсэн хэдий ч өнөөдөр бид энэхүү бичил архитектур дээр бүтээгдсэн боловч ширээний компьютерт зориулагдсан FX процессортой танилцлаа. Эндээс л Бульдозерын техник хангамж болон ердийн ширээний ажлын ачаалал хоёрын зөрүү бүрэн тодорхой болсон. Маркетингийн кампанит ажил нь Бульдозерыг ширээний зах зээлд өсөж буй од гэдэгт олон хүн итгэдэг байсан нь сэтгэл дундуур байна. Гэсэн хэдий ч эдгээр итгэл найдвар биелэхгүй байв.


Бульдозерын микроархитектур дээр суурилсан FX процессорууд нь энгийн хэрэглэгчдийн шийддэг багахан хэмжээний даалгавруудад л өөрсдийн давуу талыг харуулж чадсан. Ердийн нийтлэг програмуудын дунд энгийн бүхэл тоон олон урсгалтай ажлын ачааллыг үүсгэдэг жишээ тийм ч олон байдаггүй бөгөөд Бульдозерын өндөр гүйцэтгэл нь зөвхөн энэ тохиолдолд л илэрдэг. Үүний үр дүнд зарим тохиолдолд Бульдозер нь Intel-ийн өрсөлдөгч шийдлүүдээс удаан биш, харин өмнөх үеийн бичил архитектур дээр бүтээгдсэн Phenom II X6 процессороос ч муу болсон. Энэ нь AMD нь хувьсгалт ширээний процессор үйлдвэрлэж чадаагүй гэсэн үг юм.

Үнэн хэрэгтээ FX бол зүгээр л дараагийн Phenom бөгөөд энэ нь өөрөө өмнөх үеийнхтэй харьцуулахад нэлээд сайн юм шиг санагддаг. FX процессор нь ерөнхийдөө Phenom II-ээс илүү хурдан, overclock нь хамаагүй дээр бөгөөд бага зэрэг бага зарцуулдаг тул хуучирсан K10 бичил архитектурын тээвэрлэгчдийн хувьд сайн орлуулагч гэж үзэж болно.

Гэсэн хэдий ч AMD зөвхөн өөртэйгээ төдийгүй өөртэйгөө дайтаж байгааг сануулъя Intel компани. Тиймээс бид FX процессорууд нь зөвхөн видео боловсруулалт, кодчилолд төвлөрсөн ширээний компьютерт л жинхэнэ утга учиртай гэсэн урам хугарсан дүгнэлтийг хэлэхээс аргагүй хэвээр байна. Бусад тохиолдолд Sandy Bridge процессортой харьцуулахад тэдний гүйцэтгэл нь урам зориг өгөх нь ховор байдаг. Эрчим хүчний хэрэглээ болон overclocking талаар ижил зүйлийг хэлж болно. Орчин үеийн 3D тоглоомууд үнэхээр олон урсгалтай алгоритмуудыг бараг ашигладаггүй тул AMD FX процессорууд нь таамаглаж байсанчлан тоглоомын системд муу сонголт болсон гэдгийг тусад нь нэмж хэлэх хэрэгтэй. Гэсэн хэдий ч тоглоомын секундэд фрэймийн тоог процессор биш харин графикаар хязгаарладаг тул AMD-н бүтээгдэхүүний шүтэн бишрэгчид үүнийг тэвчих байх.

Өөрөөр хэлбэл, FX процессоруудын зах зээлийн хэтийн төлөв нь хоёр хүчин зүйлээс хамаарна: AMD-н дэмжигчдийн арми хэр том байх; үйлдвэрлэгч үнийн хөшүүргийг хэр чадварлаг удирдах талаар. Гэсэн хэдий ч Бульдозерын микроархитектур бүхий ширээний процессорууд олны дунд түгээмэл болж чадахгүй нь тодорхой.

AMD нь шинэхэн процессорын архитектурт дуртай байдаггүй. Хэрэв Intel хоёр жил тутам бүтцийг шинэчилдэг бол өрсөлдөгч нь хамгийн сүүлд 2007 онд хуучин K8-ийн шинэчлэгдсэн хувилбар болох K10-ыг гаргасан байна. Тиймээс шинэ бульдозер гарч ирэх нь чухал үйл явдал юм. Ойрын хэдэн жилийн хугацаанд архитектур нь бүх AMD талстуудын үндэс суурь болохоос гадна гүйцэтгэлийн төлөөх өрсөлдөөнд Intel-тэй өрсөлдөх анхны боломж болох болно.

Бид хосоороо явдаг

Бульдозерыг бүтээснээр AMD-ийн инженерүүд хуучин бүтээн байгуулалтыг сайжруулах, хэсэгчлэн хуулбарлах батлагдсан стратегиа орхисон. Чулуунуудын бүтэц нь x86 системд бидний харж байсан зүйлээс үндсэндээ өөр юм.

Эхний бөгөөд хамгийн чухал шинэлэг зүйл бол анхны зохион байгуулалт юм. Бульдозерын бүх шилдэг хувилбарууд албан ёсоор найман цөмөөр тоноглогдсон байдаг. Гэсэн хэдий ч бодит байдал дээр дөрвөн бүрэн хэмжээний модуль байдаг бөгөөд тус бүр нь хоёр тооцоолох нэгжтэй байдаг. Энэ нь дараах байдалтай харагдаж байна: хоёр бүхэл тоон арифметик кластер (тэдгээрийг цөм гэж нэрлэдэг бөгөөд тооцоололд шууд хариуцдаг) нь Front-End, хөвөгч цэгийн кластер (FPU) болон хоёр дахь түвшний кэшийг 2 МБ хүртэл нэмэгдүүлсэн.

Ийм тандемын давуу тал нь орон зай хэмнэх, эрчим хүчний хэрэглээ, үйлдвэрлэлийн зардлыг бууруулах явдал юм. Сул тал - ижил багцыг хуваалцах нь эцсийн гүйцэтгэлд муу нөлөө үзүүлдэг. Их ачаалалтай үед нэг Front-End нь хоёр цөмтэй ажиллах боломжгүй байж магадгүй юм. AMD нь гүйцэтгэлийн алдагдлыг үгүйсгэхгүй: үүний дагуу duo нь бүрэн хэмжээний хоёр цөмт процессороос 20 орчим хувиар сул байна.

Харилцааны хүндрэлүүд

Түгжрэлийг арилгахын тулд Front-End нь хоёр цөмийн хооронд нөөцийг хэрхэн үр ашигтай хуваалцах талаар суралцах ёстой байв. Үүнд хүрэхийн тулд салбарыг урьдчилан таамаглах нэгж болон командын декодлогчийг дахин зохион бүтээсэн бөгөөд энэ нь заавар боловсруулах дөрөв дэх сувгийг (Сэнди гүүрэн дээрх шиг) болон технологийг хүлээн авсан. Салбар Fusion. Сүүлийнх нь зааврын хэсгийг нэг үйлдэлд нааж болно. Энэ бүхэн нь Front-End-ийн ажлыг хурдасгаж, болорыг сул зогсохоос сэргийлнэ.

Цөмүүдийн хувьд энэ нь захиалгагүй, ачаалах/буулгах, L1 кэш болон хоёр тооцоолох кластеруудын багц юм. Ээлжит бус гүйцэтгэх нэгж нь одоо физик файлын бүртгэлтэй болсон. Сэнди гүүрний нэгэн адил ажлын өгөгдлийг хадгалах хаягийг түүн дотор оруулдаг бөгөөд энэ нь үндсэн захиалгагүй дамжуулах хоолойг буулгах боломжийг олгодог. Ачих/буулгах процессор нь буфер нэмэгдэж, хүчин чадал нь хоёр дахин нэмэгдэж, түүнтэй ажиллах чадвартай болсон виртуал хаягууд, энэ нь онолын хувьд L1 өгөгдлийн кэштэй ажиллах хурдыг нэмэгдүүлэх ёстой. Бульдозер дахь сүүлийнх нь 4 дахин бага болсон: K10-д 64 КБ-ын эсрэг 16. Алдагдлыг ажлын хурдаар нөхсөн. L1 нэгдэл хоёроос дөрвөн суваг болж нэмэгдсэн нь хоёр дахин нэмэгдсэн гэсэн үг Охайлтын үр ашгийг нэмэгдүүлэх.

Нэг модульд гурван тооцооллын кластер байдаг: хоёр бүхэл тоо, нэг нь хөвөгч цэгийн өгөгдөлтэй ажиллах зориулалттай. K10-тай харьцуулахад эхний хос нь нэг ALU (тооцоололд оролцдог) болон AGU (санах ойн хаягуудтай харьцсан) алдсан. Онолын хувьд энэ нь оргил гүйцэтгэлийг бууруулсан гэсэн үг юм. Практикт өөрчлөлт нь бараг мэдэгдэхүйц биш байх болно: бүхэл тоон кластеруудыг бүрэн ачаалахад хэцүү байдаг.

Гол өөрчлөлтүүд нь хөвөгч цэгийн нарийн төвөгтэй тооцооллыг хариуцдаг FPU-д нөлөөлсөн. K10-д энэ нь илүү хүчирхэг болсон: нэмэх, үржүүлэх үйлдлийг гүйцэтгэх хос MMX болон 128 битийн FMAC төхөөрөмжийг хүлээн авсан. K10-аас ялгаатай нь FMAC-уудыг бүх нийтийн болгосон: тэдгээр нь бие биенээ сольж чаддаг бөгөөд энэ нь тооцооллын хурдад эерэгээр нөлөөлдөг. Үүнээс гадна тэд үйлдлүүдийг нэг илэрхийлэлд нэгтгэж сурсан нь тооцооллын нарийвчлалыг нэмэгдүүлсэн.

Нэмж дурдахад, FPU шинэчилсэн зааварчилгааг хүлээн авсан. Нэгдүгээрт, процессор нь одоо 256 битийн бүртгэлийг дэмждэг AVX-тэй ажилладаг. Тэдний тооцооллын хувьд Сэнди гүүрний нэгэн адил хоёр FMAC-ийг нэгтгэсэн болно. Хоёрдугаарт, Бульдозер нь SSE 4.2, AENSI, FMA4, XOP заавартай ажиллах боломжтой. Сүүлийн хоёр багц нь AMD-д зориулагдсан. Та болон миний хувьд эдгээр бүх өөрчлөлтүүд нь зөвхөн нэг зүйлийг л илэрхийлдэг - өмнө нь хэд хэдэн цагийн мөчлөгөөр хийгдсэн командуудыг одоо нэгээр тооцох бөгөөд энэ нь гүйцэтгэлд шууд нөлөөлдөг. Үнэн бол хурдыг нэмэгдүүлэхийн тулд програм хангамжийн зааварчилгааг дэмжих шаардлагатай байдаг.

Цавуу ба хайч

Үүний үр дүнд Бульдозерын модуль бүр нь нэг Front-End, L2 ба L1 өгөгдлийн кэш, хоёр бүхэл тоо кластер, хөвөгч цэгийн тоонуудтай ажиллах блокоос бүрдэнэ. Нийтдээ нэг чулуу нь ийм дөрвөн багцыг агуулж болно. Үүний зэрэгцээ тус бүр нь хэд хэдэн нийтлэг элементүүдэд хандах боломжтой. Эхнийх нь DDR3-1866 МГц дэмждэг хоёр сувгийн санах ойн хянагч юм. Хоёр дахь нь L3 кэш бөгөөд түүний хэмжээ K10-тай харьцуулахад 6-аас 8 МБ хүртэл, нэгдэл нь 48-аас 64 суваг хүртэл нэмэгдсэн байна. Сэнди гүүрээс ялгаатай нь L3 кэшийн давтамж нь цөмийн хурдтай давхцдаггүй гэдгийг анхаарна уу. Хэрэв шилдэг загвар нь 3.6 GHz хурдтай ажилладаг бол хамгийн сүүлийн үеийн санах ой нь 2.2 GHz байна. Энэ нь гүйцэтгэлд сөргөөр нөлөөлдөг мэдэгдэхүйц саатал үүсгэдэг. AMD-ийн үзэж байгаагаар энэ золиослол нь өндөр давтамжтай тогтвортой ажиллахын тулд хийгдсэн.

Тадам!

Архитектурын заль мэх, 32 нм технологийн технологитой хэдий ч Бульдозер нь 315 хавтгай дөрвөлжин метр талбайг эзэлдэг. миллиметр. Энэ нь дөрвөлсөн цөмт Сэнди гүүр болон түүнээс өмнөх үеийнхээс нэг хагас дахин их юм Лано. Аз болоход эрчим хүчний хэрэглээг боломжийн хязгаарт байлгасан - 125 Вт.

Найман цөмт загвараас гадна зургаа, дөрөвтэй хувилбарууд байдаг тооцоолох нэгжүүд. Дүү нар нь ижил найман цөмт загвар дээр суурилдаг боловч нэг юмуу хоёр модулийг идэвхгүй болгосон.

Үндсэн давтамж нь 3.1-3.6 GHz хооронд хэлбэлздэг. Sandy Bridge-ийн нэгэн адил Бульдозер нь автомат overclocking технологитой. Хариуцсан тусгай чип Turbo Core 2.0, одоогийн үндсэн ачаалал болон TDP түвшинг хянаж, боломж гармагц процессорын давтамжийг нэмэгдүүлдэг. Топ болорын хувьд бүх модулийг ашиглах үед хурдыг 300 МГц-ээр нэмэгдүүлэх боломжтой. Хэрэв зарим нөөц сул байгаа бол - 600 МГц дээр. Бага ачаалалтай үед Бульдозер нь эрчим хүч хэмнэх горимд ордог бөгөөд үүнийг технологи хариуцдаг Сэрүүн, чимээгүй.

Гараар overclock хийх нь энгийн зүйл юм. Нэгдүгээрт, бүх мөрөнд түгжээгүй үржүүлэгч байна. Хоёрдугаарт, шинээр ирсэн хүмүүс өндрийг сайн авдаг: шингэн азотын дор хуучин Бульдозер дэлхийн шинэ дээд амжилтыг тогтоосон - 8429 МГц.

Хамтрагчид

Бульдозер нь Socket AM3+ дээр ажилладаг. Үндсэндээ энэ нь нэг нэмэлт зүү бүхий бага зэрэг сайжруулсан AM3 юм. Шинэ процессорын залгуур бүхий чипсетийг дууддаг 990FX, 990XТэгээд 970 . Эдгээр нь PCIe 2.0 хянагчаар ялгаатай. Хуучин загвар нь 32 шугамаар тоноглогдсон, залуу нь 16. Түүнээс гадна 990FX болон 990X нь CrossFireX-ийг дэмждэг. Чипсетүүдийн онцлог шинж чанаруудын дунд бид зургаан SATA Rev портыг тэмдэглэж байна. 3 ба 14 USB холбогч 2.0. USB 3.0 хянагч байхгүй.

Бульдозер нь хуучин самбар дээр ажиллах боломжтой гэдгийг анхаарна уу. Танд хэрэгтэй зүйл бол шинэчлэгдсэн BIOS юм. Хязгаарлалтууд: Turbo Core болон Cool"n"Quiet нь хариу өгөх хурдыг бууруулсан бөгөөд зарим эрчим хүч хэмнэх функцууд байхгүй байна.

Бульдозерын процессорын архитектур нь сонирхолтой болсон. Эцэст нь, AMD өөрийгөө хуулбарлахаа больж, үнэхээр шинэ зүйлийг гаргаж ирэв. Харамсалтай нь өрсөлдөгчдөөс тодорхой давуу тал цөөн байна. Зарлагдсан найман цөм байхгүй. Сайнаар хэлэхэд бид Intel Hyper-Threading шиг, гэхдээ техник хангамжийн түвшинд нэмэгдсэн тооцооллын нэгж бүхий дөрвөлсөн цөмт загваруудтай болсон. Санаа нь сайн, гэхдээ гүйцэтгэл нь Front-End хэр хурдан байхаас хамаарна. Бульдозерын жинхэнэ давуу тал нь зөвхөн хөвөгч цэгийн тооцоололд зориулсан хүчирхэг FPU, K10-тай харьцуулахад ажлын давтамжийг нэмэгдүүлэх явдал юм.

Үүнийг гаргацгаая! Оршуулцгаая!

AMD дараах процессоруудыг гаргахаар төлөвлөж байгаагаа зарлав. Тус компани архитектурыг жил бүр шинэчилж, нэг ватт тутамд 15 орчим хувийн гүйцэтгэлтэй байхаар төлөвлөж байна. Хэрэв AMD төлөвлөгөөгөө баримталбал 2012 онд архитектурыг харах болно Овоолуулагч("копер"), жилийн дараа - Уурын дугуй("уурын галзуу"), мөн 2014 оныг зарласнаар санах болно Экскаватор. Барилгын ажил ийм л байна.

Буруу цонхнууд

AMD-ийн мэдээлснээр, Windows 7шинэ бүтээлийн бүрэн боломжийг нээж чадахгүй байна: OS хуваарь нь Бульдозерын онцлогийг харгалздаггүй. Жишээлбэл, шинэ процессоруудын хувьд хоорондоо холбогдсон утаснуудыг нэг модульд хуваарилах нь чухал бөгөөд эс тэгвээс цөм нь хурдан L2 кэшээр биш, харин гурав дахь түвшний санах ойгоор дамжуулан өгөгдөл солилцох болно. Зарим хуваагдсан урсгалуудыг Turbo Core 2.0-ийн үр ашгийг дээшлүүлэхийн тулд ижил төстэй аргаар илүү сайн боловсруулдаг. Нэг цагт тодорхой ажлууд Front End блок дээр илүү их ачаалал үүсгэх бөгөөд тэдгээрийг өөр өөр модулиудаар тараах нь дээр. хамтран ажилласанд баярлалаа Microsoftэдгээр нюансуудыг төлөвлөгчдөө харгалзан үзнэ Windows 8. Гэсэн хэдий ч та гүйцэтгэлийн мэдэгдэхүйц өсөлтийг хүлээх ёсгүй.

Толь бичиг

Бүхэл тоон тооцооллын кластер- бүхэл тоотой (1, 2, 10) үйлдлүүдийг авч үздэг.

Front-End- урьдчилан татах блок. Програмаас командуудыг хүлээн авч процессорт ойлгомжтой хэл рүү хөрвүүлнэ.

FPU- хөвөгч цэгийн өгөгдлийн тооцооллын кластер. Бутархай тоо (1.2345) ба том утгууд (1.2345E-10) бүхий тооцооллыг гүйцэтгэдэг.

Салбарын таамаглалын блок- Дараагийн мөчид програмд ​​ямар өгөгдөл, үйлдлүүд хэрэгтэй болохыг урьдчилан таамаглах. Процессорыг сул зогсохыг зөвшөөрдөггүй.

Командын декодер- програмыг бичил үйлдлүүд болгон хувааж, дараа нь тооцоолох кластерууд ашигладаг.

Захиалга дууссан- онцгой гүйцэтгэлийн блок. Цөмүүдийн хоорондох үйлдлүүдийн хуваарилалтыг авч үзсэн. Зөвхөн өгөгдөл байгаа командуудыг тооцоолоход илгээдэг.

Блокыг ачаалах / буулгах (LSU) - дамжуулагчийн гаралт ба L1 мэдээллийн кэшийн хоорондох өгөгдлийн хөдөлгөөнийг хянадаг.

Кэшийн холбоо- кэшийн шугам, баганыг холбох. Ассоциаци өндөр байх тусам хайлтын хурд бага байх боловч үр ашиг нь өндөр байдаг.

MMX- 8 байт хүртэлх тоонуудтай ажиллах блокуудын багц.

Зааварчилгааны багц- нэг тушаалд хэд хэдэн өгөгдөл дээр үйлдэл хийхийг зөвшөөрөх.

Хүснэгт 1

AMD Buldozer процессоруудын техникийн үзүүлэлтүүд

Тооцооллын цөмийн тоо

Үндсэн давтамж

Турбо үндсэн давтамж

Санах ойн дэмжлэг

Энерги зарцуулалт

Техникийн үйл явц

2011 оны 11-р сарын үнэ

үл мэдэгдэх

Процессорын гүйцэтгэлийг юу бүрдүүлдэг вэ? Өмнө нь гүйцэтгэлийг нэг цагийн мөчлөгт гүйцэтгэсэн зааврын тоо ба энэ процессорын ажиллах давтамжийн үржвэр гэж тодорхойлсон томъёог ашиглаж байсан. Одоо энэ томъёонд гурав дахь хүчин зүйл гарч ирэв - тооцоолох цөмийн тоо. Тиймээс хурдан бүтээгдэхүүн гаргахыг хүсч буй процессор хөгжүүлэгч үүнийг хийх хэд хэдэн сонголттой байдаг.

Гэсэн хэдий ч бүх зүйл тийм ч энгийн биш юм. Тооцооллын цөмийн гүйцэтгэсэн зааврын тоог нэг цагийн мөчлөгт нэмэгдүүлэх нь нэлээд хэцүү ажил юм. Сонгодог x86 програмын кодЭнэ нь зааврын дараалсан гүйцэтгэлийг багтаадаг тул тэдгээрийг зэрэгцүүлэн боловсруулахын тулд процессор нь өндөр үр ашигтай салбарыг урьдчилан таамаглах, зааварчилгааг өөрчлөх нэгжүүдээр тоноглогдсон байх ёстой бөгөөд үүнийг хэрэгжүүлэхэд ихээхэн инженерийн хүчин чармайлт шаардагдана. Үүний зэрэгцээ микроархитектурын хүндрэл нь болорын физик хэмжээст нөлөөлж, цөмийн тоог нэмэгдүүлэхэд хязгаарлалт хийхэд хүргэдэг. Тиймээс хэрэв үйлдвэрлэгч олон тооны цөм бүхий процессор хийх гэж байгаа бол бичил архитектур нь эсрэгээрээ хялбарчлахыг хичээх хэрэгтэй. Энэ нь амаргүй цагийн давтамж. Түүний өсөлтөд бооцоо тавих нь процессорын дотоод блокуудад өөрчлөлт оруулах, гүйцэтгэлийн шугамыг уртасгах шаардлагатай болно. Үр дүн нь дараах байдалтай байна: процессор гүйцэтгэлийн хувьд медаль авахын тулд түүний хөгжүүлэгчид хэд хэдэн параметрүүдийг нэгэн зэрэг оновчтой болгохын тулд шаргуу ажиллах ёстой.

Асуудал нь процессорын гүйцэтгэлийг сайжруулах сонгосон аргуудын аль нэг нь зөвхөн онцгой тохиолдлуудад амжилттай байж болох явдал юм. Бүх програмууд олон тооны цөмтэй үр дүнтэй ажиллах боломжгүй. Зарим алгоритм нь шилжилтийг зөв таамаглах, зааврыг дахин эрэмбэлэх боломжийг олгодоггүй. Мөн зарим тохиолдолд цагийн давтамж нэмэгдсэн ч гүйцэтгэл нь нэмэгддэггүй, учир нь системд бусад саад бэрхшээлүүд байдаг.

Оновчтой тэнцвэрийг олох нь тийм ч хялбар биш бөгөөд хамгийн оновчтой шалгуурыг юу гэж үздэг вэ? Бид зөвхөн хязгаарлагдмал тооны программ дахь процессоруудын гүйцэтгэлийг харьцуулж, тухайн тохиолдлын хувьд хамгийн хурданг нь сонгох боломжтой. Гэсэн хэдий ч энэ нь янз бүрийн туршилтын хэрэгслийг ашигласнаар бид огт эсрэг тооцоолол авахгүй гэсэн баталгаа биш юм. Өнөөдөр бид Zambezi кодын нэрээр алдартай AMD-ийн тэргүүлэх бүтээгдэхүүн болох AMD FX процессоруудын шинэ цувралтай танилцах гэж байгаа тул ийм урт танилцуулгыг энд оруулав. Энэхүү процессор нь маш маргаантай Бульдозерын бичил архитектур дээр суурилдаг бөгөөд энэ нь аль хэдийн олон тооны таагүй сэтгэгдэл цуглуулж чадсан юм. Гэхдээ гол зүйл бол энэ бичил архитектур нь огт муу биш юм. Онцлог шинж чанаруудын хамгийн сайн тэнцвэрийг сонгохдоо хөгжүүлэгчид ихэнх хэрэглэгчдийн хэрэгцээг буруу үнэлж, "үндсэн томъёо" дахь буруу хүчин зүйлд гол анхаарлаа хандуулсан. Үүний үр дүнд шинэ үеийн өндөр хүчин чадалтай шийдлийг гаргах анхны төлөвлөгөө нь буруу болж, нээлтийн амлалтад татагдсан AMD-ийн дэмжигчид хүлээж байснаас тэс өөр зүйлийг хүлээн авав. Гэсэн хэдий ч энэ нь урам хугарах ноцтой бөгөөд бодитой шалтгаан мөн үү? Бид энэ материалд энэ талаар ярих болно.

⇡ Цөм тоолох: найм уу, дөрөв үү?

Гүйцэтгэлийн процессоруудын шинэ загвар дээр ажиллаж байхдаа AMD процессорын цөмийн тоог чухалчлахаар шийджээ. Жил ирэх тусам олон урсгалтай програм хангамж нэмэгдэж байгаа бөгөөд олон жилийн хөгжилд зориулагдсан бичил архитектурыг хөгжүүлэх нь зах зээлийн өнөөгийн байдлыг бус харин юуны түрүүнд харгалзан үзэх ёстой бөгөөд энэ нь бүрэн логик сонголт юм. ажиглагдсан чиг хандлага. Шинэ процессорын үндсэн хувилбарт өгөгдсөн найман цөм нь AMD-ийн зах зээлийг байлдан дагуулж байсан зүйл бөгөөд одоогоор зөвхөн чипүүд гарч ирсэн бөгөөд цөмийн хамгийн дээд тоо нь зургаа хүртэл байсан юм. ( Энд бид зөвхөн ширээний компьютеруудын тухай ярьж байна. - ойролцоогоор. ed. )

Үүний зэрэгцээ хөгжүүлэгчид хуучин K10 бичил архитектурын цөмийг авахыг хүсээгүй. Тэд хэтэрхий том төдийгүй физик хэмжээ, гэхдээ бас Лланогийн дүгнэж байгаачлан орчин үеийн 32 нм технологид шилжсэн ч өндөр давтамжтай ажиллах хандлагатай байдаггүй. Үүнээс гадна тэд AVX заавар гэх мэт орчин үеийн олон функцийг дэмждэггүй. Тиймээс найман цөмт процессоруудыг угсрахын тулд AMD шинэ бичил архитектурыг хийсэн - Бульдозер. Компанийн төлөөлөгчид түүний хөгжлийг эхнээс нь хийсэн гэж хэлэхийг илүүд үздэг боловч үнэн хэрэгтээ Бульдозерын цөмд та энэ жил танилцуулсан өөр нэг бичил архитектур болох Бобкатыг авсаархан, эрчим хүчний хэмнэлттэй төхөөрөмжид ашиглахад чиглэсэн олон лавлагаа олж болно. Гэсэн хэдий ч Бульдозер ба Бобкат хоёрын харилцаа нэлээд хол бөгөөд ерөнхий санаа нь тодорхой болохын тулд бид үүнийг дурдлаа - Бульдозер нь харьцангуй энгийн олон цөмүүдийг нэгтгэдэг.

Үүний зэрэгцээ, бид нэг хагас дамжуулагч чип дээрх найман энгийн цөмийн анхдагч хослолын тухай яриагүй байна. Ийм нөхцөлд үүссэн процессор нь маш бага нэг урсгалтай гүйцэтгэлтэй байх бөгөөд ачааллыг хэд хэдэн тооцооллын хэлхээнд хуваадаггүй програм цөөхөн байдаг тул энэ нь нэлээд ноцтой асуудал болно. Тиймээс, нэгдүгээрт, цөмүүдийг өндөр цагийн хурдтайгаар ажиллуулахаар оновчтой болгосон. Хоёрдугаарт, тэдгээрийг нэг урсгалд үйлчлэхийн тулд нөөцөө хуваалцах чадвартай хоёр цөмт модулиудтай хослуулсан. Үр дүн нь нэлээд сонирхолтой загвар юм: ийм хоёр цөмт модулийн гүйцэтгэх дамжуулах хоолойн оролтын хэсэг нь нийтлэг байдаг бөгөөд цаашдын заавар боловсруулалтыг хоёр багц гүйцэтгэх төхөөрөмжийн хооронд хуваадаг.

Бульдозерын дизайны үндэс нь ердийн хоёр цөмт модуль гэж нэрлэгддэг зүйл юм

Мэдээлэл боловсруулах үйл явц нь орчин үеийн процессорЭнэ нь хэд хэдэн үе шатыг агуулдаг: кэш санах ойноос x86 зааврыг татаж авах, тэдгээрийг тайлах - дотоод макро үйлдэл болгон хөрвүүлэх, гүйцэтгэх, үр дүнг бүртгэх. Бульдозерын модулийн эхний хоёр үе шатыг хос цөмд хамтад нь гүйцэтгэдэг бөгөөд дараа нь бүхэл тоон зааврын хувьд гүйцэтгэлийг хоёр кластер цөмд хуваарилдаг эсвэл бодит арифметикийн хувьд хөвөгч цэгийн үйлдлүүдийн блокоор гүйцэтгэдэг. хоёр цөмд нийтлэг байдаг.

Бульдозерын модулиуд нь нэг цагийн мөчлөгт дөрвөн зааврыг боловсруулахад зориулагдсан бөгөөд макро нэгтгэх технологийн ачаар зарим хос x86 командыг процессор нэг үйлдэл гэж үзэж болно. Энэ нь ерөнхийдөө хоёр цөмт Бульдозерын модуль нь хүчин чадлын хувьд орчин үеийн Intel процессоруудын нэг цөмтэй төстэй бөгөөд цаг тутамд дөрвөн заавар боловсруулж, макро нэгтгэлийг дэмждэг.

Гэсэн хэдий ч Бульдозерын модуль болон Сэнди гүүрний үндсэн хооронд мэдэгдэхүйц ялгаа байдаг бөгөөд энэ нь тэдний ойролцоогоор ижил онолын хурдыг эргэлзээтэй болгож чадна. Шинэ AMD процессоруудын модуль нь хоёр ижил цөмийн үлдэгдлийг агуулсан байдаг тул энэ нь зөвхөн хос утас боловсруулах үед хамгийн их гүйцэтгэлийг харуулж чадна. Хэрэв энэ нь нэг урсгалтай ачааллыг дааж байвал үйлчилгээний хурд нь нэг кластер доторх гүйцэтгэх төхөөрөмжүүдийн тоогоор хязгаарлагдах болно. AMD-ийн бие даасан цөмүүдийг хялбарчлах хүсэлтэй байгаа тул тэдгээрийн тоо тийм ч олон байдаггүй - Sandy Bridge эсвэл K10 бичил архитектуртай процессоруудаас нэг хагас дахин бага. Өөрөөр хэлбэл, хоёр арифметик ALU, хоёр хаяг AGU.

Бульдозерын микроархитектур дээр баригдсан модулийн функциональ бүтэц ийм харагдаж байна. Хоёр цөмөөс зөвхөн хоёр багц бүхэл тооны идэвхжүүлэгч үлдсэн

Процессорын модульд нийтлэг байдаг хөвөгч цэгийн үйлдлүүдийн блок нь мөн нарийн төвөгтэй байдлын хувьд харьцангуй бага юм. Үүнд 128 битийн FMAC гүйцэтгэх хоёр нэгж багтсан бөгөөд тэдгээрийг нэг нэгж болгон нэгтгэж 256 битийн зааврыг боловсруулах боломжтой. Энд тийм ч олон идэвхжүүлэгч байдаггүй юм шиг санагдаж байна, ялангуяа тэдгээрийг хос цөмд хуваасан гэж үзвэл. Гэхдээ тэдгээр нь тусдаа үржүүлэгч, нэмэгч ашигладаг өмнөх болон өрсөлдөж буй бичил архитектуруудаас илүү түгээмэл байдаг. Үүний ачаар зарим тохиолдолд бодит тоонуудтай ажиллахдаа хоёр цөмт бульдозерын модуль нь харьцуулж болохуйц, бүр илүү ихийг өгөх боломжтой. маш сайн гүйцэтгэлЖишээ нь, нэг Сэнди гүүрний цөм.

128 битийн төхөөрөмжүүдийг 256 битийн заавартай хослуулах ижил төстэй санааг Сэнди гүүрт ашигладаг.

Гэсэн хэдий ч бульдозерын модуль нь хос утастай ачааллын дор хамгийн их хүч чадлаа харуулах ёстой. Нэг Sandy Bridge цөм нь хоёр тооцооллын хэлхээг боловсруулах чадвартай бөгөөд үүнд Hyper-Threading технологи байдаг. Гэсэн хэдий ч бүх зааврыг нэг багц идэвхжүүлэгч рүү илгээдэг бөгөөд энэ нь практикт олон тооны мөргөлдөөн үүсгэдэг. Бульдозерын модуль нь хэлхээг зэрэгцүүлэн ажиллуулж чадах бие даасан хоёр бүхэл тоон кластер агуулдаг бөгөөд тэдгээрийн гүйцэтгэх төхөөрөмжүүдийн нийт тоо нь Сэнди гүүрний цөм дэх ийм төхөөрөмжүүдийн тооноос нэг хагас дахин их байна.

Зүүн талд Бульдозерын модуль, баруун талд Hyper-Threading-ийн дэмжлэгтэй өрсөлдөгч цөм байна. Үнэн хэрэгтээ энэ нь Сэнди гүүртэй төстэй биш боловч зураглал нь асуудлын мөн чанарыг харуулж байна.

Үүний үр дүнд Бульдозерын модуль нь Сэнди гүүрний голоос илүү өндөр гүйцэтгэлтэй боловч энэ гүйцэтгэлийг нээхэд арай илүү хэцүү байдаг. Сэнди гүүрний цөм нь нэг урсгалтай кодыг бие даан задлан шинжилж, түүнийгээ бүрэн гүйцэтгэх төхөөрөмж дээрээ зэрэгцүүлэн ажиллуулдаг чип дээрх дэвшилтэт логикийн ачаар өөрийн нөөцийг ухаалгаар ачаалдаг. Бульдозер дээр идэвхжүүлэгчийг үр дүнтэй ашиглах ажлыг программист хэсэгчлэн шилжүүлсэн бөгөөд тэрээр өөрийн кодыг хоёр хэлхээ болгон хуваах ёстой. бүрэн татаж авахЗөвхөн тэр үед л бүх модулийн хүчин чадал боломжтой болно.

Мөн энэ нь ердийн зүйл юм. Хоёр цөмт Бульдозер процессорын модулийг авч үзэхдээ бид үүнийг нэг Сэнди гүүрний цөмтэй байнга харьцуулж, үүнтэй зэрэгцэн нэлээд зөв параллелуудыг зурж чадсан. Энэ нь биднийг гайхшруулж байна: шинэ бичил архитектурын "найман үндсэн" шинж чанарыг маркетеруудын төсөөллийн бүтээгдэхүүн гэж үзэх ёстой гэж үү? AMD нь цөмүүдийг бүхэл тоон кластерын тоогоор тооцох ёстой гэж хэлээд модуль нь бие даасан хоёр цөмийн гүйцэтгэлийн 80 хүртэлх хувийг хангаж чадна гэж маргажээ. Гэсэн хэдий ч, Бульдозер дээр суурилсан цөм нь бусад процессоруудын цөмөөс хамаагүй хялбар гэдгийг мартаж болохгүй. Тиймээс хоёр цөмт модулиудын тоо нь Бульдозерын гүйцэтгэлийг илүү сайн тусгасан шинж чанар юм.

Процессорын цөмийн хамгийн их тоог олоод AMD маркетингийн хэлтэст ажилд ороорой

⇡ Кэш санах ой

Бульдозерын процессоруудын кэш санах ойн зохион байгуулалт нь бие даасан цөмтэй биш, харин хоёр цөмт модулиудтай "уягдсан". Үнэн хэрэгтээ цөм бүрд зөвхөн өөрийн эхний түвшний өгөгдлийн кэш хуваарилагдсан байдаг; кэш санах ойн бусад бүх түвшин нь модуль эсвэл процессортой холбоотой байдаг.

  • Цөм бүр өгөгдөлд зориулсан өөрийн L1 кэштэй. Түүний эзэлхүүн нь 16 KB бөгөөд архитектур нь дөрвөн ассоциатив сувагтай гэж үздэг. Энэ кэш нь бичих алгоритмаар ажилладаг бөгөөд энэ нь багтаамжтай гэсэн үг.
  • Заавруудын эхний түвшний кэшийг хос процессорын модуль бүрт нэг хуулбараар өгдөг. Түүний эзэлхүүн нь 64 KB, нэгдлийн сувгийн тоо хоёр байна.
  • Хоёрдахь түвшний кэш нь нэг модульд нэг тохиолдлоор хэрэгждэг. Түүний хэмжээ нь гайхалтай 2 МБ, нэгдэл нь 16 суваг, үйлдлийн алгоритм нь онцгой юм.
  • Нэмж дурдахад найман цөмт процессор нь бүхэлдээ 64 сувгийн нэгдэл бүхий 8 мегабайт L3 кэштэй. Энэхүү кэшийн онцлог нь процессортой харьцуулахад харьцангуй бага давтамжтайгаар ажилладаг бөгөөд энэ нь ойролцоогоор 2 GHz юм.

Дараах хүснэгтэд найман цөмт Бульдозер, дөрвөн цөмт Сэнди гүүр, Тубан процессоруудын (K10 бичил архитектур дээр бүтээгдсэн зургаан цөмт Phenom II X6) кэш санах ойн эзлэхүүний харьцааг тайлбарлав.

Кэшийн төрөл Бульдозер (8 цөм/4 модуль) Элсэн гүүр (4 цөм) Тубан (6 цөм)
L1I (заавар) 4х64 КБ 4х32 КБ 6x64 КБ
L1D (өгөгдөл) 8х16 КБ 4х32 КБ 6x64 КБ
L2 4х2 МБ 4х256 КБ 6х512 КБ
L3 8 MB, 2.0-2.2 GHz 8 MB, процессорын хурдаар ажилладаг 6 MB, 2.0 GHz

Хүснэгтээс харахад AMD дээд түвшний багтаамжтай кэшүүд дээр тулгуурладаг байсан бөгөөд энэ нь ноцтой олон урсгалтай ачаалалтай үед үнэхээр ашигтай байж болох юм. Гэсэн хэдий ч шинэ процессоруудын кэш санах ой нь өмнөх болон өрсөлдөгч бүтээгдэхүүнүүдийнхээс ерөнхийдөө удаан байдаг. Практик хоцролтыг хэмжихэд үүнийг амархан илрүүлдэг.

Бульдозер дахь өгөгдөлд хандах үед их хэмжээний саатлыг зөвхөн эдгээр CPU-ийн өндөр хурдаар нөхөж болно. Гэхдээ үүнийг анх төлөвлөж байсан - давтамжийн хувьд шинэ найман цөмт процессорууд нь Phenom II-ээс 30% илүү байх ёстой байв. Гэсэн хэдий ч AMD хэзээ ч ийм өндөр давтамжтай тогтвортой ажиллах чадвартай хагас дамжуулагч талстуудыг зохион бүтээж чадаагүй. Үүний үр дүнд кэшийн өндөр хоцрогдол нь Бульдозер дээр суурилсан системд ихээхэн хохирол учруулж болзошгүй юм.