Το AMD Bulldozer είναι η τελευταία γενιά επεξεργαστών AMD. Ποιος είναι Διαχειριστής Συστήματος;

Η AMD αποφάσισε να ακολουθήσει μια εντελώς διαφορετική προσέγγιση για τη νέα αρχιτεκτονική Bulldozer. Αποφασίστηκε να δημιουργηθούν μονάδες διπλού πυρήνα που μοιράζονται ορισμένους πόρους (κρυφή μνήμη L2, μονάδα κινητής υποδιαστολής), αλλά δεν είναι εντελώς ανεξάρτητες μεταξύ τους. (δείτε την παρακάτω εικόνα)
Σύμφωνα με την AMD, αυτό έγινε για να βελτιστοποιηθεί ο επεξεργαστής και ταυτόχρονα να μειωθεί η τιμή του επεξεργαστή. Η βελτιστοποίηση είναι ότι σε συμβατικούς επεξεργαστές πολλαπλών πυρήνων, ορισμένες μονάδες ενδέχεται να είναι σε αδράνεια και τέτοιες μονάδες μπορούν να συνδυαστούν στην αρχιτεκτονική Bulldozer. Και αν υπάρχουν λιγότερες μονάδες, σημαίνει ότι θα σπαταληθεί λιγότερο υλικό και αυτό, με τη σειρά του, θα έχει θετική επίδραση στο κόστος, την εξοικονόμηση ενέργειας και τη μείωση της θερμότητας.
Επομένως, αν και η AMD θα ονομάσει τους νέους επεξεργαστές Bulldozer της dual-core, στην πραγματικότητα δεν θα είναι πραγματικά dual-core, αφού δεν θα έχουν εντελώς ανεξάρτητους πυρήνες. Και το όνομα" επεξεργαστή διπλού πυρήνα» θα χρησιμοποιηθεί για σκοπούς μάρκετινγκ.

για τη δημιουργία " τετραπύρηνους επεξεργαστές", η AMD χρησιμοποιεί δύο από αυτές τις μονάδες, επομένως ο επεξεργαστής έχει στην πραγματικότητα δύο "επεξεργαστές" μέσα (τα δύο δομικά στοιχεία φαίνονται στην παρακάτω εικόνα), αντί για τέσσερις. Η AMD θα συνεχίσει να αποκαλεί τους νέους επεξεργαστές τετραπύρηνους.


Επεξεργαστής οκτώ πυρήνων βασισμένος στην αρχιτεκτονική Bulldozer.

Τώρα ας ρίξουμε μια πιο προσεκτική ματιά στις μονάδες Fetch και Decode που χρησιμοποιούνται στην αρχιτεκτονική Bulldozer.

Ανάκτηση και αποκωδικοποίηση ενοτήτων

Η μονάδα Fetch είναι υπεύθυνη για την ανάκτηση οδηγιών για αποκωδικοποίηση από τη μνήμη cache ή μνήμη τυχαίας προσπέλασης.

Ανάκτηση και αποκωδικοποίηση ενοτήτων.

Όπως έχει ήδη σημειωθεί, οι μονάδες δειγματοληψίας χρησιμοποιούν δύο «πυρήνες» ταυτόχρονα. Η κρυφή μνήμη εντολών L1 χρησιμοποιείται επίσης από δύο πυρήνες ταυτόχρονα, αλλά κάθε πυρήνας επεξεργαστή έχει τη δική του κρυφή μνήμη δεδομένων L1.
Η AMD έχει ήδη ανακοινώσει ότι η κρυφή μνήμη εντολών L1 που χρησιμοποιείται στην αρχιτεκτονική Bulldozer αποτελείται από μια κρυφή μνήμη διπλής κατεύθυνσης 64 KB. Η ίδια ρύθμιση παραμέτρων χρησιμοποιείται σε επεξεργαστές με αρχιτεκτονική AMD64, αλλά η διαφορά είναι ότι οι επεξεργαστές AMD64 έχουν μνήμη cache L1 ανά πυρήνα, ενώ οι επεξεργαστές Bulldozer θα έχουν μία προσωρινή μνήμη L1 ανά ζεύγος πυρήνων. Ωστόσο, η κρυφή μνήμη δεδομένων θα έχει μόνο 16 KB, που είναι σημαντικά λιγότερο από τα 64 KB ανά πυρήνα που χρησιμοποιούνται σε επεξεργαστές που βασίζονται στην αρχιτεκτονική AMD64.

TLB (Μετάφραση Look-aside Buffer- εξαιρετικά γρήγορο buffer μνήμης). Τα μεγέθη των TLB έχουν αποκαλυφθεί. Αυτά είναι buffer με μικρή ποσότητα μνήμης, σχεδιασμένα να μετατρέπουν διευθύνσεις εικονικής μνήμης σε φυσικές διευθύνσεις.
Η εικονική μνήμη, πιο γνωστή ως αρχείο σελίδας, είναι μια τεχνολογία όπου η ποσότητα της μνήμης RAM "αυξάνεται" από ένα ειδικό αρχείο στον σκληρό δίσκο.

Τα προγράμματα υπολογιστών γράφονται χρησιμοποιώντας οδηγίες x86, αλλά επί του παρόντος οι επεξεργαστές κατανοούν μόνο εγγενείς οδηγίες RISC. Η μονάδα αποκωδικοποίησης είναι υπεύθυνη για τη μετατροπή των οδηγιών προγράμματος x86 σε μικροεντολές RISC. Η αρχιτεκτονική Bulldozer έχει τέσσερις αποκωδικοποιητές, αλλά αυτή τη στιγμήΗ AMD δεν αποκαλύπτει ποιες οδηγίες εκτελεί κάθε αποκωδικοποιητής. Συνήθως ένας από αυτούς τους αποκωδικοποιητές εκτελεί περίπλοκες, πολύπλοκες εντολές χρησιμοποιώντας τον παρεχόμενο μικροκώδικα ROM («μκώδικας» ή «μικροκώδικας»). Η αποκωδικοποίηση πολύπλοκων εντολών ολοκληρώνεται μετά από μερικούς κύκλους ρολογιού, μετά τους οποίους μετατρέπονται σε πολλές μικροεντολές. Συνήθως, οι κατασκευαστές βελτιστοποιούν τους επεξεργαστές τους με τέτοιο τρόπο ώστε κατά την αποκωδικοποίηση των πιο συνηθισμένων εντολών, να εκτελούνται σε έναν μόνο κύκλο ρολογιού.

Εισαγωγή Δεν υπάρχει αμφιβολία ότι οι νέοι επεξεργαστές της AMD, βασισμένοι στη μικροαρχιτεκτονική Bulldozer, είναι από τα πιο αναμενόμενα προϊόντα όχι μόνο φέτος, αλλά τουλάχιστον της τρέχουσας πενταετίας. Υπάρχουν αρκετοί λόγοι για αυτό, καθώς και για την ύπαρξη ενός τεράστιου στρατού θαυμαστών για τα προϊόντα AMD. Μερικοί άνθρωποι έχουν νωπές αναμνήσεις από τις εποχές που οι επεξεργαστές αυτής της εταιρείας ήταν καλύτεροι από τους επεξεργαστές της Intel από όλες τις απόψεις. Μερικοί άνθρωποι αγαπούν τα προϊόντα AMD για τον ισορροπημένο συνδυασμό τιμής και απόδοσης. Και κάποιοι εντυπωσιάστηκαν από τις συναισθηματικές ιστορίες της AMD σχετικά με τα πλεονεκτήματα της μικροαρχιτεκτονικής που αναπτύσσεται στην εταιρεία. Όλα αυτά προστέθηκαν σε πολλά χρόνια κουραστικής αναμονής για την κυκλοφορία των επεξεργαστών της γενιάς Bulldozer, και ιδού το αποτέλεσμα - διαβάζετε αυτό το άρθρο με μεγάλη προσοχή και απροκάλυπτο ενδιαφέρον.

Ωστόσο, σαφώς αξίζει τον κόπο. Η κατάσταση στην αγορά των επεξεργαστών τα επόμενα χρόνια εξαρτάται από το πόσο επιτυχημένη θα είναι η μικροαρχιτεκτονική του Bulldozer. Εξάλλου, μόνο η Intel έχει τους πόρους μηχανικής και παραγωγής για να αναπτύξει νέες μικροαρχιτεκτονικές λύσεις κάθε δύο έως τρία χρόνια. Η AMD αναγκάζεται να ακολουθήσει έναν πολύ πιο μετρημένο ρυθμό ανάπτυξης. Είναι τρομακτικό να θυμόμαστε, αλλά η μικροαρχιτεκτονική που χρησιμοποιείται στους σημερινούς επεξεργαστές Phenom II και Athlon II χρονολογείται από το 1999 και από τότε η AMD κάνει μόνο αισθητικές αλλαγές σε αυτήν. Επομένως, δεν έχουμε ιδιαίτερες ψευδαισθήσεις ότι ο κύκλος ανάπτυξης θα γίνει ξαφνικά πιο ενεργός με την κυκλοφορία του Bulldozer. Είναι προφανές ότι το Bulldozer θα βρίσκεται στον πυρήνα των προσφορών απόδοσης της AMD για τα επόμενα χρόνια.

Επί τρέχουσα έκδοσηΤα σχέδια της εταιρείας για την ανάπτυξη αυτής της μικροαρχιτεκτονικής καταρτίζονται μέχρι το 2014, αλλά είναι σχεδόν βέβαιο ότι θα συνεχιστεί περαιτέρω.

Το γεγονός ότι η AMD υπόσχεται αύξηση της απόδοσης κατά 10-15 τοις εκατό κάθε χρόνο είναι περισσότερο ανησυχητικό σύμπτωμα παρά ενθαρρυντικό. Πιθανότατα, μια τέτοια αύξηση θα παρέχεται κυρίως από μια αύξηση στις συχνότητες ρολογιού, και μόνο τότε από κάποιες νέες μικροαρχιτεκτονικές βελτιώσεις.

Με άλλα λόγια, η επιτυχία της μικροαρχιτεκτονικής Bulldozer στην τρέχουσα μορφή της θα έχει καθοριστικό αντίκτυπο στη μελλοντική θέση της AMD, στην ανταγωνιστικότητα των προϊόντων της και, τελικά, στη συνολική κατάσταση στην αγορά των επεξεργαστών.

Φυσικά, δεν μπορεί να αμφισβητηθεί ότι το Bulldozer for AMD δεν είναι το μόνο βασικό προϊόν. Αυτή η μικροαρχιτεκτονική απευθύνεται στο τμήμα επιτραπέζιων υπολογιστών και διακομιστών υψηλής απόδοσης σήμερα. Παράλληλα, η AMD έχει και άλλες προτάσεις για άλλα τμήματα της αγοράς. Για παράδειγμα, οι φθηνοί, οικονομικά αποδοτικοί επεξεργαστές με τη μικροαρχιτεκτονική Bobcat ή τις APU της οικογένειας Llano, που κυκλοφόρησε η εταιρεία νωρίτερα φέτος, δεν είναι λιγότερο σημαντικοί τομείς για την εταιρεία. Και αυτές οι προτάσεις, όπως είδαμε από τα αποτελέσματα των δοκιμών, είναι επιτυχημένες λύσεις που μπορούν να λειτουργήσουν επαρκώς τόσο ως λύσεις για netbooks και nettops, όσο και ως βάση για ολοκληρωμένες πλατφόρμες σε μεσαίες σειρές τιμών.

Ωστόσο, η επιτυχία ή η αποτυχία του Bulldozer έχει πολύ πιο σημαντικές επιπτώσεις. Πρώτον, αυτή η μικροαρχιτεκτονική στοχεύει τμήματα της αγοράς με πολύ υψηλότερα περιθώρια κέρδους - διακομιστές και συστήματα παραγωγικότητας επιτραπέζιων υπολογιστών. Επομένως, μπορεί να έχει πολύ ισχυρότερο αντίκτυπο στην οικονομική κατάσταση της AMD. Δεύτερον, επιτυχία Επεξεργαστές AMDσειρές C, E και A - αυτό, ειλικρινά, δεν είναι καθόλου αξία των μηχανικών που εμπλέκονται στην ανάπτυξη του σχεδιασμού μικροεπεξεργαστή. Η επιτυχία στην αγορά αυτών των CPU (ή των APU, αν μείνουμε στην ορολογία της AMD) πηγάζει από την παρουσία πυρήνων γραφικών της οικογένειας Radeon HD, που βρήκαν τον δρόμο τους στους επεξεργαστές AMD χάρη στην έγκαιρη αγορά της ATI. Το Bulldozer είναι ένα είδος κατατακτήριων εξετάσεων για μια ομάδα μηχανικών που εργάζεται ειδικά στη μικροαρχιτεκτονική των πυρήνων υπολογιστών. Και τρίτον, το Bulldozer θα γίνει τελικά η βάση ολόκληρης της σειράς επεξεργαστών AMD, με εξαίρεση τις λύσεις για ενεργειακά αποδοτικές πλατφόρμες. Έτσι, τελικά, αυτή η μικροαρχιτεκτονική είναι που θα έρθει σε χαμηλότερα τμήματα της αγοράς, εκτοπίζοντας το K10 σχεδόν παντού, συμπεριλαμβανομένων των επεξεργαστών Llano.



Εν ολίγοις, είναι δύσκολο να υπερεκτιμηθεί η σημασία μιας επιτυχημένης κυκλοφορίας επεξεργαστών με τη μικροαρχιτεκτονική Bulldozer. Αυτό είναι ένα εμβληματικό προϊόν τόσο σε συναισθηματικό όσο και σε υλιστικό επίπεδο. Και επομένως θέλω πολύ να δούμε, μεταφορικά μιλώντας, ένα νέο Κ7 ή Κ8 στην πραγματικότητα.

Αλλά ακόμη και πριν από τη δοκιμή, μπορούμε να πούμε ότι οι πιθανότητες επανάληψης ενός τέτοιου φαινομένου είναι μικρές. Η ίδια η Intel βοήθησε την AMD να αδράξει την παλάμη την τελευταία φορά, προσπαθώντας να προωθήσει την κάθε άλλο παρά ιδανική μικροαρχιτεκτονική NetBurst. Στη συνέχεια, οι μηχανικοί της Intel επικεντρώθηκαν στην αύξηση των ταχυτήτων ρολογιού, οι οποίες τελικά συνάντησαν εμπόδια με τη μορφή γιγαντιαίων ρευμάτων διαρροής, ενώ η AMD πρόσφερε μια πιο ισορροπημένη μικροαρχιτεκτονική με στόχο την εκτέλεση περισσότερων εντολών ανά κύκλο ρολογιού. Αλλά αφού η Intel αναθεώρησε το δόγμα της και εισήγαγε μια νέα μικροαρχιτεκτονική Core, η οποία στόχευε επίσης στην εκτέλεση του μέγιστου αριθμού εντολών ανά κύκλο ρολογιού, η AMD έπεσε στη θέση της καθυστερημένης, όπου βρισκόταν μέχρι τώρα.

Είναι προφανές ότι είναι πολύ δύσκολο να ξεπεράσεις τους σύγχρονους επεξεργαστές Intel ως προς τον αριθμό των εντολών που εκτελούνται ανά κύκλο ρολογιού. Η σημερινή μικροαρχιτεκτονική του Sandy Bridge είναι το αποτέλεσμα τουλάχιστον τριών κύκλων βελτιστοποίησης ενός εγγενώς αποδοτικού σχεδιασμού, επομένως δεν μπορούμε να περιμένουμε ακόμη υψηλότερη ειδική απόδοση πυρήνα από την AMD. Επιπλέον, οι μηχανικοί της AMD δεν έθεσαν καν τέτοιο στόχο για τον εαυτό τους.

Η κύρια ιδέα του Bulldozer βρίσκεται αλλού. Σύμφωνα με τους προγραμματιστές, οι επεξεργαστές που βασίζονται σε αυτήν τη μικροαρχιτεκτονική θα πρέπει να παρουσιάζουν καλή απόδοση λόγω των υψηλών ταχυτήτων ρολογιού και του μεγαλύτερου αριθμού υπολογιστικών πυρήνων από τους ανταγωνιστές και τους προκατόχους τους. Ταυτόχρονα, θα πρέπει να παραμείνουν αρκετά κερδοφόροι στην παραγωγή, δηλαδή να μην έχουν πολύ μεγάλο κρύσταλλο ημιαγωγών και να μην επιδεικνύουν πολύ υψηλή απαγωγή θερμότητας όσον αφορά έναν μεμονωμένο πυρήνα.

Μυστικά σχεδίασης πολλαπλών πυρήνων της AMD

Είναι απολύτως σαφές ότι η αύξηση του αριθμού των πυρήνων επεξεργαστή συνεπάγεται αναπόφευκτα αύξηση της περιοχής του τσιπ επεξεργαστή. Ως αποτέλεσμα, αυξάνεται τόσο η πολυπλοκότητα της παραγωγής όσο και το κόστος των τελικών προϊόντων. Επομένως, για παράδειγμα, επεξεργαστές με τον μέγιστο αριθμό πυρήνων υπολογιστών χρησιμοποιούνται σήμερα μόνο στο τμήμα της αγοράς διακομιστών - οι εταιρικοί πελάτες είναι πολύ πιο πρόθυμοι να ξοδέψουν χρήματα από τους μεμονωμένους χρήστες. Το μάθημα που επέλεξε η AMD για να αυξήσει τον αριθμό των πυρήνων διατηρώντας ένα αποδεκτό κόστος των επεξεργαστών που προκύπτουν πρέπει να συνδυαστεί με μια απλοποίηση των ίδιων των πυρήνων. Ωστόσο, από την άλλη πλευρά, η απλοποίηση των πυρήνων συνεπάγεται ένα ανεπιθύμητο αποτέλεσμα - πτώση της απόδοσης σε εφαρμογές με ασθενώς παραλληλισμένα φορτία, από τα οποία υπάρχει ακόμη επαρκής αριθμός αυτή τη στιγμή.

Ως εκ τούτου, οι μηχανικοί της AMD ακολούθησαν το δικό τους δρόμο. Η μικροαρχιτεκτονική των μεμονωμένων πυρήνων έχει γίνει πιο περίπλοκη, αυξάνοντας τον αριθμό των εντολών που εκτελούνται ανά ρολόι όποτε είναι δυνατόν.



Αλλά αποφασίστηκε να γίνει μέρος των πόρων που υπάρχουν συνήθως σε κάθε πυρήνα, αλλά ταυτόχρονα υπερβολικά αποδοτικοί, να μοιράζονται μεταξύ ζευγαριών υπολογιστικών πυρήνων.



Το συγκρότημα διπλού πυρήνα που προέκυψε έγινε το βασικό δομικό στοιχείο για τους επεξεργαστές Bulldozer. Ένας τέτοιος κόμβος, που ονομάζεται ενότητα στην ορολογία της AMD, έχει δύο πλήρεις σειρές ενεργοποιητών ακεραίων. Αλλά ταυτόχρονα, η μονάδα κινητής υποδιαστολής, οι συσκευές προ-ανάκτησης και αποκωδικοποίησης εντολών, καθώς και η κρυφή μνήμη δεύτερου επιπέδου υπάρχουν σε ένα μόνο αντίγραφο για μερικούς πυρήνες και μοιράζονται τους πόρους τους μεταξύ τους. Σύμφωνα με τις εκτιμήσεις των προγραμματιστών, η ισχύς αυτών των στοιχείων είναι αρκετά αρκετή για δύο πυρήνες, καθώς κατά την εξυπηρέτηση ενός μόνο πυρήνα στην πραγματική ζωή είναι συχνά αδρανείς. Επιπλέον, οι καθυστερήσεις στην αδιάλειπτη λειτουργία τους δεν έχουν σοβαρό αντίκτυπο στην απόδοση που προκύπτει.

Σύμφωνα με την ίδια την AMD, μια μονάδα διπλού πυρήνα σχεδιασμένη με τον τρόπο που περιγράφηκε είναι ικανή να προσφέρει έως και το 80% της απόδοσης ενός ολοκληρωμένου επεξεργαστή διπλού πυρήνα. Ταυτόχρονα, η εξοικονόμηση στον προϋπολογισμό του τρανζίστορ (και, κατά συνέπεια, στην περιοχή του κρυστάλλου ημιαγωγών) φτάνει το 44%.

Χάρη σε αυτήν την έξυπνη συμπύκνωση πυρήνα, η AMD μπόρεσε να ενσωματώσει ένα σχέδιο οκτώ πυρήνων (ή τετραπλών μονάδων) στη βασική σχεδίαση της μήτρας ημιαγωγών Bulldozer.



Επιπλέον, ένα αρκετά σημαντικό μέρος του κρυστάλλου δίνεται στη μνήμη cache. Οι κρυφές μνήμες δεύτερου επιπέδου, που μοιράζονται μεταξύ ζευγαριών πυρήνων σε κάθε μονάδα επεξεργαστή, έχουν χωρητικότητα 2 MB και η συνολική μνήμη cache L3 για ολόκληρο τον επεξεργαστή είναι 8 MB. Έτσι, λαμβάνοντας υπόψη την παραδοσιακή αποκλειστική οργάνωση της κρυφής μνήμης της AMD, μπορούμε να πούμε ότι ο συνολικός όγκος τους είναι 16 MB ανά οκταπύρηνο επεξεργαστή. Ταυτόχρονα, η περιοχή του κρυστάλλου ημιαγωγού Bulldozer παραμένει εντός αποδεκτών ορίων, επομένως οι προγραμματιστές της AMD έχουν επιτύχει πλήρως τον στόχο τους.



Σε απόλυτους αριθμούς, αυτό σημαίνει ότι τα μπουλντόζες οκτώ πυρήνων θα έχουν μικρότερο καλούπι ημιαγωγών από, για παράδειγμα, τους εξαπύρηνους επεξεργαστές Thuban (Phenom II X6), που είναι κατασκευασμένοι στη μικροαρχιτεκτονική K10. Ωστόσο, θα πρέπει να ληφθεί υπόψη ότι το Bulldozer θα παραχθεί χρησιμοποιώντας μια πιο προηγμένη τεχνική διαδικασία με πρότυπα 32 nm. Σε σύγκριση με τους σύγχρονους τετραπύρηνους επεξεργαστές Intel Sandy Bridges, οι νέοι οκταπύρηνες επεξεργαστές της AMD θα έχουν μόνο 45% περισσότερη επιφάνεια καλουπιών.

Ωστόσο, οι τετραπύρηνες επεξεργαστές Sandy Bridge, χάρη στην υποστήριξη της τεχνολογίας Hyper-Threading, όπως και το Bulldozer, μπορούν να παρουσιαστούν στο λειτουργικό σύστημα ως επεξεργαστές οκτώ πυρήνων. Αυτό σίγουρα θα προκαλέσει διαμάχη σχετικά με τη νομιμότητα της κλήσης ολοκληρωμένων επεξεργαστών οκτώ πυρήνων Bulldozer. Ωστόσο, πρέπει να γίνει κατανοητό ότι η AMD και η Intel έχουν καταλήξει στο επιτρεπτό της ταυτόχρονης εκτέλεσης οκτώ υπολογιστικών νημάτων με διαφορετικούς τρόπους. Οι προγραμματιστές της Intel έχουν μπει στη μικροαρχιτεκτονική τους Επιπρόσθετα χαρακτηριστικά, επιτρέποντας σε δύο νήματα να τρέχουν μέσα σε έναν πυρήνα, σε ένα σύνολο μονάδων εκτέλεσης. Η AMD, αντίθετα, έκοψε "επιπλέον" μέρη από δύο πλήρεις πυρήνες, αλλά υπήρχαν μόνο δύο σετ ενεργοποιητών μέσα σε κάθε μονάδα.



Ως αποτέλεσμα, η τεχνολογία Hyper-Threading της Intel αυξάνει την απόδοση πολλαπλών νημάτων μόνο κατά 15-20%, ενώ η λύση της AMD δίνει 80% αύξηση στην απόδοση όταν μετακινείται από 4 σε 8 νήματα.

Αν και φυσικά ο ημιαγωγικός κρύσταλλος του οκταπύρηνου Bulldozer, λόγω της αρθρωτής δομής του, μοιάζει πραγματικά πολύ με τον τετραπύρηνο.


Περισσότερες οδηγίες ανά κύκλο;

Η αύξηση του αριθμού των πυρήνων επεξεργαστή από μόνη της δεν θα σας πάει μακριά. Αυτό έγινε σαφές ακόμη και μετά την κυκλοφορία των εξαπύρηνων επεξεργαστών Phenom II X6, οι οποίοι είναι γενικά κατώτεροι σε απόδοση από τους τετραπύρηνους Sandy Bridge. Ως εκ τούτου, οι προγραμματιστές της AMD δεν περιορίστηκαν μόνο σε εκτεταμένες σχεδιαστικές αλλαγές. Η βασική μικροαρχιτεκτονική του Bulldozer, σε σύγκριση με το K10, έχει επανασχεδιαστεί ελαφρώς λιγότερο από πλήρως, γεγονός που δίνει ελπίδα για επιτάχυνση της λειτουργίας συστημάτων σε επεξεργαστές AMD όχι μόνο σε εργασίες πολλαπλών νημάτων, αλλά και σε εφαρμογές με χαμηλό επίπεδο παραλληλισμού. Επιπλέον, αυτές οι ελπίδες βασίζονται σε απολύτως αντικειμενικές συνθήκες. Ενώ οι προηγούμενες μικροαρχιτεκτονικές AMD σχεδιάστηκαν για να εκτελούν τρεις εντολές ανά ρολόι (σε ​​έναν πυρήνα), η μικροαρχιτεκτονική Bulldozer προϋποθέτει την εκτέλεση τεσσάρων εντολών ανά ρολόι και είναι πιο κοντά σε αυτό το χαρακτηριστικό σε ανταγωνιστές επεξεργαστές με μικροαρχιτεκτονική Core.

Οι ποιοτικές αλλαγές μπορούν να εντοπιστούν ξεκινώντας από τα πρώτα στάδια του αγωγού εκτέλεσης - από το στάδιο της προανάκτησης και της αποκωδικοποίησης εντολών. Αυτά τα στάδια είναι κοινά σε ζεύγη πυρήνων μέσα σε μία μονάδα, επομένως η AMD φρόντισε ιδιαίτερα να διασφαλίσει ότι δεν θα γίνουν μικροαρχιτεκτονικό εμπόδιο. Οι οδηγίες λαμβάνονται από την κρυφή μνήμη L1I για αποκωδικοποίηση σε μπλοκ των 32 byte - διπλάσια από ό,τι σε επεξεργαστές με μικροαρχιτεκτονική Core (δεύτερη γενιά). Η ίδια η κρυφή μνήμη εντολών πρώτου επιπέδου έχει χωρητικότητα 64 KB και συσχετισμό δύο καναλιών. Οι οδηγίες που προορίζονται για αποκωδικοποίηση φορτώνονται σε αυτό από την κρυφή μνήμη δεύτερου επιπέδου εκ των προτέρων.

Το μπλοκ πρόβλεψης κλάδου, το οποίο εμπλέκεται πιο άμεσα στη διαδικασία δειγματοληψίας, περιέχει δύο σετ buffer που παρακολουθούν ανεξάρτητα τη δραστηριότητα διαφορετικών πυρήνων. Έτσι, κατά την πρόβλεψη των αποτελεσμάτων των λογικών διακλαδώσεων, το Bulldozer δεν συγχέεται μεταξύ των νημάτων. Δεδομένου ότι η νέα μικροαρχιτεκτονική στοχεύει να λειτουργεί σε υψηλές ταχύτητες ρολογιού, η ποιότητα της μονάδας πρόβλεψης κλάδου είναι υψίστης σημασίας. Ως εκ τούτου, οι αλγόριθμοι που χρησιμοποιούνται σε αυτό έχουν επανασχεδιαστεί πλήρως και η AMD ελπίζει ότι η αποτελεσματικότητα της πρόβλεψης κλάδου του Bulldozer θα βελτιωθεί.



Ο αποκωδικοποιητής εντολών x86 της Bulldozer διαιρεί επίσης τους πόρους του σε δύο πυρήνες και είναι ικανός να αποκωδικοποιήσει έως και 4 εισερχόμενες εντολές ανά κύκλο ρολογιού. Ωστόσο, η απόδοσή του περιορίζεται στην έκδοση μόνο τεσσάρων εντολών μακροεντολών (που προκύπτουν από την αποκωδικοποίηση με όρους AMD), ενώ οι εντολές x86 μπορούν να χωριστούν σε 1-2 ή και περισσότερες εντολές μακροεντολών. Έτσι, αν και ο αποκωδικοποιητής έχει αυξήσει την απόδοσή του κατά ένα τρίτο σε σύγκριση με την προηγούμενη γενιά μικροαρχιτεκτονικής, η ταχύτητά του μπορεί να μην είναι αρκετή, δεδομένου ότι έχει ως αποστολή να υποστηρίζει δύο συμπλέγματα υπολογιστών ακεραίων και ενός πραγματικού αριθμού.

Θα πρέπει να σημειωθεί ότι ένα συγκεκριμένο ανάλογο της τεχνολογίας σύντηξης με οδηγίες σύντηξης μακροεντολών έχει χρησιμοποιηθεί επίσης στο Bulldozer. Ορισμένες ομάδες εντολών x86 μπορούν να συνδυαστούν σε ένα ενιαίο σύνολο και να περάσουν μέσω του αποκωδικοποιητή ως μία εντολή - η AMD ονομάζει αυτό το Branch Fusion.

Οι αποκωδικοποιημένες μακροεντολές κατανέμονται σε τρία υπολογιστικά συμπλέγματα, δύο από τα οποία είναι τα υπολείμματα πλήρους υπολογιστικών πυρήνων και το ένα είναι με πραγματικό αριθμό, που μοιράζεται μεταξύ των πυρήνων. Κάθε ένα από αυτά τα συμπλέγματα έχει τη δική του λογική αναδιάταξης εντολών και τον δικό του χρονοπρογραμματιστή. Αυτό προφανώς σημαίνει ότι η AMD διατηρεί τη δυνατότητα να αντικαταστήσει ή να συμπληρώσει πλήρως ορισμένα από αυτά τα συμπλέγματα σε μελλοντικά προϊόντα.

Η αναδιάταξη των εντολών σε κάθε ένα από τα συμπλέγματα βασίζεται στη χρήση ενός φυσικού αρχείου καταχωρητή, το οποίο αποθηκεύει αναφορές στα περιεχόμενα των καταχωρητών και εξαλείφει την ανάγκη για συνεχείς μεταφορές δεδομένων εντός του επεξεργαστή κατά την αναδιάταξη της σειράς των εντολών. Αυτή η προσέγγιση έχει αντικαταστήσει το buffer αναδιάταξης στη θέση του, καθώς το αρχείο φυσικού μητρώου δεν είναι μόνο πιο αποδοτικό από την άποψη της κατανάλωσης ενέργειας, αλλά και πιο ευνοϊκό για την αύξηση της ταχύτητας ρολογιού του επεξεργαστή.

Τα ακέραια συμπλέγματα περιέχουν δύο μονάδες αριθμητικής εκτέλεσης (ALUs) και δύο μονάδες διευθύνσεων μνήμης (AGUs). Σε σύγκριση με τη μικροαρχιτεκτονική K10, ο αριθμός των συσκευών έχει μειωθεί κατά ένα ALU και ένα AGU, αλλά η AMD διαβεβαιώνει ότι αυτό δεν θα μειώσει σημαντικά την απόδοση, αλλά η περιοχή του πυρήνα θα εξοικονομήσει σημαντικά. Πιστεύουμε εύκολα ότι η ύπαρξη περισσότερων από δύο ALU και AGU σε κάθε σύμπλεγμα ακέραιων αριθμών δεν έχει πρακτικό νόημα, επειδή δεν μπορούν να φτάσουν περισσότερες από τέσσερις εντολές μακροεντολών ανά κύκλο ρολογιού από τον αποκωδικοποιητή για εκτέλεση και από τα δύο συμπλέγματα.



Ταυτόχρονα, οι ενεργοποιητές έχουν γίνει πιο καθολικοί· πρακτικά δεν διαφέρουν στις λειτουργίες τους.

Η οργάνωση του υποσυστήματος της κρυφής μνήμης έχει αλλάξει σοβαρά. Η κρυφή μνήμη L1D μειώθηκε από 64 σε 16 KB και έγινε εγγραφή μέσω εγγραφής. Ταυτόχρονα, η συσχέτισή του αυξήθηκε σε 4 κανάλια, επιπλέον στα οποία προστέθηκε ένας «πρόβλεψη διαδρομής». Η μείωση του μεγέθους της κρυφής μνήμης δεδομένων πρώτου επιπέδου αντισταθμίζεται από μια σημαντική αύξηση της διεκπεραίωσής της· τώρα μπορεί να εξυπηρετήσει έως και τρεις λειτουργίες 128-bit ταυτόχρονα: δύο αναγνώσεις και μία εγγραφή.

Προφανώς, οι αλλαγές στο εύρος ζώνης της κρυφής μνήμης L1D σχετίζονται σε μεγάλο βαθμό με την ανάγκη εφαρμογής οδηγιών AVX 256-bit στη μικροαρχιτεκτονική, η υποστήριξη για την οποία εμφανίστηκε στη μονάδα FPU που μοιράζεται μεταξύ των πυρήνων. Ωστόσο, αυτό δεν σημαίνει ότι οι ενεργοποιητές πραγματικού αριθμού έχουν γίνει 256-bit. Στην πραγματικότητα, η μονάδα Bulldozer έχει δύο συσκευές 128 bit και οι οδηγίες AVX αποκωδικοποιούνται ως συνδεδεμένα ζεύγη εντολών 128 bit. Κατά συνέπεια, για την εκτέλεσή τους, συνδυάζονται συσκευές FMAC (πολλαπλασιασμός-συσσώρευση κινητής υποδιαστολής) και η απόδοση ενός συμπλέγματος με πραγματικό αριθμό μειώνεται σε μία εντολή AVX ανά μονάδα επεξεργαστή ανά κύκλο ρολογιού.



Η FPU δεν έχει τη δική της κρυφή μνήμη πρώτου επιπέδου, επομένως αυτό το σύμπλεγμα λειτουργεί με δεδομένα μέσω ακέραιων συσκευών.

Εφόσον οι μηχανικοί της AMD έχουν ήδη αναλάβει το έργο της υλοποίησης υποστήριξης για τις οδηγίες AVX που προτείνονται από την Intel, άλλα σχετικά σύνολα έχουν προστεθεί στους επεξεργαστές Bulldozer: οδηγίες SSE4.2 και AESNI που στοχεύουν στην επιτάχυνση των λειτουργιών κρυπτογράφησης. Επιπλέον, η AMD εισήγαγε μερικές από τις δικές της εντολές: τον πολλαπλασιασμό-προσθήκη τριών τελεστών FMA4 και το δικό της όραμα για την περαιτέρω ανάπτυξη του AVX - XOP.



Η κρυφή μνήμη L2 στο Bulldozer είναι κοινόχρηστη μέσα στη μονάδα επεξεργαστή και μοιράζεται μεταξύ των πυρήνων. Η χωρητικότητά του είναι εντυπωσιακά 2 MB και η συσχέτισή του είναι 16 κανάλια. Ωστόσο, η καθυστέρηση της κρυφής μνήμης που λειτουργεί σύμφωνα με αυτό το σχήμα αυξήθηκε σε 18-20 κύκλους, παρά το γεγονός ότι το πλάτος του διαύλου παρέμεινε το ίδιο με πριν - 128-bit. Αυτό σημαίνει ότι η προσωρινή μνήμη L2 στο Bulldozer, αν και μεγάλη, δεν είναι πολύ γρήγορη· οι ανταγωνιστικοί και οι προηγούμενοι επεξεργαστές προσφέρουν προσωρινή μνήμη L2 με περίπου τη μισή καθυστέρηση. Σε συνδυασμό με μια μικρή κρυφή μνήμη L1D με καθυστέρηση 4 κύκλων (η οποία είναι επίσης μεγαλύτερη από τη μικροαρχιτεκτονική K10), όλα αυτά δεν φαίνονται πολύ ενθαρρυντικά. Ωστόσο, η AMD ισχυρίζεται ότι η καθυστέρηση της προσωρινής μνήμης έχει αυξηθεί αποκλειστικά για να δώσει στο Bulldozer τη δυνατότητα να λειτουργεί σε υψηλές ταχύτητες ρολογιού.



Επιπλέον, οι μηχανικοί της AMD έχουν εφαρμόσει μια αποτελεσματική μονάδα prefetch, η οποία έχει σχεδιαστεί για να φορτώνει τα απαραίτητα δεδομένα στην κρυφή μνήμη πρώτου και δεύτερου επιπέδου εκ των προτέρων. Η απόδοση αυτών των μπλοκ λέγεται ότι έχει βελτιωθεί και τώρα είναι ακόμη σε θέση να αναγνωρίζουν ακανόνιστες δομές δεδομένων.

Θεωρητικά, το Bulldozer κάνει καλή εντύπωση. Η AMD αναθεώρησε πλήρως την παλιά της προσέγγιση στη μικροαρχιτεκτονική επεξεργαστή και εφάρμοσε έναν εντελώς επανασχεδιασμένο σχεδιασμό. Το οποίο, με την πρώτη ματιά, φαίνεται πολλά υποσχόμενο, επειδή η νέα μικροαρχιτεκτονική είναι βελτιστοποιημένη για την εκτέλεση τεσσάρων, αντί τριών, εντολών ανά κύκλο ρολογιού σε έναν πυρήνα επεξεργαστή. Επιπλέον, υποστηρίζει τη συγχώνευση μακροεντολών εντολών κατά τη διαδικασία αποκωδικοποίησης, η οποία αυξάνει περαιτέρω τη συγκεκριμένη απόδοση.

Αλλά όλα φαίνονται τόσο καλά μόνο όσο κοιτάμε μόνο έναν πυρήνα και δεν σκεφτόμαστε το γεγονός ότι στην πραγματικότητα τέτοιοι πυρήνες συνδυάζονται σε ζεύγη. Και η διπύρηνη μονάδα Bulldozer έχει πάρα πολλά κοινά μέρη για μερικούς πυρήνες. Ειδικότερα, λόγω του γεγονότος ότι μια τέτοια μονάδα έχει μόνο μία μονάδα ανάκτησης εντολών και έναν αποκωδικοποιητή, ο μέγιστος αριθμός εντολών που εκτελούνται ανά κύκλο ρολογιού παραμένει ίσος με τέσσερις για ολόκληρο το συγκρότημα διπλού πυρήνα. Αυτό σημαίνει ότι το λογικό ισοδύναμο για έναν μεμονωμένο πυρήνα Sandy Bridge από άποψη θεωρητικής απόδοσης είναι η ενότητα και όχι ο πυρήνας του Buldozer. Η ικανότητα της μονάδας να εκτελεί δύο νήματα σε αυτήν την περίπτωση μοιάζει με μια απολύτως λογική απόκριση από την AMD στην τεχνολογία Hyper-Threading.

Φυσικά, οι δοκιμές μας σε πραγματικούς επεξεργαστές θα βάλουν τα πάντα στη θέση τους, αλλά ήδη στο στάδιο της εξέτασης της μικροαρχιτεκτονικής, αναγκαζόμαστε να σκεφτούμε ότι η τοποθέτηση του Bulldozer ως πλήρους επεξεργαστών οκτώ πυρήνων είναι ένα τέχνασμα μάρκετινγκ. Μια πιο αξιόπιστη αξιολόγηση των υπολογιστικών δυνατοτήτων αυτών των επεξεργαστών θα πρέπει να βασίζεται στον αριθμό των μονάδων, οι οποίες, από την άποψη της θεωρητικής απόδοσης, είναι απόλυτα συγκρίσιμες με τους πυρήνες που έχουν κατασκευαστεί στη μικροαρχιτεκτονική Intel Core δεύτερης γενιάς.

Από αυτή την άποψη, τίθεται ένα απολύτως λογικό ερώτημα - γιατί η AMD ασχολήθηκε ακόμη και με την υλοποίηση της επεξεργασίας διπλού νήματος σε μια ενιαία μονάδα επεξεργαστή; Γιατί δεν ήταν δυνατός ο συνδυασμός ενεργοποιητών κατανεμημένων σε δύο πυρήνες σε ένα ενιαίο σύμπλεγμα; Υπάρχουν διάφοροι λόγοι για αυτό.

Πρώτον, για να φορτωθεί ταυτόχρονα ένας μεγάλος αριθμός ενεργοποιητών με εργασία, στη γενική περίπτωση, απαιτείται προηγμένη λογική εντός του επεξεργαστή. Η AMD, προφανώς, δεν μπόρεσε να εφαρμόσει εξαιρετικά αποτελεσματικές μονάδες πρόβλεψης διακλαδώσεων και εντολών και προανάκτησης δεδομένων στη μικροαρχιτεκτονική Bulldozer. Επομένως, το έργο της παραλληλοποίησης της εργασίας και της βέλτιστης χρήσης των συσκευών εκτέλεσης μετατίθεται στους κατασκευαστές λογισμικού, οι οποίοι πρέπει να παρέχουν προϊόντα με υποστήριξη πολλαπλών νημάτων για το Bulldozer.

Δεύτερον, η αύξηση του αριθμού των νημάτων που εκτελούνται ταυτόχρονα δεν είναι τόσο κακό. Εάν για τους χρήστες επιτραπέζιων υπολογιστών, και ειδικά για τους παίκτες, οκτώ αρκετά απλοί πυρήνες Bulldozer δεν υπόσχονται ιδιαίτερα πλεονεκτήματα, τότε στις εφαρμογές διακομιστή μια τέτοια μικροαρχιτεκτονική θα πρέπει να αντιμετωπίζεται πολύ ευνοϊκά. Έτσι, είναι πολύ πιθανό ότι ο κύριος στόχος στην ανάπτυξη του Bulldozer δεν ήταν να ικανοποιήσει τις φιλοδοξίες των ενθουσιωδών, αλλά να αποκαταστήσει τη θέση της AMD στην αγορά των διακομιστών.

Turbo Core ακόμα πιο Turbo

Η ενεργειακή απόδοση είναι ένα από τα τα πιο σημαντικά χαρακτηριστικάσύγχρονους επεξεργαστές. Για παράδειγμα, στο δικό τους μελλοντικές μικροαρχιτεκτονικέςΗ Intel δίνει προσοχή στη μείωση της κατανάλωσης ενέργειας σχεδόν στην πρώτη θέση. Η AMD δεν έχει φτάσει ακόμη σε αυτό το σημείο· οι μηχανικοί αυτής της εταιρείας παλεύουν πρωτίστως για επιδόσεις. Αλλά αυτό δεν σημαίνει ότι οι προγραμματιστές δεν νοιάστηκαν καθόλου για τα θερμικά και ενεργειακά χαρακτηριστικά του Bulldozer. Αντίθετα, ακολουθώντας τον Llano, θεμελιωδώς νέες προσεγγίσεις για την αύξηση της ενεργειακής απόδοσης έχουν βρει το δρόμο τους στους επεξεργαστές Bulldozer. Ωστόσο, σε αυτήν την περίπτωση, οι μηχανικοί χρησιμοποίησαν το δυναμικό που απελευθερώθηκε όχι τόσο για να εξοικονομήσουν χρήματα, αλλά για να αποσπάσουν πρόσθετες επιδόσεις αυξάνοντας τις συχνότητες ρολογιού.

Φυσικά, η νέα τεχνολογία παραγωγής έχει φέρει ορισμένες βελτιώσεις όσον αφορά την κατανάλωση ενέργειας και την απαγωγή θερμότητας. Το Bulldozer χρησιμοποιεί τεχνολογία διεργασίας 32 nm που χρησιμοποιεί διηλεκτρικό υλικό υψηλής ποιότητας, μεταλλικά τρανζίστορ πύλης και τεχνολογία SOI. Με άλλα λόγια, πρόκειται για την ίδια τεχνική διαδικασία της GlobalFoundries που παράγει επεξεργαστές Llano. Χάρη σε νέα τεχνολογίαΜε πρότυπα 32 nm, οι τάσεις τροφοδοσίας λειτουργίας των σειριακών επεξεργαστών Bulldozer οκτώ πυρήνων δεν υπερβαίνουν τα 1,4 V.

Ωστόσο, η κύρια καινοτομία που πέρασε από το Llano στο Bulldozer είναι τα τρανζίστορ πύλης ισχύος, σχεδιασμένα να διακόπτουν την τροφοδοσία από ορισμένα μέρη του επεξεργαστή. Στο Bulldozer, σας επιτρέπουν να εκτονώνετε ανεξάρτητα την τάση από μεμονωμένες μονάδες διπλού πυρήνα και από τη μνήμη cache.



Όταν και οι δύο πυρήνες υπολογιστών στη μονάδα εισέρχονται στην κατάσταση εξοικονόμησης ενέργειας C6, η μονάδα απενεργοποιείται. Δυστυχώς, αυτή η τεχνολογία δεν μπορεί να εφαρμοστεί σε πυρήνες επεξεργαστών, καθώς απλά δεν υπάρχουν αποκλειστικοί πυρήνες μέσα στο Bulldozer - μοιράζονται μερικούς από τους πόρους με τους γείτονές τους.

Οι καταστάσεις εξοικονόμησης ενέργειας των πυρήνων C6 ελέγχονται με την τεχνολογία Bulldozer και Turbo Core. Σε εκείνες τις στιγμές που τουλάχιστον οι μισές μονάδες επεξεργαστή Bulldozer βρίσκονται σε κατάσταση απενεργοποίησης εξοικονόμησης ενέργειας, αυξάνει την τάση τροφοδοσίας και τη συχνότητα ρολογιού. Αυτή η αναγκαστική λειτουργία λειτουργίας ονομάζεται Max Turbo Boost.

Ωστόσο, το Max Turbo Boost δεν είναι κάτι καινούργιο· αυτό το αυτόματο overclocking εισήχθη από την AMD σε επεξεργαστές Thuban που βασίζονται στη μικροαρχιτεκτονική K10. Αυτό που είναι πραγματικά νέο είναι η λειτουργία All Core Boost, στην οποία η ταχύτητα του ρολογιού μπορεί να αυξηθεί πάνω από την ονομαστική τιμή ακόμα και όταν όλοι οι πυρήνες επεξεργαστών είναι ενεργοί. Η βελτιωμένη έκδοση του Turbo Core που εφαρμόζεται στο Bulldozer επιτρέπει στον επεξεργαστή να κρίνει με καλή ακρίβεια την πρακτική κατανάλωση ενέργειας και την απαγωγή θερμότητας, με βάση πληροφορίες σχετικά με το φόρτο εργασίας ορισμένων μπλοκ. Αντίστοιχα, εάν, σύμφωνα με αυτήν την αξιολόγηση, η τρέχουσα απαγωγή θερμότητας και η κατανάλωση ισχύος είναι σημαντικά κάτω από το όριο, ο επεξεργαστής μπορεί να αυξήσει την τάση τροφοδοσίας και τη συχνότητα ρολογιού ακόμα κι αν κανένας πυρήνας δεν βρίσκεται σε παθητική κατάσταση.



Έτσι, η συχνότητα λειτουργίας των επεξεργαστών με τη μικροαρχιτεκτονική Bulldozer είναι μια εξαιρετικά μεταβλητή τιμή. Ανάλογα με τη «σοβαρότητα» των αλγορίθμων που εκτελούνται και τον αριθμό των εμπλεκόμενων πυρήνων, μπορεί να αλλάξει δυναμικά σε ένα πολύ μεγάλο εύρος, φτάνοντας τα 900 MHz.

Ενημερωμένη πλατφόρμα επιφάνειας εργασίας

Με την εισαγωγή της νέας μικροαρχιτεκτονικής, η AMD όχι μόνο δεν άλλαξε τη σχεδίαση της πλατφόρμας, αλλά διατήρησε ακόμη και τη συμβατότητα των επεξεργαστών Bulldozer με την υπάρχουσα υποδομή. Αντίστοιχα, όπως και οι προκάτοχοί τους, οι νέοι επεξεργαστές περιέχουν μια ενσωματωμένη βόρεια γέφυρα, που περιλαμβάνει μια κρυφή μνήμη τρίτου επιπέδου, έναν ελεγκτή μνήμης και έναν ελεγκτή διαύλου Hyper-Transport. Ταυτόχρονα, παρά το γεγονός ότι όλοι οι νέοι επεξεργαστές AMD και Intel έχουν επίσης ενσωματωμένο ελεγκτή διαύλου γραφικών PCI Express, το Bulldozer δεν διαθέτει αυτό.



Ακριβώς όπως στους επεξεργαστές που έχουν κατασκευαστεί στη μικροαρχιτεκτονική K10, η ενσωματωμένη βόρεια γέφυρα στο Bulldozer χρησιμοποιεί τη δική της συχνότητα ρολογιού, η οποία έχει ρυθμιστεί στα 2,0-2,2 GHz για διαφορετικά μοντέλα. Σημειώστε ότι αυτή η συχνότητα έχει κάποιο αντίκτυπο στην απόδοση, καθώς επηρεάζει άμεσα την ταχύτητα της κρυφής μνήμης L3. Το οποίο στην τρέχουσα έκδοση επεξεργαστών έχει αυξημένο όγκο στα 8 MB και έχει συσχετισμό 64 καναλιών. Ανταποκρινόμενοι στις επιθυμίες των εταιρικών χρηστών, τα δεδομένα που είναι αποθηκευμένα σε αυτήν την κρυφή μνήμη προστατεύονται από κωδικό διόρθωσης σφάλματος ECC.

Ο ελεγκτής μνήμης που είναι ενσωματωμένος στο Bulldozer δεν έχει ουσιαστικά νέες δυνατότητες. Όπως και πριν, υποστηρίζει DDR3 SDRAM, χρησιμοποιεί σχεδίαση διπλού καναλιού και, στην πραγματικότητα, αποτελείται από δύο ανεξάρτητους ελεγκτές μονού καναλιού που μπορούν να λειτουργήσουν είτε σε ζεύγη είτε σε μη συνδεδεμένη λειτουργία. Η AMD πρόσθεσε μόνο υποστήριξη για τύπους μνήμης υψηλότερης ταχύτητας, δηλώνοντας συμβατότητα με το DDR3-1867 και φρόντισε για τη συμβατότητα με ενεργειακά αποδοτικές μονάδες με τάσεις λειτουργίας 1,25 και 1,35 V.

Μιλώντας για την επιτραπέζια τροποποίηση Bulldozer, η οποία έχει τη δική της κωδική ονομασία Zambezi, πρέπει να σημειωθεί ότι στοχεύει σε ένα νέο Πλατφόρμα υποδοχής AM3+, γνωστό και με την κωδική ονομασία Scorpius. Επεξεργαστής πρίζαΤο AM3+ έχει 942 ακίδες, μία ακίδα παραπάνω από το Socket AM3. Ωστόσο, παρόλα αυτά, το Zambezi παραμένει συμβατό με παλαιότερες πλακέτες Socket AM3. Κατά την εγκατάσταση νέων επεξεργαστών σε παλιές μητρικές, στην πραγματικότητα, χάνονται μόνο ορισμένες λειτουργίες διαχείρισης ενέργειας. Έτσι, η ταχύτητα εναλλαγής συχνότητας μειώνεται όταν εκτελούνται οι τεχνολογίες Turbo Core και Cool"n"Quiet και το Vdrop δεν λειτουργεί.

Ωστόσο, τη στιγμή που κυκλοφόρησε το Zambezi, η AMD και οι κατασκευαστές μητρικές πλακέτεςέχουν ετοιμάσει έναν γαλαξία νέων προϊόντων που βασίζονται στα νέα λογικά σετ της σειράς 900. Η δομή ενός τυπικού συστήματος που βασίζεται στον επεξεργαστή Zambezi και βασίζεται στο νέο chipset φαίνεται στο μπλοκ διάγραμμα παρακάτω.


Οι διαφορές μεταξύ του νέου chipset AMD 990FX (και των απλοποιημένων εκδόσεων AMD 990X και AMD 970) έγκεινται αποκλειστικά στην υποστήριξη των συγκεκριμένων ηλεκτρικών ιδιοτήτων του Socket AM3+ και δεν φέρνουν μαζί τους νέες διεπαφές. Όπως και τα chipset της σειράς 800, η ​​νέα νότια γέφυρα διαθέτει έξι θύρες SATA 6 Gbps και δεκατέσσερις θύρες USB 2.0. Ανεξάρτητα από το πόσο θα θέλαμε να δούμε υποστήριξη για τις προδιαγραφές PCI Express 3.0 ή, στη χειρότερη, θύρες USB 3.0 στα νέα λογικά σύνολα συστήματος, δεν υπάρχει τίποτα παρόμοιο σε αυτά και αυτή τη φορά. Αυτό, παρεμπιπτόντως, είναι πολύ περίεργο, επειδή η υποστήριξη USB 3.0 εισήχθη σε chipset για την πλατφόρμα Socket FM1 χαμηλότερου επιπέδου.

Οι διαφορές μεταξύ των τροποποιήσεων της νέας σειράς συνόλων λογικής συστήματος συνίστανται αποκλειστικά στην υποστήριξη διαφόρων διαμορφώσεων πολλαπλών GPU.


Σειρά επεξεργαστών Zambezi

Η κυκλοφορία των επεξεργαστών Zambezi ολοκληρώνει την ενημέρωση γκάμα μοντέλων, προσφέρεται από την AMD. Οι επιτραπέζιοι επεξεργαστές που βασίζονται στη μικροαρχιτεκτονική Bulldozer θα γίνουν η νέα ναυαρχίδα αυτού του κατασκευαστή και θα εκτοπίσουν γρήγορα κάθε είδους τροποποιήσεις Phenom II από την αγορά.

Δίνοντας έμφαση στην καινοτομία της νέας μικροαρχιτεκτονικής, η AMD θα χρησιμοποιήσει ένα νέο εμπορικό όνομα για τους επιτραπέζιους επεξεργαστές Zambezi - FX. Αφενός ταιριάζει απόλυτα στη νέα ονοματολογία που περιλαμβάνει τη σήμανση των επεξεργαστών με γράμματα και αφετέρου αποτελεί αναφορά στους θρυλικούς επεξεργαστές Athlon 64 FX, που πριν από έξι ή επτά χρόνια ήταν οι ταχύτεροι επιτραπέζιοι επεξεργαστές. Ωστόσο, αυτές οι μέρες έχουν περάσει αμετάκλητα, οπότε ας δούμε τι είναι έτοιμη να μας προσφέρει τώρα η AMD.

Στο εγγύς μέλλον, η γκάμα των επεξεργαστών της σειράς FX θα περιλαμβάνει τέσσερα μοντέλα.



Παρά το γεγονός ότι η διαφορά μεταξύ των μοντέλων επεξεργαστών Zambezi δεν είναι μόνο στις ταχύτητες ρολογιού, αλλά και στον αριθμό των ενεργών πυρήνων υπολογιστών, όλοι θα βασίζονται στο ίδιο ενοποιημένο τσιπ ημιαγωγών. Εδώ είναι:



Για να αποκτήσει επεξεργαστές με λιγότερους από οκτώ πυρήνες, η AMD θα απενεργοποιήσει ορισμένους από αυτούς στο τσιπ ημιαγωγών. Η δυνατότητα ξεκλειδώματος τους πίσω, όπως ήταν δυνατό με τους επεξεργαστές με τη μικροαρχιτεκτονική K10, εξακολουθεί να αμφισβητείται. Ωστόσο, στο BIOS των μητρικών που βασίζονται σε σετ λογικής σειράς 900 που έχουν περάσει από το εργαστήριό μας, υπάρχουν οι αντίστοιχες επιλογές, οπότε υπάρχει ελπίδα για μια ευνοϊκή λύση σε αυτό το θέμα.

Η απενεργοποίηση των πυρήνων για την απόκτηση τροποποιήσεων επεξεργαστών έξι πυρήνων και τετραπύρηνων θα συμβεί "μονάδα προς μονάδα". Δηλαδή, θα μπλοκαριστούν ολόκληρες οι διπύρηνες μονάδες και όχι οι «δεύτεροι» πυρήνες μέσα τους, αν και μια τέτοια τακτική θα ήταν πολύ πιο ωφέλιμη από πλευράς απόδοσης. Ωστόσο, η κυκλοφορία εξαπύρηνων και τετραπύρηνων επεξεργαστών που βασίζονται στη μικροαρχιτεκτονική Bulldozer εξηγείται όχι τόσο από λόγους μάρκετινγκ όσο από την ανάγκη εφαρμογής απόρριψης, η οποία, δεδομένων των μάλλον μεγάλων διαστάσεων του τσιπ και της νέας τεχνολογικής διαδικασίας, θα είναι αρκετά.

Παρά το γεγονός ότι η AMD ακονίζει τη νέα μικροαρχιτεκτονική ώστε να λειτουργεί σε υψηλές συχνότητες ρολογιού, δεν μπορούμε ακόμη να ονομάσουμε τις επιτευχθείσες τιμές εντυπωσιακή ανακάλυψη. Το φράγμα των τεσσάρων gigahertz παραμένει ακαταπόνητο και η ονομαστική συχνότητα του παλαιότερου επεξεργαστή FX είναι ακόμη χαμηλότερη από, για παράδειγμα, του Phenom II X4 980. Θα θέλαμε να ελπίζουμε ότι με τη βελτίωση της τεχνολογίας παραγωγής, οι συχνότητες Zambezi θα ανέβουν γρήγορα . Αν και, αν πιστεύετε στην τρέχουσα έκδοση των σχεδίων της AMD, η γραμμή θα επιταχυνθεί όχι νωρίτερα από το πρώτο τρίμηνο του 2012.

Δεν υπάρχει σημαντική πρόοδος όσον αφορά την απελευθέρωση θερμότητας και την κατανάλωση ενέργειας. Η AMD έχει συζητήσει εδώ και καιρό για το πώς η μικροαρχιτεκτονική Bulldozer θα είναι πιο ενεργειακά αποδοτική, αλλά στην πραγματικότητα τα παλαιότερα μοντέλα οκτώ πυρήνων έχουν το ίδιο επίπεδο TDP με το παλαιότερο Phenom II. Είναι αλήθεια ότι μετά από κάποιο χρονικό διάστημα η εταιρεία θα πρέπει να προσθέσει στις προσφορές της μια έκδοση 95 Watt του FX-8120 και έναν επεξεργαστή FX-8100 με την ίδια υπολογισμένη απαγωγή θερμότητας.

Αλλά οι τιμές των νέων επεξεργαστών της σειράς FX φαίνονται κάτι παραπάνω από ελκυστικές. Η AMD δεν θέλει να παρεκκλίνει από την πορεία της να προσφέρει πλατφόρμες σε πιο ευνοϊκή τιμή από τους ανταγωνιστές της, επομένως τα παλαιότερα μοντέλα Zambezi οκτώ πυρήνων αντιτίθενται στους παλαιότερους επεξεργαστές Intel Core i5. Γενικά, η AMD σχεδιάζει να τηρήσει το ακόλουθο σχήμα τοποθέτησης για τα προϊόντα της:



Με άλλα λόγια, η AMD δεν σκοπεύει να ανταγωνιστεί τους εξαπύρηνους επεξεργαστές της Intel και την πολλά υποσχόμενη πλατφόρμα LGA2011, αλλά θέλει να επικεντρωθεί στην κατάκτηση του τμήματος της μεσαίας τιμής.

Καλά νέα για τους λάτρεις θα είναι το γεγονός ότι δεν θα αποκλειστούν πολλαπλασιαστές σε όλους τους επεξεργαστές της σειράς FX. Όλα τα Zambezi όχι μόνο μπορούν να υπερχρονιστούν εύκολα με απλή αλλαγή του πολλαπλασιαστή βάσης, αλλά μπορούν επίσης να διαμορφωθούν ξανά με την τεχνολογία Turbo Core. Επίσης, διατίθεται overclocking του υποσυστήματος μνήμης και της συχνότητας της βόρειας γέφυρας που είναι ενσωματωμένη στον επεξεργαστή.

Επεξεργαστής δοκιμής: AMD FX-8150

Η AMD έστειλε στους συντάκτες μας τον ανώτερο επεξεργαστή της οικογένειας Zambezi, FX-8150.



Έχει ονομαστική ταχύτητα ρολογιού 3,6 GHz και περισσότερο λεπτομερείς πληροφορίεςΤα χαρακτηριστικά του μπορούν να ληφθούν από το δεδομένο στιγμιότυπο οθόνης του CPU-Z.



Λάβετε υπόψη ότι ο επεξεργαστής βασίζεται στο βήμα B2 – και αυτή δεν είναι η πρώτη έκδοση. Προηγούμενες τροποποιήσεις του κρυστάλλου ημιαγωγών απορρίφθηκαν από τον κατασκευαστή επειδή δεν μπορούσαν να λειτουργήσουν στις αρχικά προγραμματισμένες συχνότητες ρολογιού. Αυτό είναι που προκάλεσε κάποια καθυστέρηση στην ανακοίνωση, η οποία αρχικά είχε προγραμματιστεί την άνοιξη, στη συνέχεια το καλοκαίρι, αλλά στην πραγματικότητα συνέβη στα μέσα Οκτωβρίου.

Ωστόσο, η συχνότητα των 3,6 GHz που επιτυγχάνεται σήμερα δεν φαίνεται πολύ εντυπωσιακή. Τόσο η ίδια η AMD όσο και η Intel έχουν προϊόντα που τρέχουν σε υψηλότερες ταχύτητες. Ωστόσο, ο FX-8150 διαθέτει πολλά υποσχόμενη τεχνολογία Turbo Core, η οποία, υπό χαμηλό φορτίο, μπορεί να αυξήσει αυτόματα τη συχνότητα του επεξεργαστή έως και 4,2 GHz.



Αξιοσημείωτο είναι ότι μπορεί να επιτευχθεί συχνότητα 3,9 GHz ακόμη και αν το φορτίο είναι σε όλους τους πυρήνες υπολογιστών, αλλά ταυτόχρονα αφήνει περιθώρια για αυτόματο υπερχρονισμό χωρίς να υπερβαίνει τα όρια κατανάλωσης ενέργειας και απαγωγής θερμότητας.



Όταν είναι σε αδράνεια, η τεχνολογία Cool"n"Quiet μειώνει τη συχνότητα του FX-8150 στα 1,4 GHz. Η τάση τροφοδοσίας πέφτει στα 0,85 V.


Πώς δοκιμάσαμε

Συγκρίναμε τον νέο οκταπύρηνο επεξεργαστή AMD FX-8150, που βασίζεται στη μικροαρχιτεκτονική Bulldozer, με έναν από τους προκατόχους του, τον εξαπύρηνο Phenom II X6, και με ανταγωνιστικές (τιμολογημένες) προσφορές Intel - quad-core Βασικοί επεξεργαστές i5-2500 και Core i7-2600. Επιπλέον, για μεγαλύτερη σαφήνεια, στα αποτελέσματα έχουν προστεθεί δείκτες απόδοσης για τον εξαπύρηνο επεξεργαστή Core i7-990X.

Ως αποτέλεσμα, τα συστήματα δοκιμής περιλάμβαναν τα ακόλουθα στοιχεία λογισμικού και υλικού:

Επεξεργαστές:

AMD FX-8150 (Zambezi, 8 πυρήνες, 3,6 GHz, 8 MB L2 + 8 MB L3);
AMD Phenom II X6 1100T (Thuban, 6 πυρήνες, 3,3 GHz, 3 MB L2 + 6 MB L3);
Intel Core i7-2600K (Sandy Bridge, 4 πυρήνες, 3,4 GHz, 1 MB L2 + 8 MB L3);
Intel Core i5-2500K (Sandy Bridge, 4 πυρήνες, 3,3 GHz, 1 MB L2 + 6 MB L3);
Intel Core i7-990X Extreme Edition(Gulftown, 6 πυρήνες, 3,46 GHz, 1,5 MB L2 + 12 MB L3).

Ψύκτη CPU: NZXT Havik 140;
Μητρικές πλακέτες:

Gigabyte 990FXA-UD5 (Socket AM3+, AMD 990FX + SB950);
ASUS P8Z68-V PRO (LGA1155, Intel Z68 Express);
Gigabyte X58A-UD5 (LGA1366, Intel X58 Express).

Μνήμη:

2 x 2 GB, DDR3-1600 SDRAM, 9-9-9-27 (Kingston KHX1600C8D3K2/4GX);
3 x 2 GB, DDR3-1600 SDRAM, 9-9-9-27 (Crucial BL3KIT25664TG1608).

Κάρτα γραφικών: AMD Radeon HD 6970.
Σκληρός δίσκος: Kingston SNVP325-S2/128GB.
Τροφοδοτικό: Tagan TG880-U33II (880 W).
Λειτουργικό σύστημα: Microsoft Windows 7 SP1 Ultimate x64.
Οδηγοί:

Πρόγραμμα οδήγησης Intel Chipset 9.2.0.1030;
Πρόγραμμα οδήγησης Intel Management Engine 7.1.10.1065;
Intel Rapid Storage Technology 10.6.0.1022;
Πρόγραμμα οδήγησης οθόνης AMD Catalyst 11.10.

Λάβετε υπόψη ότι η δοκιμή πραγματοποιήθηκε με την τρέχουσα έκδοση του λειτουργικού συστήματος Windows 7, αλλά η AMD υποδεικνύει ότι ο διαχειριστής εργασιών αυτού του λειτουργικού συστήματος δεν κατανέμει τα νήματα υπολογιστών με τον βέλτιστο τρόπο. Τα Windows 7 προτιμούν κυρίως να κατευθύνουν νήματα σε πυρήνες που βρίσκονται σε διαφορετικές λειτουργικές μονάδες. Και αυτό παρέχει πραγματικά υψηλότερη ειδική απόδοση, καθώς μειώνει το φορτίο στα μπλοκ που χωρίζονται μέσα στη μονάδα. Ωστόσο, αυτή η στρατηγική αποτρέπει τη συμπερίληψη λειτουργιών turbo, οι οποίες θα μπορούσαν να χρησιμοποιηθούν από τον επεξεργαστή εάν ορισμένες από τις μονάδες διπλού πυρήνα ήταν σε καταστάσεις εξοικονόμησης ενέργειας.

Υποσχόμενο χειρουργείο Σύστημα WindowsΤο 8 θα ακολουθήσει διαφορετική τακτική και εκεί τα νήματα θα εκχωρηθούν πρώτα στους πυρήνες της ίδιας ενότητας. Ως αποτέλεσμα, η AMD υπόσχεται ότι σε ορισμένες εφαρμογές, η απόδοση των συστημάτων που βασίζονται στο Zambezi μπορεί να αυξηθεί έως και 10%.

Εκτέλεση

Προκαταρκτική αξιολόγηση της αποτελεσματικότητας της μικροαρχιτεκτονικής Bulldozer

Πριν ξεκινήσουμε τις «πραγματικές» δοκιμές των επεξεργαστών, αποφασίσαμε να καταλάβουμε τι θα μπορούσαμε να περιμένουμε από τη μικροαρχιτεκτονική Bulldozer κατ' αρχήν. Για να γίνει αυτό, πραγματοποιήσαμε μια μικρή σύγκριση ενός επεξεργαστή με αυτήν τη μικροαρχιτεκτονική με άλλες CPU με μικροαρχιτεκτονικές K10 και Sandy Bridge κάτω από τεχνητά δημιουργημένες ίσες συνθήκες: στην ίδια συχνότητα ρολογιού και με τον ίδιο αριθμό ενεργοποιημένων πυρήνων.

Πιο συγκεκριμένα, συγκρίναμε τα AMD FX-8150, Phenom II X6 1100T και Core i7-2600 στα 3,6 GHz με ενεργοποιημένους μόνο δύο πυρήνες επεξεργασίας. Για την καθαρότητα του πειράματος, όλες οι τεχνολογίες εξοικονόμησης ενέργειας και αυτόματου υπερχρονισμού απενεργοποιήθηκαν φυσικά. Ως εργαλεία δοκιμών επιλέχθηκε ένα σύνολο απλών συνθετικών σημείων αναφοράς που περιλαμβάνονται στο βοηθητικό πρόγραμμα SiSoft Sandra 2011, κατά το οποίο απενεργοποιήσαμε αναγκαστικά όλα τα σύνολα εντολών παλαιότερα από το SSE3, καθώς δεν υποστηρίζονται στη μικροαρχιτεκτονική K10.



Οι αριθμοί στον πίνακα μιλούν πιο δυνατά από οποιαδήποτε λέξη. Η απόδοση της μικροαρχιτεκτονικής Bulldozer έχει γίνει πολύ χαμηλότερη από αυτή των προηγούμενων επεξεργαστών. Ο συνδυασμός ζευγών πυρήνων σε μια ενότητα με κοινόχρηστους πόρους και η συνοδευτική απλοποίηση της μικροαρχιτεκτονικής οδήγησε στο γεγονός ότι στην ίδια συχνότητα, η ειδική απόδοση του Bulldozer ανά πυρήνα μειώθηκε κατά 25-40% σε σύγκριση με την προηγούμενη γενιά μικροαρχιτεκτονικής AMD. Ως αποτέλεσμα, οι πυρήνες Bulldozer είναι σχεδόν κατά το ήμισυ αργοί από τους πυρήνες Sandy Bridge. Επιπλέον, η απόδοση της μονάδας επεξεργαστή Bulldozer, η οποία περιλαμβάνει δύο πυρήνες, είναι ακόμη χαμηλότερη από την ταχύτητα ενός μόνο πυρήνα Sandy Bridge με ενεργοποιημένη την τεχνολογία Hyper-Threading. Θα έπρεπε να περιμένουμε ρεκόρ απόδοσης από έναν επεξεργαστή που βασίζεται σε μια τέτοια μικροαρχιτεκτονική; Το ερώτημα είναι ρητορικό.

Στην πορεία, ας ρίξουμε μια ματιά πρακτικά χαρακτηριστικάκρυφές μνήμες και υποσυστήματα μνήμης. Για να αξιολογήσουμε την ταχύτητα λειτουργίας αυτών των λειτουργικών μονάδων, πραγματοποιήσαμε δοκιμές στο βοηθητικό πρόγραμμα Cachemem από το πακέτο Aida64. Σε όλες τις περιπτώσεις, χρησιμοποιήθηκε μνήμη DDR3-1600 με λανθάνοντες χρόνους 9-9-9-27-1T. Όπως και στην προηγούμενη περίπτωση, οι συχνότητες του επεξεργαστή παρέμειναν ευθυγραμμισμένες στα 3,6 GHz.



Στο Zambezi, σε σύγκριση με τους επεξεργαστές Phenom II, οι πρακτικές καθυστερήσεις τόσο σε όλες τις κρυφές μνήμες όσο και στο υποσύστημα μνήμης έχουν αυξηθεί. Μιλήσαμε για αυτό όταν σκεφτήκαμε τη μικροαρχιτεκτονική της Μπουλντόζας. Ωστόσο, αλλάζοντας τη λογική οργάνωση της κρυφής μνήμης, η απόδοση της αυξήθηκε σχεδόν σε όλες τις περιπτώσεις.

Ταυτόχρονα, ο ταχύτερος ελεγκτής μνήμης δύο καναλιών και το ταχύτερο υποσύστημα κρυφής μνήμης υλοποιούνται στο Sandy Bridge. Αν και, φυσικά, όσον αφορά τη χωρητικότητα της κρυφής μνήμης, ο επεξεργαστής Intel είναι κάπως κατώτερος από τα μέσα μικροαρχιτεκτονικής Bulldozer.

Συνολική απόδοση

Για να αξιολογήσουμε την απόδοση του επεξεργαστή σε κοινές εργασίες, χρησιμοποιούμε παραδοσιακά τη δοκιμή Bapco SYSmark 2012, η ​​οποία προσομοιώνει την εργασία των χρηστών σε κοινά σύγχρονα προγράμματα γραφείουκαι εφαρμογές δημιουργίας και επεξεργασίας ψηφιακού περιεχομένου. Η ιδέα της δοκιμής είναι πολύ απλή: παράγει μια ενιαία μέτρηση που χαρακτηρίζει τη σταθμισμένη μέση ταχύτητα του υπολογιστή σε κοινές εφαρμογές.

Ας θυμηθούμε ότι πριν από λίγο καιρό η AMD προσπάθησε να τρολάρει το SYSmark, διαδίδοντας ισχυρισμούς ότι ήταν προκατειλημμένο λόγω της χρήσης του «λάθους» συνόλου πραγματικών εφαρμογών. Ωστόσο, κατά τη γνώμη μας, μια τέτοια κρίση δεν δικαιολογείται, καθώς είναι κοινά και πραγματικά δημοφιλή προγράμματα που χρησιμοποιούνται για την αξιολόγηση της απόδοσης, η συμβολή καθενός από τα οποία στο τελικό αποτέλεσμα φαίνεται στο παρακάτω διάγραμμα:



Επομένως, δεν έχουμε εγκαταλείψει τη χρήση του SYSmark 2012 και συνεχίζουμε να χρησιμοποιούμε τις μετρήσεις του για την αξιολόγηση της κοινής απόδοσης.



Η πρώτη δοκιμή είναι μια τέτοια απογοήτευση. Το αποτέλεσμα του οκταπύρηνου FX-8150 είναι μόνο 10% καλύτερο από την απόδοση του εξαπύρηνου Phenom II X6 1100T και, φυσικά, δεν φτάνει καθόλου τις επιδόσεις των τετραπύρηνων επεξεργαστών Intel. Άρα η τακτική που επέλεξε η AMD να εφαρμόσει μεγάλο αριθμό πυρήνων με χαμηλή ειδική απόδοση στον επεξεργαστή αντί για μέτριο αριθμό σύνθετων γενικά δεν δίνει θετικό αποτέλεσμα.

Η βαθύτερη κατανόηση των αποτελεσμάτων του SYSmark 2012 μπορεί να παρέχει πληροφορίες για τις βαθμολογίες απόδοσης που λαμβάνονται σε διάφορα σενάρια χρήσης συστήματος.

Το σενάριο Παραγωγικότητας του Office προσομοιώνει τυπική εργασία γραφείου: προετοιμασία κειμένου, επεξεργασία υπολογιστικών φύλλων, εργασία με μέσω e-mailκαι επίσκεψη ιστοσελίδων στο Διαδίκτυο. Το σενάριο χρησιμοποιεί το ακόλουθο σύνολο εφαρμογών: ABBYY FineReader Pro 10.0, Adobe Acrobat Pro 9, Adobe FlashΠαίκτης 10.1 Microsoft Excel 2010, Microsoft Internet Explorer 9, Microsoft Outlook 2010, Microsoft PowerPoint 2010, Microsoft Word 2010 και WinZip Pro 14.5.



Το σενάριο δημιουργίας πολυμέσων προσομοιώνει τη δημιουργία μιας διαφήμισης χρησιμοποιώντας ψηφιακές εικόνες και βίντεο πριν τη λήψη. Για το σκοπό αυτό χρησιμοποιούνται δημοφιλή πακέτα της Adobe: Photoshop CS5 Extended, Premiere Pro CS5 και After Effects CS5.



Η ανάπτυξη Ιστού είναι ένα σενάριο μέσα στο οποίο μοντελοποιείται η δημιουργία μιας ιστοσελίδας. Εφαρμογές που χρησιμοποιούνται: Adobe Photoshop CS5 Extended, Adobe Premiere Pro CS5, Adobe Dreamweaver CS5, Mozilla Firefox 3.6.8 και Microsoft Internet Explorer 9.



Το σενάριο Data/Financial Analysis είναι αφιερωμένο στη στατιστική ανάλυση και την πρόβλεψη των τάσεων της αγοράς, η οποία εκτελείται στο Microsoft Excel 2010.



Το σενάριο 3D Modeling είναι εξ ολοκλήρου αφιερωμένο στη δημιουργία τρισδιάστατων αντικειμένων και στην απόδοση στατικών και δυναμικών σκηνών με χρησιμοποιώντας την Adobe Photoshop CS5 Extended, Autodesk 3ds Max 2011, Autodesk AutoCAD 2011 και Google SketchUp Pro 8.



Το τελευταίο σενάριο, η Διαχείριση Συστήματος, περιλαμβάνει τη δημιουργία αντιγράφων ασφαλείας και την εγκατάσταση λογισμικού και ενημερώσεων. Εδώ εμπλέκονται αρκετοί διαφορετικές εκδόσεις Mozilla Firefox Installer και WinZip Pro 14.5.



Στο διάφορα μοντέλαΗ χρήση ενός επεξεργαστή με τη μικροαρχιτεκτονική Bulldozer δείχνει θεμελιωδώς διαφορετικά αποτελέσματα. Σε ορισμένες περιπτώσεις αποδεικνύεται ακόμη πιο αργό από το Phenom II X6, αλλά υπάρχουν και οι αντίθετες καταστάσεις. Γενικά, ο γενικός κανόνας είναι ο εξής: το πλεονέκτημα του FX-8150 γίνεται ιδιαίτερα αισθητό όταν ο φόρτος εργασίας είναι πολλαπλών νημάτων και είναι καλά παραλληλισμένος, αλλά όχι υπολογιστικά περίπλοκος.

Ωστόσο, ακόμη και στις πιο ευνοϊκές καταστάσεις, ο FX-8150 υστερεί σε σχέση με τον Core i5-2500. Το μόνο σενάριο όπου αυτοί οι επεξεργαστές είναι συγκρίσιμοι σε ταχύτητα είναι η τρισδιάστατη απόδοση. Κατά μέσο όρο, η προσφορά της Intel προηγείται του νέου προϊόντος της AMD κατά ένα εντυπωσιακό 25%. Δυστυχώς.

Απόδοση παιχνιδιού

Όπως γνωρίζετε, η απόδοση των πλατφορμών εξοπλισμένων με επεξεργαστές υψηλής απόδοσης στη συντριπτική πλειοψηφία των σύγχρονων παιχνιδιών καθορίζεται από τη δύναμη του υποσυστήματος γραφικών. Αυτός είναι ο λόγος για τον οποίο, όταν δοκιμάζουμε επεξεργαστές, προσπαθούμε να διεξάγουμε δοκιμές με τέτοιο τρόπο ώστε να αφαιρούμε το φορτίο από την κάρτα βίντεο όσο το δυνατόν περισσότερο: επιλέγονται τα παιχνίδια που εξαρτώνται περισσότερο από τον επεξεργαστή και οι δοκιμές πραγματοποιούνται χωρίς να ενεργοποιηθεί το anti -παράλληλη και με την εγκατάσταση μακριά από τα περισσότερα υψηλές αναλύσεις. Δηλαδή, τα αποτελέσματα που λαμβάνονται καθιστούν δυνατή την αξιολόγηση όχι τόσο του επιπέδου fps που επιτυγχάνεται σε συστήματα με σύγχρονες κάρτες γραφικών, αλλά πόσο καλά λειτουργούν οι επεξεργαστές με φόρτο παιχνιδιού κατ' αρχήν. Επομένως, με βάση τα αποτελέσματα που παρουσιάζονται, είναι πολύ πιθανό να υποθέσουμε πώς θα συμπεριφέρονται οι επεξεργαστές στο μέλλον, όταν εμφανιστούν στην αγορά ταχύτερες επιλογές για επιταχυντές γραφικών.


















Τα παιχνίδια δεν ανήκουν στην κατηγορία των εργασιών που δημιουργούν ένα παραλληλισμένο φορτίο πολλαπλών νημάτων. Επομένως, για τις σημερινές εφαρμογές gaming είναι πιο κατάλληλοι επεξεργαστές με τέσσερις πυρήνες και όχι αυτά τα πολυπύρηνα τέρατα που προσφέρει η AMD. Βλέπουμε μια σαφή απεικόνιση αυτής της δήλωσης στα παρακάτω διαγράμματα. Ο νέος οκταπύρηνος FX-8150 δεν είναι ταχύτερος από τον εξαπύρηνο προκάτοχό του, το Phenom II X6.

Όσον αφορά την αναλογία απόδοσης gaming μεταξύ Zambezi και Sandy Bridge, η AMD εξακολουθεί να είναι πολύ πιο απαισιόδοξη για το νέο προϊόν. Η τρέχουσα μικροαρχιτεκτονική επεξεργαστή της Intel χειρίζεται πολύ καλύτερα τον τυπικό φόρτο εργασίας που δημιουργείται από τρισδιάστατα παιχνίδια και δεν υπάρχει καμία ελπίδα ότι η AMD θα μπορέσει ποτέ να καλύψει τη διαφορά με τους ανταγωνιστές επεξεργαστές σε αυτήν την κατηγορία εργασιών. Με άλλα λόγια, η χρήση Bulldozer σε συστήματα gaming μπορεί να έχει νόημα μόνο όταν υπάρχει βεβαιότητα ότι η απόδοση ενός συγκεκριμένου επεξεργαστή είναι επαρκής για ένα συγκεκριμένο υποσύστημα βίντεο σε ένα συγκεκριμένο σύνολο παιχνιδιών. Ωστόσο, ακόμη και σε αυτήν την περίπτωση, πρέπει να συνειδητοποιήσετε ότι με την επόμενη αναβάθμιση του επιταχυντή βίντεο, μπορεί να παραμείνετε σε σοβαρό μειονέκτημα σε σύγκριση με εκείνους τους χρήστες που αρχικά προτιμούσαν την πλατφόρμα και τους σύγχρονους επεξεργαστές Intel.

Εκτός από τις δοκιμές gaming, θα παρουσιάσουμε επίσης τα αποτελέσματα του συνθετικού σημείου αναφοράς Futuremark 3DMark 11, που κυκλοφόρησε με το προφίλ Extreme.



Ο σκοπός της προσθήκης αυτών των αποτελεσμάτων ήταν να δείξει την πολύ ιδανική κατάσταση για το FX-8150, όταν το υποσύστημα βίντεο δεν επιτρέπει την πλήρη υλοποίηση της ισχύος του επεξεργαστή. Εδώ το κύριο φορτίο πέφτει στην κάρτα βίντεο και ο επεξεργαστής παίζει μόνο υποστηρικτικό ρόλο. Σε τέτοιες περιπτώσεις, μπορούμε να μιλάμε για ίση απόδοση των επεξεργαστών Bulldozer και Sandy Bridge, αν και, φυσικά, αυτό δεν είναι απολύτως αληθές.



Ωστόσο, το FX-8150 φαίνεται επίσης καλό (σε σύγκριση με προηγούμενα αποτελέσματα) στη φυσική δοκιμή 3DMark 11. φυσικό μοντέλοΟ νέος επεξεργαστής οκτώ πυρήνων της AMD λειτουργεί με ταχύτητες συγκρίσιμες με τον τετραπύρηνο Core i5-2500.

Δοκιμές σε εφαρμογές

Συνολικά, ο σταθμισμένος μέσος όρος της Bulldozer και η απόδοση gaming στην επιφάνεια εργασίας ήταν πολύ κάτω από τις προσδοκίες μας. Ωστόσο, ας μην απελπιζόμαστε και ας προσπαθήσουμε να βρούμε εκείνες τις περιπτώσεις που η νέα μικροαρχιτεκτονική της AMD είναι σε θέση να δείξει δυνάμεις.

Για να μετρήσουμε την ταχύτητα των επεξεργαστών κατά τη συμπίεση πληροφοριών, χρησιμοποιούμε Αρχειοθέτηση WinRAR, με τη βοήθεια του οποίου αρχειοθετούμε ένα φάκελο με διάφορα αρχεία συνολικού όγκου 1,4 GB με τον μέγιστο βαθμό συμπίεσης.



Το αποτέλεσμα του FX-8150 είναι κοντά στον Core i5-2500. Το WinRAR δεν είναι μία από τις εφαρμογές που μπορούν να παραλληλίσουν τους υπολογισμούς του και στους οκτώ πυρήνες του Bulldozer, αλλά η γιγάντια μνήμη cache φαίνεται να σώζει την κατάσταση.

Η δεύτερη παρόμοια δοκιμή για την ταχύτητα αρχειοθέτησης πραγματοποιείται στο πρόγραμμα 7 zip, χρησιμοποιώντας τον αλγόριθμο συμπίεσης LZMA2.



Σε 7-zip, η απόδοση του FX-8150 είναι αξιέπαινη. Αυτός ο οκταπύρηνος επεξεργαστής καταφέρνει να προσεγγίσει την ταχύτητα του τετραπύρηνου Core i7-2600, ο οποίος περιλαμβάνει υποστήριξη για Hyper-Threading και ο οποίος, όπως το Bulldozer, μπορεί να εκτελέσει οκτώ νήματα ταυτόχρονα.

Η απόδοση κρυπτογράφησης των επεξεργαστών μετράται από το ενσωματωμένο σημείο αναφοράς του δημοφιλούς βοηθητικού προγράμματος κρυπτογράφησης TrueCrypt. Θα πρέπει να σημειωθεί ότι δεν είναι μόνο ικανό να φορτώσει αποτελεσματικά οποιονδήποτε αριθμό πυρήνων με εργασία, αλλά υποστηρίζει επίσης ένα εξειδικευμένο σύνολο οδηγιών AES.



Καλά παραλληλισμένοι, απλοί ακέραιοι αλγόριθμοι είναι αυτό που χρειάζεται η μικροαρχιτεκτονική Bulldozer. Σε τέτοιες περιπτώσεις, όπως βλέπουμε, μπορεί να επιτευχθεί πολύ εξαιρετική απόδοση. Ειδικότερα, όσον αφορά την κρυπτογράφηση, ο FX-8150 υστερεί μόνο σε σχέση με τον εξαπύρηνο Core i7-990X και προηγείται όλων των επεξεργαστών για την πλατφόρμα LGA1155.

Κατά τη δοκιμή της ταχύτητας διακωδικοποίησης ήχου, χρησιμοποιήστε το βοηθητικό πρόγραμμα Apple iTunes, το οποίο μετατρέπει τα περιεχόμενα ενός CD σε μορφή AAC. Σημειώστε ότι ένα χαρακτηριστικό γνώρισμα αυτού του προγράμματος είναι η δυνατότητα χρήσης μόνο ενός ζεύγους πυρήνων επεξεργαστή.



Είναι καλύτερα να κρατάτε τα προγράμματα που δημιουργούν μικρό αριθμό υπολογιστικών νημάτων μακριά από το Bulldozer. Ορισμένοι πυρήνες αυτής της CPU είναι πολύ αδύναμοι για να δείξουν αξιοπρεπή αποτελέσματα σε τέτοιες περιπτώσεις.

Μετράμε την απόδοση στο Adobe Photoshop χρησιμοποιώντας το δικό μας τεστ, το οποίο είναι δημιουργικά επεξεργασμένο Δοκιμή ταχύτητας Photoshop Artists Retouch, η οποία περιλαμβάνει τυπική επεξεργασία τεσσάρων εικόνων 10 megapixel που λαμβάνονται με ψηφιακή κάμερα.



Στο Photoshop, η απόδοση του FX-8150 δεν είναι τόσο καταστροφική όσο αυτή των επεξεργαστών με μικροαρχιτεκτονική K10, αλλά εξακολουθεί να απέχει πολύ από τον Core i5-2500. Προφανώς, μια μεγάλη μνήμη cache είναι μια καλή βοήθεια για τη μικροαρχιτεκτονική του Bulldozer σε αυτήν την περίπτωση, αλλά αυτό από μόνο του δεν θα σας πάει μακριά. Η αποτελεσματικότητα και η συγκεκριμένη απόδοση των πυρήνων υπολογιστών είναι ακόμα ύψιστης σημασίας.

Πραγματοποιήσαμε επίσης δοκιμές σε Πρόγραμμα Adobe Photoshop Lightroom 3. Το σενάριο δοκιμής περιλαμβάνει μετα-επεξεργασία και εξαγωγή JPEG εκατό εικόνων 12 megapixel σε μορφή RAW.



Το Lightroom μπορεί να παραλληλίσει την επεξεργασία φωτογραφιών σε οποιονδήποτε αριθμό πυρήνων και επομένως ο οκταπύρηνος FX-8150 δείχνει καλά αποτελέσματα εδώ. Ωστόσο, το «όχι κακό» είναι μια σχετική έννοια σε αυτήν την περίπτωση· στην πραγματικότητα, η απόδοσή του είναι συγκρίσιμη μόνο με τον Core i5-2500. Αυτό σημαίνει ότι δύο πυρήνες Bulldozer είναι ίσοι με έναν πυρήνα Sandy Bridge χωρίς υποστήριξη Hyper-Threading.

Η απόδοση στο Adobe Premiere Pro ελέγχεται με τη μέτρηση του χρόνου απόδοσης σε μορφή H.264 Blu-Ray ενός έργου που περιέχει βίντεο HDV 1080p25 με διάφορα εφέ που εφαρμόζονται.



Οι επεξεργαστές AMD προηγούμενης γενιάς χειρίστηκαν επίσης καλά τη διακωδικοποίηση βίντεο. Η μικροαρχιτεκτονική Bulldozer επέτρεψε μια ελαφρά αύξηση της απόδοσης σε εφαρμογές αυτού του είδους και, ως εκ τούτου, ο FX-8150 είναι ακόμη πιο γρήγορος από τον Core i5-2500.

Η ταχύτητα της επεξεργασίας βίντεο με χρήση του Adobe After Effects αξιολογήθηκε με μέτρηση του χρόνου εκτέλεσης ενός προκαθορισμένου συνόλου φίλτρων και εφέ, συμπεριλαμβανομένου του θολώματος, της δημιουργίας προσκρούσεων, της ανάμειξης καρέ, της δημιουργίας λάμψης, της προσθήκης αποεστίασης κίνησης, της σκίασης, της χειραγώγησης 2D και 3D, της αναστροφής, και τα λοιπά.



Παρά το γεγονός ότι το φορτίο είναι καλά παραλληλισμένο, το FX-8150 υστερεί έναντι των ανταγωνιστών της Intel στο After Effects.

Για τη μέτρηση της ταχύτητας μετατροπής βίντεο σε μορφή H.264, χρησιμοποιείται η δοκιμή x264 HD, η οποία βασίζεται στη μέτρηση του χρόνου επεξεργασίας του βίντεο πηγής σε μορφή MPEG-2, που έχει εγγραφεί σε ανάλυση 720p με ροή 4 Mbit/sec. Θα πρέπει να σημειωθεί ότι τα αποτελέσματα αυτής της δοκιμής έχουν μεγάλη πρακτική σημασία, καθώς ο κωδικοποιητής x264 που χρησιμοποιείται σε αυτό αποτελεί τη βάση πολλών δημοφιλών βοηθητικών προγραμμάτων διακωδικοποίησης, για παράδειγμα, HandBrake, MeGUI, VirtualDub κ.λπ.






Κατά τη διακωδικοποίηση βίντεο με τον κωδικοποιητή x264, οι επεξεργαστές AMD έδειχναν πάντα καλή απόδοση. Με την κυκλοφορία της μικροαρχιτεκτονικής οκτώ πυρήνων, τα αποτελέσματά τους έχουν αυξηθεί περαιτέρω και τώρα το FX-8150 ξεπερνά ακόμη και τον Core i7-2600 στο δεύτερο πέρασμα κωδικοποίησης με μεγαλύτερη ένταση πόρων. Έτσι, με αρκετή δυσκολία, βρήκαμε τελικά μια δεύτερη εφαρμογή, εκτός από το TrueCrypt, όπου η απόδοση ενός επεξεργαστή με τη μικροαρχιτεκτονική Bulldozer αξίζει κολακευτικές κριτικές.

Μετράμε την υπολογιστική απόδοση και την ταχύτητα απόδοσης στο Autodesk 3ds max 2011 χρησιμοποιώντας την εξειδικευμένη δοκιμή SPECapc. Ξεκινώντας με αυτήν τη δοκιμή, αρχίζουμε να χρησιμοποιούμε τη νέα επαγγελματική έκδοση του SPECapc για το 3ds Max 2011.






Η απόδοση είναι επίσης μία από τις εργασίες που υπόκεινται σε βελτιστοποίηση για μικροαρχιτεκτονικές πολλαπλών πυρήνων. Ωστόσο, παρόλα αυτά, ο FX-8150 εξακολουθεί να είναι πιο αργός από τον Core i5-2500 και τον Core i7-2600, για να μην αναφέρουμε τον Core i7-990X. Από την άλλη πλευρά, δεν υπάρχει ντροπή όταν ένας νέος επεξεργαστής AMD χάνει από τον προκάτοχό του.

Με τον μέσο όρο των αποτελεσμάτων σε μεμονωμένες εφαρμογές, το FX-8150 ήταν περίπου 14% ταχύτερο από το Phenom II X6 1100T στο σύνολο των εφαρμογών μας. Και αυτό του επέτρεψε να έχει χειρότερη απόδοση από τον Core i5-2500 σε λίγο λιγότερες από τις μισές περιπτώσεις. Ωστόσο, η διαφορά με το επόμενο μοντέλο Sandy Bridge, Core i7-2600, παραμένει σημαντική και ανέρχεται σε περισσότερο από 10%.

Κατανάλωση ενέργειας

Παρά το γεγονός ότι μπορέσαμε να βρούμε ένα σύνολο εργασιών στις οποίες η απόδοση του Bulldozer μπορεί να χαρακτηριστεί αποδεκτή, οι επεξεργαστές που βασίζονται στη νέα μικροαρχιτεκτονική δεν μοιάζουν καθόλου με επαναστατικούς επεξεργαστές. Η μόνη ελπίδα παραμένει για την κατανάλωση ενέργειας, επειδή προηγουμένως οι επεξεργαστές AMD ήταν περισσότερο από σημαντικά κατώτεροι από τους ανταγωνιστές τους σε αυτήν την παράμετρο. Τώρα, αν πιστεύετε τις υποσχέσεις των προγραμματιστών, η μικροαρχιτεκτονική έχει επικεντρωθεί περισσότερο στην ενεργειακή απόδοση και η νέα τεχνολογική διαδικασία 32 nm θα έπρεπε να έχει συμβάλει στη βελτίωση Ηλεκτρικά Χαρακτηριστικά. Ας δούμε λοιπόν το FX-8150 μέσα από το φακό απόδοσης ανά watt.

Τα ακόλουθα γραφήματα, εκτός εάν αναφέρεται διαφορετικά, δείχνουν τη συνολική κατανάλωση συστήματος (χωρίς οθόνη), που μετράται «μετά» την παροχή ρεύματος και αντιπροσωπεύει το άθροισμα της κατανάλωσης ισχύος όλων των εξαρτημάτων που εμπλέκονται στο σύστημα. Η απόδοση της ίδιας της τροφοδοσίας δεν λαμβάνεται υπόψη σε αυτή την περίπτωση. Κατά τη διάρκεια των μετρήσεων, το φορτίο στους επεξεργαστές δημιουργήθηκε από την έκδοση 64-bit του βοηθητικού προγράμματος LinX 0.6.4. Επιπλέον, για να εκτιμήσουμε σωστά την κατανάλωση ρεύματος σε αδράνεια, ενεργοποιήσαμε όλες τις διαθέσιμες τεχνολογίες εξοικονόμησης ενέργειας: C1E, C6, AMD Cool"n"Quiet και Enhanced Intel SpeedStep.



Όταν ήταν σε αδράνεια, η κατανάλωση συστημάτων με επεξεργαστές χτισμένους στη μικροαρχιτεκτονική Bulldozer έγινε χαμηλότερη από εκείνη παρόμοιων συστημάτων με επεξεργαστές της οικογένειας Phenom II. Ωστόσο, τα σύγχρονα συστήματα Intel LGA1155 καταναλώνουν σημαντικά λιγότερη κατανάλωση σε κατάσταση αδράνειας.



Στην περίπτωση που το υπολογιστικό φορτίο είναι μονού νήματος, η κατανάλωση των συστημάτων Socket AM3+ αυξάνεται κατακόρυφα, προφανώς λόγω της υψηλής επιθετικότητας της τεχνολογίας Turbo Core. Με ενσωματωμένα συστήματα Επεξεργαστές Intel, αυτό δεν παρατηρείται και μπορούν και πάλι να καυχηθούν για σημαντικά υψηλότερη ενεργειακή απόδοση.



Με ένα πλήρες φορτίο πολλαπλών νημάτων, η κατάσταση δεν είναι πολύ διαφορετική. Είναι μόνο το σύστημα με τον επεξεργαστή LGA1366 Core i7-990X που «πήρε μπροστά». Διαφορετικά, όλα είναι όπως πριν. Όσον αφορά την κατανάλωση ενέργειας, το FX-8150 δεν έχει κάποια ιδιαίτερη επιτυχία. Άρχισε να καταναλώνει λίγο λιγότερο από το Phenom II X6 1100T, αλλά οι επεξεργαστές Sandy Bridge είναι τουλάχιστον μιάμιση φορά πιο οικονομικοί.

Η AMD χρησιμοποίησε όλη την ενεργειακή απόδοση που αποκτήθηκε μέσω της εισαγωγής μιας νέας μικροαρχιτεκτονικής για να αυξήσει τις συχνότητες ρολογιού. Και, ως αποτέλεσμα, δεν βλέπουμε κανένα νέο επίπεδοαποτελεσματικότητα, ούτε ριζικά βελτιωμένη απόδοση. Κατά συνέπεια, όσον αφορά την απόδοση ανά watt, το Bulldozer, όπως και οι προκάτοχοί του, είναι σοβαρά κατώτερο από τις ανταγωνιστικές μικροαρχιτεκτονικές της Intel.

Για αναφορά, παρουσιάζουμε την κατανάλωση σε πλήρες φορτίο, μετρημένη ξεχωριστά στα κυκλώματα τροφοδοσίας του επεξεργαστή και της μητρικής πλακέτας.






Η «καθαρή» κατανάλωση του οκταπύρηνου FX-8150 ξεπερνά την κατανάλωση Αμμώδεις επεξεργαστέςΓέφυρα περίπου δύο φορές. Λαμβάνοντας υπόψη ότι και οι δύο επεξεργαστές κατασκευάζονται με την ίδια τεχνολογική διαδικασία και έχουν παρόμοιες τάσεις πυρήνα, γίνεται απίστευτα ενδιαφέρον τι εννοούσε η AMD όταν μίλησε για την ενεργειακή απόδοση της μικροαρχιτεκτονικής της Bulldozer.

Overclocking

Η πλατφόρμα Socket AM3+ και οι επεξεργαστές της σειράς FX τοποθετούνται αρχικά ως overclockers. Αυτό αποδεικνύεται τόσο από το πλήρες ξεκλείδωμα όλων των πολλαπλασιαστών όσο και από τα πειράματα που πραγματοποιήθηκαν υπό την αιγίδα της AMD, στα οποία σημειώθηκε παγκόσμιο ρεκόρ overclocking χρησιμοποιώντας έναν από τους επεξεργαστές FX-8150. Ελπιδοφόρες φαίνονται και οι δηλώσεις της εταιρείας ότι η νέα μικροαρχιτεκτονική είναι βελτιστοποιημένη για λειτουργία σε υψηλές συχνότητες ρολογιού. Θα έχουμε πραγματικά ένα νέο θαύμα overclocking από την AMD; Ας ελέγξουμε.

Το overclocking οποιωνδήποτε επεξεργαστών FX είναι πολύ απλό· δεν είναι καθόλου τυχαίο που το "Unlocked" αναγράφεται απευθείας στο λογότυπό τους. Η συχνότητα του επεξεργαστή μπορεί να αλλάξει με πολλαπλασιαστή είτε μέσω του BIOS Setup είτε μέσω εξειδικευμένων βοηθητικών προγραμμάτων που παρέχονται τόσο από την ίδια την AMD (Overdrive Utility) όσο και από τους κατασκευαστές μητρικών πλακών. Ομοίως, στα συστήματα Socket AM3+, μπορείτε να υπερχρονίσετε τη βόρεια γέφυρα και τη μνήμη που είναι ενσωματωμένη στον επεξεργαστή.

Κατά τη διάρκεια των δοκιμών, μπορέσαμε να επιτύχουμε σταθερή λειτουργία του FX-8150 σε συχνότητα 4,6 GHz. Για να διασφαλιστεί η σταθερότητα σε αυτήν την κατάσταση, η τάση τροφοδοσίας του επεξεργαστή έπρεπε να αυξηθεί στα 1,475 V και, επιπλέον, ήταν απαραίτητο να ενεργοποιηθεί η λειτουργία Βαθμονόμησης γραμμής φορτίου. Κατά τη διάρκεια των δοκιμών σταθερότητας, η θερμοκρασία του επεξεργαστή που λειτουργεί σε αυτή τη συχνότητα δεν ξεπερνούσε τους 85 βαθμούς σύμφωνα με τον αισθητήρα υποδοχής ή τους 75 βαθμούς σύμφωνα με τον ενσωματωμένο αισθητήρα στον επεξεργαστή. Για την απομάκρυνση της θερμότητας, υπενθυμίζουμε ότι χρησιμοποιήθηκε αποτελεσματικός ψύκτης αέρα NZXT Havik 140.



Λάβετε υπόψη ότι την ίδια στιγμή προσπαθήσαμε να υπερχρονίσουμε τη βόρεια γέφυρα που είναι ενσωματωμένη στην CPU, επειδή η αύξηση της συχνότητάς της έχει θετική επίδραση στην ταχύτητα της κρυφής μνήμης τρίτου επιπέδου και του ελεγκτή μνήμης. Ωστόσο, δυστυχώς, ο σημαντικός υπερχρονισμός αυτού του κόμβου επεξεργαστή συνάντησε ένα αόρατο εμπόδιο και δεν μπόρεσε να φτάσει σε συχνότητα πάνω από 2,4 GHz, παρόλο που προσπαθήσαμε ταυτόχρονα να αυξήσουμε την τάση τροφοδοσίας του.

Σε κάθε περίπτωση, το overclocking του FX-8150 στα 4,6 GHz είναι ένα καλό αποτέλεσμα, ειδικά αν λάβουμε υπόψη το γεγονός ότι οι επεξεργαστές AMD της οικογένειας Phenom II σπάνια υπερχρονίστηκαν στον αέρα πέρα ​​από τα 4,0 GHz. Με άλλα λόγια, η μικροαρχιτεκτονική Bulldozer κατέστησε πραγματικά δυνατή την ελαφρά ώθηση του ορίου συχνότητας υψηλότερα.

Ωστόσο, το overclocking των επεξεργαστών FX θα πρέπει πρώτα απ 'όλα να συγκριθεί όχι με τον παλιό Phenom II, αλλά με ανταγωνιστικούς επεξεργαστές Core i5 και Core i7 για συστήματα LGA1155. Αλλά σαφώς δεν επιταχύνουν χειρότερα. Για παράδειγμα, ένα αρκετά τυπικό overclock για τον Core i5-2500K με αύξηση τάσης 0,15 V πάνω από την ονομαστική και χρήση ψυγείου αέρα είναι 4,7 GHz. Και σε αυτό το πλαίσιο, το αποτέλεσμα του FX-8150 δεν φαίνεται πλέον τόσο λαμπρό.

Η εντύπωση του overclocking του Zambezi χειροτερεύει ακόμη περισσότερο αν συγκρίνουμε την απόδοση του υπερχρονισμένου FX-8150 και του υπερχρονισμένου Core i5-2500K (η αύξηση της απόδοσης σε σχέση με την ονομαστική λειτουργία υποδεικνύεται σε παρένθεση):



Γενικά, το overclocking δεν αλλάζει την ποιότητα των αποτελεσμάτων. Αλλά όπου το FX-8150 ήταν ταχύτερο στην ονομαστική λειτουργία, το χάσμα μειώθηκε. Και όπου ο Core i5-2500 ήταν πρώτος, εδραίωσε το πλεονέκτημά του. Δεν αποτελεί έκπληξη: η συχνότητα του FX-8150 όταν ήταν overclocked αυξήθηκε κατά 28%, ενώ η αύξηση συχνότητας του Core i5-2500K ήταν 42%. Και γενικά, όπως μπορεί να κριθεί από το μέγεθος του κέρδους απόδοσης από το overclocking, η μικροαρχιτεκτονική του Sandy Bridge αντιδρά πιο ευαίσθητα στις αυξανόμενες συχνότητες. Με άλλα λόγια, ακόμη και αν λάβουμε υπόψη το overclocking, οι επεξεργαστές με τη μικροαρχιτεκτονική Bulldozer, αν και κάνουν αρκετά καλά overclock, δεν φαίνονται πιο δυνατοί από τους ανταγωνιστές της Intel.

συμπεράσματα

Επιτυχία ή αποτυχία; Σίγουρα πολλοί από εσάς θέλετε να δείτε μια ξεκάθαρη ετυμηγορία στο τέλος του άρθρου. Ωστόσο, σε αυτή την περίπτωση, όλα είναι πολύ διφορούμενα και η AMD έχει φέρει τους κριτικούς σε πολύ δύσκολη θέση με το Bulldozer της.

Το γεγονός είναι ότι η AMD έχει επιδείξει μια εντελώς μη τυποποιημένη προσέγγιση στην ανάπτυξη μικροαρχιτεκτονικής. Λαμβάνοντας υπόψη ότι η απόδοση του επεξεργαστή αποτελείται από τρία στοιχεία: τον αριθμό των εντολών που εκτελούνται στον πυρήνα του επεξεργαστή ανά κύκλο ρολογιού, τη συχνότητα και τον αριθμό των πυρήνων, οι προγραμματιστές έχουν μετατοπίσει τις προτεραιότητές τους στον αριθμό των πυρήνων. Ταυτόχρονα, η συγκεκριμένη απόδοση των μεμονωμένων πυρήνων μειώθηκε, αλλά η σχεδίαση που προέκυψε άνοιξε το δρόμο για τη δημιουργία φθηνών οκταπύρηνων ή και πιο πολύπλοκων επεξεργαστών. Αυτή είναι μια πολύ ισχυρή κίνηση για την αγορά διακομιστών, όπου φορτώνονται πολλαπλά νήματα και επεξεργαστές μεγάλο ποσόοι πυρήνες έχουν σοβαρή ζήτηση. Έτσι, είναι πολύ πιθανό η νέα μικροαρχιτεκτονική Bulldozer να επιτρέψει στην AMD να βελτιώσει σημαντικά τη θέση της στην αγορά των διακομιστών απόδοσης.

Ωστόσο, σήμερα γνωρίσαμε τον επεξεργαστή FX, χτισμένο πάνω σε αυτή τη μικροαρχιτεκτονική, αλλά απευθύνεται σε επιτραπέζιους υπολογιστές. Και εδώ έγινε πλήρως εμφανής η ασυμφωνία μεταξύ των δυνατοτήτων υλικού του Bulldozer και των τυπικών φόρτων εργασίας για επιτραπέζιους υπολογιστές. Είναι ιδιαίτερα απογοητευτικό το γεγονός ότι η καμπάνια μάρκετινγκ ήταν δομημένη με τέτοιο τρόπο που πολλοί πίστευαν στο Bulldozer ως ανερχόμενο αστέρι στην αγορά επιτραπέζιων υπολογιστών. Ωστόσο, αυτές οι ελπίδες δεν ήταν προορισμένες να πραγματοποιηθούν.


Οι επεξεργαστές FX, οι οποίοι βασίζονται στη μικροαρχιτεκτονική Bulldozer, μπόρεσαν να επιδείξουν τα δυνατά τους σημεία μόνο σε ένα μικρό υποσύνολο εργασιών που επιλύθηκαν από απλούς χρήστες. Μεταξύ των τυπικών κοινών εφαρμογών, δεν υπάρχουν πολλά παραδείγματα που δημιουργούν έναν απλό ακέραιο φόρτο εργασίας πολλαπλών νημάτων και η υψηλή απόδοση του Bulldozer αποκαλύπτεται μόνο σε αυτήν την περίπτωση. Ως αποτέλεσμα, σε ορισμένες περιπτώσεις το Bulldozer αποδείχτηκε όχι μόνο πιο αργό από τις ανταγωνιστικές λύσεις της Intel, αλλά ακόμη χειρότερο από τον επεξεργαστή Phenom II X6, βασισμένο στη μικροαρχιτεκτονική προηγούμενης γενιάς. Και αυτό σημαίνει ότι η AMD απέτυχε να παράγει έναν επαναστατικό επιτραπέζιο επεξεργαστή.

Στην πραγματικότητα, το FX είναι απλώς το επόμενο Phenom, το οποίο φαίνεται να είναι αρκετά καλό από μόνο του, ειδικά σε σύγκριση με τους προκατόχους του. Οι επεξεργαστές FX είναι γενικά ταχύτεροι από το Phenom II, overclock σημαντικά καλύτεροι και έχουν ελαφρώς χαμηλότερη κατανάλωση, επομένως μπορούν να θεωρηθούν καλός αντικαταστάτης των φορέων της ξεπερασμένης μικροαρχιτεκτονικής K10.

Ωστόσο, να σας υπενθυμίσουμε ότι η AMD βρίσκεται σε πόλεμο όχι μόνο με τον εαυτό της, αλλά και με τον εαυτό της από την Intel. Ως εκ τούτου, εξακολουθούμε να αναγκαζόμαστε να εκφράσουμε το απογοητευτικό συμπέρασμα ότι οι επεξεργαστές FX έχουν πραγματικό νόημα μόνο σε εκείνους τους επιτραπέζιους υπολογιστές που επικεντρώνονται στην επεξεργασία και τη διακωδικοποίηση βίντεο. Σε άλλες περιπτώσεις, σε σύγκριση με τους επεξεργαστές Sandy Bridge, η απόδοσή τους σπάνια φαίνεται ενθαρρυντική. Το ίδιο μπορεί να ειπωθεί για την κατανάλωση ενέργειας και το overclocking. Ξεχωριστά, θα πρέπει να προστεθεί ότι οι επεξεργαστές AMD FX, όπως αναμενόταν, αποδείχθηκαν κακή επιλογή για συστήματα παιχνιδιών, καθώς τα σύγχρονα παιχνίδια 3D πρακτικά δεν χρησιμοποιούν αλγόριθμους πραγματικά πολλαπλών νημάτων. Ωστόσο, οι λάτρεις των προϊόντων AMD πιθανότατα θα μπορούν να το ανεχτούν, δεδομένου ότι ο αριθμός των καρέ ανά δευτερόλεπτο στα παιχνίδια συχνά περιορίζεται από τα γραφικά και όχι από τον επεξεργαστή.

Με άλλα λόγια, οι προοπτικές της αγοράς για τους επεξεργαστές FX θα εξαρτηθούν από δύο παράγοντες: πόσο μεγάλος είναι ο στρατός των οπαδών της AMD. και για το πόσο επιδέξια θα διαχειριστεί ο κατασκευαστής τον μοχλό τιμών. Ωστόσο, οι επιτραπέζιοι επεξεργαστές με τη μικροαρχιτεκτονική Bulldozer σαφώς δεν αναμένεται να γίνουν ευρέως δημοφιλείς.

Η AMD σπάνια επιδίδεται σε νέες αρχιτεκτονικές επεξεργαστών. Εάν η Intel ενημερώνει τη δομή κάθε δύο χρόνια, τότε ο ανταγωνιστής σημείωσε τελευταία φορά το 2007, κυκλοφόρησε το K10, μια επανασχεδιασμένη έκδοση του παλιού K8. Έτσι, η εμφάνιση μιας νέας Μπουλντόζας είναι ένα σημαντικό γεγονός. Για τα επόμενα χρόνια, η αρχιτεκτονική θα γίνει η βάση για όλους τους κρυστάλλους AMD, καθώς και η πρώτη ευκαιρία μετά από πολύ καιρό να ανταγωνιστεί την Intel στον αγώνα για επιδόσεις.

Πάμε ζευγάρι

Με τη δημιουργία του Bulldozer, οι μηχανικοί της AMD εγκατέλειψαν την αποδεδειγμένη στρατηγική βελτίωσης και μερικής αντιγραφής παλαιών εξελίξεων. Η δομή των λίθων είναι ριζικά διαφορετική από αυτή που έχουμε συνηθίσει να βλέπουμε στα συστήματα x86.

Η πρώτη και πιο σημαντική καινοτομία είναι η αρχική διάταξη. Όλες οι κορυφαίες εκδόσεις του Bulldozer είναι επίσημα εξοπλισμένες με οκτώ πυρήνες. Ωστόσο, στην πραγματικότητα υπάρχουν τέσσερις πλήρεις ενότητες, μόνο η καθεμία με δύο υπολογιστικές μονάδες. Μοιάζει με αυτό: δύο αριθμητικά συμπλέγματα ακέραιων αριθμών (ονομάζονται πυρήνες και είναι άμεσα υπεύθυνα για τους υπολογισμούς) μοιράζονται ένα Front-End, ένα σύμπλεγμα κινητής υποδιαστολής (FPU) και μια κρυφή μνήμη δεύτερου επιπέδου που έχει αυξηθεί στα 2 MB.

Το όφελος από ένα τέτοιο tandem είναι η εξοικονόμηση χώρου, η μείωση της κατανάλωσης ενέργειας και του κόστους παραγωγής. Μειονέκτημα - το να μοιράζεσαι τα ίδια σετ έχει άσχημη επίδραση στην τελική απόδοση. Υπό βαρύ φορτίο, ένα Front-End ενδέχεται να μην μπορεί να αντιμετωπίσει δύο πυρήνες. Η AMD δεν αρνείται την απώλεια απόδοσης: σύμφωνα με αυτήν, το δίδυμο είναι περίπου 20% πιο αδύναμο από έναν πλήρη επεξεργαστή διπλού πυρήνα.

Δυσκολίες επικοινωνίας

Για να εξαλείψει το σημείο συμφόρησης, το Front-End έπρεπε να μάθει πώς να μοιράζεται αποτελεσματικά τους πόρους μεταξύ των δύο πυρήνων. Για να επιτευχθεί αυτό, επανασχεδιάστηκαν η μονάδα πρόβλεψης διακλάδωσης και ο αποκωδικοποιητής εντολών, ο οποίος έλαβε ένα τέταρτο κανάλι για οδηγίες επεξεργασίας (όπως στο Sandy Bridge) και τεχνολογία Branch Fusion. Το τελευταίο σας επιτρέπει να κολλήσετε μέρος των οδηγιών σε μία λειτουργία. Όλα αυτά θα πρέπει να επιταχύνουν την εργασία του Front-End και να αποτρέψουν το αδρανές κρύσταλλο.

Όσον αφορά τους ίδιους τους πυρήνες, αυτό είναι ένα σύνολο από Out-of-Order, load/unload, L1 cache και δύο computing clusters. Η μονάδα εκτέλεσης εκτός σειράς διαθέτει πλέον έναν καταχωρητή φυσικού αρχείου. Όπως και στο Sandy Bridge, οι διευθύνσεις για την αποθήκευση δεδομένων εργασίας πέφτουν σε αυτό, κάτι που σας επιτρέπει να ξεφορτώσετε τον κύριο αγωγό εκτός παραγγελίας. Ο επεξεργαστής φόρτωσης/εκφόρτωσης έλαβε αυξημένο buffer, διπλασιάστηκε η χωρητικότητα και δυνατότητα εργασίας εικονικές διευθύνσεις, το οποίο θεωρητικά θα πρέπει να αυξήσει την ταχύτητα εργασίας με την προσωρινή μνήμη δεδομένων L1. Το τελευταίο στο Bulldozer έγινε τέσσερις φορές μικρότερο: 16 έναντι 64 KB στο K10. Η απώλεια αντισταθμίστηκε από την ταχύτητα της εργασίας. Η συσχέτιση L1 αυξήθηκε από δύο σε τέσσερα κανάλια, που σημαίνει διπλάσια Ομεγαλύτερη αποτελεσματικότητα αναζήτησης.

Υπάρχουν τρία συμπλέγματα υπολογιστών σε μία ενότητα: δύο ακέραιοι και ένα για εργασία με δεδομένα κινητής υποδιαστολής. Σε σύγκριση με το K10, το πρώτο ζεύγος έχασε ένα ALU (που ασχολούνταν με τους υπολογισμούς) και AGU (αφορούσε διευθύνσεις μνήμης). Θεωρητικά, αυτό σημαίνει μειωμένη απόδοση αιχμής. Στην πράξη, η αλλαγή θα είναι πρακτικά απαρατήρητη: είναι δύσκολο να φορτωθούν πλήρως τα συμπλέγματα ακεραίων.

Οι κύριες αλλαγές επηρέασαν το FPU, το οποίο είναι υπεύθυνο για πολύπλοκους υπολογισμούς κινητής υποδιαστολής. Στο K10 έγινε πολύ πιο ισχυρό: έλαβε ένα ζεύγος συσκευών MMX και 128-bit FMAC για την εκτέλεση εργασιών πρόσθεσης και πολλαπλασιασμού. Σε αντίθεση με το K10, τα FMAC έχουν γίνει καθολικά: μπορούν να αντικαταστήσουν το ένα το άλλο, γεγονός που έχει θετική επίδραση στην ταχύτητα υπολογισμού. Επιπλέον, έμαθαν να συνδυάζουν πράξεις σε μία έκφραση, γεγονός που αύξησε την ακρίβεια των υπολογισμών.

Επιπλέον, το FPU έλαβε ένα ενημερωμένο σύνολο οδηγιών. Πρώτον, ο επεξεργαστής λειτουργεί τώρα με AVX, το οποίο υποστηρίζει καταχωρητές 256-bit. Για τους υπολογισμούς τους, όπως στο Sandy Bridge, συνδυάζονται δύο FMAC. Δεύτερον, το Bulldozer μπορεί να λειτουργήσει με οδηγίες SSE 4.2, AENSI, FMA4 και XOP. Τα δύο τελευταία σετ είναι μοναδικά για την AMD. Για εσάς και εμένα, όλες αυτές οι αλλαγές σημαίνουν μόνο ένα πράγμα - οι εντολές που έγιναν στο παρελθόν σε πολλούς κύκλους ρολογιού θα υπολογίζονται τώρα σε έναν και αυτό επηρεάζει άμεσα την απόδοση. Είναι αλήθεια ότι για να βιώσετε την αύξηση της ταχύτητας, είναι απαραίτητη η υποστήριξη για οδηγίες από το λογισμικό.

Κόλλα και ψαλίδι

Ως αποτέλεσμα, κάθε ενότητα Bulldozer αποτελείται από μία κρυφή μνήμη δεδομένων Front-End, L2 και L1, δύο συμπλέγματα ακεραίων και ένα μπλοκ για εργασία με αριθμούς κινητής υποδιαστολής. Συνολικά, μια πέτρα μπορεί να περιέχει έως και τέσσερα τέτοια σετ. Ταυτόχρονα, καθένα από αυτά έχει πρόσβαση σε μια σειρά κοινών στοιχείων. Το πρώτο είναι ένας ελεγκτής μνήμης δύο καναλιών με υποστήριξη για DDR3-1866 MHz. Το δεύτερο είναι η προσωρινή μνήμη L3, ο όγκος της οποίας, σε σύγκριση με το K10, έχει αυξηθεί από 6 σε 8 MB και η συσχέτιση - από 48 σε 64 κανάλια. Σημειώστε ότι, σε αντίθεση με το Sandy Bridge, η συχνότητα της κρυφής μνήμης L3 δεν συμπίπτει με την ταχύτητα των πυρήνων. Εάν το κορυφαίο μοντέλο λειτουργεί με ταχύτητα 3,6 GHz, τότε η μνήμη του τελευταίου επιπέδου είναι στα 2,2 GHz. Αυτό οδηγεί σε αισθητές καθυστερήσεις που επηρεάζουν αρνητικά την απόδοση. Σύμφωνα με την AMD, αυτή η θυσία έγινε για χάρη της σταθερής λειτουργίας στις υψηλές συχνότητες.

Tadam!

Παρά τα αρχιτεκτονικά κόλπα και την τεχνολογία διαδικασίας 32 nm, το Bulldozer καταλαμβάνει εντυπωσιακά 315 τετραγωνικά μέτρα. χιλιοστά. Αυτό είναι περίπου μιάμιση φορά περισσότερο από το τετραπύρηνο Sandy Bridge και άνω Μεγάλη άδενδρη πεδιάδα. Ευτυχώς, η κατανάλωση ενέργειας διατηρήθηκε σε λογικά όρια - 125 W.

Εκτός από τα μοντέλα οκτώ πυρήνων, υπάρχουν εκδόσεις με έξι και τέσσερις υπολογιστικές μονάδες. Τα μικρότερα αδέρφια βασίζονται στον ίδιο σχεδιασμό οκτώ πυρήνων, αλλά έχουν απενεργοποιημένη μία ή δύο μονάδες.

Η βασική συχνότητα κυμαίνεται από 3,1 έως 3,6 GHz. Όπως το Sandy Bridge, το Bulldozer διαθέτει τεχνολογία αυτόματου υπερχρονισμού. Ένα ειδικό τσιπ υπεύθυνο για Turbo Core 2.0, παρακολουθεί το τρέχον φορτίο πυρήνα και το επίπεδο TDP και, μόλις παρουσιαστεί η ευκαιρία, αυξάνει τη συχνότητα του επεξεργαστή. Στην περίπτωση ενός κορυφαίου κρυστάλλου, όταν χρησιμοποιούνται όλες οι μονάδες, η ταχύτητα μπορεί να αυξηθεί κατά 300 MHz. Εάν κάποιοι από τους πόρους είναι αδρανείς - στα 600 MHz. Σε χαμηλά φορτία, το Bulldozer μεταβαίνει σε λειτουργία εξοικονόμησης ενέργειας, η τεχνολογία είναι υπεύθυνη για αυτό Cool "n" Ήσυχο.

Το χειροκίνητο overclocking είναι απλό. Πρώτον, ολόκληρη η γραμμή έχει έναν ξεκλείδωτο πολλαπλασιαστή. Δεύτερον, οι νεοφερμένοι κερδίζουν καλά υψόμετρο: υπό υγρό άζωτο, η παλαιότερη μπουλντόζα σημείωσε νέο παγκόσμιο ρεκόρ - 8429 MHz.

Σύντροφοι

Η μπουλντόζα λειτουργεί στο Socket AM3+. Ουσιαστικά πρόκειται για ένα ελαφρώς βελτιωμένο AM3 με ένα επιπλέον pin. Τα chipset με νέα υποδοχή επεξεργαστή ονομάζονται 990FX, 990ΧΚαι 970 . Διαφέρουν στον ελεγκτή PCIe 2.0. Το παλαιότερο μοντέλο είναι εξοπλισμένο με 32 γραμμές, οι νεότερες - 16. Επιπλέον, οι 990FX και 990X υποστηρίζουν CrossFireX. Μεταξύ των χαρακτηριστικών των chipsets, σημειώνουμε έξι θύρες SATA Rev. 3 και 14 Υποδοχές USB 2.0. Δεν υπάρχει ελεγκτής USB 3.0.

Σημειώστε ότι το Bulldozer μπορεί να λειτουργήσει και σε παλαιότερες σανίδες. Το μόνο που χρειάζεστε είναι ένα ενημερωμένο BIOS. Περιορισμοί: Το Turbo Core και το Cool"n"Quiet έχουν μειωμένη ταχύτητα απόκρισης και ορισμένες λειτουργίες εξοικονόμησης ενέργειας δεν είναι διαθέσιμες.

Η αρχιτεκτονική του επεξεργαστή Bulldozer αποδείχθηκε ενδιαφέρουσα. Τελικά, η AMD σταμάτησε να αντιγράφει τον εαυτό της και κατέληξε σε κάτι πραγματικά νέο. Δυστυχώς, υπάρχουν λίγα σαφή πλεονεκτήματα έναντι των ανταγωνιστών. Δεν υπάρχουν δηλωμένοι οκτώ πυρήνες. Με την καλή έννοια, έχουμε τετραπύρηνα μοντέλα με αυξημένο αριθμό υπολογιστικών μονάδων, κάτι σαν το Intel Hyper-Threading, αλλά σε επίπεδο υλικού. Η ιδέα είναι καλή, αλλά η απόδοση θα εξαρτηθεί από το πόσο γρήγορο είναι το Front-End. Τα πραγματικά πλεονεκτήματα του Bulldozer περιλαμβάνουν μόνο ένα ισχυρό FPU για υπολογισμούς κινητής υποδιαστολής και αυξημένες συχνότητες λειτουργίας σε σύγκριση με το K10.

Ας το ξεδιπλώσουμε! Ας το θάψουμε!

Η AMD ανακοίνωσε σχέδια για την κυκλοφορία των ακόλουθων σειρών επεξεργαστών. Η εταιρεία αναμένει να ενημερώνει την αρχιτεκτονική ετησίως, επιτυγχάνοντας περίπου 15 τοις εκατό κέρδη απόδοσης ανά watt κάθε φορά. Εάν η AMD επιμείνει στο σχέδιό της, θα δούμε την αρχιτεκτονική το 2012 Piledriver("koper"), ένα χρόνο αργότερα - Οδοστρωτήρ("steam roller"), και το 2014 θα μείνει αξέχαστο για την ανακοίνωση Εκσκαφέας. Έτσι είναι οι οικοδομικές εργασίες.

Λάθος παράθυρα

Σύμφωνα με την AMD, Windows 7ανίκανος να απελευθερώσει το πλήρες δυναμικό της νέας δημιουργίας: ο προγραμματιστής λειτουργικού συστήματος δεν λαμβάνει υπόψη τα χαρακτηριστικά του Bulldozer. Για παράδειγμα, για τους νέους επεξεργαστές είναι σημαντικό τα διασυνδεδεμένα νήματα να αντιστοιχίζονται σε μία μονάδα, διαφορετικά οι πυρήνες θα ανταλλάσσουν δεδομένα όχι μέσω της γρήγορης κρυφής μνήμης L2, αλλά μέσω της μνήμης τρίτου επιπέδου. Ορισμένες διαιρούμενες ροές αντιμετωπίζονται επίσης καλύτερα με παρόμοιο τρόπο για τη βελτίωση της αποτελεσματικότητας του Turbo Core 2.0. Ταυτοχρονα συγκεκριμένα καθήκονταδημιουργήστε μεγαλύτερο φορτίο στο μπλοκ Front End και είναι καλύτερο να τα διασκορπίσετε σε διαφορετικές μονάδες. Χάρη στη συνεργασία με Microsoftαυτές οι αποχρώσεις θα ληφθούν υπόψη στον σχεδιαστή παράθυρα 8. Ωστόσο, δεν πρέπει να περιμένετε σημαντική αύξηση της απόδοσης.

Λεξικό

Ακέραιο Υπολογιστικό Σύμπλεγμα- ασχολείται με πράξεις με ακέραιους αριθμούς (1, 2, 10).

Front-End- μπλοκ προανάκτησης. Λαμβάνει εντολές από το πρόγραμμα και τις μεταφράζει σε γλώσσα κατανοητή στον επεξεργαστή.

FPU- σύμπλεγμα υπολογισμών δεδομένων κινητής υποδιαστολής. Εκτελεί υπολογισμούς με κλασματικούς αριθμούς (1,2345) και μεγάλες τιμές με δυνάμεις (1,2345E-10).

Μπλοκ πρόβλεψης κλάδου- προβλέπει εκ των προτέρων ποια δεδομένα και λειτουργίες μπορεί να χρειαστεί το πρόγραμμα την επόμενη στιγμή. Δεν αφήνει τον επεξεργαστή σε αδράνεια.

Αποκωδικοποιητής εντολών- χωρίζει το πρόγραμμα σε μικρο-λειτουργίες, οι οποίες στη συνέχεια χρησιμοποιούνται από συμπλέγματα υπολογιστών.

Εκτός λειτουργίας- μπλοκ έκτακτης εκτέλεσης. Ασχολήθηκε με την κατανομή των ενεργειών μεταξύ των πυρήνων. Στέλνει για υπολογισμό μόνο τις εντολές για τις οποίες υπάρχουν δεδομένα.

Φόρτωση/εκφόρτωση μπλοκ (LSU) - παρακολουθεί την κίνηση των δεδομένων μεταξύ της εξόδου από τον μεταφορέα και της κρυφής μνήμης δεδομένων L1.

Συσχετισμός κρυφής μνήμης- σύνδεση γραμμών κρυφής μνήμης και στηλών. Όσο υψηλότερη είναι η συσχέτιση, τόσο χαμηλότερη είναι η ταχύτητα αναζήτησης, αλλά τόσο μεγαλύτερη είναι η απόδοσή της.

ΜΜΧ- ένα σύνολο μπλοκ για εργασία με αριθμούς έως 8 byte.

Σετ οδηγιών- επιτρέψτε σε μία εντολή να εκτελέσει μια λειτουργία σε πολλά δεδομένα.

Τραπέζι 1

Προδιαγραφές επεξεργαστών AMD Bulldozer

Αριθμός υπολογιστικών πυρήνων

Βασική συχνότητα

Συχνότητα Turbo Core

Υποστήριξη μνήμης

Κατανάλωση ενέργειας

Τεχνική διαδικασία

Τιμή από τον Νοέμβριο του 2011

άγνωστος

Τι συνθέτει την απόδοση του επεξεργαστή; Προηγουμένως, υπήρχε ένας τύπος σε χρήση που περιέγραφε την απόδοση ως το γινόμενο του αριθμού των εντολών που εκτελούνται ανά κύκλο ρολογιού και της συχνότητας με την οποία λειτουργεί αυτός ο επεξεργαστής. Τώρα έχει εμφανιστεί ένας τρίτος παράγοντας σε αυτόν τον τύπο - ο αριθμός των πυρήνων υπολογιστών. Επομένως, ένας προγραμματιστής επεξεργαστή που θέλει να κυκλοφορήσει ένα γρήγορο προϊόν έχει πολλές επιλογές για να το κάνει αυτό.

Ωστόσο, δεν είναι όλα τόσο απλά. Η αύξηση του αριθμού των εντολών που εκτελούνται από έναν υπολογιστικό πυρήνα ανά κύκλο ρολογιού είναι ένα αρκετά δύσκολο έργο. Κλασικό x86 κώδικα προγράμματοςπεριλαμβάνει τη διαδοχική εκτέλεση εντολών και επομένως, για να επιτευχθεί η παράλληλη επεξεργασία τους, ο επεξεργαστής πρέπει να είναι εξοπλισμένος με πολύ αποδοτικές μονάδες πρόβλεψης κλάδων και αναδιάταξης εντολών, η υλοποίηση των οποίων απαιτεί σημαντική προσπάθεια μηχανικής. Ταυτόχρονα, η επιπλοκή της μικροαρχιτεκτονικής επηρεάζει τις φυσικές διαστάσεις του κρυστάλλου και οδηγεί σε περιορισμούς κατά την αύξηση του αριθμού των πυρήνων. Αν λοιπόν ένας κατασκευαστής πρόκειται να φτιάξει έναν επεξεργαστή με μεγάλο αριθμό πυρήνων, τότε η μικροαρχιτεκτονική θα πρέπει, αντίθετα, να προσπαθήσει να απλοποιήσει. Δεν είναι εύκολο με συχνότητα ρολογιού. Ένα στοίχημα για την ανάπτυξή του θα απαιτήσει και πάλι αλλαγές στα εσωτερικά μπλοκ του επεξεργαστή και επιμήκυνση της γραμμής εκτέλεσής του. Το αποτέλεσμα είναι το εξής: για να κερδίσει ένας επεξεργαστής ένα μετάλλιο απόδοσης, οι προγραμματιστές του πρέπει να εργαστούν σκληρά για να βελτιστοποιήσουν ταυτόχρονα έναν αριθμό παραμέτρων.

Το πρόβλημα έγκειται επίσης στο γεγονός ότι οποιοσδήποτε από τους επιλεγμένους τρόπους βελτίωσης της απόδοσης του επεξεργαστή μπορεί να είναι επιτυχής μόνο για ειδικές περιπτώσεις. Δεν μπορούν όλα τα προγράμματα να λειτουργήσουν αποτελεσματικά με μεγάλο αριθμό πυρήνων. Ορισμένοι αλγόριθμοι δεν σας επιτρέπουν να προβλέψετε σωστά τις μεταβάσεις και να αναδιατάξετε τις οδηγίες. Και σε ορισμένες περιπτώσεις, η απόδοση δεν αυξάνεται ακόμη και με αύξηση της συχνότητας του ρολογιού, επειδή υπάρχουν κάποια άλλα σημεία συμφόρησης στο σύστημα.

Η εύρεση της βέλτιστης ισορροπίας δεν είναι εύκολη και ποιο θεωρείται το βέλτιστο κριτήριο; Μπορούμε μόνο να συγκρίνουμε την απόδοση των επεξεργαστών σε έναν πεπερασμένο αριθμό προγραμμάτων και να επιλέξουμε το ταχύτερο για μια δεδομένη συγκεκριμένη περίπτωση. Ωστόσο, αυτό δεν εγγυάται καθόλου ότι, χρησιμοποιώντας ένα διαφορετικό σύνολο εργαλείων δοκιμής, δεν θα έχουμε εντελώς αντίθετες εκτιμήσεις. Μια τόσο εκτενής εισαγωγή δίνεται εδώ γιατί σήμερα πρόκειται να γνωρίσουμε τη νέα σειρά επεξεργαστών AMD FX - το κορυφαίο προϊόν της AMD, ευρέως γνωστό με την κωδική ονομασία Zambezi. Αυτός ο επεξεργαστής βασίζεται στην πολύ αμφιλεγόμενη μικροαρχιτεκτονική Bulldozer, η οποία έχει ήδη καταφέρει να συγκεντρώσει ένα σημαντικό μπουκέτο από μη κολακευτικές κριτικές. Αλλά το θέμα δεν είναι ότι αυτή η μικροαρχιτεκτονική είναι εντελώς κακή. Κατά την επιλογή της καλύτερης ισορροπίας χαρακτηριστικών, οι προγραμματιστές εκτίμησαν εσφαλμένα τις ανάγκες της πλειοψηφίας των χρηστών και έδωσαν την κύρια έμφαση στον λάθος παράγοντα στη «βασική φόρμουλα». Ως αποτέλεσμα, το αρχικό σχέδιο για την κυκλοφορία μιας λύσης υψηλής απόδοσης μιας νέας γενιάς πήγε στραβά και οι οπαδοί της AMD, ενθουσιασμένοι από τις υποσχέσεις για μια σημαντική ανακάλυψη, έλαβαν κάτι εντελώς διαφορετικό από αυτό που περίμεναν. Ωστόσο, είναι αυτός ένας σοβαρός και αντικειμενικός λόγος απογοήτευσης; Θα μιλήσουμε για αυτό σε αυτό το υλικό.

⇡ Μετρώντας πυρήνες: οκτώ ή τέσσερις;

Ενώ εργαζόταν σε έναν νέο σχεδιασμό για επεξεργαστές απόδοσης, η AMD αποφάσισε να δώσει προτεραιότητα στον αριθμό των πυρήνων επεξεργασίας. Αυτή είναι μια απολύτως λογική επιλογή, που βασίζεται στο γεγονός ότι με τα χρόνια υπάρχει όλο και περισσότερο λογισμικό πολλαπλών νημάτων και η ανάπτυξη μιας μικροαρχιτεκτονικής σχεδιασμένης για πολλά χρόνια ανάπτυξης θα πρέπει πρωτίστως να λαμβάνει υπόψη όχι την τρέχουσα κατάσταση της αγοράς, αλλά τις παρατηρούμενες τάσεις. Οκτώ πυρήνες, που παρέχονται στη βασική έκδοση του νέου επεξεργαστή, ήταν αυτό που επρόκειτο να κατακτήσει η AMD στην αγορά, όπου μέχρι στιγμής είχαν παρουσιαστεί μόνο τσιπ, ο μέγιστος αριθμός πυρήνων στους οποίους περιορίστηκε στους έξι. ( Εδώ μιλάμε μόνο για επιτραπέζιους υπολογιστές. — περίπου. εκδ. )

Την ίδια στιγμή, οι προγραμματιστές δεν ήθελαν να πάρουν τους πυρήνες της παλιάς μικροαρχιτεκτονικής K10. Όχι μόνο είναι πολύ μεγάλα φυσικό μέγεθος, αλλά επίσης, όπως μπορεί να κριθεί από τον Llano, δεν είναι επιρρεπείς να λειτουργούν σε υψηλές συχνότητες ρολογιού ακόμα και μετά τη μεταφορά τους στη σύγχρονη τεχνολογία 32 nm. Επιπλέον, δεν υποστηρίζουν πολλές σύγχρονες δυνατότητες, όπως οδηγίες AVX. Ως εκ τούτου, για τη συναρμολόγηση επεξεργαστών οκτώ πυρήνων, η AMD δημιούργησε μια νέα μικροαρχιτεκτονική - το Bulldozer. Οι εκπρόσωποι της εταιρείας προτιμούν να πουν ότι η ανάπτυξή της πραγματοποιήθηκε από το μηδέν, αλλά στην πραγματικότητα, στους πυρήνες Bulldozer μπορείτε να βρείτε πολλές αναφορές σε μια άλλη μικροαρχιτεκτονική που παρουσιάστηκε φέτος - το Bobcat, που στοχεύει στη χρήση σε συμπαγείς και ενεργειακά αποδοτικές συσκευές. Ωστόσο, η σχέση μεταξύ Bulldozer και Bobcat είναι αρκετά μακρινή και την αναφέρουμε μόνο για να γίνει ξεκάθαρη η γενική ιδέα - το Bulldozer συνδυάζει πολλούς σχετικά απλούς πυρήνες.

Ταυτόχρονα, δεν μιλάμε για τον πρωτόγονο συνδυασμό οκτώ απλών πυρήνων σε ένα τσιπ ημιαγωγών. Σε αυτήν την περίπτωση, ο επεξεργαστής που θα προκύψει θα είχε πολύ χαμηλή απόδοση ενός νήματος και αυτό θα γινόταν ένα αρκετά σοβαρό πρόβλημα, καθώς δεν υπάρχουν τόσο λίγα προγράμματα που δεν χωρίζουν το φορτίο σε πολλά υπολογιστικά νήματα. Επομένως, πρώτον, οι πυρήνες βελτιστοποιήθηκαν για λειτουργία σε υψηλές ταχύτητες ρολογιού. Και δεύτερον, συνδυάστηκαν σε μονάδες διπλού πυρήνα ικανές να μοιράζονται τους πόρους τους για να εξυπηρετήσουν ένα μόνο νήμα. Το αποτέλεσμα είναι ένας αρκετά ενδιαφέρον σχεδιασμός: το τμήμα εισόδου του αγωγού εκτέλεσης μιας τέτοιας μονάδας διπλού πυρήνα είναι κοινό και η περαιτέρω επεξεργασία εντολών χωρίζεται σε δύο σετ συσκευών εκτέλεσης.

Η βάση του σχεδιασμού της μπουλντόζας είναι αυτό που συμβατικά ονομάζεται μονάδα διπλού πυρήνα

Υπενθυμίζουμε ότι η διαδικασία επεξεργασίας δεδομένων σε σύγχρονο επεξεργαστήπεριλαμβάνει διάφορα στάδια: ανάκτηση οδηγιών x86 από την κρυφή μνήμη, αποκωδικοποίησή τους - μετάφρασή τους σε εσωτερικές μακροεντολές, εκτέλεση, καταγραφή των αποτελεσμάτων. Τα δύο πρώτα στάδια στη μονάδα Bulldozer εκτελούνται για ένα ζεύγος πυρήνων μαζί και, στη συνέχεια, για ακέραιες οδηγίες, η εκτέλεση κατανέμεται σε δύο πυρήνες συμπλέγματος ή, στην περίπτωση της πραγματικής αριθμητικής, εκτελείται σε ένα μπλοκ πράξεων κινητής υποδιαστολής κοινό σε δύο πυρήνες.

Οι μονάδες μπουλντόζας έχουν σχεδιαστεί για να επεξεργάζονται τέσσερις εντολές ανά κύκλο ρολογιού και, χάρη στην τεχνολογία συγχώνευσης μακροεντολών, ορισμένα ζεύγη εντολών x86 μπορούν να θεωρηθούν από τον επεξεργαστή ως μία λειτουργία. Αυτό σημαίνει ότι, γενικά, η μονάδα Dual-core Bulldozer είναι παρόμοια σε ισχύ με έναν μόνο πυρήνα σύγχρονων επεξεργαστών Intel, ο οποίος μπορεί επίσης να επεξεργαστεί τέσσερις οδηγίες ανά κύκλο ρολογιού και επίσης να υποστηρίζει συγχωνεύσεις μακροεντολών.

Ωστόσο, υπάρχουν σημαντικές διαφορές μεταξύ της μονάδας Bulldozer και του πυρήνα της Sandy Bridge που μπορεί να θέσουν υπό αμφισβήτηση την ίδια περίπου θεωρητική ταχύτητά τους. Λόγω του γεγονότος ότι η μονάδα των νέων επεξεργαστών AMD περιέχει τα υπολείμματα δύο ίσων πυρήνων, μπορεί να επιδείξει μέγιστη απόδοση μόνο κατά την επεξεργασία ενός ζεύγους νημάτων. Εάν φέρει φορτίο μονού νήματος, τότε η ταχύτητα της υπηρεσίας του θα περιοριστεί από τον αριθμό των συσκευών εκτέλεσης σε ένα τέτοιο σύμπλεγμα. Και δεν υπάρχουν τόσα πολλά από αυτά, δεδομένης της επιθυμίας της AMD να απλοποιήσει μεμονωμένους πυρήνες - μιάμιση φορά λιγότερο από ό,τι σε επεξεργαστές με μικροαρχιτεκτονική Sandy Bridge ή K10. Δηλαδή, δύο αριθμητικές ALU και δύο διευθύνσεις AGU.

Αυτή είναι η λειτουργική δομή μιας μονάδας που βασίζεται στη μικροαρχιτεκτονική Bulldozer. Από δύο πυρήνες απομένουν μόνο δύο σετ ακέραιων ενεργοποιητών

Το μπλοκ λειτουργιών κινητής υποδιαστολής που είναι κοινό στη μονάδα επεξεργαστή είναι επίσης σχετικά χαμηλής πολυπλοκότητας. Περιλαμβάνει δύο μονάδες εκτέλεσης FMAC 128 bit, οι οποίες μπορούν να συνδυαστούν σε μία μονάδα για την επεξεργασία εντολών 256 bit. Φαίνεται ότι δεν υπάρχουν τόσοι πολλοί ενεργοποιητές εδώ, ειδικά αν σκεφτεί κανείς ότι χωρίζονται σε ένα ζευγάρι πυρήνων. Αλλά είναι πιο καθολικές από ό,τι σε προηγούμενες και ανταγωνιστικές μικροαρχιτεκτονικές, οι οποίες χρησιμοποιούν ξεχωριστούς πολλαπλασιαστές και αθροιστές. Και χάρη σε αυτό, σε ορισμένες περιπτώσεις, όταν εργάζεστε με πραγματικούς αριθμούς, η μονάδα διπύρηνου Bulldozer μπορεί να προσφέρει συγκρίσιμα και ακόμη περισσότερα υψηλή απόδοσηπαρά, για παράδειγμα, ένας πυρήνας Sandy Bridge.

Μια παρόμοια ιδέα συνδυασμού συσκευών 128-bit για εργασία με οδηγίες 256-bit χρησιμοποιείται στο Sandy Bridge

Ωστόσο, η μονάδα Bulldozer θα πρέπει να δείχνει τις μεγαλύτερες δυνάμεις της κάτω από ένα φορτίο διπλού νήματος. Ένας πυρήνας Sandy Bridge είναι επίσης ικανός να επεξεργαστεί δύο υπολογιστικά νήματα· γι' αυτό διαθέτει τεχνολογία Hyper-Threading. Ωστόσο, όλες οι οδηγίες αποστέλλονται σε ένα σύνολο ενεργοποιητών, το οποίο στην πράξη προκαλεί πολυάριθμες συγκρούσεις. Η μονάδα Bulldozer περιέχει δύο ανεξάρτητα συμπλέγματα ακεραίων που μπορούν να εκτελούν νήματα παράλληλα και ο συνολικός αριθμός των συσκευών εκτέλεσης σε αυτά υπερβαίνει τον αριθμό τέτοιων συσκευών στον πυρήνα Sandy Bridge κατά μιάμιση φορά.

Αριστερά είναι η μονάδα Bulldozer, στα δεξιά υπάρχει ένας ανταγωνιστικός πυρήνας με υποστήριξη Hyper-Threading. Στην πραγματικότητα, δεν μοιάζει πολύ με Sandy Bridge, αλλά η εικόνα μεταφέρει την ουσία του προβλήματος

Ως αποτέλεσμα, η μονάδα Bulldozer έχει υψηλότερη απόδοση αιχμής από τον πυρήνα Sandy Bridge, αλλά αυτή η απόδοση είναι κάπως πιο δύσκολο να ξεκλειδωθεί. Ο πυρήνας Sandy Bridge φορτώνει έξυπνα τους δικούς του πόρους χάρη στην προηγμένη λογική στο τσιπ που αναλύει ανεξάρτητα τον κώδικα ενός νήματος και τον εκτελεί παράλληλα στο πλήρες σύνολο των συσκευών εκτέλεσης. Στο Bulldozer, το έργο της αποτελεσματικής χρήσης ενεργοποιητών μετατίθεται εν μέρει στον προγραμματιστή, ο οποίος πρέπει να χωρίσει τον κώδικά του σε δύο νήματα - πλήρης λήψηόλων των χωρητικοτήτων της μονάδας θα καταστεί δυνατή μόνο τότε.

Και αυτό είναι το χαρακτηριστικό. Όταν εξετάζουμε τη μονάδα επεξεργαστή Dual-core Bulldozer, τη συγκρίναμε συνεχώς με έναν μόνο πυρήνα Sandy Bridge και ταυτόχρονα καταφέραμε να σχεδιάσουμε αρκετά σωστούς παραλληλισμούς. Αυτό μας κάνει να αναρωτιόμαστε: δεν θα έπρεπε η «οκταπύρηνη» φύση της νέας μικροαρχιτεκτονικής να θεωρείται προϊόν της φαντασίας των εμπόρων; Η AMD λέει ότι οι πυρήνες θα πρέπει να μετρώνται από τον αριθμό των ακέραιων συστάδων, υποστηρίζοντας ότι η μονάδα μπορεί να παρέχει έως και το 80% της απόδοσης δύο ανεξάρτητων πυρήνων. Ωστόσο, δεν πρέπει να ξεχνάμε ότι οι πυρήνες στους οποίους βασίζεται το Bulldozer είναι σημαντικά πιο απλοί από τους πυρήνες άλλων επεξεργαστών. Ως εκ τούτου, ο αριθμός των μονάδων διπλού πυρήνα είναι ένα χαρακτηριστικό που αντικατοπτρίζει την απόδοση του Bulldozer πολύ πιο επαρκώς.

Βρείτε τον μέγιστο αριθμό πυρήνων επεξεργαστών και βρείτε δουλειά στο τμήμα μάρκετινγκ της AMD

⇡ Προσωρινή μνήμη

Η οργάνωση της κρυφής μνήμης στους επεξεργαστές Bulldozer είναι επίσης «δεμένη» όχι τόσο με μεμονωμένους πυρήνες, αλλά με μονάδες διπλού πυρήνα. Στην πραγματικότητα, σε κάθε πυρήνα εκχωρείται μόνο η δική του κρυφή μνήμη πρώτου επιπέδου· όλα τα άλλα επίπεδα της κρυφής μνήμης σχετίζονται είτε με τη μονάδα στο σύνολό της είτε με τον επεξεργαστή:

  • Κάθε πυρήνας έχει τη δική του προσωρινή μνήμη L1 για δεδομένα. Ο όγκος του είναι 16 KB και η αρχιτεκτονική προϋποθέτει την παρουσία τεσσάρων συνειρμικών καναλιών. Αυτή η κρυφή μνήμη λειτουργεί με έναν αλγόριθμο εγγραφής, πράγμα που σημαίνει ότι περιλαμβάνει.
  • Η κρυφή μνήμη πρώτου επιπέδου για οδηγίες παρέχεται σε ένα μόνο αντίγραφο για κάθε μονάδα διπλού επεξεργαστή. Ο όγκος του είναι 64 KB και ο αριθμός των καναλιών συσχέτισης είναι δύο.
  • Η κρυφή μνήμη δεύτερου επιπέδου υλοποιείται επίσης σε μία μόνο παρουσία ανά λειτουργική μονάδα. Το μέγεθός του είναι εντυπωσιακά 2 MB, η συσχέτιση είναι 16 κανάλια και ο αλγόριθμος λειτουργίας είναι αποκλειστικός.
  • Επιπλέον, ο οκταπύρηνος επεξεργαστής στο σύνολό του διαθέτει μνήμη cache L3 8 megabyte με συσχετισμό 64 καναλιών. Η ιδιαιτερότητα αυτής της κρυφής μνήμης είναι ότι λειτουργεί σε σημαντικά χαμηλότερη συχνότητα σε σύγκριση με τον ίδιο τον επεξεργαστή, που είναι περίπου 2 GHz.

Ο ακόλουθος πίνακας περιγράφει την αναλογία όγκων μνήμης cache για επεξεργαστές Bulldozer οκτώ πυρήνων, τεσσάρων πυρήνων Sandy Bridge και Thuban (εξαπύρηνο Phenom II X6, που βασίζεται στη μικροαρχιτεκτονική K10).

Τύπος κρυφής μνήμης Μπουλντόζα (8 πυρήνες/4 μονάδες) Sandy Bridge (4 πυρήνες) Thuban (6 πυρήνες)
L1I (οδηγίες) 4x64 KB 4x32 KB 6x64 KB
L1D (δεδομένα) 8x16 KB 4x32 KB 6x64 KB
L2 4x2 MB 4x256 KB 6x512 KB
L3 8 MB, 2,0-2,2 GHz 8 MB, τρέχει με ταχύτητα επεξεργαστή 6 MB, 2,0 GHz

Όπως μπορείτε να δείτε από τον πίνακα, η AMD βασίστηκε σε μεγάλες κρυφές μνήμες ανώτερου επιπέδου, οι οποίες μπορούν να είναι πραγματικά χρήσιμες σε περίπτωση σοβαρού φορτίου πολλαπλών νημάτων. Ωστόσο, η προσωρινή μνήμη στους νέους επεξεργαστές είναι γενικά πιο αργή από αυτή των προηγούμενων και ανταγωνιστικών προϊόντων. Αυτό εντοπίζεται εύκολα κατά τη μέτρηση της πρακτικής καθυστέρησης.

Οι μεγάλες καθυστερήσεις κατά την πρόσβαση σε δεδομένα στο Bulldozer μπορούν να αντισταθμιστούν μόνο από την υψηλή ταχύτητα ρολογιού αυτών των CPU. Κάτι που όμως αρχικά είχε προγραμματιστεί - όσον αφορά τις συχνότητες, οι νέοι οκταπύρηνες επεξεργαστές υποτίθεται ότι ξεπερνούσαν το Phenom II κατά 30%. Ωστόσο, η AMD δεν μπόρεσε ποτέ να σχεδιάσει κρυστάλλους ημιαγωγών ικανούς να λειτουργούν σταθερά σε τόσο υψηλές συχνότητες. Ως αποτέλεσμα, η υψηλή καθυστέρηση της προσωρινής μνήμης μπορεί να προκαλέσει σημαντική ζημιά στα συστήματα που βασίζονται σε Bulldozer.