تعداد واحدها یا پردازنده های محاسباتی (شیدر). کارت های ویدئویی فرکانس واحد سایه زن

اجزای اصلی کارت گرافیک:

  • خروجی ها
  • رابط ها
  • سیستم خنک کننده؛
  • پردازنده گرافیکی
  • حافظه ویدیویی

فناوری های گرافیکی:

  • فرهنگ لغت؛
  • معماری GPU: ویژگی ها
    واحدهای رأس/پیکسل، شیدرها، نرخ پر شدن، واحدهای بافت/راستر، خطوط لوله.
  • معماری GPU: فناوری
    فرآیند فنی، فرکانس GPU، حافظه ویدئویی محلی (حجم، اتوبوس، نوع، فرکانس)، راه حل هایی با چندین کارت گرافیک؛
  • توابع بصری
    DirectX، محدوده دینامیکی بالا (HDR)، ضد آلیاسینگ تمام صفحه، فیلتر بافت، بافت های با وضوح بالا.

واژه نامه اصطلاحات گرافیکی پایه

نرخ تجدید

درست مانند یک سینما یا تلویزیون، کامپیوتر شما با نمایش متوالی فریم ها، حرکت را روی مانیتور شبیه سازی می کند. نرخ تازه سازی مانیتور نشان می دهد که تصویر روی صفحه چند بار در ثانیه به روز می شود. به عنوان مثال، فرکانس 75 هرتز مربوط به 75 به روز رسانی در ثانیه است.

اگر رایانه فریم‌ها را سریع‌تر از مانیتور پردازش کند، ممکن است مشکلاتی در بازی‌ها رخ دهد. به عنوان مثال، اگر رایانه 100 فریم در ثانیه رندر می‌کند و نرخ تازه‌سازی مانیتور 75 هرتز است، به دلیل همپوشانی‌ها، مانیتور تنها می‌تواند بخشی از تصویر را در طول دوره تازه‌سازی خود نمایش دهد. در نتیجه، مصنوعات بصری ظاهر می شوند.

به عنوان یک راه حل، می توانید V-Sync (همگام سازی عمودی) را فعال کنید. این تعداد فریم هایی را که رایانه می تواند تولید کند به نرخ تازه سازی مانیتور محدود می کند و از ایجاد مصنوعات جلوگیری می کند. اگر V-Sync را فعال کنید، تعداد فریم های محاسبه شده در بازی هرگز از نرخ تازه سازی بیشتر نخواهد شد. یعنی در 75 هرتز کامپیوتر بیش از 75 فریم در ثانیه خروجی نخواهد داشت.

پیکسل

کلمه "Pixel" مخفف " عکس ture elعنصر" - عنصر تصویر. این یک نقطه کوچک روی صفحه نمایش است که می تواند در یک رنگ خاص بدرخشد (در بیشتر موارد، رنگ با ترکیبی از سه رنگ اصلی: قرمز، سبز و آبی نمایش داده می شود). اگر وضوح صفحه نمایش 1024x768 باشد، می توانید ماتریسی از 1024 پیکسل در عرض و 768 پیکسل در ارتفاع را مشاهده کنید. همه پیکسل ها با هم تصویر را تشکیل می دهند. بسته به نوع نمایشگر و خروجی داده از کارت ویدئو، تصویر روی صفحه از 60 تا 120 بار در ثانیه به روز می شود. مانیتورهای CRT صفحه نمایش را خط به خط تازه می کنند، در حالی که مانیتورهای LCD با صفحه تخت می توانند هر پیکسل را به صورت جداگانه تازه کنند.

راس

تمام اشیاء در یک صحنه سه بعدی از رئوس تشکیل شده اند. راس نقطه ای در فضای سه بعدی با مختصات X، Y و Z است. چندین راس را می توان در یک چند ضلعی گروه بندی کرد: اغلب این یک مثلث است، اما اشکال پیچیده تری نیز ممکن است. سپس یک بافت بر روی چند ضلعی اعمال می شود که باعث می شود شی واقع گرایانه به نظر برسد. مکعب سه بعدی نشان داده شده در تصویر بالا از هشت راس تشکیل شده است. اجسام پیچیده تر دارای سطوح منحنی هستند که در واقع از تعداد بسیار زیادی رئوس تشکیل شده اند.

بافت

بافت به سادگی یک تصویر دو بعدی با اندازه دلخواه است که برای شبیه سازی سطح آن بر روی یک شی سه بعدی نگاشت می شود. به عنوان مثال، مکعب سه بعدی ما از هشت راس تشکیل شده است. قبل از اعمال بافت، مانند یک جعبه ساده به نظر می رسد. اما وقتی بافت را اعمال می کنیم، جعبه رنگی می شود.

سایه بان

برنامه‌های سایه‌زن پیکسل به کارت ویدیو اجازه می‌دهند تا جلوه‌های چشمگیری تولید کند، به عنوان مثال، مانند آب داخل طومارهای بزرگ: فراموشی.

امروزه دو نوع سایه زن وجود دارد: راس و پیکسل. برنامه های سایه زن Vertex می توانند اشیاء سه بعدی را تغییر داده یا تبدیل کنند. برنامه های سایه زن پیکسل به شما امکان می دهند رنگ پیکسل ها را بر اساس برخی داده ها تغییر دهید. یک منبع نور را در یک صحنه سه بعدی تصور کنید که باعث می شود اشیاء نورانی درخشان تر بدرخشند و در عین حال باعث ایجاد سایه بر روی اشیاء دیگر شود. همه اینها با تغییر اطلاعات رنگ پیکسل ها به دست می آید.

سایه زن پیکسل برای ایجاد جلوه های پیچیده در بازی های مورد علاقه شما استفاده می شود. به عنوان مثال، کد سایه زن می تواند پیکسل های اطراف یک شمشیر سه بعدی را درخشان تر کند. سایه زن دیگر می تواند تمام رئوس یک شی پیچیده سه بعدی را پردازش کرده و یک انفجار را شبیه سازی کند. توسعه دهندگان بازی به طور فزاینده ای برای ایجاد برنامه های سایه زن پیچیده روی می آورند گرافیک واقعی. تقریباً هر بازی مدرن با گرافیک غنی از شیدرها استفاده می کند.

با انتشار رابط برنامه نویسی برنامه (API) بعدی مایکروسافت DirectX 10، نوع سوم سایه زن به نام geometry shader منتشر خواهد شد. با کمک آنها، بسته به نتیجه مورد نظر، شکستن اشیاء، اصلاح و حتی از بین بردن آنها امکان پذیر خواهد بود. نوع سوم شیدرها را می توان دقیقاً به همان روشی که دو مورد اول برنامه ریزی کرد، اما نقش آن متفاوت خواهد بود.

نرخ پر

اغلب در جعبه کارت گرافیک می توانید مقدار نرخ پر شدن را پیدا کنید. اساساً نرخ پر شدن نشان می دهد که GPU با چه سرعتی می تواند پیکسل ها را خروجی دهد. کارت‌های ویدئویی قدیمی‌تر دارای نرخ پر شدن مثلث بودند. اما امروزه دو نوع نرخ پر شدن وجود دارد: میزان پر شدن پیکسل و نرخ پر شدن بافت. همانطور که قبلا ذکر شد، نرخ پر شدن پیکسل با نرخ خروجی پیکسل مطابقت دارد. به عنوان تعداد عملیات شطرنجی (ROP) ضرب در فرکانس ساعت محاسبه می شود.

نرخ پر شدن بافت توسط ATi و nVidia متفاوت محاسبه می شود. انویدیا معتقد است که سرعت با ضرب تعداد خطوط لوله پیکسل در فرکانس ساعت به دست می آید. و ATi تعداد واحدهای بافت را در سرعت ساعت ضرب می کند. در اصل، هر دو روش صحیح هستند، زیرا nVidia از یک واحد بافت در هر واحد سایه زن استفاده می کند (یعنی یک واحد در هر خط لوله پیکسل).

با در نظر گرفتن این تعاریف، اجازه دهید ادامه دهیم و مهم ترین عملکردهای GPU، کارهایی که انجام می دهند و چرا اینقدر مهم هستند را مورد بحث قرار دهیم.

معماری GPU: ویژگی ها

واقعی بودن گرافیک سه بعدی تا حد زیادی به عملکرد کارت گرافیک بستگی دارد. هرچه تعداد بلوک‌های سایه‌زن پیکسلی پردازنده بیشتر باشد و فرکانس آن بیشتر باشد، می‌توان جلوه‌های بیشتری را روی صحنه سه‌بعدی اعمال کرد تا درک بصری آن را بهبود بخشد.

GPU شامل بسیاری از بلوک های عملکردی مختلف است. با تعداد برخی از مؤلفه ها، می توانید تخمین بزنید که GPU چقدر قدرتمند است. قبل از حرکت بیشتر، اجازه دهید مهم ترین بلوک های کاربردی را مرور کنیم.

پردازنده های راس (واحد سایه زن راس)

مانند واحدهای سایه زن پیکسل، پردازنده های راس کد سایه زن را اجرا می کنند که رئوس را لمس می کند. از آنجایی که بودجه راس بزرگتر امکان ایجاد اشیاء سه بعدی پیچیده تر را فراهم می کند، عملکرد پردازنده های راس در صحنه های سه بعدی بسیار مهم است. اشیاء پیچیدهیا با تعداد زیادی از آنها. با این حال، واحدهای سایه زن راس هنوز هم مانند پردازنده‌های پیکسل تأثیر آشکاری بر عملکرد ندارند.

پردازنده های پیکسل (واحد سایه زن پیکسل)

پردازنده پیکسلی جزء یک تراشه گرافیکی است که به پردازش برنامه های سایه زن پیکسل اختصاص داده شده است. این پردازنده ها محاسباتی را انجام می دهند که فقط به پیکسل ها مربوط می شود. از آنجایی که پیکسل ها حاوی اطلاعات رنگی هستند، سایه زن های پیکسل به شما اجازه می دهد تا جلوه های گرافیکی چشمگیری داشته باشید. به عنوان مثال، بیشتر افکت های آبی که در بازی ها می بینید با استفاده از سایه زن های پیکسل ایجاد می شوند. به طور معمول، تعداد پردازنده های پیکسل برای مقایسه عملکرد پیکسل کارت های ویدئویی استفاده می شود. اگر یک کارت دارای هشت واحد سایه زن پیکسل و دیگری دارای 16 واحد باشد، منطقی است که فرض کنیم یک کارت گرافیک با 16 واحد در پردازش برنامه های سایه زن پیچیده پیکسل سریعتر خواهد بود. سرعت کلاک را نیز باید در نظر گرفت، اما امروزه دوبرابر کردن تعداد پردازنده‌های پیکسلی نسبت به دو برابر کردن فرکانس تراشه‌های گرافیکی، صرفه‌جویی در مصرف انرژی دارد.

شیدرهای یکپارچه

شیدرهای یکپارچه هنوز وارد دنیای رایانه های شخصی نشده اند، اما استاندارد آتی DirectX 10 مبتنی بر معماری مشابهی است. یعنی ساختار کد برنامه های رأس، هندسه و پیکسل یکسان خواهد بود، اگرچه سایه بان ها کار متفاوتی را انجام می دهند. مشخصات جدید را می توان در Xbox 360 مشاهده کرد، جایی که GPU به طور ویژه توسط ATi برای مایکروسافت طراحی شده است. دیدن اینکه DirectX 10 جدید چه پتانسیل هایی را به همراه دارد بسیار جالب خواهد بود.

واحدهای نقشه برداری بافت (TMU)

بافت ها باید انتخاب و فیلتر شوند. این کار توسط واحدهای نگاشت بافت انجام می شود که در ارتباط با واحدهای سایه زن پیکسل و رأس کار می کنند. وظیفه TMU اعمال عملیات بافت بر روی پیکسل ها است. تعداد واحدهای بافت در یک GPU اغلب برای مقایسه عملکرد بافت کارت‌های ویدئویی استفاده می‌شود. منطقی است که فرض کنیم یک کارت گرافیک با TMU های بیشتر، عملکرد بافت بهتری را ارائه می دهد.

واحدهای اپراتور رستر (ROP)

پردازنده های رستر وظیفه نوشتن داده های پیکسلی در حافظه را بر عهده دارند. سرعتی که این عملیات با آن انجام می شود، نرخ پر شدن است. در روزهای اولیه شتاب دهنده های سه بعدی، ROP و نرخ پر شدن از ویژگی های بسیار مهم کارت های ویدئویی بودند. امروزه، کار ROP هنوز مهم است، اما عملکرد کارت گرافیک دیگر مانند گذشته توسط این بلوک ها محدود نمی شود. بنابراین، عملکرد (و تعداد) ROP به ندرت برای ارزیابی سرعت یک کارت گرافیک استفاده می شود.

نوار نقاله

خطوط لوله برای توصیف معماری کارت های ویدئویی و ارائه یک ایده بسیار واضح از عملکرد GPU استفاده می شود.

نوار نقاله را نمی توان یک اصطلاح فنی دقیق در نظر گرفت. GPU از خطوط لوله مختلفی استفاده می کند که عملکردهای مختلفی را انجام می دهند. از لحاظ تاریخی، خط لوله به معنای یک پردازنده پیکسلی بود که به واحد نقشه برداری بافت (TMU) متصل بود. به عنوان مثال، کارت گرافیک Radeon 9700 از هشت پردازنده پیکسل استفاده می کند که هر کدام به TMU خود متصل هستند، بنابراین کارت دارای هشت خط لوله در نظر گرفته می شود.

ولی پردازنده های مدرنتوصیف آن با تعداد نوار نقاله بسیار دشوار است. در مقایسه با طراحی های قبلی، پردازنده های جدید از ساختار ماژولار و تکه تکه استفاده می کنند. ATi را می توان یک مبتکر در این زمینه در نظر گرفت که با خط کارت گرافیک X1000 به ساختار ماژولار تبدیل شد که امکان دستیابی به دستاوردهای عملکرد را از طریق بهینه سازی داخلی ممکن کرد. برخی از بلوک‌های CPU بیشتر از سایرین استفاده می‌شوند و برای بهبود عملکرد GPU، ATi سعی کرده است بین تعداد بلوک‌های مورد نیاز و ناحیه Die (که نمی‌توان آن را زیاد افزایش داد) سازش پیدا کند. در این معماری، اصطلاح "pixel pipeline" معنای خود را از دست داده است، زیرا پردازنده های پیکسل دیگر به TMU های خود متصل نیستند. به عنوان مثال، پردازنده گرافیکی ATi Radeon X1600 دارای 12 واحد سایه زن و تنها چهار واحد نقشه برداری بافت TMU است. بنابراین، نمی توان گفت که معماری این پردازنده دارای 12 پیکسل پیکسل است، همانطور که نمی توان گفت که تنها چهار مورد از آنها وجود دارد. با این حال، طبق سنت، خطوط لوله پیکسل هنوز ذکر شده است.

با در نظر گرفتن مفروضات فوق، تعداد خطوط لوله پیکسل در یک GPU اغلب برای مقایسه کارت های ویدئویی (به استثنای خط ATi X1x00) استفاده می شود. به عنوان مثال، اگر کارت‌های ویدئویی را با خط لوله 24 و 16 می‌گیرید، کاملاً منطقی است که فرض کنیم کارت با 24 خط لوله سریع‌تر خواهد بود.

معماری GPU: فناوری

فرآیند فنی

این اصطلاح به اندازه یک عنصر (ترانزیستور) تراشه و دقت فرآیند ساخت اشاره دارد. بهبود در فرآیندهای فنی امکان به دست آوردن عناصر با اندازه کوچکتر را فراهم می کند. به عنوان مثال، فرآیند 0.18 میکرون ویژگی های بزرگ تری نسبت به فرآیند 0.13 میکرون ایجاد می کند، بنابراین کارآمد نیست. ترانزیستورهای کوچکتر با ولتاژ کمتر کار می کنند. به نوبه خود، کاهش ولتاژ منجر به کاهش مقاومت حرارتی می شود که منجر به کاهش مقدار گرمای تولید شده می شود. بهبود در فرآیند فنی امکان کاهش فاصله بین بلوک های عملکردی تراشه را فراهم می کند و انتقال داده ها زمان کمتری را می طلبد. فواصل کوتاه تر، ولتاژهای کمتر و سایر پیشرفت ها امکان دستیابی به سرعت کلاک بالاتر را فراهم می کند.

آنچه درک را تا حدودی پیچیده می کند این است که امروزه از هر دو میکرومتر (μm) و نانومتر (nm) برای تعیین یک فرآیند فنی استفاده می شود. در واقع، همه چیز بسیار ساده است: 1 نانومتر برابر با 0.001 میکرومتر است، بنابراین فرآیندهای 0.09 میکرومتر و 90 نانومتر یکسان هستند. همانطور که در بالا ذکر شد، یک فناوری فرآیند کوچکتر امکان سرعت ساعت بالاتر را فراهم می کند. برای مثال، اگر کارت‌های ویدئویی را با تراشه‌های 0.18 میکرون و 0.09 میکرون (90 نانومتر) مقایسه کنیم، انتظار فرکانس بالاتر از یک کارت 90 نانومتری کاملا منطقی است.

سرعت ساعت GPU

سرعت ساعت GPU با مگاهرتز (MHz) اندازه گیری می شود که میلیون ها سیکل ساعت در ثانیه است.

سرعت ساعت به طور مستقیم بر عملکرد GPU تأثیر می گذارد. هر چه بالاتر باشد، کار بیشترمی تواند در یک ثانیه انجام شود. برای مثال اول، کارت گرافیک nVidia GeForce 6600 و 6600 GT را در نظر بگیرید: پردازنده گرافیکی 6600 GT با فرکانس 500 مگاهرتز کار می کند و کارت معمولی 6600 - در 400 مگاهرتز. از آنجایی که پردازنده ها از نظر فنی یکسان هستند، افزایش 20 درصدی 6600 GT در سرعت ساعت منجر به عملکرد بالاتر می شود.

اما سرعت ساعت همه چیز نیست. به خاطر داشته باشید که عملکرد تا حد زیادی تحت تاثیر معماری است. برای مثال دوم، کارت گرافیک GeForce 6600 GT و GeForce 6800 GT را در نظر بگیرید. پردازنده گرافیکی 6600 GT با فرکانس 500 مگاهرتز کار می کند، اما 6800 GT تنها با فرکانس 350 مگاهرتز کار می کند. حال بیایید در نظر بگیریم که 6800 GT از 16 پیکسل استفاده می کند، در حالی که 6600 GT تنها از هشت پیکسل استفاده می کند. بنابراین، یک 6800 GT با 16 خط لوله در فرکانس 350 مگاهرتز تقریباً همان عملکرد یک پردازنده با هشت خط لوله و دو برابر سرعت کلاک (700 مگاهرتز) را دارد. با این گفته، سرعت ساعت را می توان به راحتی برای مقایسه عملکرد استفاده کرد.

حافظه ویدئویی محلی

حافظه کارت گرافیک تا حد زیادی بر عملکرد تأثیر می گذارد. ولی پارامترهای مختلفحافظه به طرق مختلف تحت تأثیر قرار می گیرد.

اندازه حافظه ویدیویی

احتمالاً می توان مقدار حافظه ویدیویی را بیش از حد برآورد شده ترین پارامتر یک کارت گرافیک نامید. مصرف کنندگان بی تجربه اغلب از ظرفیت حافظه ویدیویی برای مقایسه کارت های مختلف با یکدیگر استفاده می کنند، اما در واقعیت، ظرفیت در مقایسه با پارامترهایی مانند فرکانس گذرگاه حافظه و رابط (عرض باس) تأثیر کمی بر عملکرد دارد.

در بیشتر موارد، کارتی با 128 مگابایت حافظه ویدئویی تقریباً مشابه کارت با 256 مگابایت عمل می کند. البته، شرایطی وجود دارد که حافظه بیشتر باعث بهبود عملکرد می شود، اما به خاطر داشته باشید که حافظه بیشتر به طور خودکار منجر به افزایش سرعت بازی نمی شود.

جایی که حجم می تواند مفید باشد در بازی هایی با بافت های با وضوح بالا است. توسعه دهندگان بازی چندین مجموعه از بافت ها را برای بازی ارائه می دهند. و هرچه حافظه روی کارت گرافیک بیشتر باشد، بافت های بارگذاری شده وضوح بیشتری می توانند داشته باشند. بافت های با وضوح بالا بیشتر ارائه می دهند کیفیت بالاو جزئیات در بازی بنابراین، اگر همه معیارهای دیگر مطابقت داشته باشند، گرفتن کارتی با مقدار حافظه زیاد کاملاً منطقی است. اجازه دهید یک بار دیگر به شما یادآوری کنیم که عرض گذرگاه حافظه و فرکانس آن تأثیر بسیار قوی تری بر عملکرد نسبت به میزان حافظه فیزیکی روی کارت دارد.

عرض گذرگاه حافظه

عرض گذرگاه حافظه یکی از مهمترین جنبه های عملکرد حافظه است. باس های مدرن از 64 تا 256 بیت و در برخی موارد حتی 512 بیت متغیر هستند. هرچه گذرگاه حافظه عریض تر باشد، اطلاعات بیشتری می تواند در هر سیکل ساعت منتقل کند. و این به طور مستقیم بر بهره وری تاثیر می گذارد. به عنوان مثال، اگر دو اتوبوس با فرکانس های مساوی را انتخاب کنید، از نظر تئوری یک گذرگاه 128 بیتی دو برابر بیشتر از یک گذرگاه 64 بیتی در هر سیکل ساعت، داده انتقال می دهد. و گذرگاه 256 بیتی دو برابر بزرگتر است.

پهنای باند گذرگاه بالاتر (بیان شده در بیت یا بایت در ثانیه، 1 بایت = 8 بیت) عملکرد حافظه بالاتری را ارائه می دهد. به همین دلیل است که گذرگاه حافظه بسیار مهمتر از اندازه آن است. در فرکانس های مساوی، گذرگاه حافظه 64 بیتی تنها با سرعت 25 درصد از 256 بیتی کار می کند!

بیایید مثال زیر را در نظر بگیریم. کارت گرافیک با 128 مگابایت حافظه ویدئویی، اما با گذرگاه 256 بیتی، عملکرد حافظه بسیار بالاتری نسبت به مدل 512 مگابایتی با گذرگاه 64 بیتی ارائه می دهد. توجه به این نکته ضروری است که برای برخی از کارت های خط ATi X1x00، سازندگان مشخصات گذرگاه حافظه داخلی را نشان می دهند، اما ما به پارامترهای گذرگاه خارجی علاقه مند هستیم. به عنوان مثال، X1600 دارای یک گذرگاه حلقه داخلی با عرض 256 بیت است، اما یک گذرگاه خارجی که تنها 128 بیت عرض دارد. و در واقع، گذرگاه حافظه با عملکرد 128 بیتی کار می کند.

انواع حافظه

حافظه را می توان به دو دسته اصلی تقسیم کرد: SDR (انتقال تک داده) و DDR (انتقال دوگانه داده) که در آن داده ها در هر سیکل ساعت دو برابر سریعتر منتقل می شوند. امروزه فناوری SDR انتقال تک منسوخ شده است. از آنجا که حافظه DDRداده ها دو برابر سریعتر از SDR منتقل می شوند؛ مهم است که به یاد داشته باشید که کارت های ویدیویی با حافظه DDR اغلب فرکانس دو برابر را نشان می دهند، نه فیزیکی. به عنوان مثال، اگر حافظه DDR روی 1000 مگاهرتز مشخص شده باشد، این فرکانس موثری است که باید در آن کار کند. حافظه معمولی SDR برای ارائه همان توان عملیاتی. اما در واقع فرکانس فیزیکی 500 مگاهرتز است.

به همین دلیل، هنگامی که فرکانس 1200 مگاهرتز DDR برای حافظه کارت گرافیک آنها نشان داده می شود، بسیاری تعجب می کنند و شرکت های خدماتی نیز 600 مگاهرتز را گزارش می دهند. بنابراین باید به آن عادت کنید. حافظه‌های DDR2 و GDDR3/GDDR4 بر اساس یک اصل کار می‌کنند، یعنی با انتقال اطلاعات مضاعف. تفاوت بین حافظه های DDR، DDR2، GDDR3 و GDDR4 در فناوری تولید و برخی جزئیات نهفته است. DDR2 می تواند در فرکانس های بالاتر از حافظه DDR کار کند و DDR3 می تواند حتی در فرکانس های بالاتر از DDR2 کار کند.

فرکانس باس حافظه

مانند یک پردازنده، حافظه (یا به طور دقیق تر، گذرگاه حافظه) روی برخی کار می کند سرعت های ساعت، بر حسب مگاهرتز اندازه گیری می شود. در اینجا، افزایش سرعت ساعت به طور مستقیم بر عملکرد حافظه تأثیر می گذارد. و فرکانس گذرگاه حافظه یکی از پارامترهایی است که برای مقایسه عملکرد کارت های ویدئویی استفاده می شود. به عنوان مثال، اگر همه مشخصات دیگر (عرض گذرگاه حافظه و غیره) یکسان باشند، کاملاً منطقی است که بگوییم یک کارت گرافیک با حافظه 700 مگاهرتز سریعتر از کارت گرافیک با حافظه 500 مگاهرتز است.

باز هم، سرعت ساعت همه چیز نیست. حافظه 700 مگاهرتز با گذرگاه 64 بیتی کندتر از حافظه 400 مگاهرتز با گذرگاه 128 بیتی خواهد بود. عملکرد حافظه 400 مگاهرتز در یک گذرگاه 128 بیتی تقریباً معادل حافظه 800 مگاهرتز در یک گذرگاه 64 بیتی است. همچنین باید به یاد داشته باشید که فرکانس‌های GPU و حافظه پارامترهای کاملاً متفاوتی هستند و معمولاً متفاوت هستند.

رابط کارت گرافیک

تمام داده های منتقل شده بین کارت گرافیک و پردازنده از طریق رابط کارت گرافیک می گذرد. امروزه از سه نوع رابط برای کارت های ویدئویی استفاده می شود: PCI، AGP و PCI Express. آنها از نظر پهنای باند و سایر مشخصات متفاوت هستند. واضح است که هر چه توان عملیاتی بیشتر باشد، سرعت مبادله نیز بیشتر می شود. با این حال، فقط مدرن‌ترین کارت‌ها می‌توانند از پهنای باند بالا و حتی در آن صورت فقط تا حدی استفاده کنند. در برخی مواقع، سرعت رابط دیگر یک گلوگاه نبود، امروز به سادگی کافی است.

کندترین اتوبوسی که برای آن کارت‌های ویدئویی تولید شده است PCI (Peripheral Components Interconnect) است. البته بدون ورود به تاریخ. PCI واقعاً عملکرد کارت‌های ویدیویی را کاهش داد، بنابراین آنها به رابط AGP (درگاه گرافیکی شتاب‌دار) تغییر مکان دادند. اما حتی مشخصات AGP 1.0 و 2x نیز عملکرد را محدود می کند. هنگامی که استاندارد سرعت را به سطوح AGP 4x افزایش داد، ما شروع به نزدیک شدن به محدودیت عملی پهنای باندی که کارت‌های ویدئویی می‌توانند از عهده آن برآیند، شدیم. مشخصات AGP 8x بار دیگر توان عملیاتی را در مقایسه با AGP 4x (2.16 گیگابایت بر ثانیه) دو برابر کرد، اما افزایش قابل توجهی مشاهده نشد. عملکرد گرافیکیما هنوز آن را دریافت نکرده ایم

جدیدترین و سریعترین اتوبوس PCI Express است. کارت‌های گرافیک جدید معمولاً از رابط PCI Express x16 استفاده می‌کنند که 16 خط PCI Express را برای خروجی کل 4 گیگابایت بر ثانیه (یک جهت) ترکیب می‌کند. این دو برابر توان عملیاتی AGP 8x است. گذرگاه PCI Express پهنای باند ذکر شده را در هر دو جهت (انتقال داده به و از کارت گرافیک) فراهم می کند. اما سرعت استاندارد AGP 8x قبلاً کافی بود، بنابراین ما هنوز با وضعیتی مواجه نشده‌ایم که تعویض به PCI Express باعث افزایش عملکرد در مقایسه با AGP 8x شود (اگر سایر پارامترهای سخت‌افزاری یکسان باشند). به عنوان مثال، نسخه AGP GeForce 6800 Ultra همانند 6800 Ultra برای PCI Express کار خواهد کرد.

امروزه بهتر است کارتی با رابط PCI Express خریداری کنید؛ این کارت برای چندین سال دیگر در بازار باقی خواهد ماند. قدرتمندترین کارت ها دیگر با رابط AGP 8x تولید نمی شوند و راه حل های PCI Express معمولاً راحت تر از آنالوگ های AGP یافت می شوند و ارزان تر هستند.

راه حل در کارت های ویدئویی متعدد

استفاده از چندین کارت گرافیک برای افزایش عملکرد گرافیکی ایده جدیدی نیست. در روزهای اولیه گرافیک سه بعدی، 3dfx با دو کارت گرافیک به صورت موازی وارد بازار شد. اما با ناپدید شدن 3dfx، فناوری چند کارت گرافیک مصرف کننده برای کار با یکدیگر به فراموشی سپرده شد، اگرچه ATI منتشر شد. سیستم های مشابهبرای شبیه سازهای حرفه ای از زمان عرضه Radeon 9700. چند سال پیش، این فناوری به بازار بازگشت: با ظهور راه حل های nVidia SLI و کمی بعد، ATi Crossfire.

اشتراک گذاری چند کارت گرافیک عملکرد کافی برای اجرای بازی در تنظیمات با کیفیت بالا را فراهم می کند. کیفیت بالا. اما انتخاب یک راه حل یا راه حل دیگر چندان ساده نیست.

بیایید با این واقعیت شروع کنیم که راه حل های مبتنی بر چندین کارت گرافیک به مقدار زیادی انرژی نیاز دارند، بنابراین منبع تغذیه باید به اندازه کافی قدرتمند باشد. تمام این گرما باید از کارت گرافیک حذف شود، بنابراین باید به کیس کامپیوتر و خنک کننده توجه کنید تا سیستم بیش از حد گرم نشود.

همچنین، به یاد داشته باشید که SLI/CrossFire به یک مادربرد مناسب (چه برای یک فناوری یا دیگری) نیاز دارد، که معمولاً هزینه بیشتری نسبت به مدل‌های استاندارد دارد. پیکربندی nVidia SLI فقط روی بردهای خاص nForce4 کار می کند و کارت های ATi CrossFire فقط روی بردهای خاص مادربردهابا چیپست CrossFire یا در برخی از مدل های اینتل. برای پیچیده تر کردن مسائل، برخی از پیکربندی های CrossFire نیاز دارند که یکی از کارت ها یک کارت خاص باشد: CrossFire Edition. پس از انتشار CrossFire، برای برخی از مدل‌های کارت‌های ویدئویی، ATi اجازه گنجاندن فناوری همکاری از طریق گذرگاه PCI Express را داد و با انتشار نسخه‌های درایور جدید، تعداد ترکیب‌های ممکن افزایش می‌یابد. اما همچنان، CrossFire سخت افزاری با کارت مربوطه CrossFire Edition عملکرد بالاتری را ارائه می دهد. اما کارت های CrossFire Edition نیز گران تر از مدل های معمولی هستند. بر این لحظهمی توانید حالت CrossFire نرم افزار (بدون کارت CrossFire Edition) را در کارت های گرافیک Radeon X1300، X1600 و X1800 GTO فعال کنید.

عوامل دیگری نیز وجود دارد که باید در نظر گرفته شود. اگرچه دو کارت گرافیک با هم کار می کنند، عملکرد را افزایش می دهند، اما دو برابر نیست. اما شما دو برابر پول پرداخت خواهید کرد. اغلب، افزایش بهره وری 20-60٪ است. و در برخی موارد به دلیل هزینه های محاسباتی اضافی برای تطبیق، هیچ افزایشی وجود ندارد. به همین دلیل، بعید است که پیکربندی‌های چند کارتی با مدل‌های ارزان‌تر ارزش داشته باشند، زیرا کارت گرافیک گران‌تر معمولاً همیشه از چند کارت ارزان‌تر بهتر است. به طور کلی، برای اکثر مصرف کنندگان، خرید راه حل SLI/CrossFire منطقی نیست. اما اگر می‌خواهید همه گزینه‌های بهبود کیفیت را فعال کنید یا با وضوح‌های فوق‌العاده بازی کنید، به عنوان مثال، 2560x1600، زمانی که باید بیش از 4 میلیون پیکسل در هر فریم را محاسبه کنید، بدون دو یا چهار کارت ویدیوی جفت نمی‌توانید کار کنید.

ویژگی های بصری

علاوه بر مشخصات سخت افزاری، نسل های مختلفو مدل‌های GPU ممکن است در مجموعه عملکردها متفاوت باشند. به عنوان مثال، اغلب گفته می شود که کارت های نسل ATi Radeon X800 XT با Shader Model 2.0b (SM) سازگار هستند، در حالی که nVidia GeForce 6800 Ultra با SM 3.0 سازگار است، اگرچه مشخصات سخت افزاری آنها به یکدیگر نزدیک است (16 خط لوله). ). بنابراین، بسیاری از مصرف کنندگان به نفع یک راه حل یا راه حل دیگر انتخاب می کنند بدون اینکه حتی بدانند تفاوت به چه معناست.

نسخه های Microsoft DirectX و Shader Model

این نام ها اغلب در دعوا استفاده می شود، اما تعداد کمی از مردم معنی واقعی آنها را می دانند. برای درک، بیایید با تاریخچه APIهای گرافیکی شروع کنیم. DirectX و OpenGL API های گرافیکی هستند، یعنی رابط های برنامه نویسی برنامه - استانداردهای کد باز در دسترس همه هستند.

قبل از ظهور APIهای گرافیکی، هر سازنده GPU از مکانیزم خاص خود برای برقراری ارتباط با بازی ها استفاده می کرد. توسعه دهندگان باید برای هر پردازنده گرافیکی که می خواستند از آن پشتیبانی کنند، کد جداگانه بنویسند. روشی بسیار پرهزینه و بی اثر. برای حل این مشکل، API هایی برای گرافیک های سه بعدی توسعه داده شد تا توسعه دهندگان کد را برای یک API خاص بنویسند، نه برای یک کارت گرافیک خاص. پس از آن، مشکلات سازگاری بر دوش سازندگان کارت گرافیک افتاد، که باید اطمینان حاصل می کردند که درایورها با API سازگار هستند.

تنها مشکل این است که امروزه از دو API مختلف استفاده می‌شود، یعنی Microsoft DirectX و OpenGL که GL مخفف Graphics Library است. از آنجایی که DirectX API امروزه در بازی ها محبوبیت بیشتری دارد، ما روی آن تمرکز خواهیم کرد. و این استاندارد تأثیر قوی تری بر توسعه بازی ها داشت.

DirectX است ایجاد مایکروسافت. در واقع DirectX شامل چندین API است که تنها یکی از آنها برای گرافیک سه بعدی استفاده می شود. DirectX شامل APIهایی برای صدا، موسیقی، دستگاه های ورودی و غیره است. Direct3D API وظیفه گرافیک سه بعدی در DirectX را بر عهده دارد. هنگامی که آنها در مورد کارت های ویدئویی صحبت می کنند، منظور آنها این است، بنابراین از این نظر مفاهیم DirectX و Direct3D قابل تعویض هستند.

DirectX با پیشرفت فناوری گرافیک و توسعه دهندگان بازی تکنیک های جدید برنامه نویسی بازی را به طور دوره ای به روز می کند. همانطور که DirectX به سرعت در محبوبیت رشد کرد، تولید کنندگان GPU شروع به طراحی نسخه های جدید محصولات برای تطبیق با قابلیت های DirectX کردند. به همین دلیل، کارت‌های ویدئویی اغلب به پشتیبانی سخت‌افزاری برای یک یا نسل دیگری از DirectX (DirectX 8، 9.0 یا 9.0c) گره خورده‌اند.

برای پیچیده تر کردن مسائل، بخش هایی از Direct3D API می توانند در طول زمان بدون تغییر نسل های DirectX تغییر کنند. به عنوان مثال، مشخصات DirectX 9.0 پشتیبانی از Pixel Shader 2.0 را مشخص می کند. ولی به روز رسانی DirectX 9.0c شامل Pixel Shader 3.0 است. بنابراین، اگرچه کارت‌ها از نوع DirectX 9 هستند، اما می‌توانند مجموعه‌های ویژگی‌های مختلفی را پشتیبانی کنند. به عنوان مثال، Radeon 9700 از Shader Model 2.0 و Radeon X1800 از Shader Model 3.0 پشتیبانی می کند، اگرچه هر دو کارت را می توان به عنوان نسل DirectX 9 طبقه بندی کرد.

به یاد داشته باشید که هنگام ایجاد بازی های جدید، توسعه دهندگان صاحبان ماشین ها و کارت های ویدئویی قدیمی را در نظر می گیرند، زیرا اگر این بخش از کاربران را نادیده بگیرید، سطح فروش پایین تر خواهد بود. به همین دلیل، مسیرهای کد متعددی در بازی ها تعبیه شده است. یک بازی کلاس DirectX 9 احتمالاً دارای مسیر DirectX 8 و حتی مسیر DirectX 7 برای سازگاری است.معمولاً اگر مسیر قدیمی انتخاب شود، برخی از جلوه های مجازی موجود در کارت های ویدیویی جدید از بازی ناپدید می شوند. اما در حداقل، می توانید حتی روی سخت افزار قدیمی بازی کنید.

بسیاری از بازی های جدید نیاز به نصب آخرین نسخه DirectX دارند، حتی اگر کارت گرافیک از نسل قبلی باشد. یعنی یک بازی جدید که از مسیر DirectX 8 استفاده می کند همچنان نیازمند نصب آخرین نسخه DirectX 9 برای کارت گرافیک کلاس DirectX 8 است.

چه تفاوت هایی وجود دارد نسخه های مختلف Direct3D API در DirectX؟ نسخه های اولیه DirectX - 3، 5، 6 و 7 - از نظر قابلیت های Direct3D API نسبتا ساده بودند. توسعه دهندگان می توانند جلوه های بصری را از لیست انتخاب کرده و سپس نحوه عملکرد آنها را در بازی آزمایش کنند. گام مهم بعدی در برنامه نویسی گرافیک DirectX 8 بود. این امکان را برای برنامه ریزی کارت گرافیک با استفاده از سایه بان ها معرفی کرد، بنابراین توسعه دهندگان برای اولین بار آزادی برنامه ریزی افکت ها را به روشی که نیاز داشتند داشتند. DirectX 8 از نسخه های Pixel Shader 1.0 تا 1.3 و Vertex Shader 1.0 پشتیبانی می کند. DirectX 8.1، نسخه به روز شده DirectX 8، Pixel Shader 1.4 و Vertex Shader 1.1 را دریافت کرد.

در DirectX 9 می توانید برنامه های سایه زن پیچیده تری ایجاد کنید. DirectX 9 از Pixel Shader 2.0 و Vertex Shader 2.0 پشتیبانی می کند. DirectX 9c، نسخه به روز شده DirectX 9، دارای مشخصات Pixel Shader 3.0 است.

DirectX 10، نسخه API آینده، نسخه جدید را همراهی خواهد کرد نسخه ویندوزویستا نمی توانید DirectX 10 را روی ویندوز XP نصب کنید.

نور HDR و OpenEXR HDR

HDR مخفف عبارت High Dynamic Range است. یک بازی با نور HDR می تواند تصویر بسیار واقعی تری نسبت به بازی بدون آن ایجاد کند و همه کارت های ویدئویی از نور HDR پشتیبانی نمی کنند.

قبل از ظهور کارت‌های گرافیک DirectX 9، پردازنده‌های گرافیکی به دلیل دقت محاسبات نوری آن‌ها به شدت محدود بودند. تا به حال، روشنایی فقط با 256 (8 بیت) سطح داخلی قابل محاسبه بود.

هنگامی که کارت‌های ویدئویی DirectX 9 ظاهر شدند، قادر به تولید نور با دقت بالا - 24 بیت کامل یا 16.7 میلیون سطح بودند.

با 16.7 میلیون سطح و گام بعدی در عملکرد کارت‌های ویدئویی DirectX 9/Shader Model 2.0، نور HDR در رایانه‌ها امکان‌پذیر شد. این یک فناوری نسبتاً پیچیده است و شما باید آن را به صورت پویا تماشا کنید. اگر صحبت کنیم به زبان سادهسپس نور HDR کنتراست را افزایش می دهد (سایه های تیره تیره تر، سایه های روشن روشن تر به نظر می رسند)، در حالی که میزان جزئیات روشنایی را در مناطق تاریک و روشن افزایش می دهد. بازی با نور HDR زنده تر و واقعی تر از بدون آن به نظر می رسد.

پردازنده‌های گرافیکی سازگار با آخرین مشخصات Pixel Shader 3.0 محاسبات نورپردازی با دقت 32 بیتی و ترکیب نقطه شناور را امکان‌پذیر می‌کنند. بنابراین، کارت‌های ویدئویی کلاس SM 3.0 می‌توانند از روش نورپردازی OpenEXR HDR ویژه ای که برای صنعت فیلم طراحی شده است، پشتیبانی کنند.

برخی از بازی‌هایی که فقط از نورپردازی OpenEXR HDR پشتیبانی می‌کنند، با نور HDR روی کارت‌های گرافیک Shader Model 2.0 اجرا نمی‌شوند. با این حال، بازی هایی که به روش OpenEXR متکی نیستند، بر روی هر کارت گرافیک DirectX 9 اجرا می شوند. به عنوان مثال، Oblivion از روش OpenEXR HDR استفاده می کند و فقط اجازه می دهد تا نور HDR را بر روی آخرین کارت های گرافیکی که از مشخصات Shader Model 3.0 پشتیبانی می کنند، استفاده کنند. به عنوان مثال، nVidia GeForce 6800 یا ATi Radeon X1800. بازی‌هایی که از موتور سه بعدی Half-Life 2 استفاده می‌کنند، از جمله Counter-Strike: Source و Half-Life 2: Aftermath آینده، امکان رندر HDR را در کارت‌های گرافیک DirectX 9 قدیمی‌تر که فقط Pixel Shader 2.0 را پشتیبانی می‌کنند، فعال می‌کنند. به عنوان مثال می توان به خط GeForce 5 یا ATi Radeon 9500 اشاره کرد.

در نهایت، به خاطر داشته باشید که همه اشکال رندر HDR نیاز به جدی دارند قدرت پردازشو می تواند حتی قوی ترین پردازنده های گرافیکی را به زانو درآورد. اگر می خواهید بازی کنید جدیدترین بازی هابا نور HDR، نمی توانید بدون گرافیک با کارایی بالا کار کنید.

ضد آلیاسینگ تمام صفحه

ضد aliasing تمام صفحه (به اختصار AA) به شما امکان می دهد "نردبان" مشخصه را در مرزهای چند ضلعی حذف کنید. اما باید در نظر داشت که ضدآلیاسینگ تمام صفحه منابع محاسباتی زیادی را مصرف می کند که منجر به کاهش نرخ فریم می شود.

Anti-aliasing بسیار به عملکرد حافظه ویدیویی بستگی دارد، بنابراین یک کارت گرافیک پرسرعت با حافظه سریع می تواند آنتی آلیاسینگ تمام صفحه را با تأثیر کمتری بر عملکرد نسبت به یک کارت گرافیک ارزان قیمت محاسبه کند. Antialiasing را می توان در حالت های مختلف فعال کرد. به عنوان مثال، 4x antialiasing تصویر بهتری نسبت به 2x antialiasing ایجاد می‌کند، اما ضربه بزرگی به عملکرد خواهد بود. در حالی که 2x antialiasing وضوح افقی و عمودی را دو برابر می کند، حالت 4x آن را چهار برابر می کند.

فیلتر بافت

تکسچرها بر روی تمام اشیاء سه بعدی بازی اعمال می شوند و هر چه زاویه سطح نمایش داده شده بزرگتر باشد، اعوجاج بافت بیشتر به نظر می رسد. برای حذف این اثر، پردازنده‌های گرافیکی از فیلتر بافت استفاده می‌کنند.

اولین روش فیلتر دو خطی نام داشت و نوارهای مشخصه ای تولید کرد که چندان برای چشم خوشایند نبود. وضعیت با معرفی فیلتر سه خطی بهبود یافت. هر دو گزینه روی کارت‌های ویدئویی مدرن بدون جریمه عملکرد کار می‌کنند.

امروز ترین بهترین راهفیلتر بافت، فیلتر ناهمسانگرد (AF) است. فیلتر ناهمسانگرد مانند آنتی آلیازینگ تمام صفحه، می تواند در سطوح مختلف فعال شود. به عنوان مثال، 8x AF بیشتر می دهد کیفیت بالافیلتر بیش از 4 برابر AF. فیلتر ناهمسانگرد مانند آنتی آلیازینگ تمام صفحه به مقدار مشخصی از قدرت پردازش نیاز دارد که با افزایش سطح AF افزایش می یابد.

بافت با وضوح بالا

همه بازی‌های سه بعدی با در نظر گرفتن مشخصات خاصی ساخته می‌شوند و یکی از این الزامات حافظه بافتی را که بازی به آن نیاز خواهد داشت، تعیین می‌کند. تمام بافت های لازم باید در حین بازی در حافظه کارت گرافیک قرار بگیرند، در غیر این صورت عملکرد به طور قابل توجهی کاهش می یابد، زیرا دسترسی به بافت در رمتأخیر قابل توجهی ایجاد می کند، به غیر از فایل پیجینگ روی هارد دیسک. بنابراین، اگر یک توسعه دهنده بازی روی 128 مگابایت حافظه ویدیویی حساب می کند حداقل ملزومات، پس مجموعه بافت های فعال در هیچ زمانی نباید از 128 مگابایت بیشتر شود.

بازی‌های مدرن دارای چندین مجموعه بافت هستند، بنابراین بازی روی کارت‌های ویدیویی قدیمی‌تر با حافظه ویدیویی کمتر و همچنین روی کارت‌های جدید با حافظه ویدیویی بیشتر بدون مشکل اجرا می‌شود. به عنوان مثال، یک بازی ممکن است شامل سه مجموعه بافت باشد: برای 128 مگابایت، 256 مگابایت و 512 مگابایت. امروزه بازی های کمی هستند که از 512 مگابایت حافظه ویدئویی پشتیبانی می کنند، اما همچنان عینی ترین دلیل برای خرید کارت گرافیک با این حجم حافظه هستند. در حالی که افزایش حافظه تأثیر کمی بر عملکرد دارد، اما اگر بازی از مجموعه بافت های مناسب پشتیبانی کند، از کیفیت بصری بهبود یافته بهره مند خواهید شد.

آنچه باید در مورد کارت گرافیک بدانید؟

در تماس با

کار فارغ التحصیل

واحدهای عملیات شطرنجی (ROP)

واحدهای شطرنجی عملیات نوشتن پیکسل های محاسبه شده توسط کارت گرافیک در بافرها و عملیات اختلاط آنها (ترکیب) را انجام می دهند. همانطور که در بالا ذکر شد، عملکرد بلوک های ROP بر نرخ پر شدن تأثیر می گذارد و این یکی از ویژگی های اصلی کارت های ویدیویی است. و اگرچه در اخیرامقدار آن تا حدودی کاهش یافته است و هنوز مواردی وجود دارد که عملکرد برنامه به شدت به سرعت و تعداد بلوک های ROP بستگی دارد. بیشتر اوقات این به دلیل استفاده فعال از فیلترهای پس از پردازش و فعال کردن آنتی آلیاسینگ در تنظیمات تصویر بالا است.

اتوماسیون حسابداری تراکنش های بانکی و اجرای آن در برنامه حسابداری 1C

اگر بتوان تمام فعالیت های یک شرکت را به فرآیندهای تجاری تقسیم کرد، آنگاه فرآیندها را می توان به اجزای کوچکتر تقسیم کرد. در روش شناسی ساخت فرآیندهای تجاری به این امر تجزیه می گویند...

داخلی و لوازم جانبیکامپیوتر

مطالعه مدل جمعیت گسسته با استفاده از برنامه Model Vision Studio

بلوک اصلی توصیف در MVS بلوک است. یک بلوک مقداری است شی فعال، به موازات و مستقل از اشیاء دیگر در زمان پیوسته عمل می کند. بلوک یک بلوک جهت دار است...

استفاده از LMS Moodle در فرآیند آموزشی

هر دوره باید دارای یک منطقه مرکزی باشد. ممکن است ستون چپ یا راست با بلوک وجود نداشته باشد. اما بلوک های مختلف موجود در سیستم مدیریت یادگیری مودل باعث افزایش عملکرد...

بررسی قابلیت های معلم در سیستم آموزش از راه دورمودل

برای افزودن منابع، عناصر، بلوک های جدید یا ویرایش منابع موجود در دوره خود، روی دکمه ویرایش واقع در بلوک کنترل کلیک کنید. فرم کلیپنجره دوره در حالت ویرایش در شکل 2.5 نشان داده شده است: شکل 2...

شبیه سازی در حین توسعه نرم افزار

فرهنگ لغت زبان UMLشامل سه نوع بلوک ساختمانی است: نهادها. ارتباط؛ نمودارها موجودیت ها انتزاعیاتی هستند که عناصر اساسی یک مدل هستند...

شبیه سازی کار در کتابخانه

عملگرها - بلوک ها منطق مدل را تشکیل می دهند. GPSS/PC حدود 50 نوع بلوک مختلف دارد که هر کدام عملکرد خاصی را انجام می دهند. در پشت هر یک از این بلوک ها یک زیربرنامه مترجم مربوطه وجود دارد...

ویژگی های کلیدی CSS3

می توانید با استفاده از انواع بلوک های مکالمه که باز هم بر اساس فناوری های CSS3 ساخته شده اند، متن را به روشی اصلی طراحی کنید. (شکل 5.) شکل 5...

ویژگی های کلیدی CSS3

اثر شفافیت یک عنصر به وضوح در تصویر پس زمینه قابل مشاهده است و در موارد مختلف گسترده شده است سیستم های عاملچون شیک و زیبا به نظر میرسه...

آماده سازی سند متنیمطابق با STP 01-01

بلوک‌های توسعه (کارت‌ها) یا کارت‌ها (کارت‌ها) که گاهی اوقات به آنها گفته می‌شود، می‌توانند برای سرویس‌دهی دستگاه‌های متصل به رایانه شخصی IBM استفاده شوند. می توان از آنها برای اتصال استفاده کرد دستگاه های اضافی(آداپتورهای صفحه نمایش، کنترل کننده دیسک و غیره)...

خرابی و تعمیر کارت گرافیک

این بلوک ها در ارتباط با پردازنده های سایه زن از همه انواع مشخص کار می کنند؛ آنها داده های بافت لازم برای ساخت صحنه را انتخاب و فیلتر می کنند.

برنامه ثبت فرآیند تولید برای سیستم خودکارمدیریت شرکت صنعت الکترونیک

11 نوع بلوک وجود دارد که از آنها می توان یک سیستم MES خاص برای یک تولید خاص ساخت...

توسعه بسته نرم افزاری برای محاسبه خسارت تعمیرات اساسی

در پایین ترین سطح جزئیات، داده های پایگاه داده Oracle در بلوک های داده ذخیره می شود. یک بلوک داده مربوط به تعداد مشخصی بایت از فضای فیزیکی دیسک است...

توسعه سیستم مدیریت سخت افزار و نرم افزار برای پلتفرم های حمل و نقل در Simatic Step-7

واحدهای سیستم اجزای سیستم عامل هستند. آنها را می توان توسط برنامه ها (توابع سیستم، SFC) یا داده ها (بلوک های داده سیستم، SDB) ذخیره کرد. واحدهای سیستم دسترسی به عملکردهای مهم سیستم را فراهم می کنند...

دستگاه های موجود در کامپیوتر

واحدهای توسعه (کارت) یا کارت (کارت) که گاهی اوقات به آنها گفته می شود، می توانند برای سرویس دهی به دستگاه های متصل به رایانه شخصی IBM استفاده شوند. می توان از آنها برای اتصال دستگاه های اضافی (آداپتورهای صفحه نمایش، کنترل کننده دیسک و غیره) استفاده کرد...

معماری GPU: ویژگی ها

واقعی بودن گرافیک سه بعدی تا حد زیادی به عملکرد کارت گرافیک بستگی دارد. هرچه تعداد بلوک‌های سایه‌زن پیکسلی پردازنده بیشتر باشد و فرکانس آن بیشتر باشد، می‌توان جلوه‌های بیشتری را روی صحنه سه‌بعدی اعمال کرد تا درک بصری آن را بهبود بخشد.

GPU شامل بسیاری از بلوک های عملکردی مختلف است. با تعداد برخی از مؤلفه ها، می توانید تخمین بزنید که GPU چقدر قدرتمند است. قبل از حرکت بیشتر، اجازه دهید مهم ترین بلوک های کاربردی را مرور کنیم.

پردازنده های راس (واحد سایه زن راس)

مانند واحدهای سایه زن پیکسل، پردازنده های راس کد سایه زن را اجرا می کنند که رئوس را لمس می کند. از آنجایی که بودجه راس بزرگتر اجازه می دهد تا اشیاء سه بعدی پیچیده تری ایجاد شوند، عملکرد پردازنده های راس در صحنه های سه بعدی با تعداد اشیاء پیچیده یا زیاد بسیار مهم است. با این حال، واحدهای سایه زن راس هنوز هم مانند پردازنده‌های پیکسل تأثیر آشکاری بر عملکرد ندارند.

پردازنده های پیکسل (واحد سایه زن پیکسل)

پردازنده پیکسلی جزء یک تراشه گرافیکی است که به پردازش برنامه های سایه زن پیکسل اختصاص داده شده است. این پردازنده ها محاسباتی را انجام می دهند که فقط به پیکسل ها مربوط می شود. از آنجایی که پیکسل ها حاوی اطلاعات رنگی هستند، سایه زن های پیکسل به شما اجازه می دهد تا جلوه های گرافیکی چشمگیری داشته باشید. به عنوان مثال، بیشتر افکت های آبی که در بازی ها می بینید با استفاده از سایه زن های پیکسل ایجاد می شوند. به طور معمول، تعداد پردازنده های پیکسل برای مقایسه عملکرد پیکسل کارت های ویدئویی استفاده می شود. اگر یک کارت دارای هشت واحد سایه زن پیکسل و دیگری دارای 16 واحد باشد، منطقی است که فرض کنیم یک کارت گرافیک با 16 واحد در پردازش برنامه های سایه زن پیچیده پیکسل سریعتر خواهد بود. سرعت کلاک را نیز باید در نظر گرفت، اما امروزه دوبرابر کردن تعداد پردازنده‌های پیکسلی نسبت به دو برابر کردن فرکانس تراشه‌های گرافیکی، صرفه‌جویی در مصرف انرژی دارد.

شیدرهای یکپارچه

شیدرهای یکپارچه هنوز وارد دنیای رایانه های شخصی نشده اند، اما استاندارد آتی DirectX 10 مبتنی بر معماری مشابهی است. یعنی ساختار کد برنامه های رأس، هندسه و پیکسل یکسان خواهد بود، اگرچه سایه بان ها کار متفاوتی را انجام می دهند. مشخصات جدید را می توان در Xbox 360 مشاهده کرد، جایی که GPU به طور ویژه توسط ATi برای مایکروسافت طراحی شده است. دیدن اینکه DirectX 10 جدید چه پتانسیل هایی را به همراه دارد بسیار جالب خواهد بود.

واحدهای نقشه برداری بافت (TMU)

بافت ها باید انتخاب و فیلتر شوند. این کار توسط واحدهای نگاشت بافت انجام می شود که در ارتباط با واحدهای سایه زن پیکسل و رأس کار می کنند. وظیفه TMU اعمال عملیات بافت بر روی پیکسل ها است. تعداد واحدهای بافت در یک GPU اغلب برای مقایسه عملکرد بافت کارت‌های ویدئویی استفاده می‌شود. منطقی است که فرض کنیم یک کارت گرافیک با TMU های بیشتر، عملکرد بافت بهتری را ارائه می دهد.

واحدهای اپراتور رستر (ROP)

پردازنده های رستر وظیفه نوشتن داده های پیکسلی در حافظه را بر عهده دارند. سرعتی که این عملیات با آن انجام می شود، نرخ پر شدن است. در روزهای اولیه شتاب دهنده های سه بعدی، ROP و نرخ پر شدن از ویژگی های بسیار مهم کارت های ویدئویی بودند. امروزه، کار ROP هنوز مهم است، اما عملکرد کارت گرافیک دیگر مانند گذشته توسط این بلوک ها محدود نمی شود. بنابراین، عملکرد (و تعداد) ROP به ندرت برای ارزیابی سرعت یک کارت گرافیک استفاده می شود.

نوار نقاله

خطوط لوله برای توصیف معماری کارت های ویدئویی و ارائه یک ایده بسیار واضح از عملکرد GPU استفاده می شود.

نوار نقاله را نمی توان یک اصطلاح فنی دقیق در نظر گرفت. GPU از خطوط لوله مختلفی استفاده می کند که عملکردهای مختلفی را انجام می دهند. از لحاظ تاریخی، خط لوله به معنای یک پردازنده پیکسلی بود که به واحد نقشه برداری بافت (TMU) متصل بود. به عنوان مثال، کارت گرافیک Radeon 9700 از هشت پردازنده پیکسل استفاده می کند که هر کدام به TMU خود متصل هستند، بنابراین کارت دارای هشت خط لوله در نظر گرفته می شود.

اما توصیف پردازنده های مدرن با تعداد خطوط لوله بسیار دشوار است. در مقایسه با طراحی های قبلی، پردازنده های جدید از ساختار ماژولار و تکه تکه استفاده می کنند. ATi را می توان یک مبتکر در این زمینه در نظر گرفت که با خط کارت گرافیک X1000 به ساختار ماژولار تبدیل شد که امکان دستیابی به دستاوردهای عملکرد را از طریق بهینه سازی داخلی ممکن کرد. برخی از بلوک‌های CPU بیشتر از سایرین استفاده می‌شوند و برای بهبود عملکرد GPU، ATi سعی کرده است بین تعداد بلوک‌های مورد نیاز و ناحیه Die (که نمی‌توان آن را زیاد افزایش داد) سازش پیدا کند. در این معماری، اصطلاح "pixel pipeline" معنای خود را از دست داده است، زیرا پردازنده های پیکسل دیگر به TMU های خود متصل نیستند. به عنوان مثال، پردازنده گرافیکی ATi Radeon X1600 دارای 12 واحد سایه زن و تنها چهار واحد نقشه برداری بافت TMU است. بنابراین، نمی توان گفت که معماری این پردازنده دارای 12 پیکسل پیکسل است، همانطور که نمی توان گفت که تنها چهار مورد از آنها وجود دارد. با این حال، طبق سنت، خطوط لوله پیکسل هنوز ذکر شده است.

با در نظر گرفتن مفروضات فوق، تعداد خطوط لوله پیکسل در یک GPU اغلب برای مقایسه کارت های ویدئویی (به استثنای خط ATi X1x00) استفاده می شود. به عنوان مثال، اگر کارت‌های ویدئویی را با خط لوله 24 و 16 می‌گیرید، کاملاً منطقی است که فرض کنیم کارت با 24 خط لوله سریع‌تر خواهد بود.


محتوا

پردازنده‌های گرافیکی مدرن شامل بلوک‌های کاربردی زیادی هستند که تعداد و ویژگی‌های آن‌ها سرعت رندر نهایی را تعیین می‌کند که بر راحتی بازی تأثیر می‌گذارد. بر اساس تعداد مقایسه‌ای این بلوک‌ها در تراشه‌های ویدیویی مختلف، می‌توانید تقریباً سرعت یک GPU خاص را تخمین بزنید. تراشه‌های ویدیویی دارای ویژگی‌های بسیار زیادی هستند که در این بخش تنها مهم‌ترین آنها را بررسی می‌کنیم.

سرعت ساعت تراشه ویدیویی

فرکانس کاری یک GPU معمولاً بر حسب مگاهرتز اندازه گیری می شود، یعنی میلیون ها سیکل در ثانیه. این مشخصه مستقیماً بر عملکرد تراشه ویدیویی تأثیر می گذارد - هرچه بالاتر باشد، GPU می تواند کار بیشتری را در واحد زمان انجام دهد. مقدار زیادرئوس و پیکسل ها مثالی از زندگی واقعی: فرکانس تراشه ویدئویی نصب شده بر روی برد Radeon HD 6670 840 مگاهرتز است و دقیقاً همان تراشه در مدل Radeon HD 6570 با فرکانس 650 مگاهرتز کار می کند. بر این اساس، تمام ویژگی های عملکرد اصلی متفاوت خواهد بود. اما این تنها فرکانس کاری تراشه نیست که عملکرد را تعیین می کند، سرعت آن نیز تا حد زیادی تحت تأثیر خود معماری گرافیکی است: طراحی و تعداد واحدهای اجرایی، ویژگی های آنها و غیره.

در برخی موارد، سرعت کلاک تک تک بلوک‌های GPU با فرکانس کاری بقیه تراشه متفاوت است. یعنی قسمت های مختلف پردازنده گرافیکی در فرکانس های مختلف کار می کنند و این کار برای افزایش کارایی انجام می شود، زیرا برخی از بلوک ها قادر به کار در فرکانس های بالاتر هستند در حالی که برخی دیگر اینطور نیستند. اکثر پردازنده های گرافیکی به چنین پردازنده های گرافیکی مجهز هستند. کارت گرافیک GeForceاز NVIDIA به عنوان نمونه اخیر، بیایید به تراشه ویدئویی در مدل GTX 580 نگاه کنیم، که اکثر آنها در فرکانس 772 مگاهرتز کار می کنند و واحدهای محاسباتی جهانی تراشه دارای فرکانس دو برابر شده - 1544 مگاهرتز هستند.

نرخ پر

نرخ پر شدن نشان می دهد که تراشه ویدئویی با چه سرعتی قادر به ترسیم پیکسل است. دو نوع نرخ پر شدن وجود دارد: نرخ پر شدن پیکسل و نرخ پر شدن بافت. نرخ پر شدن پیکسل، سرعت ترسیم پیکسل ها روی صفحه را نشان می دهد و به فرکانس عملیاتی و تعداد واحدهای ROP (واحدهای عملیات شطرنجی و ترکیبی) بستگی دارد و نرخ پر شدن بافت، سرعت نمونه برداری از داده های بافت است که به فرکانس عملیاتی بستگی دارد. و تعداد واحدهای بافت

به عنوان مثال، حداکثر میزان پرکردن پیکسل GeForce GTX 560 Ti برابر با 822 (فرکانس تراشه) × 32 (تعداد واحدهای ROP) = 26304 مگاپیکسل در ثانیه، و نرخ پرکردن بافت 822 × 64 (تعداد واحدهای بافت سازی) = 5260 مگاپیکسل است. /s. به روشی ساده شده، وضعیت به این صورت است - هر چه عدد اول بزرگتر باشد، کارت گرافیک سریعتر می تواند پیکسل های تمام شده را بکشد، و هرچه عدد دوم بزرگتر باشد، داده های بافت سریعتر نمونه برداری می شود.

اگرچه اهمیت نرخ پر شدن خالص اخیراً به طور قابل توجهی کاهش یافته است و جای خود را به سرعت محاسباتی داده است، این پارامترها هنوز هم بسیار مهم هستند، به ویژه برای بازی هایی با هندسه ساده و محاسبات پیکسل و راس نسبتاً ساده. بنابراین هر دو پارامتر برای بازی های مدرن مهم هستند، اما باید متعادل باشند. بنابراین، تعداد واحدهای ROP در تراشه های ویدئویی مدرن معمولا کمتر از تعداد واحدهای بافت است.

تعداد واحدها یا پردازنده های محاسباتی (شیدر).

شاید در حال حاضر این بلوک ها قسمت های اصلی تراشه ویدیویی باشند. اجرا می کنند برنامه های ویژه، به عنوان سایه زن شناخته می شود. علاوه بر این، اگر سایه‌زن‌های پیکسل قبلی بلوک‌های سایه‌زن پیکسل را انجام می‌دادند، و سایه‌زن‌های راس بلوک‌های راس را انجام می‌دادند، پس از آن برای مدتی معماری‌های گرافیکی متحد شدند و این واحدهای محاسباتی جهانی شروع به پرداختن به محاسبات مختلف کردند: محاسبات راس، پیکسل، هندسی و حتی جهانی.

برای اولین بار، معماری یکپارچه در یک تراشه ویدئویی استفاده شد کنسول بازیمایکروسافت ایکس باکس 360، این پردازنده گرافیکی توسط ATI (بعدها توسط AMD خریداری شد) توسعه یافته است. و در تراشه های ویدئویی برای کامپیوترهای شخصیواحدهای سایه زن یکپارچه روی برد ظاهر شدند NVIDIA GeForce 8800. و از آن زمان، تمام تراشه های ویدئویی جدید بر اساس یک معماری یکپارچه هستند، که دارای یک کد جهانی برای برنامه های سایه زن مختلف (راس، پیکسل، هندسه و غیره) است و پردازنده های یکپارچه مربوطه می توانند هر برنامه ای را اجرا کنند.

بر اساس تعداد واحدهای محاسباتی و فرکانس آنها، می توانید عملکرد ریاضی کارت های ویدئویی مختلف را مقایسه کنید. اکثر بازی ها در حال حاضر توسط عملکرد سایه زن های پیکسل محدود شده اند، بنابراین تعداد این بلوک ها بسیار مهم است. به عنوان مثال، اگر یک مدل کارت گرافیک مبتنی بر یک GPU با 384 پردازنده محاسباتی در ترکیب آن باشد، و دیگری از همان خط دارای یک GPU با 192 واحد محاسباتی باشد، در این صورت در فرکانس یکسان دومی دو برابر کندتر خواهد بود. نوع سایه زن، و به طور کلی خواهد بود همان تولید بیشتر.

اگرچه صرفاً بر اساس تعداد واحدهای محاسباتی نمی‌توان نتیجه‌گیری بدون ابهام در مورد عملکرد انجام داد، اما لازم است فرکانس ساعت و معماری متفاوت واحدهای نسل‌های مختلف و تولیدکنندگان تراشه را در نظر گرفت. فقط بر اساس این اعداد، می‌توانید تراشه‌ها را فقط در خط تولید یک سازنده مقایسه کنید: AMD یا NVIDIA. در موارد دیگر، باید به تست های عملکرد در بازی ها یا اپلیکیشن های مورد علاقه خود توجه کنید.

واحدهای بافت (TMU)

این واحدهای GPU در ارتباط با پردازنده‌های محاسباتی کار می‌کنند؛ آنها بافت و سایر داده‌های لازم برای ساخت صحنه و محاسبات همه منظوره را انتخاب و فیلتر می‌کنند. تعداد واحدهای بافت در یک تراشه ویدیویی عملکرد بافت را تعیین می کند - یعنی سرعت واکشی تکل ها از بافت ها.

اگرچه اخیراً تأکید بیشتری بر محاسبات ریاضی شده است و برخی از بافت‌ها با موارد رویه‌ای جایگزین می‌شوند، بار روی بلوک‌های TMU هنوز بسیار زیاد است، زیرا علاوه بر بافت‌های اصلی، باید از نقشه‌های معمولی و جابجایی نیز انتخاب شود. و همچنین بافرهای رندر هدف خارج از صفحه نمایش.

با در نظر گرفتن تاکید بسیاری از بازی ها از جمله عملکرد واحدهای تکسچرینگ، می توان گفت که تعداد واحدهای TMU و عملکرد بافت بالا مربوطه نیز یکی از مهم ترین پارامترهای تراشه های ویدئویی است. این پارامتر در هنگام استفاده از فیلتر ناهمسانگرد، که به نمونه‌های بافت اضافی نیاز دارد، و همچنین با الگوریتم‌های سایه نرم پیچیده و الگوریتم‌های جدید مانند Screen Space Ambient Occlusion، تأثیر خاصی بر سرعت رندر تصویر دارد.

واحدهای عملیات شطرنجی (ROP)

واحدهای شطرنجی عملیات نوشتن پیکسل های محاسبه شده توسط کارت گرافیک در بافرها و عملیات اختلاط آنها (ترکیب) را انجام می دهند. همانطور که در بالا اشاره کردیم، عملکرد بلوک‌های ROP بر نرخ پر شدن تأثیر می‌گذارد و این یکی از ویژگی‌های اصلی کارت‌های ویدیویی در همه زمان‌ها است. و اگرچه اخیراً اهمیت آن نیز تا حدودی کاهش یافته است، اما هنوز مواردی وجود دارد که عملکرد برنامه به سرعت و تعداد بلوک های ROP بستگی دارد. بیشتر اوقات این به دلیل استفاده فعال از فیلترهای پس از پردازش و فعال کردن آنتی آلیاسینگ در تنظیمات بالای بازی است.

اجازه دهید یک بار دیگر توجه کنیم که تراشه های ویدئویی مدرن را نمی توان تنها با تعداد بلوک های مختلف و فرکانس آنها ارزیابی کرد. هر سری GPU از معماری جدیدی استفاده می کند که در آن واحدهای اجرایی با واحدهای قدیمی تفاوت زیادی دارند و ممکن است نسبت تعداد واحدهای مختلف متفاوت باشد. بنابراین، بلوک‌های ROP AMD در برخی راه‌حل‌ها می‌توانند کار بیشتری را در هر سیکل ساعت نسبت به بلوک‌های موجود انجام دهند راه حل های NVIDIA، و بالعکس. همین امر در مورد توانایی های واحدهای بافت TMU نیز صدق می کند - آنها در نسل های مختلف GPU متفاوت هستند تولید کنندگان مختلف، و این باید در هنگام مقایسه در نظر گرفته شود.

بلوک های هندسی

تا همین اواخر، تعداد واحدهای پردازش هندسه اهمیت خاصی نداشت. یک بلوک در GPU برای اکثر کارها کافی بود، زیرا هندسه در بازی ها بسیار ساده بود و تمرکز اصلی عملکرد محاسبات ریاضی بود. اهمیت پردازش هندسه موازی و تعداد بلوک های متناظر با ظهور پشتیبانی از هندسه تسلاسیون در DirectX 11 به طرز چشمگیری افزایش یافت. NVIDIA اولین کسی بود که پردازش داده های هندسی را موازی کرد، زمانی که چندین بلوک متناظر در تراشه های خانواده GF1xx ظاهر شد. سپس، AMD راه حل مشابهی را منتشر کرد (فقط در راه حل های برتر خط Radeon HD 6700 مبتنی بر تراشه های Cayman).

در این مطالب، ما وارد جزئیات نمی‌شویم؛ آنها را می‌توان در مطالب اولیه وب‌سایت ما که به پردازنده‌های گرافیکی سازگار با DirectX 11 اختصاص داده شده است، مطالعه کرد. چیزی که در اینجا برای ما مهم است این است که تعداد واحدهای پردازش هندسه تأثیر زیادی بر عملکرد کلی در جدیدترین بازی‌هایی که از تسلیت استفاده می‌کنند، مانند Metro 2033، HAWX 2 و Crysis 2 (با آخرین وصله‌ها) دارد. و هنگام انتخاب یک کارت گرافیک بازی مدرن، توجه به عملکرد هندسی بسیار مهم است.

اندازه حافظه ویدیویی

حافظه خود توسط تراشه‌های ویدئویی برای ذخیره داده‌های لازم استفاده می‌شود: بافت‌ها، رئوس، داده‌های بافر و غیره. به نظر می‌رسد که هر چه بیشتر باشد، بهتر است. اما خیلی ساده نیست؛ تخمین قدرت یک کارت گرافیک بر اساس میزان حافظه ویدیویی رایج ترین اشتباه است! کاربران بی تجربه اغلب ارزش حافظه ویدئویی را بیش از حد تخمین می زنند و همچنان از آن برای مقایسه مدل های مختلف کارت های ویدئویی استفاده می کنند. این قابل درک است - این پارامتر یکی از اولین پارامترهایی است که در لیست ویژگی های سیستم های تمام شده نشان داده شده است و همچنین روی جعبه های کارت گرافیک نیز نوشته شده است. چاپ بزرگ. بنابراین، به نظر یک خریدار بی تجربه به نظر می رسد که از آنجایی که حافظه دو برابر بیشتر است، پس سرعت چنین راه حلی باید دو برابر بیشتر باشد. واقعیت با این افسانه در این است که حافظه می تواند متفاوت باشد انواع متفاوتو ویژگی ها و رشد بهره وری فقط تا یک حجم مشخص رشد می کند و پس از رسیدن به آن به سادگی متوقف می شود.

بنابراین، در هر بازی و با تنظیمات خاص و صحنه های بازی مقدار مشخصی حافظه ویدیویی وجود دارد که برای تمام داده ها کافی است. و حتی اگر 4 گیگابایت حافظه ویدیویی را در آنجا قرار دهید، دلیلی برای افزایش سرعت رندر وجود نخواهد داشت، سرعت توسط واحدهای اجرایی مورد بحث در بالا محدود می شود و به سادگی حافظه کافی وجود خواهد داشت. به همین دلیل است که در بسیاری از موارد، یک کارت گرافیک با 1.5 گیگابایت حافظه ویدئویی با سرعت یک کارت با 3 گیگابایت کار می کند (همه موارد دیگر برابر هستند).

موقعیت‌هایی وجود دارد که حافظه بیشتر منجر به افزایش قابل مشاهده عملکرد می‌شود - این بازی‌ها بسیار سخت‌گیرانه هستند، به ویژه در وضوح‌های فوق‌العاده بالا و تنظیمات حداکثر کیفیت. اما چنین مواردی همیشه اتفاق نمی افتد و باید میزان حافظه را در نظر گرفت، فراموش نکنید که عملکرد به سادگی بالاتر از مقدار مشخصی افزایش نمی یابد. تراشه های حافظه بیشتر دارند پارامترهای مهممانند عرض گذرگاه حافظه و فرکانس کاری آن. این موضوع به قدری گسترده است که به جزئیات بیشتری در مورد انتخاب میزان حافظه ویدیویی در آن خواهیم پرداخت قسمت ششممواد ما

عرض گذرگاه حافظه

عرض گذرگاه حافظه است مهمترین ویژگی، بر پهنای باند حافظه (MBB) تأثیر می گذارد. عرض بزرگتر اجازه می دهد تا اطلاعات بیشتری را از حافظه ویدیویی به GPU و در واحد زمان انتقال دهیم که در اکثر موارد تأثیر مثبتی بر عملکرد دارد. از نظر تئوری، یک گذرگاه 256 بیتی می تواند دو برابر بیشتر از یک گذرگاه 128 بیتی در هر چرخه ساعت، داده انتقال دهد. در عمل تفاوت سرعت رندر اگرچه به دو برابر نمی رسد اما در بسیاری از موارد با تاکید بر پهنای باند حافظه ویدئویی بسیار به این نزدیک است.

کارت‌های ویدئویی بازی مدرن از عرض گذرگاه‌های مختلفی استفاده می‌کنند: از 64 تا 384 بیت (قبلا تراشه‌هایی با گذرگاه 512 بیتی وجود داشت)، بسته به محدوده قیمت و زمان انتشار مدل خاصپردازنده گرافیکی برای ارزان‌ترین کارت‌های ویدئویی ارزان‌قیمت، 64 و کمتر 128 بیت، برای سطح متوسط ​​از 128 تا 256 بیت، و کارت‌های گرافیکی از محدوده قیمت بالا از اتوبوس‌هایی با عرض 256 تا 384 بیت استفاده می‌کنند. عرض گذرگاه دیگر نمی تواند صرفاً به دلیل محدودیت های فیزیکی رشد کند - اندازه قالب GPU برای قرار دادن بیش از یک گذرگاه 512 بیتی کافی نیست و این بسیار گران است. بنابراین، پهنای باند حافظه در حال حاضر با استفاده از انواع جدید حافظه افزایش یافته است (به زیر مراجعه کنید).

فرکانس حافظه ویدیویی

پارامتر دیگری که بر پهنای باند حافظه تأثیر می گذارد فرکانس ساعت آن است. و افزایش پهنای باند اغلب به طور مستقیم بر عملکرد کارت گرافیک در برنامه های سه بعدی تأثیر می گذارد. فرکانس گذرگاه حافظه در کارت های ویدئویی مدرن از 533 (1066، با احتساب دو برابر شدن) مگاهرتز تا 1375 (5500، با در نظر گرفتن چهار برابر شدن) مگاهرتز متغیر است، یعنی می تواند بیش از پنج برابر متفاوت باشد! و از آنجایی که پهنای باند هم به فرکانس حافظه و هم به عرض گذرگاه آن بستگی دارد، حافظه با یک گذرگاه 256 بیتی که در فرکانس 800 (3200) مگاهرتز کار می کند، در مقایسه با حافظه ای که در 1000 (4000) مگاهرتز با فرکانس 128 کار می کند، پهنای باند بیشتری خواهد داشت. اتوبوس بیت.

توجه ویژه به پارامترهای عرض گذرگاه حافظه، نوع و فرکانس کاری آن باید هنگام خرید کارت‌های گرافیکی نسبتاً ارزان، که بسیاری از آنها فقط دارای رابط‌های 128 بیتی یا حتی 64 بیتی هستند، مورد توجه قرار گیرد که تأثیر بسیار منفی بر عملکرد آنها دارد. . به طور کلی، خرید یک کارت گرافیک با استفاده از یک گذرگاه حافظه ویدئویی 64 بیتی برای رایانه های شخصی بازی را توصیه نمی کنیم. توصیه می شود حداقل یک سطح متوسط ​​با حداقل گذرگاه 128 یا 192 بیتی را ترجیح دهید.

انواع حافظه

کارت گرافیک های مدرن به انواع مختلف حافظه مجهز هستند. دیگر هیچ جا حافظه تک سرعته SDR قدیمی را پیدا نخواهید کرد، اما انواع مدرن حافظه های DDR و GDDR ویژگی های متفاوتی دارند. انواع مختلف DDR و GDDR به شما این امکان را می‌دهند که دو یا چهار برابر داده‌های بیشتری را در یک فرکانس ساعت در واحد زمان انتقال دهید، و بنابراین، رقم فرکانس کاری اغلب دو یا چهار برابر می‌شود، ضربدر 2 یا 4 می‌شود. بنابراین، اگر فرکانس 1400 مگاهرتز مشخص شود. برای حافظه DDR ، این حافظه در فرکانس فیزیکی 700 مگاهرتز کار می کند ، اما آنها فرکانس به اصطلاح "موثر" را نشان می دهند ، یعنی فرکانسی که حافظه SDR باید در آن کار کند تا پهنای باند یکسانی را ارائه دهد. در مورد GDDR5 هم همینطور است، اما فرکانس آن حتی چهار برابر شده است.

مزیت اصلی انواع جدید حافظه، قابلیت کارکرد با سرعت کلاک بالاتر و در نتیجه افزایش پهنای باند نسبت به فناوری های قبلی است. این به قیمت تاخیرهای افزایش یافته به دست می آید، که، با این حال، برای کارت های ویدئویی چندان مهم نیستند. اولین بردی که از حافظه DDR2 استفاده کرد NVIDIA GeForce FX 5800 Ultra بود. از آن زمان، فناوری حافظه های گرافیکی پیشرفت چشمگیری داشته است و استاندارد GDDR3 که نزدیک به مشخصات DDR2 است، با تغییراتی به طور خاص برای کارت های ویدئویی توسعه یافته است.

GDDR3 حافظه ای است که به طور خاص برای کارت های ویدئویی طراحی شده است، با فناوری های مشابه DDR2، اما با بهبود مصرف و ویژگی های اتلاف گرما، که امکان ایجاد تراشه هایی با سرعت کلاک بالاتر را فراهم می کند. با وجود این واقعیت که این استاندارد توسط ATI توسعه داده شد، اولین کارت گرافیکی که از آن استفاده کرد، دومین اصلاح NVIDIA GeForce FX 5700 Ultra و مورد بعدی GeForce 6800 Ultra بود.

GDDR4 توسعه بیشتر حافظه گرافیکی است که تقریباً دو برابر سریعتر از GDDR3 کار می کند. تفاوت اصلی بین GDDR4 و GDDR3 که برای کاربران قابل توجه است، بار دیگر افزایش فرکانس کاری و کاهش مصرف انرژی است. از نظر فنی، حافظه GDDR4 تفاوت چندانی با GDDR3 ندارد؛ این یک توسعه بیشتر از همان ایده ها است. اولین کارت‌های گرافیکی با تراشه‌های GDDR4 ATI Radeon X1950 XTX بودند و انویدیا اصلاً محصولات مبتنی بر این نوع حافظه را عرضه نکرد. مزایای تراشه های حافظه جدید نسبت به GDDR3 این است که مصرف انرژی ماژول ها می تواند حدود یک سوم کمتر باشد. این از طریق رتبه بندی ولتاژ پایین تر برای GDDR4 به دست می آید.

با این حال، GDDR4 به طور گسترده حتی در راه حل های AMD استفاده نمی شود. با شروع با خانواده پردازنده‌های گرافیکی RV7x0، کنترل‌کننده‌های حافظه کارت گرافیک از نوع جدیدی از حافظه GDDR5 پشتیبانی می‌کنند که با فرکانس چهارگانه مؤثر تا 5.5 گیگاهرتز و بالاتر (از لحاظ نظری، فرکانس‌های تا 7 گیگاهرتز امکان‌پذیر است) کار می‌کند، که توان عملیاتی را افزایش می‌دهد. تا 176 گیگابایت بر ثانیه با استفاده از رابط 256 بیتی. اگر برای افزایش پهنای باند حافظه GDDR3/GDDR4 استفاده از یک گذرگاه 512 بیتی ضروری بود، در این صورت انتقال به استفاده از GDDR5 امکان دو برابر کردن عملکرد را فراهم کرد. اندازه های کوچکترکریستال و مصرف انرژی کمتر.

مدرن ترین انواع حافظه های ویدئویی GDDR3 و GDDR5 هستند؛ آنها در برخی جزئیات با DDR تفاوت دارند و همچنین با انتقال داده های دوگانه یا چهارگانه کار می کنند. این نوع حافظه ها از فناوری های خاصی برای افزایش فرکانس کاری استفاده می کنند. بنابراین، حافظه GDDR2 معمولاً در فرکانس‌های بالاتر در مقایسه با DDR، GDDR3 در فرکانس‌های بالاتر عمل می‌کند و GDDR5 حداکثر فرکانس و پهنای باند را در حال حاضر فراهم می‌کند. اما مدل‌های ارزان قیمت هنوز به حافظه DDR3 "غیر گرافیکی" با فرکانس بسیار پایین‌تر مجهز هستند، بنابراین باید با دقت بیشتری کارت گرافیک را انتخاب کنید.