وحدة المعالجة الرسومية


وحدة المعالجة الرسومية


الجرافيكس أظهرت وعود هائلة ليس فقط لإنتاج تأثير مرئيات عالية، ولكن أيضا لمعالجة البيانات والمشاكل من مختلف الأنواع، بما في ذلك بعض من أصعب التحديات التي تواجهها الآن الحوسبة. وبالتالي، وحدة معالجة الرسومات وحدات المعالجة المركزية تسير على ما يبدو على مسار واحد لبعض الوقت حتى الآن، وهذا الإدراك دافعا إعادة ترتيب في الأعمال المعالج. مخطط لعمل وحدة المعالجة الرسومية:


ومخطط البنيوي :

نظرة للداخل: سنبدأ جولتنا من Fermi بتكريم الوقت كرمت تقاليد البحث في رسم تخطيطي للكتلة المنطقية للبنية الجرافيك.

دعونا نرى ما إذا كنا نستطيع فك الأشياء

هياكل طويل القامة(مستطيلة الشكل الازرقاء أو SMs) والمصطلحات في Nvidia بـ   multiprocessors والتي تحوي على 16 منة    

مربعات صغيرة خضراء داخل كل multiprocessors هي ما تسميه " نوى برنامج كودا " هذه هي أهم موارد التنفيذ على الرقاقة ستة المستطيلات زرقاء داكنة على جانبي المخطط هي واجهات الذاكرة، في عبوات منتجاتهم. تلك هي واجهات 64 بت، وهو ما يعني المسار الكلي للـ Fermi للذاكرة التي هي 384 بت أكثر ما يميز Fermi من خلال تقديم ما يقرب من ضعف عرض النطاق الترددي لكل طرف عن طريق تقديم الدعم لGDDR5 الذاكرة. فيما يلي جدول يبين ذروة القوة النظرية الحسابية وذاكرة سعة من بطاقات الرسوميات الأسرع على أساس وحدات معالجة الرسومات الأخيرة من AMD and Nvidia


يتألف من 3 بلايين من الترانزستورات المقدرة. على النقيض من AMD التي حوالى 2.15 مليار ترانزيستور، وبحجم 334 ملم ². إذا Fermi مصنوع باستخدام 40 نانومتر عملية بنفس التجهيز

في الواقع، Nvidia استثمرت مبالغ هائلة في بناء البنية التحتية والبرمجيات لبرنامج كودا داخل SMs في نواح كثيرة، SMs هو قلب Ferm. هي قادرة على جلب تعليمات، بحيث يمكن القول إنها "نوى المعالجة" على الجرافيك. و Ferm لديها 16 منهم أو أكثر


وتقوم بالجدولة الأولية والتي تعتبر Nvidia ذكية جدا فيها، تسمى "GigaThread" التي تتزاحم فيها مجموعات من" "warps وتدار هرميا فيFerm. هذا الجدولة الرئيسي يتدفقون لmultiprocessors التي تقوم بعد ذلك بالتعامل مع الحبيبات الدقيقة SMs له أربع وحدات للتنفيذ الرئيسية. اثنان منهم لها 16 - مجموعات واسعة من النوى "برنامج كودا" ،،. هناك أيضا 16 عنصرا للتحميل / تخزين وأربع وحدات مجموعة واسعة من وظيفة خاصة. SFUs في التعامل مع أنواع خاصة من transcendentals مثل الرياضيات، وهنا تتم مضاعفة عدد من GT200، الذي كان اثنان لكل SMs. مما سبق نجد ان هذة البنية هي من نوع MIMD حيث تحوي عدة نوات The NVIDIA GeForce 6 Series supports MIMD branching

بعض الميزات: • برنامج كودا 512 الصميم! و 16 متعددة المعالجات متكامل على شريحة واحدة واحدة، كل معالج يحتوي على 32 برنامج كودا الصميم. • يدعم الإلكترونيات الجديد- IEEE-745 2008 القياسية من الأرقام العائمة متجاوزا حتى أكثرها تقدما من وحدة المعالجة المركزية في العالم. • جميع السجلات وذاكرة كاش، الذاكرة المشتركة، و DRAM يحميها ،بستخدام ECC والذي هو شرط حاسم لمراكز البيانات ومراكز الحوسبة الفائقة نشر وحدات معالجة الرسومات على نطاق واسع • DataCache الموازي : الكاش الأولى في التسلسل الهرمي في الجرافيك، بالاشتراك مع لرقاقة الذاكرة المشتركة يسرعان خوارزميات الحلول مثل الفيزياء، اقتفاء الأثر، ومتفرق الضرب مصفوفة البيانات حيث العناوين ليست معروفة مسبقا. • ميزات أخرى تستند إلى مفاهيم GT200 القديمة ،. كل هذه السمات تجعل Ferm ليس فقط أقوى الجرافيك الفنية لتطبيقات الحوسبة، ولكن أيضا الأكثر موثوقية. بعض المشاكل: على الرغم من الرسومات يميل إلى إشراك دفعات كبيرة جدا من أشياء مثل بكسل، قد التطبيقات الأخرى من هذا القبيل لم يحدث على نطاق واسع. في الواقع، Nvidia يعترف بأن بعض الحبات قد تعمل على شبكات البيانات أصغر من الجرافيك مثل Ferm، كما هو موضح في الرسم البياني


بعض الوظائف هي أصغر من الجرافيك والعرض، وذلك جزء من رقاقة يجلس عاطلا عن بقية العمليات كل نواة. Ferm يتجنب هذا القصور من خلال تنفيذ ما يصل إلى 16 حبات مختلفة بشكل متزامن، بما في ذلك حبات متعددة على نفس SMs. القيد هنا هو أن حبات مختلفة يجب أن يأتي من نفس سياق برنامج كودا ،و لمعالجة هذا النوع الأخير من المشكلة ،تم أسرع سياق التحول بشكل كثيروكذلك تبديل السياق هو عشرة أضعاف سرعة التي كانت عليها وهنا بعص المواصفات لكرة: Nvidia



Reference: [١] SINTEF تكنولوجيا المعلومات والاتصالات www.nvidia.com by : Samira Al-Mattar