تبليغاتX
ماهنامه دانش و كامپيوتر - تحولات دنياي پردازنده‌هاي اينتل

مرتضي زيبايي

 

در حدود يکسال پيش، يعني 12 نوامبر 2007، اينتل اولين سري از پردازنده‌هاي 45 نانومتري از معماري موفقCore  با نامPenryn  را رسماً معرفي نمود که در ابتدا به جز QX9650 ، بقيه‌ نمونه‌هاي توليدي، دربرگيرنده‌ نسخه‌هاي 2 و 4 هسته‌اي Xeon بودند؛ اين خانواده از پردازنده‌هاي اينتل، فعلاً در کارخانه‌ تازه تأسيس Fab 32 مستقر در Arizona (آريزونا) و نيز کارخانه D1D در Oregon توليد مي‌شوند؛ اکنون نيز که نزديک به يکسال از آن تاريخ مي‌گذرد، با معماري 45 نانومتري ارتقاء يافته‌ Nehalem روبرو هستيم که طبق ادعاي اينتل، بين 20 تا 50 درصد از Penryn قويتر خواهد بود.

البته در دنياي نانومتري که اندازه‌هاي يک ترانزيستور در حدود 200 اتم مي‌تواند باشد، انتظار رفتاري متفاوت و گاهي خارج از کنترل نسبت به آن چيزي که در الکترونيک مي‌شناسيم بايد داشته باشيم. ضمنا بخوبي مي‌دانيم که ترانزيستورها در داخل يک پردازنده، در نقش يک کليد دو حالتي فعاليت مي‌کنند که دو وضعيت خاموش و روشن را مي‌توانند داشته باشند که اين يعني منطق صفر و يک. اما ايجاد جريان کافي زمان روشن شدن ترانزيستور و نيز به کمترين حد رساندن جريان عبوري در زمان خاموش بودن، از بزرگترين چالش‌هاي کار در معماري نانومتري است و همين مطلب باعث شد طراحان اينتل، از مواد جديد همچون عنصر Hafnium بجاي دي‌اکسيد سيليسم و نيز از الکترود فلزي بجاي انواع پلي‌استري، در طراحي پردازنده‌هاي 45 نانومتري خود استفاده کند.

هر چند همچنان اسرار متعددي در زمينه نوع مواد استفاده شده در ترانزيستور‌هايHK+MG مورد استفاده در معماريPenryn  وجود دارد که بعيد است Intel تا پيش از سال2010 (که طبق برنامه، زمان رونمايي پردازنده‌هاي 32 نانومتري Westmere  و Gesher است)، جزئيات آنها را بر رقباي خود مکشوف کند. اينتل مدعيست که استفاده از اين مواد جديد موجب کاهش 30 درصدي توان الکتريکي مصرفي و نيز افزايش 20 درصدي سرعت اين ترانزيستورها براي سوييچ‌کردن و نيز کاهش 10 برابري نشت الکترون‌ها در گيت، نسبت به معماري 65 نانومتري پيشين شده است.

ضمن اينکه در پردازنده‌هاي جديد، بسته به دو يا 4 هسته‌اي بودن، بين 410 تا 820 ميليون ترانزيستور استفاده شده که اين ارقام نسبت به معماري پيشين، در حدود 1.5 برابر شده است.

 

شايد بتوان مهمترين اهداف اينتل از ارائه معماري Penryn (پنرين) را در موارد زير خلاصه نمود :

·      افزايش کارايي پردازنده به‌ ازاي هر سيکل پردازشي

·      افزايش سرعت(فرکانس کاري) پردازنده

·      آزمودن مواد جديد و با ضريب دي‌الکتريک بيشتر

 

در حال حاضر پردازنده‌هاي مبتني بر اين معماري، در سه پلتفورم سرور، دسکتاپ و موبايل (براي دستگاه‌هاي قابل حمل و لپ‌تاپ‌ها) در دسترس است. اما آنچه را که وجه اصلي تمايز Penryn از پردازنده‌هاي پيشين 65 نانومتري معماري Core است، مي‌توان در موارد زير ملاحظه کرد :

·      افزودن مقدار حافظه کشL2  و نيز تفکيک فعاليت کش‌ها

·      بالاتر بردن سرعت گذرگاه FSB تا سقف 1600MHz

·      افزايش فرکانس کاري پردازنده

·      تعداد دستورالعمل‌هاي انجام شده بيشتر در هر سيکل پردازش (بالا رفتن عدد IPC)

·      معرفي مجموعه دستورالعمل‌هاي جديد جرياني SSE4 که خود مشتمل بر 47 دستورالعملSSE  مي‌باشد

·    توسعه‌ فناوري‌ Deep Power Down و ويرايش جديد EIST(Enhanced Intel Dynamic Acceleration Technology) در جهت بهبود مصرف انرژي، به ويژه در نسخه‌هاي موبايل پنرين

·      بلوک جدا کننده سريع مبناي 16 (واحد مميز شناور قويتر)  که هر 4 بيت داده را در يک سيکل پردازش مي‌کند

·    ارائه‌ فناوري Super Shuffle engine (واحد مميز شناور قويتر)؛ اين فناوري امکان پردازش چندين 128bit دستورالعمل SSE را در هر سيکل کلاک مي‌دهد و موجب افزايش چشمگير کارايي دستورالعمل‌هاي SSSE3 و SSE4 مي‌شود.

·      Enhanced Virtualization Technology که بين 25 تا 75 درصد موجب بهبود کارايي Virtual Machine شده است.

 

SSE4 چيست؟

Intel® Streaming SIMD Extensions 4 يا بطور خلاصهSSE4 ، يک مجموعه‌ جديد از دستورالعمل‌هاييست که از يک‌ سو موجب بهبود کارايي و کاهش مصرف انرژي در محدوده‌ وسيعي از برنامه‌ها مي‌شود و از سوي ديگر به کمک توسعه‌دهندگان نرم‌افزاري و برنامه‌نويسان خواهد آمد.

 

مجموعه دستورالعمل‌هاي SSE4 که در Penryn معرفي شده و مشتمل است بر 54 دستورالعمل که به دو بخش اصلي تقسيم مي‌شوند:

1))  کامپايلر بْرداري و شتاب‌دهنده‌هاي گرافيکي و چندرسانه‌اي

2))  شتاب‌دهنده‌هاي بهبود يافته ويرايش متن و رشته‌ها

 

- کامپايلر بْرداري و شتاب دهنده‌هاي چند رسانه‌اي و گرافيکي، موجب بهبود کارايي کامپايلرهاي پيشين و نيز بهبود کارايي عمليات‌هاي چند رسانه‌اي و کارکرد حافظه مي‌شود که نتيجه‌ آن را در افزايش کارايي نرم‌افزارهاي ويرايشگر صدا، تصوير و عکس و نيز افزايش کارايي برنامه‌هاي ويژه‌ کدگذاري ويدئويي و سه بعدي و نيز بازي‌ها مي‌توان ديد.

- شتاب‌دهنده‌هاي بهبود يافته ويرايش متن و رشته‌ها نيز شامل نوعي دستورالعمل‌هاي مقايسه رشته‌هاست که اجازه انجام همزمان چندين عمليات مقايسه و جستجو را مي‌دهد. برنامه‌هايي که از اين ويژگي به بهترين شکل مي‌توانند سود ببرند، شامل برنامه‌هاي کار با پايگاه داده‌ها، برنامه‌هايي‌ که با حجم عظيمي از داده‌ها سرو کار دارند و نيز کامپايلرها و برنامه‌هايي که بدنبال الگوهاي خاصي هستند، از قبيل ويروس‌ياب‌ها مي‌باشند.

 

چنانکه پيشتر اشاره شد، مجموعه دستورالعمل‌هاي SSE4 برابر 54 دستورالعمل است که در دو مجموعه‌ 4.1 و 4.2 قرار مي‌گيرند.

مجموعه دستورالعمل‌هاي SSE4.1 شامل 47 دستورالعمل است که در معماري Penryn معرفي شده است و باقيمانده (7 دستورالعمل) در مجموعه SSE4.2 جاي مي‌گيرد که در معماري ارتقا يافته Nehalem گنجانده شده‌ و در بخش مربوط به خود توضيح داده خواهد شد.

 

 

توسعه‌ فناوري‌هاي کاهش مصرف انرژي

اينتل با حركت به سمت ريزمعماري جديد، نام رايج پردازنده‌هاي دوهسته‌اي موبايل خود را نيز ازCentrino Duo  وCentrino Pro ، به Centrino2 تغيير داد و لوگوي جديدي را هم جايگزين لوگوي پيشين نمود.

 

از جمله آنچه معماري 45 نانومتري بطور اختصاصي براي پردازنده‌هاي موبايل به ارمغان آورده است، گذشته از فناوري (SSE4) Intel HD Boost،  مي‌توان به دو فناوري جديد در زمينه کاهش مصرف انرژي ، يعني فناوري Deep power down وEnhanced dynamic acceleration  اشاره کرد.

 

Deep Power Down (DPD)

پردازنده‌هاي موبايل اينتل که عمدتاً براي لپ‌تاپ‌ها و ساير دستگاه‌هاي قابل حمل طراحي شده‌اند، قادرند در زمان بار کم و بيکاري، براي کاهش مصرف انرژي که موجب حفظ توان باتري و توليد کمتر گرما مي‌شود، ولتاژ را به‌ نحو موثري کاهش دهند، کلاک پردازنده را متوقف کنند و حتي حافظه کش پردازنده را هم خاموش کنند.

همچنين از زمان معرفي اولين پردازنده‌هاي دو هسته‌اي اينتل بر پايه‌ پلتفورم Pentium M با نام Core Duo تاکنون، اينتل چند حالت بهينه‌سازي مصرف انرژي موسوم به C-state را هم در آن‌ها طراحي کرده بود که اين Modeها عبارت‌ بودند از :

·      C0 يا Fully Active

·      C1 يا Halt

·      C2 يا Stop Clock

·      C3 يا Deep Sleep

اين حالات مختلف مي‌توانستند در هر کدام از هسته‌هاي فاقد فعاليت، ولتاژ را کاهش داده و کلاک آن هسته را خاموش کنند و اين حالت مي‌توانست تا زماني ادامه يابد که هسته فعالِ ديگر، به بالاترين سطح کاري خود مي‌رسيد؛ بر همين اساس، هر کدام از هسته‌ها مي‌توانست در حالتC  متفاوتي باشد.

در ويرايش‌هاي بعدي، اينتل دو حالت C ديگر هم به C-stateهاي پيشين افزود که مي‌توانستند فقط بر روي هر دو هسته در يک زمان فعال شوند که عبارت بودند از :

·      C4 يا Deeper Sleep

·      DC4 يا Enhanced Deeper Sleep

اما در معماري Penryn شاهد هستيم که حالت جديدي با نام C6 ياDeep Power Down معرفي شده که موجب کاهش چشمگير ولتاژ پردازنده، توقف کلاک و خاموش شدن حافظه‌هاي کش مي‌شود و بيش از هر کدام از C-Modeهاي پيشين، مي‌تواند توان مصرفي را کاهش دهد. هر چند مي‌تواند قدري بيشتر از قبل، موجب تأخير پردازنده در بازگشت به حالت کاري حداکثر خود ‌شود.

 

فناوري Deep Power Down همچنين بر روي کاهش مصرف انرژي در حافظه‌هايMobile RAM  هم تأثير ويژه خود را دارد؛ طرز کار به اين صورت است که اگر براي مدتي نسبتاً طولاني، در حافظه رم اعمال نوشتن يا خوانده شدن صورت نگيرد، مصرف انرژي الکتريکي در رم کاهش مي‌يابد؛ در اين حالت همه‌ ورودي‌هاي بافرها بجز کلاک خاموش مي‌شود؛ اين فناوري مي‌تواند مصرف برق را از طريق متوقف کردن عملياتRefresh  حافظه و خاموش کردن مولد انرژي داخلي به حداقل برساند. با اينحال، داده‌هاي موجود در رم از بين نخواهد رفت.

 

Enhanced Dynamic Acceleration (EDAT)

اين ويژگي، ما را به‌ياد سامانه (Displacement on Demand (DOD موجود در بعضي خودروهاي 6 سيلندر به بالا مي‌اندازد! که به ‌منظور کاهش مصرف انرژي (سوخت) باعث مي‌شود بسته به نياز و ميزان فشار راننده بر روي پدال گاز، فرضاً در يک شورولت ايمپالاي 6 سيلندر، فقط 3 يا 4 سيلندر، عمل احتراق را انجام دهند و بقيه سيلندرهاي از مدار خارج شده، با بسته ماندن ورودي سوخت‌شان، هيچ احتراقي صورت ندهند.

سابقاً اينتل در پردازنده‌هاي سري سانتاروزا که توليد آن موجب شد براي نخستين بار لپ‌تاپ‌ها به باس800MHz  دست يابند، از فناوريDynamic Acceleration استفاده کرده بود؛ اين فناوري قادر به نوعي اورکلاک هوشمندانه هم در پردازنده بود.

در عين حال در اغلب اوقات، هسته‌هاي پردازشي نياز به حداکثر فعاليت ندارند. بر همين اساس، در يک پردازنده‌ دو هسته‌اي، بيشتر بار پردازشي بر دوش يکي از هسته‌ها قرار مي‌گيرد و هسته ديگر تا زمانيکه نيازي وجود نداشته باشد، به حال استراحت فرو مي‌رود. اين حالت به لحاظ صرفه‌جويي در مصرف انرژي، به‌مراتب بسيار بهتر از آنست که بار پردازشي بر دوش همه‌ هسته‌هاي پردازنده قرار گيرد.

 

در ويرايش جديد اين فناوري که در پردازند‌هاي پنرين‌ از نوع موبايل ارائه شده و به EDAT موسوم است، اين ويژگي باز هم تقويت شده، به طوريکه اگر يکي از هسته‌ها به مرحله‌ C3 وارد شود، هسته ديگر اجازه مي‌يابد که کلاک خود را بيش از حد عادي هم افزايش دهد و به طور هوشمندانه اورکلاک شود. اين در حاليست که هسته ديگر در حالت کمترين مصرف انرژي قرار گرفته و هسته فعال هم بهتر مي‌تواند به دفع گرماي توليدي بپردازد. اين فناوري به‌ ويژه در زمان اجراي نرم‌افزارهاي قديمي تک رشته‌اي (Single Thread)، مي‌تواند نقش موثر خود را بروز دهد.

 

نگاهي به ديگر مولفه‌هاي پلتفورم موبايل

ميزان حافظه‌ کاشه سطح 1 در پنرين‌هاي موبايل و دسکتاپ، مشابه انواع 65 نانومتري پيشين باقي مانده؛ يعني براي هر هسته، 32 KB کش دستورالعمل‌ و 32 KB کش داده. به عبارتي در يک پردازنده‌ دو هسته‌اي موبايل پنرين همچون انواع دسکتاپ، همچنان  L1 Cacheمعادل 2 x32 + 2 x32 کيلوبايت است.

اما در حافظه سطح 2 که بيشتر بودن آن بويژه در عمليات‌ رندرينگ سه‌بعدي و ويرايش‌هاي ويدئويي، نقش خود را برجسته‌تر نشان مي‌دهد، شاهد افزايش قابل توجهي هستيم که اين مرهون کوچک شدن ابعاد ترانزيستورها و ساير عناصر نيمه‌هادي‌ و در نتيجه قرار دادن تعدادي بيشتري از آن‌ها در بخش حافظه کش بوده است. از اين لحاظ، پردازنده‌هاي دو هسته‌اي تا سقف 6 مگابايت، و 4 هسته‌اي‌ها 12 مگابايت، داراي کش L2 شده‌اند.

سرعت FSB هم در اين سري پردازنده‌ها به رقم شگفت‌انگيز 1066 مگاهرتز رسيده است که در مقايسه با معماري 65 نانومتري سلف خود که 667 MHz، و همچنين سانتاروزا که داراي باس 800 مگاهرتزي بود، پيشرفت قابل توجهي محسوب مي‌شود.

سرعت کلاک پردازنده‌هاي موبايل خانواده‌ي پنرين نيز از 1.2GHz در تک هسته‌اي  Celeron M-ULV 722با TDP 5.5W آغاز و به 3.06GHz در X9100 با TDP برابر با  44Wختم مي‌شود.

در عين حال، همانطور كه اشاره شد، اينتل همچنين توانسته براي نخستين بار 4 هسته‌ پردازشگر را بر روي پلتفورم موبايل پنرين قرار دهد (Q9100 و QX9300)؛ هر چند هنوز بسيار نادرند لپ‌تاپ‌هايي که اين پردازنده‌هاي 4 هسته‌اي بسيار گرانقيمت را که به‌تنهايي بهايي معادل يک لپ‌تاپ رايج را دارند، استفاده کرده باشند.

 

پردازنده‌هاي سرور و دسکتاپ پنرين  

اينتل به مانند معماري سابق، پردازنده‌هاي دسکتاپ و سرور پنرين را نيز در آرايش‌هاي 2 و 4 هسته‌اي روانه بازار کرده است.

پردازنده‌هاي 45 نانومتري سرور (از نوع زئون) در نوع دو هسته‌اي، با کد سري E31xx و در نوع چهار هسته‌اي با کد E33xx ، داراي سرعت کلاکي بين 2.83 تا 3GHz ، کش 6 يا 12مگابايتي و 1333مگاهرتز باس خارجي(FSB) هستند.

همچنين زئون‌هاي سري 52xx دو هسته‌اي و 54xx چهارهسته‌اي، داراي FSB بين 1066 تا 1600مگاهرتز، کش 6 يا 12 مگابايتي و فرکانس کاري 1.86 تا 3.4GHz هستند.

 

و اما در پلتفورم دسکتاپ، در ابتدا شاهد يک مدل از نوع ارزان ‌قيمت Pentium Dual Core هستيم که با کد E5200 و مشخصات سخت‌افزاري (2.5GHz, 2MB L2 Cache,800MHz FSB) مشخص شده است. لازم به ذكر است، اينتل براي كامپيوتر‌هاي روميزي (برعکس لپ‌تاپ‌ها)، هنوز نسخه‌ Celeron از اين معماري عرضه نکرده است.

 

ناگفته نماند در نسخه‌هاي Core2 با دو سري 7000 و 8000 روبرو هستيم که با جزئيات آن‌ها هم آشنا مي‌شويم.

 

سري‌  E7XXX:

·      E7200(2.53GHz,3MB L2 Cache,1066Mhz FSB)

·      E7300(2.66GHz,3MB L2 Cache,1066Mhz FSB)

·      E7400(2.80GHz,3MB L2 Cache,1066Mhz FSB)

 

و سري E8XXX  :

·      E8190(2.66GHz,6MB L2 Cache,1333MHz FSB)  

(فاقد Virtualization Technology و Intel® Trusted Execution Technology)

·      E8200(2.66GHz,6MB L2 Cache,1333MHz FSB)

·      E8300(2.83GHz,6MB L2 Cache,1333MHz FSB)

·      E8400(3.00GHz,6MB L2 Cache,1333MHz FSB)

·      E8500(3.16GHz,6MB L2 Cache,1333MHz FSB)

·      E8600(3.33GHz,6MB L2 Cache,1333MHz FSB)

 

نسخه‌هاي 4 هسته‌اي دسکتاپ نيز شامل مدل‌هاي زير هستند:

·      Q8200(2.33GHz, 4MB L2 Cache,1333MHz FSB)

(فاقد  Virtualization Technology و Intel® Trusted Execution Technology)

·      Q9100(2.26GHz, 12MB L2 Cache,1066MHz FSB)

·      Q9300(2.50GHz, 6MB L2 Cache,1333MHz FSB)

·      Q9400(2.66GHz, 6MB L2 Cache,1333MHz FSB)

·      Q9450(2.66GHz, 12MB L2 Cache,1333MHz FSB)

·      Q9550(2.83GHz, 12MB L2 Cache,1333MHz FSB)

·      Q9650(3.00GHz, 12MB L2 Cache,1333MHz FSB)

 

سري گرانبها و قدرتمند Extreme هم فعلاً فقط شامل نسخه‌‌هاي 4 هسته‌اي زير است :

·      QX9650(3.00GHz,12MB L2 Cache,1333MHz FSB)

·      QX9770(3.20GHz,12MB L2 Cache,1600MHz FSB)

·      QX9775(3.20GHz,12MB L2 Cache,1600MHz FSB)

(فقط سازگار با مادربورد Intel DX5400 ويژه‌ي پيکربندي dual-socket)

 

چيپست‌هاي سازگار

همزمان، اينتل چيپست‌هاي جديدي نيز براي سازگاري بيشتر با پردازنده‌هاي جديد خود و نيز پشتيباني مطلوب‌تر از رم‌هاي پرسرعت DDR3، در اختيار سازندگان مادربورد قرار داده که در پلتفورم لپ‌تاپ، شامل PM45 (هر چند بسياري از سازندگان لپ‌تاپ همچنان از PM965 براي لپ‌تاپ‌هاي داراي پردازنده پنرين استفاده مي‌کنند) و در پلتفورم دسکتاپ هم، از P45 تا X48 چيپست‌هاي قدرتمندي هستند که مي‌توانند بالاترين سازگاري با پردازنده‌هاي جديد را داشته باشند.

 

 Nehalem

نخستين بار Paul Otellini که در حال حاضر رياست اينتل را بعهده دارد، در همايش توسعه‌دهندگان اينتل(IDF) 2007 اعلام کرد که Nehalem نام معماري بسيار پويا و آتي اينتل خواهد بود که محصولات بر پايه آن، با نام Core i7 در سال 2009 عرضه خواهند شد؛ حتي وي، ويفرهاي اجرايي آن را هم در آنجا نمايش داد و در نمايشگاه Computex 2008 نيز اطلاعات بيشتري ارائه شد.

 

نگاهي گذرا بر مهم‌ترين ويژگي‌هاي اين معماري :

·      Nehalem بر اساس معماري Core و طراحي 45 نانومتري بنا شده است.

·      پردازنده‌هاي مبتني بر اين معماري، داراي اسم رمز Bloomfield و طبق اعلام اينتل بين 2 تا 8  هسته‌ خواهند داشت.

·    Core i7 از فناوري HyperThreading با نامSimultaneous multi threading(SMT) (بکار رفته در معماري Netburst در طراحي Pentium4) استفاده مي‌کند؛ بنابراين در سيستم عامل، يک پردازنده 8 هسته‌اي Nehalem را 16 هسته‌اي خواهيم ديد و اين پردازنده در يک لحظه مي‌تواند 16 رشته (Thread) را پردازش کند؛ در بنچ‌مارک‌هايي که به ‌عمل آمده، همچنان که در گذشته و درباره‌ پردازنده‌هاي پنتيوم 4 نشان داده شده بود، غيرفعال کردن SMT در بعضي از آزمون‌ها، مي‌تواند کارايي پردازنده را بالاتر ببرد.

·    کنترلر حافظه سه کاناله‌ ( Triple-Channel DDR3 ( در داخل پردازنده قرار گرفته و بدين لحاظ، سوکت پردازنده هم از نوع LGA775 به LGA1366 تبديل شده است؛ حافظه‌ تک کاناله (Single-Channel) توانايي انتقال 64 بيت داده را در هر سيکل کلاک دارد و اين نرخ انتقال در حافظه‌هاي دوکاناله (Dual-Channel) برابر 128بيت است؛ حال آنکه در حافظه‌هاي سه کاناله، با افزايشي 50 درصدي، نرخ انتقال داده در هر سيکل به 192بيت مي‌رسد. همچنين با استفاده از ماژول‌هاي رم DDR3-1333، پهناي باندي برابر با 32GB/s حاصل مي‌شود که اين پهناي باند، 5/1 برابر بيشتر از حالتيست که از همين RAM در حالت دو کاناله استفاده شود.

·    چيدمان حافظه‌ کش در پردازنده‌هاي Core i7 ، شبيه پردازنده‌ 4 هسته‌اي Phenom شرکت AMD است. مقدار کشL1 مشابه پنرين‌ها است، اما براي هر هسته داراي 256 کيلوبايت L2 Cache اختصاصي و ضمنا يک L3 Cache بزرگ نيز به صورت اشتراکي بين هسته‌ها قرار گرفته است.

·    جايگزيني گذرگاه FSB با گذرگاه جديد QuickPath : گذرگاه QuickPath که کارکردي مشابه Hyper Transport در پردازنده‌هاي AMD دارد، گذرگاهيست براي ارتباط پردازنده با چيپست مادربورد و نيز ارتباط دو پردازنده با هم، که قابليت انتقالي در حدود 6.4GT/s دارد و با توجه به اينکه به ازاي هر سوکت پردازنده روي مادربورد، دو لينک QuickPath وجود دارد و هر لينک نيز مسير جداگانه‌اي براي انتقال و دريافت داده دارد، نتيجه مي‌گيريم که در اين پلتفورم، هر پردازنده مي‌تواند قابليت بيش از 25GT/s به ازاي هر لينک داشه باشد.

·    در اين معماري از 4 واحد ارسال (Dispatch Unit) استفاده شده است. حال آنکه در پردازنده‌هاي پيشين، از 3 واحد استفاده شده است. به اين ترتيب، پردازنده در هر لحظه قادر است 4 دستورالعمل(در مقابل 3 دستورالعمل در پنرين) را پردازش کند که اين موجب 33% بهبود پردازش Nehalem شده است.

·    استفاده از مجموعه دستورالعمل‌هاي SSE4.2 که به‌ويژه در پردازش متون تاثيرگذار است. توضيح اينکه پردازنده‌هاي پيشين، براي پردازش هر کاراکتر از نوع Metadata، Name و يا White Space که مرورگرهاي وب در باز کردن صفحات با آن‌ها سر و کار دارند، مجبور به صرف يک سيکل کلاک بودند. چرا که آن پردازنده‌ها قادر نبودند اين کاراکترها را تجزيه کنند. اما با دستورالعمل‌هاي جديد Intel SSE4.2، پردازنده‌هاي Nehalem قادر به تجزيه اين کاراکترها بوده و سيکل کلاک فقط صرف تشخيص نوع کاراکتر خواهد شد.

بنابر اظهار اينتل، ميزان سيکل کلاک در صورت استفاده پردازنده از اين مجموعه دستورالعمل‌ها، تا 83 درصد کاهش مي‌يابد که اين مطلب به ويژه براي سرورهاي وب، اهميت مضاعفي خواهد داشت.

·      وجود دو ورودي TLB 512 براي افزايش سرعت ترجمه‌ آدرس‌هاي مجازي و انتقال داده بين آدرس‌هاي فيزيکي و مجازي درVirtual Memory (حافظه مجازي).

·      همچنين استفاده از شاخه اضافي واحد حدس (با افزودن بافر هدف BTB) که موجب بهبود کارايي واحد حدس در پيش‌بيني درخواست‌هاي پردازنده از حافظه مي‌شود.

·      پيشرفت و تقويت فناوري Intel VT(Virtualization)

 

اميد است ارائه اين بحث سخت‌افزاري، توانسته باشد اطلاعات مفيدي در رابطه با آخرين تحولات و پيشرفت‌هاي مربوط به دنياي پردازنده‌هاي كامپيوتري را در اختيار شما علاقمندان قرار دهد.

 

+ نوشته شده در  ساعت   توسط دانش و كامپيوتر  |