TAHA
04-16-2010, 06:50 PM
طی یک سال گذشته شرکت امریکایی amd که بعنوان دومین کارخانه ی بزرگ در بازار پردازنده ها به حساب آورده می شود ، معماری جدید خود را در قالب یک server solution Barcelona ارائه کرد.
http://pnu-club.com/imported/2010/04/1268.jpg
طی یک سال گذشته شرکت امریکایی amd که بعنوان دومین کارخانه ی بزرگ در بازار پردازنده ها به حساب آورده می شود ، معماری جدید خود را در قالب یک server solution Barcelona ارائه کرد. در واقع Barcelona جزو دسته ی Opteron ها محسوب می شود که توانایی های جدید ی را نسبت به مدل های قبلی در زمینه های مجازی سازی داراست و با multi-socket scaling خود ، توانایی های قابل توجهی را در بسیاری از نرم افزار های همسان ساز چند مسیره از خود بروز می دهد.
با توجه به جذابیت کامپیوتر های Desktop یا رومیزی ، معماری K۱۰ در راستای ایجاد یک بستر کاملا جدید و یکپارچه ، متشکل از یک پردازشکر PHENOM X۴ و مادربردی با چیپ ست AMD-ATI و یک پردازشگر گرافیکی ( یا بیشتر) آن هم از AMD-ATI ، تحت نام SPIDER ، به بازار عرضه شدند. نتیجه ی این مجموعه ، تشکیل یک ماشین قدرتمند در زمینه ی بازی و مالتی مدیا با تناسب ۱۰۰ درصد و تحت پوشش AMD بود. پردازنده ی این مجموعه خود یک محصول کاملا AMD ای است که تحت تاثیر معماری قبلی یعنی K۸ ، می باشد اما با تغییراتی عمده بخصوص در بهبود کارکرد در زمینه ی برنامه های چند مسیری یا multithread و i.e ( برنامه های i.e قادرند تا از چند هسته به طور همزمان و کامل استفاده کنند.).
بسیاری بر این باورند که با دو هسته در یک پردازنده بطور طبیعی ،دوبرابر شدن کارکرد حاصل خواهد شد. این نظر شبیه به استفاده از ۱۰ کارگر برای انجام کار یک کارگر است که موجب ۱۰ برابر شدن سرعت انجام کار می شود. در واقع این عمل شما را مجبور می سازد تا کار را در یک مسیر به شکل موازی بین آنه تقسیم کنید. البته قرار دادن محصولات در کنار هم نیز تا اندازه ای زمان بر است؛ از این رو پرش کارکرد هرگز نمی تواند خطی باشد. PHENOM و کلا خانواده ی K۱۰ اصولا برای اجابت کردن خواسته های رو به افزایش برنامه های multithread ، طراحی و مشهور شده اند.
● نوزاد جدید در شهر
معرفی یک ریز معماری جدید همواره یک رویداد جالب تلقی می شود. نسل پردازشگر های K۱۰ در نوع خود قابل احترام است (هرچند بر پایه ی معماری های قبلی است) ؛ اما افزایش حافظه ی کش و بالا رفتن سرعت باس، کاهش و بهبود فرایند ساخت و نحوهی آرایش اجزا ،مشابهتی با گذشته ندارد. تمام موفقیت این خانواده در گام اول به یکسان بودن پایه ی خود استوار بوده است. گذشت زمان ثابت کرده است که یک معماری خوب (با پتانسل خوب) می تواند موجب وسعت رقابتی بیشتر در بازار باشد و این خود جنبه ی تمایزی در بین تولیدات مشابه محسوب می شود. یک پردازنده ی پیشرفته قادر است تا در مقابل رقم بالای عملیات در یک چرخه (CYCLE) در یک کلاک نسبتا پایین بسیار سریع عمل کند. البته تولید پردازنده هایی با ترانزیستور های کم ، برای تولید در کمیت های زیاد مناسب تر به نظر می رسند ، اما کاملا واضح است که نسل فعلی پردازنده های K۸ به شکلی که در حال حاضر در حال اتفاق است ، بطور کامل توسط مشتقات K۱۰ در دسته بندی های متفاوت با کارایی های متفاوت و همچنین قیمت های متفاوت ، جایگزین خواهند شد. اگرچه هنوز پردازنده های فنوم نوظهور هستند ، ممکن است دارای ضعف ها و مشکلات زیادی باشند به همین دلیل است که تا قبل از ظهور پردازنده های PHENOM II ، تنوع پردازنده های سری K۱۰ بسیار محدود و کم بود اما در کل تولید چهار هسته های یکپارچه با تکنولوژی ۶۵NM ، لقمه ی بزرگی به نظر می رسید. فضای داخلی این پردازشگر ها ۲۸۶ میلی متر مربع است که این دو برابر بزرگتر از پردازشگر های CORE ۲ DUO و بیش از دو برابر اندازه ی یک ATHLONE X۲ (Brisbane) است.
که بعنوان دومین کارخانه ی بزرگ در بازار پردازنده ها به حساب آورده می شود ، معماری جدید خود را در قالب یک server solution Barcelona ارائه کرد. در واقع Barcelona جزو دسته ی Opteron ها محسوب می شود که توانایی های جدید ی را نسبت به مدل های قبلی در زمینه های مجازی سازی داراست و با multi-socket scaling خود ، توانایی های قابل توجهی را در بسیاری از نرم افزار های همسان ساز چند مسیره از خود بروز می دهد.
با توجه به جذابیت کامپیوتر های Desktop یا رومیزی ، معماری K۱۰ در راستای ایجاد یک بستر کاملا جدید و یکپارچه ، متشکل از یک پردازشکر PHENOM X۴ و مادربردی با چیپ ست AMD-ATI و یک پردازشگر گرافیکی ( یا بیشتر) آن هم از AMD-ATI ، تحت نام SPIDER ، به بازار عرضه شدند. نتیجه ی این مجموعه ، تشکیل یک ماشین قدرتمند در زمینه ی بازی و مالتی مدیا با تناسب ۱۰۰ درصد و تحت پوشش AMD بود. پردازنده ی این مجموعه خود یک محصول کاملا AMD ای است که تحت تاثیر معماری قبلی یعنی K۸ ، می باشد اما با تغییراتی عمده بخصوص در بهبود کارکرد در زمینه ی برنامه های چند مسیری یا multithread و i.e ( برنامه های i.e قادرند تا از چند هسته به طور همزمان و کامل استفاده کنند.).
بسیاری بر این باورند که با دو هسته در یک پردازنده بطور طبیعی ،دوبرابر شدن کارکرد حاصل خواهد شد. این نظر شبیه به استفاده از ۱۰ کارگر برای انجام کار یک کارگر است که موجب ۱۰ برابر شدن سرعت انجام کار می شود. در واقع این عمل شما را مجبور می سازد تا کار را در یک مسیر به شکل موازی بین آنه تقسیم کنید. البته قرار دادن محصولات در کنار هم نیز تا اندازه ای زمان بر است؛ از این رو پرش کارکرد هرگز نمی تواند خطی باشد. PHENOM و کلا خانواده ی K۱۰ اصولا برای اجابت کردن خواسته های رو به افزایش برنامه های multithread ، طراحی و مشهور شده اند.
● نوزاد جدید در شهر
معرفی یک ریز معماری جدید همواره یک رویداد جالب تلقی می شود. نسل پردازشگر های K۱۰ در نوع خود قابل احترام است (هرچند بر پایه ی معماری های قبلی است) ؛ اما افزایش حافظه ی کش و بالا رفتن سرعت باس، کاهش و بهبود فرایند ساخت و نحوهی آرایش اجزا ،مشابهتی با گذشته ندارد. تمام موفقیت این خانواده در گام اول به یکسان بودن پایه ی خود استوار بوده است. گذشت زمان ثابت کرده است که یک معماری خوب (با پتانسل خوب) می تواند موجب وسعت رقابتی بیشتر در بازار باشد و این خود جنبه ی تمایزی در بین تولیدات مشابه محسوب می شود. یک پردازنده ی پیشرفته قادر است تا در مقابل رقم بالای عملیات در یک چرخه (CYCLE) در یک کلاک نسبتا پایین بسیار سریع عمل کند. البته تولید پردازنده هایی با ترانزیستور های کم ، برای تولید در کمیت های زیاد مناسب تر به نظر می رسند ، اما کاملا واضح است که نسل فعلی پردازنده های K۸ به شکلی که در حال حاضر در حال اتفاق است ، بطور کامل توسط مشتقات K۱۰ در دسته بندی های متفاوت با کارایی های متفاوت و همچنین قیمت های متفاوت ، جایگزین خواهند شد. اگرچه هنوز پردازنده های فنوم نوظهور هستند ، ممکن است دارای ضعف ها و مشکلات زیادی باشند به همین دلیل است که تا قبل از ظهور پردازنده های PHENOM II ، تنوع پردازنده های سری K۱۰ بسیار محدود و کم بود اما در کل تولید چهار هسته های یکپارچه با تکنولوژی ۶۵NM ، لقمه ی بزرگی به نظر می رسید. فضای داخلی این پردازشگر ها ۲۸۶ میلی متر مربع است که این دو برابر بزرگتر از پردازشگر های CORE ۲ DUO و بیش از دو برابر اندازه ی یک ATHLONE X۲ (Brisbane) است.
ذکر یک نکته در اینجا شاید بد نباشد : اکثر کمپانی های بزرگ همواره با ساختن یک تراشه یا هسته یا انجین قدرتمند با قابلیت های زیاد ، تنوع محصول را از همان یک اثر ایجاد می کنند. برای مثال AMD در بسیاری موارد با خاموش کردن یک یا دو یا سه هسته از مجموع ۴ هسته و ایجاد تغییراتی در فرکانس و کش ، در حال حاضر تنوع محصول فراوانی را ایجاد کرده است. البته میزان بازدهی و تنوع به درجه ی کمال فناوری مجموعه بستگی دارد. البته بر خلاف پردازنده های CORE ۲ QUAD اینتل ، ای ام دی در یک هسته ی یکپارچه سری k۱۰ را عرضه کرده است. از طرف دیگر اینتل از MCM( شاخص چیپ چند گانه MULTY chip module ) استفاده می کند که به آنها اجازه می دهد تا دو پردازنده ی دو هسته ای را در یک جایگاه LGA مشابه قرار دهند و آنها را در یک باس مشترک ادغام کرده است. این نوع اتصال پردازنده ها در یک باس مشترک برای dual core ها نسبت به یک quad core یکپارچه ، محدودیت و اشکالاتی را در ارتباط بین هسته ها ایجا می کند و آن ایجاد بار سنگین ترافیکی بر روی چیپ ست است. برای آنکه اطلاعات موجود در کش L۲ از پردازشگر dual core اول به کش L۲ پردازنده ی دوم برسد ، می بایست دائما بین چیپ ست رفت و آمد داشته باشد. این نوع عمل در یک نوع بارگذاری از سرور ها می تواند به شکل قابل توجی کارکرد سیستم را کاهش دهد ولی هنوز برای اکثر کاربران در اکثر عملیات ها ی چند مسیری ، برای سنجش به دلیل یک شمار نسبتا پایینی از حافظه ی عملیات های I/O ، نتیجه قابل قبول است. این وابستگی خود در راهی از مسیر اول و دوم در دوهسته ی اول استفاده می کند و مسیر سوم و چهارم از جفت هستته های دوم استفاده می کند که نیاز اشترک گذاشتن داده ها را بین کش های هر هسته کاهش می دهد. مسیری که در پیکر بندی MCM توسط اینتل تعیین شده است ، عملا یک وجه ی قدرتمند در طراحی پردازننده های اینتلی به حساب نمی آید بنابراین وجه ی خیلی قدرتمند و خلاقی نیست ولی راهکار بسیار کارامدی محسوب می شود که تمامی این اشکالات در نسل نه چندان نو ظهور Core i۷ طی یک فرآیند تولید پیچیده ،دقیقا همانند k۱۰ ها بر طرف شده و به عقیده ی بسیاری از کارشناسان اینتل از تجربه و حرکت AMD از k۱۰ ها به نفع محصول تازه ی خود Core i۷ استفاده کرده است.
● یک انقلاب در معماری یا یک حرکن تکاملی؟
اگرچه هسته ی k۱۰ ممکن است بسیار به هسته ی k۸ شباهت داشته باشد ولی انصافا تغییرات بسیار زیادی را در آن می توان دید. در جدول زیر شما می توانید لیستی از تغییرات اعمال شده را ببینید که ما به ترتیب و مختصرا در ادامه ی کار آنرا برای شما تشریح خواهیم کرد.
از یک نقطه نظر ساده می توان اینگونه عنوان کرد که هر پردازشگر ۴ فاز را در ساختار خود دارد:
۱) ورود کد های عملیاتی
۲) ورود عمل کننده آدرس
۳) انتقال عملوند به دورن رجیستری پردازشگر
۴) اجرای عملیات پردازش
در عمل ، داده ها می توانند برای انتقال به رجیستری های حافظه ی پردازشگر ، بعد از اینکه پردازشگر برخی محاسبات را روی آنها انجام داد ، ساده شوند.
● ورود دستورالعمل
یک پردازشگر k۸ به روش ورود دستورالعمل در هر کلاک پردازش از کش L۱ (دستورالعمل) در بلوک های ۱۶ بایتی با داخل بافر (حافظه میانجی پردازنده) عمل می کند. ورود دستورالعمل ها از بلوک ها ( تنها برای ارسال شدن به کانال های رمزگذار X۸۶) در داخل بافر انجام می شود.نسبت ورود ( که شامل ۱۶ بایت در کلاک می باشد) ارسال داده ی رمز گذاری شده را در هر کلاک ممکن می سازد: بسته هایی از دستورالعمل هایی با طول متوسط (کمتر از ۵ بایت) . البته در برخی از دستورالعمل ها ، اندازه ی متوسط هر دستورالعمل در زنجیره می تواند از ۵ بایت بلند تر شود. برای نمونه طول SSE۲ ( دستورالعمل های ساده با رجیستری – عملوند های رجیستری مانند MOVAPD XMM۰, XMM۱ ) روی هم ۴ بایت است. در حین انجام آدرس دهی غیر مستقیم همراه با استفاده از مبنا و رجیستری های حرکت ( مثلا MOVAPD XMM۰, [EAX+۱۶] ) ، طول کل دستورالعمل به ۶ تا ۸ بایت افزایش می یابد.
در حالت ۶۴ بیت ، هنگام استفاده از رجیستری های اضافی ، به کد دستورالعمل یک بایت پیشوند REX ی دیگر اضافه می شود. در این روش طول دستورالعمل های SSE۱ ( اگر دستورالعمل یک مبنای برداری باشد ( هر چهار تا ۳۲ بیت یک مبنای برداری است) یک بیت کوتاهتر است ) اما اسکالر ( با یک عملگر تکی) دستورالعمل های SSE۱ نیز می تواند یک طول ۶ تا ۹ بایتی در بسیاری شرایط داشته باشد. در این شرایط نسبت ورود ۱۶ بایت در هر کلاک برای حفظ سرعت کدگذاری ۳ تا در هر کلاک دستورالعمل های SSE در x۸۶ ناکافی است. به دلیل انکه k۸ دو بلوک FPU ی ۶۴ بیت دارد، برای اجرای عملیات SIMD در یک زمان مشابه مورد استفاده قرار می گیرند ، یک یک دستورالعمل برداری SSE در دو عملیات بزرگ که در دو چرخه درون بلوک های FPU ی ۶۴ bit ی اجرا می شوند ، کدگذاری می گردند. اگر طول دستورالعمل SSE در بین ۷ تا ۹ بایت باشد، نسبت ورود داده ها ۱۶بایت در کلاک می شود. حد اکثز سرعت کدگذاری این دستورالعمل ها ۵.۱ در هر چرخه است ، یعنی ۳ دستورالعمل در یک چرخه . نکته ای در اینجا قابل ذکر است این است که به فاکتور محدود کننده در معماری k۸ نسبت ورود داده نیست بلکه میزان پهنای بلوک های FPU است که فقط ۶۴ بیتی هستند.
در تصویر می توانید یک نمونه از پیکربندی پنج فرمان را در یک بلوک ۳۲ بایتی ببینید که می تواند برای یک کلاک انتخاب شود. اگر صف این دستورالعمل های بلند چندین بلوک ۱۶ بایتی را را اشغال کند ، در زمان ورود دستورالعمل بلوک های ۱۶ بایتی ممکن است نسبت ۳ دستورالعمل در هر کلاک را خراب کند. معماری k۱۰ این نسبت ورود را به عنوان یک ضرورت دارد . از این نظر ورود بلوک ۳۲ بایتی که در معماری نو آورانه ی k۱۰ قرار داده شده ، به نظر می رسد که چیز بیشتری را نسبت دهی کند. در اصل بلوک ۳۲ بایتی ورود و انتخاب دستورات ۸ بایتی را از کش ممکن می سازد ، چرا که پهنای FPU در فنوم، ۱۲۸ بیت است و همین عامل موجب انجام عملیات های پایه ی برداری SSE در یک چرخه می شود که درست به مانند پردازنده ی Core۲duo است. این دلیلی برای افزایش نسبت ورود به ۲ است. ورود دستورالعمل اصولا از میان کش L۱ بیرون می رود بنابراین پهنای باس بیت کش L۱ و هسته باید از ۲x۶۴ بیت به ۲x۱۲۸ بیت افزایش داده می شد. یک ریز معماری این عملیات را انجام داده و توانسته تا ۴ عملیات ۸ بایتی را در هر چرخه رمز گذاری کند اما فاکتور محدود کننده دیگر ، تعداد رمز گذار ها و بلوک های FPU است که فقط ۳ تا از این بلوک ها موجود است اما ورودی ۳۲ بایتی می تواند سرعت اجرای دستورالعملی مختلط فرمانهای سوار بر نقاط شناور عملیات ها را افزایش دهد.پردازشگر های CORE۲ اینتل دستورالعمل ها را در بلوک های (شبیه به K۸) می گیرند و می توانند ۴ دستورالعمل را در کلاک فقط وقتی که طول دستورالعمل ها بیش از ۴ بایت نیست کد گذاری کنند. از طرفی کدگذار فقط می تواند ۳ دستورالعمل را در هر کلاک پردازش کند. مهندسان اینتلی از کمی حیله با همین تراکم استفاده کرده اند که نسبتا مشکل را حل کرده است. در هنگام ایجاد یک گره ی اجرایی ، دستورالعمل های بلندSSE درون یک پیش بافر مخصوص داخلی موقتا ذخیره میشوند (با بلندب ۶۴ بایت) که نهایتا با ۴بلوک با دستورالعملهای ۱۶ بایتی تقسیم شده و فرستاده می شوند که ورود دستورالعمل های کدگذار را در یک نسبت ۳۲ بایتی در هر کلاک میسر می کند. اگر گره در این چهار گروه نتواند جور شود ، قادر نخواهد بود به داخل بافر آورده شود و اجرا صد در صد محدود خواهد شد. هر چند ممکن است این سوال مطرح شود که چند درصد از این شرایط در K۱۰ قابل اجراست اما باید متذکر شویم که در K۱۰ مشکلی از این نوع وجود ندارد..
پردازشگر های مدرن X۸۶ می توانند به صورت یک پردازشگر در کنار یک پردازشگر دیگر در نظر گرفته شوند. قبل از اجرای یک مرحله ، یک مرحله کدگذاری دستورالعمل های X۸۶ صورت می گیرد و در آن دستورالعمل های استاندارد به عملیات هایی ریز تقسیم می شوند. برخی عملیات ها نیز در یک روش ******** اسکالر ، درون واحد های موازی ALU برای عملیات های کامل و FPU برای اعداد حقیقی انجام می شوند. K۸وk۱۰ و Core۲ همه سه واحد هر یک برای حساب ALU ی صحیح و سه تا برای شکستن نقاط یا ممیز های شناور (FPU= واحد نقاط شناور) دارند و نیز واحد های اضافه ای مانند ۳تا AGU در پردازشگر های AMD، واحد های تولید آدرس برای استفاده در بخش آدرس دهی یا جهت محاسبه ی آدرس های حافظه وجود دارد. از ابتدای دهه ی نود ، ایده ی X۸۶ CISC ( محاسبه ی مجموعه ی دستورالعمل ها ) شروع به شکستن و کاهش و شبیه سازی فعال در RSIC ی ( محاسبه ی دستورالعمل های کاهش یافته ) ساده تر و موثر تر از مایکرو شد ؛ یعنی کد های مایکرو اجرا شدند. اولین پنتیوم ها پردازنده های مطلوبی بودند و از این یکپارچه گی بر خوردار بودند. پردازنده های AMD K۵ نیز در همان بازه ی زمانی یک پردازشگر x۸۶ ب مبنای معماری AMD ۲۹۰۰۰ RISC بود اما دارای امکانات فوق العاده ای در قالب یک کدگذارx۸۶ کار می کرد. این امر اجرای دستور العمل را تند تر و موثر تر می کرد. مثلا معماری کلاسیک RSIC دانش اجرای عملیات های ضرب و تقسیم را نداشت چه برسد به جذر و درجه ها. اما در k۵ یک قسمت جداگانه برای هر یک از این عملیات ها قرار دادده شده بود که از روش های ساده ای برای محاسبه ی انواع پیچیده ای توسط به کاربردن ابزار های الگوریتم استفاده می کرد. از طرفی یک نمونه پردازشگر x۸۶ دارای دستورالعمل های پیچیده ی بسیاری است و زمان زیادی را در اجرا بر روی پردازنده های ۴۸۶ و ضعیفتر می گرفت. در بسیاری از جنبه ها ماشین های برنامه نویسی RISC اگر در یک اسمبل کننده ی زبان اعمال شوند ، بسیار پیچیده تر خواهند بود اما برنامه هایی از این قبیل می توانند تند تر از آنهایی که دستورالعمل های پیچیده ای برای عملیات های ریاضی بالاتر دارند ، کار کنند.
التیام گرمای پردازندههای فضایی AMD با نیتروژن مایع
دو پردازنده Phenom II X۴ و ۴۲ Black Edition TWKR را که پشت به پشت یکدیگر در تصویر مشاهده میکنید، احتمالا در دنیای واقعی دستتان به آنها نخواهد رسید زیرا از چیپستهای نایاب AMD هستند.
http://pnu-club.com/imported/2010/04/1269.jpg
دو پردازنده Phenom II X۴ و ۴۲ Black Edition TWKR را که پشت به پشت یکدیگر در تصویر مشاهده میکنید، احتمالا در دنیای واقعی دستتان به آنها نخواهد رسید زیرا از چیپستهای نایاب AMD هستند.
اگر از اورکلاکرهای حرفهای باشید به خوبی میدانید که پردازندههای نسخه TWKR شرکت AMD از بهترین و کمیابترین پردازندههای حال حاضر دنیا به شمار میروند و بسیاری از اینکارهها در آرزوی وصالش در حال سوختن هستند.
از هفتهها پیش که تصاویر اولیه این شاهزادهها منتشر شد چشمان زیادی در پی دیدار آنها از نزدیک بودند. به راستی چه قدرت فوقالعادهای در این چیپها نهفته است؟ چه چیزی این پردازندهها را ویژه ساخته است؟ اگر عجله نکنید به برخی از ویژگیهای این پردازندهها پی خواهید برد.
بنا به اعلام AMD به طور تقریبی ۱۰۰ عدد از پردازندههای TWKR در کل دنیا موجود است. البته این پردازندهها نیز فقط در اختیار انجمنهای فوقحرفهای و معتبر اورکلاک در دنیا قرار میگیرند تا بتوانند با ثبت رکوردهای جدید سرعت مرزها و محدودیتها را در نوردند.
نکتهای که این پردازندهها را خاص کرده قابلیت تغییر و نفوذپذیری بالای آنهاست. این قابلیت در این متن به معنای قابلیت تغییر و نفوذ بالاتر این پردازندهها نسبت به پردازندههای Phenum II معمولی است. در نتیجه دمای آنها نیز بالاتر خواهد رفت و باعث بالا رفتن قابلیت اورکلاک این پردازندهها خواهد شد.
ولتاژ این پردازندهها را میتوان با استفاده از روشهای پیچیده خنکسازی تا میزان زیادی بالا برد.
زمانی که با دقت بیشتری به این پردازندهها نگاه کنیم نوشته Not for Sale (برای فروش نیست) را مشاهده میکنیم.
روی آنها هیچ شماره سریال یا شناسه دیگری وجود ندارد. دلیل این امر هم این است که پردازندههای مذکور برای دوره کنونی ساخته و عرضه شدهاند و به دلیل بالا رفتن بیش از حد دما و در نتیجه کاهش عمر آنها شامل ضمانتهای رسمی AMD نمیشوند.
● این پردازندهها فروشی نیستند
این پردازندهها قابل خرید نیستند و به تشخیص مسوولان و دستاندرکاران AMD در اختیار جوامع منتخب اورکلاک برای شکستن رکورد سرعت پردازنده و آزمایشهای جدید قرار میگیرند.
البته این پردازندهها به دلیل پایداری کم فقط برای اورکلاکرهای حرفهای مناسب هستند. این در حالی است که محصول فوقالعاده Phenom II X۴ ۹۵۵ Black Edition در دسترس آنها قرار دارد و دمای پردازش آن توسط AMD از حد تعیین شده بالاتر نمیرود و پایداری بیشتری نیز دارد. البته یک اورکلاکر حرفهای اهمیتی به دمای بالا و پایداری کم پردازنده نمیدهد و تنها به فکر بالا بردن سرعت، قدرت پردازش و شکستن رکوردهاست.
برای اورکلاک کردن پردازندهها تا سرحد ممکن بایستی به جای فن خنککننده از دیگچه (محفظههای مخصوص) مایعات زیر صفر درجه روی پردازنده استفاده کرد. این دیگچهها نه تنها از آلیاژهای مخصوصی برای انتقال سریع دمای بالای پردازنده ساخته شدهاند، بلکه به روشی مهندسی و با طراحی خاصی ساخته میشوند تا بتوانند بیشترین میزان انتقال گرما و خنککنندگی را فراهم کنند.
برای خنکسازی این نوع خاص از پردازندهها از دیگچههای بزرگتری استفاده شده است تا ظرفیت بیشتری برای مایعاتی مانند نیتروژن مایع داشته باشد و در هنگام اورکلاک دمای پردازنده تا آنجایی که ممکن است خنک بماند.
در گذشته بیشتر پردازندهها هنگام فعالیت در دمایی پایینتر از دمای مطمئنه دچار مشکل میشدند که این مسئله به دلیل وجود اختلالی موسوم به Cold Bug بود. این Cold Bugهای بدجنس! میتوانستند به راحتی از راههای مختلف سبب ناپایداری عملکرد و حتی قفل شدن پردازنده شوند. خوشبختانه در پردازنده نسل Phenom II خبری از این جانورها نیست! این پردازندهها در دمای پایین کارکرد مناسبی دارند و پایداری آنها در اورکلاک و هنگام استفاده از هلیم مایع به عنوان خنککننده (که ۷۰ درجه خنکتر از نیتروژن مایع است) ستودنی است.
از آنجایی که پردازندههای Phenom II مشکل Cold Bug را ندارند میتوان از آنها برای دورههای زمانی طولانی در دمای خیلی پایین استفاده کرد.
باید توجه داشت برای حفظ جان پردازنده و قطعات سیستم اورکلاک شده، عایق کاری اطراف پردازنده و سطح مادربرد یک ضرورت غیرقابل چشمپوشی است. فعالیت سیستم در دمای زیر صفر درجه باعث ایجاد مایع اطراف مخزن خنککننده و در نتیجه ایجاد یخزدگی میشود.
برای حفاظت قطعات از چنین مشکلی، منطقه نسبتا وسیعی در اطراف پردازنده به وسیله یک نوع مایع لاکی مخصوص پوشیده میشود.
برای یک اورکلاک در سطح حرفهای، به همراه خنککننده نیتروژن مایع، استفاده از قطعات و تجهیزات مناسب و کارآمد از اهمیت ویژهای برخوردار است. در تستی که گزارش آن در ادامه میآید از بهترین قطعات و تجهیزات ممکن و با دقت بالایی استفاده شده که لیست این قطعات به شرح زیر است:
▪ پردازنده: AMD Phenom II X۴ ۴۲ Black Edition TWKR
▪ سیستم خنککننده پردازنده: Venom and Dragon F۱ EE
▪ مادربرد: Gigabyte MA۷۹۰FXT-UD۵P
▪ حافظه: دو ماژول ۱ گیگابایتی Crucial Ballistix PC-۱۸۰۰۰ DDR۳
▪ منبع تغذیه: یک منبع تغذیه ۱۲۰۰ واتی Silverstone Decathlon
▪ کارت گرافیک: ترکیب دو کارت گرافیک Sapphire Radeon HD ۴۸۹۰
▪ هارددیسک: هارددیسک مدل Raptor از وسترن دیجیتال با سرعت دوران ۱۰هزار دور در دقیقه
▪ و سیستم خنککننده کارت گرافیک: Danger Den Maze ۴ GPU and ۲۴۰mm Black Ice Xtreme
در هنگام شروع اورکلاک ابتدا باید نیتروژن مایع را داخل دیگچه خنککننده ریخت. هنگام این کار نیتروژن مایع به سرعت شروع به بخار شدن میکند و دمای دیگچه و اطراف آن را تا ۱۸۰ درجه سانتیگراد زیر صفر پایین میآورد. دیگچه مخصوص حاضر در این آزمایش میتواند تا ظرفیت ۲ لیتر نیتروژن مایع را در خود جای دهد و از آنجایی که نیتروژن مایع به سرعت بخار میشود میزان مصرف آن رابطه مستقیمی با ولتاژ اعمالی به پردازنده و در نتیجه حرارت ایجاد شده دارد.
اکنون این سوال پیش میآید که چرا زمانی که ما در این پردازندهها محدودیتهای وجود مشکل Ice Bug و مشکل کاهش حرارت را نداریم از هلیم مایع که بسیار خنکتر است استفاده نمیکنیم؟ اولین دلیل، قیمت بالای هلیم مایع است که قیمتی بیش از ۵ برابر نیتروژن مایع دارد. دلیل دیگر تبخیر بسیار سریعتر هلیم مایع است به صورتی که ۱۶ لیتر هلیم مایع در هنگام انجام آزمایشها میتواند حدود ۱ ساعت نیاز خنککنندگی را برطرف کند.
اکنون برگردیم به اورکلاک و ببینیم این پردازنده که این همه از آن تعریف کردیم تا چه حد میتواند سریعتر فعالیت کند؟
زمانی که ولتاژ ورودی این پردازنده را تا ۷۵/۱ ولت افزایش میدهیم، این پردازنده میتواند رکورد ۴/۶ گیگاهرتز را بشکند. اکنون سوال این است که آیا این پردازنده میتواند بیش از این رکورد را نیز به دست آورد؟! باید گفت با قابلیتهایی که این پردازنده از خود بروز داد این توانایی را دارد اما اگر بخواهید میتوانید این مسئله را آزمایش کنید! زیرا تیم اورکلاکر این پردازنده ولتاژ ورودی را از این فراتر نبردند چون به کاهش بیشتر عمر پردازنده کمعمر یا از بین بردن آن علاقه نداشتند.
شاید با خود فکر کنید که آیا پردازنده قابل خرید و در دسترس Phenom II X۴ ۹۵۵ Black Edition نیز قابلیت رسیدن به این سرعت یا فراتر از آن را دارد؟ در کمال تعجب باید گفت که بله! شانس اورکلاک هر دو پردازنده برابر است اما چیزی که پردازندههای نسخه TWKR را برای اورکلاکرها خاص میکند این نکته است که پردازندههای مذکور تمامی مشخصات و قابلیتهای ممکن برای اورکلاک بهتر را دارند.
البته سرعت مطمئنه این پردازندهها نیز مانند پردازندههای مشابه موجود در بازار ۲ گیگاهرتز (۱۰ در ۲۰۰ مگاهرتز) است که این سرعت برای سیستمهای خنککننده معمولی پیشنهاد میشود. این افزایش چشمگیر سرعت به لطف استفاده از سیستمهای خنککننده حرفهایتر ممکن شده است.
http://pnu-club.com/imported/2010/04/1268.jpg
طی یک سال گذشته شرکت امریکایی amd که بعنوان دومین کارخانه ی بزرگ در بازار پردازنده ها به حساب آورده می شود ، معماری جدید خود را در قالب یک server solution Barcelona ارائه کرد. در واقع Barcelona جزو دسته ی Opteron ها محسوب می شود که توانایی های جدید ی را نسبت به مدل های قبلی در زمینه های مجازی سازی داراست و با multi-socket scaling خود ، توانایی های قابل توجهی را در بسیاری از نرم افزار های همسان ساز چند مسیره از خود بروز می دهد.
با توجه به جذابیت کامپیوتر های Desktop یا رومیزی ، معماری K۱۰ در راستای ایجاد یک بستر کاملا جدید و یکپارچه ، متشکل از یک پردازشکر PHENOM X۴ و مادربردی با چیپ ست AMD-ATI و یک پردازشگر گرافیکی ( یا بیشتر) آن هم از AMD-ATI ، تحت نام SPIDER ، به بازار عرضه شدند. نتیجه ی این مجموعه ، تشکیل یک ماشین قدرتمند در زمینه ی بازی و مالتی مدیا با تناسب ۱۰۰ درصد و تحت پوشش AMD بود. پردازنده ی این مجموعه خود یک محصول کاملا AMD ای است که تحت تاثیر معماری قبلی یعنی K۸ ، می باشد اما با تغییراتی عمده بخصوص در بهبود کارکرد در زمینه ی برنامه های چند مسیری یا multithread و i.e ( برنامه های i.e قادرند تا از چند هسته به طور همزمان و کامل استفاده کنند.).
بسیاری بر این باورند که با دو هسته در یک پردازنده بطور طبیعی ،دوبرابر شدن کارکرد حاصل خواهد شد. این نظر شبیه به استفاده از ۱۰ کارگر برای انجام کار یک کارگر است که موجب ۱۰ برابر شدن سرعت انجام کار می شود. در واقع این عمل شما را مجبور می سازد تا کار را در یک مسیر به شکل موازی بین آنه تقسیم کنید. البته قرار دادن محصولات در کنار هم نیز تا اندازه ای زمان بر است؛ از این رو پرش کارکرد هرگز نمی تواند خطی باشد. PHENOM و کلا خانواده ی K۱۰ اصولا برای اجابت کردن خواسته های رو به افزایش برنامه های multithread ، طراحی و مشهور شده اند.
● نوزاد جدید در شهر
معرفی یک ریز معماری جدید همواره یک رویداد جالب تلقی می شود. نسل پردازشگر های K۱۰ در نوع خود قابل احترام است (هرچند بر پایه ی معماری های قبلی است) ؛ اما افزایش حافظه ی کش و بالا رفتن سرعت باس، کاهش و بهبود فرایند ساخت و نحوهی آرایش اجزا ،مشابهتی با گذشته ندارد. تمام موفقیت این خانواده در گام اول به یکسان بودن پایه ی خود استوار بوده است. گذشت زمان ثابت کرده است که یک معماری خوب (با پتانسل خوب) می تواند موجب وسعت رقابتی بیشتر در بازار باشد و این خود جنبه ی تمایزی در بین تولیدات مشابه محسوب می شود. یک پردازنده ی پیشرفته قادر است تا در مقابل رقم بالای عملیات در یک چرخه (CYCLE) در یک کلاک نسبتا پایین بسیار سریع عمل کند. البته تولید پردازنده هایی با ترانزیستور های کم ، برای تولید در کمیت های زیاد مناسب تر به نظر می رسند ، اما کاملا واضح است که نسل فعلی پردازنده های K۸ به شکلی که در حال حاضر در حال اتفاق است ، بطور کامل توسط مشتقات K۱۰ در دسته بندی های متفاوت با کارایی های متفاوت و همچنین قیمت های متفاوت ، جایگزین خواهند شد. اگرچه هنوز پردازنده های فنوم نوظهور هستند ، ممکن است دارای ضعف ها و مشکلات زیادی باشند به همین دلیل است که تا قبل از ظهور پردازنده های PHENOM II ، تنوع پردازنده های سری K۱۰ بسیار محدود و کم بود اما در کل تولید چهار هسته های یکپارچه با تکنولوژی ۶۵NM ، لقمه ی بزرگی به نظر می رسید. فضای داخلی این پردازشگر ها ۲۸۶ میلی متر مربع است که این دو برابر بزرگتر از پردازشگر های CORE ۲ DUO و بیش از دو برابر اندازه ی یک ATHLONE X۲ (Brisbane) است.
که بعنوان دومین کارخانه ی بزرگ در بازار پردازنده ها به حساب آورده می شود ، معماری جدید خود را در قالب یک server solution Barcelona ارائه کرد. در واقع Barcelona جزو دسته ی Opteron ها محسوب می شود که توانایی های جدید ی را نسبت به مدل های قبلی در زمینه های مجازی سازی داراست و با multi-socket scaling خود ، توانایی های قابل توجهی را در بسیاری از نرم افزار های همسان ساز چند مسیره از خود بروز می دهد.
با توجه به جذابیت کامپیوتر های Desktop یا رومیزی ، معماری K۱۰ در راستای ایجاد یک بستر کاملا جدید و یکپارچه ، متشکل از یک پردازشکر PHENOM X۴ و مادربردی با چیپ ست AMD-ATI و یک پردازشگر گرافیکی ( یا بیشتر) آن هم از AMD-ATI ، تحت نام SPIDER ، به بازار عرضه شدند. نتیجه ی این مجموعه ، تشکیل یک ماشین قدرتمند در زمینه ی بازی و مالتی مدیا با تناسب ۱۰۰ درصد و تحت پوشش AMD بود. پردازنده ی این مجموعه خود یک محصول کاملا AMD ای است که تحت تاثیر معماری قبلی یعنی K۸ ، می باشد اما با تغییراتی عمده بخصوص در بهبود کارکرد در زمینه ی برنامه های چند مسیری یا multithread و i.e ( برنامه های i.e قادرند تا از چند هسته به طور همزمان و کامل استفاده کنند.).
بسیاری بر این باورند که با دو هسته در یک پردازنده بطور طبیعی ،دوبرابر شدن کارکرد حاصل خواهد شد. این نظر شبیه به استفاده از ۱۰ کارگر برای انجام کار یک کارگر است که موجب ۱۰ برابر شدن سرعت انجام کار می شود. در واقع این عمل شما را مجبور می سازد تا کار را در یک مسیر به شکل موازی بین آنه تقسیم کنید. البته قرار دادن محصولات در کنار هم نیز تا اندازه ای زمان بر است؛ از این رو پرش کارکرد هرگز نمی تواند خطی باشد. PHENOM و کلا خانواده ی K۱۰ اصولا برای اجابت کردن خواسته های رو به افزایش برنامه های multithread ، طراحی و مشهور شده اند.
● نوزاد جدید در شهر
معرفی یک ریز معماری جدید همواره یک رویداد جالب تلقی می شود. نسل پردازشگر های K۱۰ در نوع خود قابل احترام است (هرچند بر پایه ی معماری های قبلی است) ؛ اما افزایش حافظه ی کش و بالا رفتن سرعت باس، کاهش و بهبود فرایند ساخت و نحوهی آرایش اجزا ،مشابهتی با گذشته ندارد. تمام موفقیت این خانواده در گام اول به یکسان بودن پایه ی خود استوار بوده است. گذشت زمان ثابت کرده است که یک معماری خوب (با پتانسل خوب) می تواند موجب وسعت رقابتی بیشتر در بازار باشد و این خود جنبه ی تمایزی در بین تولیدات مشابه محسوب می شود. یک پردازنده ی پیشرفته قادر است تا در مقابل رقم بالای عملیات در یک چرخه (CYCLE) در یک کلاک نسبتا پایین بسیار سریع عمل کند. البته تولید پردازنده هایی با ترانزیستور های کم ، برای تولید در کمیت های زیاد مناسب تر به نظر می رسند ، اما کاملا واضح است که نسل فعلی پردازنده های K۸ به شکلی که در حال حاضر در حال اتفاق است ، بطور کامل توسط مشتقات K۱۰ در دسته بندی های متفاوت با کارایی های متفاوت و همچنین قیمت های متفاوت ، جایگزین خواهند شد. اگرچه هنوز پردازنده های فنوم نوظهور هستند ، ممکن است دارای ضعف ها و مشکلات زیادی باشند به همین دلیل است که تا قبل از ظهور پردازنده های PHENOM II ، تنوع پردازنده های سری K۱۰ بسیار محدود و کم بود اما در کل تولید چهار هسته های یکپارچه با تکنولوژی ۶۵NM ، لقمه ی بزرگی به نظر می رسید. فضای داخلی این پردازشگر ها ۲۸۶ میلی متر مربع است که این دو برابر بزرگتر از پردازشگر های CORE ۲ DUO و بیش از دو برابر اندازه ی یک ATHLONE X۲ (Brisbane) است.
ذکر یک نکته در اینجا شاید بد نباشد : اکثر کمپانی های بزرگ همواره با ساختن یک تراشه یا هسته یا انجین قدرتمند با قابلیت های زیاد ، تنوع محصول را از همان یک اثر ایجاد می کنند. برای مثال AMD در بسیاری موارد با خاموش کردن یک یا دو یا سه هسته از مجموع ۴ هسته و ایجاد تغییراتی در فرکانس و کش ، در حال حاضر تنوع محصول فراوانی را ایجاد کرده است. البته میزان بازدهی و تنوع به درجه ی کمال فناوری مجموعه بستگی دارد. البته بر خلاف پردازنده های CORE ۲ QUAD اینتل ، ای ام دی در یک هسته ی یکپارچه سری k۱۰ را عرضه کرده است. از طرف دیگر اینتل از MCM( شاخص چیپ چند گانه MULTY chip module ) استفاده می کند که به آنها اجازه می دهد تا دو پردازنده ی دو هسته ای را در یک جایگاه LGA مشابه قرار دهند و آنها را در یک باس مشترک ادغام کرده است. این نوع اتصال پردازنده ها در یک باس مشترک برای dual core ها نسبت به یک quad core یکپارچه ، محدودیت و اشکالاتی را در ارتباط بین هسته ها ایجا می کند و آن ایجاد بار سنگین ترافیکی بر روی چیپ ست است. برای آنکه اطلاعات موجود در کش L۲ از پردازشگر dual core اول به کش L۲ پردازنده ی دوم برسد ، می بایست دائما بین چیپ ست رفت و آمد داشته باشد. این نوع عمل در یک نوع بارگذاری از سرور ها می تواند به شکل قابل توجی کارکرد سیستم را کاهش دهد ولی هنوز برای اکثر کاربران در اکثر عملیات ها ی چند مسیری ، برای سنجش به دلیل یک شمار نسبتا پایینی از حافظه ی عملیات های I/O ، نتیجه قابل قبول است. این وابستگی خود در راهی از مسیر اول و دوم در دوهسته ی اول استفاده می کند و مسیر سوم و چهارم از جفت هستته های دوم استفاده می کند که نیاز اشترک گذاشتن داده ها را بین کش های هر هسته کاهش می دهد. مسیری که در پیکر بندی MCM توسط اینتل تعیین شده است ، عملا یک وجه ی قدرتمند در طراحی پردازننده های اینتلی به حساب نمی آید بنابراین وجه ی خیلی قدرتمند و خلاقی نیست ولی راهکار بسیار کارامدی محسوب می شود که تمامی این اشکالات در نسل نه چندان نو ظهور Core i۷ طی یک فرآیند تولید پیچیده ،دقیقا همانند k۱۰ ها بر طرف شده و به عقیده ی بسیاری از کارشناسان اینتل از تجربه و حرکت AMD از k۱۰ ها به نفع محصول تازه ی خود Core i۷ استفاده کرده است.
● یک انقلاب در معماری یا یک حرکن تکاملی؟
اگرچه هسته ی k۱۰ ممکن است بسیار به هسته ی k۸ شباهت داشته باشد ولی انصافا تغییرات بسیار زیادی را در آن می توان دید. در جدول زیر شما می توانید لیستی از تغییرات اعمال شده را ببینید که ما به ترتیب و مختصرا در ادامه ی کار آنرا برای شما تشریح خواهیم کرد.
از یک نقطه نظر ساده می توان اینگونه عنوان کرد که هر پردازشگر ۴ فاز را در ساختار خود دارد:
۱) ورود کد های عملیاتی
۲) ورود عمل کننده آدرس
۳) انتقال عملوند به دورن رجیستری پردازشگر
۴) اجرای عملیات پردازش
در عمل ، داده ها می توانند برای انتقال به رجیستری های حافظه ی پردازشگر ، بعد از اینکه پردازشگر برخی محاسبات را روی آنها انجام داد ، ساده شوند.
● ورود دستورالعمل
یک پردازشگر k۸ به روش ورود دستورالعمل در هر کلاک پردازش از کش L۱ (دستورالعمل) در بلوک های ۱۶ بایتی با داخل بافر (حافظه میانجی پردازنده) عمل می کند. ورود دستورالعمل ها از بلوک ها ( تنها برای ارسال شدن به کانال های رمزگذار X۸۶) در داخل بافر انجام می شود.نسبت ورود ( که شامل ۱۶ بایت در کلاک می باشد) ارسال داده ی رمز گذاری شده را در هر کلاک ممکن می سازد: بسته هایی از دستورالعمل هایی با طول متوسط (کمتر از ۵ بایت) . البته در برخی از دستورالعمل ها ، اندازه ی متوسط هر دستورالعمل در زنجیره می تواند از ۵ بایت بلند تر شود. برای نمونه طول SSE۲ ( دستورالعمل های ساده با رجیستری – عملوند های رجیستری مانند MOVAPD XMM۰, XMM۱ ) روی هم ۴ بایت است. در حین انجام آدرس دهی غیر مستقیم همراه با استفاده از مبنا و رجیستری های حرکت ( مثلا MOVAPD XMM۰, [EAX+۱۶] ) ، طول کل دستورالعمل به ۶ تا ۸ بایت افزایش می یابد.
در حالت ۶۴ بیت ، هنگام استفاده از رجیستری های اضافی ، به کد دستورالعمل یک بایت پیشوند REX ی دیگر اضافه می شود. در این روش طول دستورالعمل های SSE۱ ( اگر دستورالعمل یک مبنای برداری باشد ( هر چهار تا ۳۲ بیت یک مبنای برداری است) یک بیت کوتاهتر است ) اما اسکالر ( با یک عملگر تکی) دستورالعمل های SSE۱ نیز می تواند یک طول ۶ تا ۹ بایتی در بسیاری شرایط داشته باشد. در این شرایط نسبت ورود ۱۶ بایت در هر کلاک برای حفظ سرعت کدگذاری ۳ تا در هر کلاک دستورالعمل های SSE در x۸۶ ناکافی است. به دلیل انکه k۸ دو بلوک FPU ی ۶۴ بیت دارد، برای اجرای عملیات SIMD در یک زمان مشابه مورد استفاده قرار می گیرند ، یک یک دستورالعمل برداری SSE در دو عملیات بزرگ که در دو چرخه درون بلوک های FPU ی ۶۴ bit ی اجرا می شوند ، کدگذاری می گردند. اگر طول دستورالعمل SSE در بین ۷ تا ۹ بایت باشد، نسبت ورود داده ها ۱۶بایت در کلاک می شود. حد اکثز سرعت کدگذاری این دستورالعمل ها ۵.۱ در هر چرخه است ، یعنی ۳ دستورالعمل در یک چرخه . نکته ای در اینجا قابل ذکر است این است که به فاکتور محدود کننده در معماری k۸ نسبت ورود داده نیست بلکه میزان پهنای بلوک های FPU است که فقط ۶۴ بیتی هستند.
در تصویر می توانید یک نمونه از پیکربندی پنج فرمان را در یک بلوک ۳۲ بایتی ببینید که می تواند برای یک کلاک انتخاب شود. اگر صف این دستورالعمل های بلند چندین بلوک ۱۶ بایتی را را اشغال کند ، در زمان ورود دستورالعمل بلوک های ۱۶ بایتی ممکن است نسبت ۳ دستورالعمل در هر کلاک را خراب کند. معماری k۱۰ این نسبت ورود را به عنوان یک ضرورت دارد . از این نظر ورود بلوک ۳۲ بایتی که در معماری نو آورانه ی k۱۰ قرار داده شده ، به نظر می رسد که چیز بیشتری را نسبت دهی کند. در اصل بلوک ۳۲ بایتی ورود و انتخاب دستورات ۸ بایتی را از کش ممکن می سازد ، چرا که پهنای FPU در فنوم، ۱۲۸ بیت است و همین عامل موجب انجام عملیات های پایه ی برداری SSE در یک چرخه می شود که درست به مانند پردازنده ی Core۲duo است. این دلیلی برای افزایش نسبت ورود به ۲ است. ورود دستورالعمل اصولا از میان کش L۱ بیرون می رود بنابراین پهنای باس بیت کش L۱ و هسته باید از ۲x۶۴ بیت به ۲x۱۲۸ بیت افزایش داده می شد. یک ریز معماری این عملیات را انجام داده و توانسته تا ۴ عملیات ۸ بایتی را در هر چرخه رمز گذاری کند اما فاکتور محدود کننده دیگر ، تعداد رمز گذار ها و بلوک های FPU است که فقط ۳ تا از این بلوک ها موجود است اما ورودی ۳۲ بایتی می تواند سرعت اجرای دستورالعملی مختلط فرمانهای سوار بر نقاط شناور عملیات ها را افزایش دهد.پردازشگر های CORE۲ اینتل دستورالعمل ها را در بلوک های (شبیه به K۸) می گیرند و می توانند ۴ دستورالعمل را در کلاک فقط وقتی که طول دستورالعمل ها بیش از ۴ بایت نیست کد گذاری کنند. از طرفی کدگذار فقط می تواند ۳ دستورالعمل را در هر کلاک پردازش کند. مهندسان اینتلی از کمی حیله با همین تراکم استفاده کرده اند که نسبتا مشکل را حل کرده است. در هنگام ایجاد یک گره ی اجرایی ، دستورالعمل های بلندSSE درون یک پیش بافر مخصوص داخلی موقتا ذخیره میشوند (با بلندب ۶۴ بایت) که نهایتا با ۴بلوک با دستورالعملهای ۱۶ بایتی تقسیم شده و فرستاده می شوند که ورود دستورالعمل های کدگذار را در یک نسبت ۳۲ بایتی در هر کلاک میسر می کند. اگر گره در این چهار گروه نتواند جور شود ، قادر نخواهد بود به داخل بافر آورده شود و اجرا صد در صد محدود خواهد شد. هر چند ممکن است این سوال مطرح شود که چند درصد از این شرایط در K۱۰ قابل اجراست اما باید متذکر شویم که در K۱۰ مشکلی از این نوع وجود ندارد..
پردازشگر های مدرن X۸۶ می توانند به صورت یک پردازشگر در کنار یک پردازشگر دیگر در نظر گرفته شوند. قبل از اجرای یک مرحله ، یک مرحله کدگذاری دستورالعمل های X۸۶ صورت می گیرد و در آن دستورالعمل های استاندارد به عملیات هایی ریز تقسیم می شوند. برخی عملیات ها نیز در یک روش ******** اسکالر ، درون واحد های موازی ALU برای عملیات های کامل و FPU برای اعداد حقیقی انجام می شوند. K۸وk۱۰ و Core۲ همه سه واحد هر یک برای حساب ALU ی صحیح و سه تا برای شکستن نقاط یا ممیز های شناور (FPU= واحد نقاط شناور) دارند و نیز واحد های اضافه ای مانند ۳تا AGU در پردازشگر های AMD، واحد های تولید آدرس برای استفاده در بخش آدرس دهی یا جهت محاسبه ی آدرس های حافظه وجود دارد. از ابتدای دهه ی نود ، ایده ی X۸۶ CISC ( محاسبه ی مجموعه ی دستورالعمل ها ) شروع به شکستن و کاهش و شبیه سازی فعال در RSIC ی ( محاسبه ی دستورالعمل های کاهش یافته ) ساده تر و موثر تر از مایکرو شد ؛ یعنی کد های مایکرو اجرا شدند. اولین پنتیوم ها پردازنده های مطلوبی بودند و از این یکپارچه گی بر خوردار بودند. پردازنده های AMD K۵ نیز در همان بازه ی زمانی یک پردازشگر x۸۶ ب مبنای معماری AMD ۲۹۰۰۰ RISC بود اما دارای امکانات فوق العاده ای در قالب یک کدگذارx۸۶ کار می کرد. این امر اجرای دستور العمل را تند تر و موثر تر می کرد. مثلا معماری کلاسیک RSIC دانش اجرای عملیات های ضرب و تقسیم را نداشت چه برسد به جذر و درجه ها. اما در k۵ یک قسمت جداگانه برای هر یک از این عملیات ها قرار دادده شده بود که از روش های ساده ای برای محاسبه ی انواع پیچیده ای توسط به کاربردن ابزار های الگوریتم استفاده می کرد. از طرفی یک نمونه پردازشگر x۸۶ دارای دستورالعمل های پیچیده ی بسیاری است و زمان زیادی را در اجرا بر روی پردازنده های ۴۸۶ و ضعیفتر می گرفت. در بسیاری از جنبه ها ماشین های برنامه نویسی RISC اگر در یک اسمبل کننده ی زبان اعمال شوند ، بسیار پیچیده تر خواهند بود اما برنامه هایی از این قبیل می توانند تند تر از آنهایی که دستورالعمل های پیچیده ای برای عملیات های ریاضی بالاتر دارند ، کار کنند.
التیام گرمای پردازندههای فضایی AMD با نیتروژن مایع
دو پردازنده Phenom II X۴ و ۴۲ Black Edition TWKR را که پشت به پشت یکدیگر در تصویر مشاهده میکنید، احتمالا در دنیای واقعی دستتان به آنها نخواهد رسید زیرا از چیپستهای نایاب AMD هستند.
http://pnu-club.com/imported/2010/04/1269.jpg
دو پردازنده Phenom II X۴ و ۴۲ Black Edition TWKR را که پشت به پشت یکدیگر در تصویر مشاهده میکنید، احتمالا در دنیای واقعی دستتان به آنها نخواهد رسید زیرا از چیپستهای نایاب AMD هستند.
اگر از اورکلاکرهای حرفهای باشید به خوبی میدانید که پردازندههای نسخه TWKR شرکت AMD از بهترین و کمیابترین پردازندههای حال حاضر دنیا به شمار میروند و بسیاری از اینکارهها در آرزوی وصالش در حال سوختن هستند.
از هفتهها پیش که تصاویر اولیه این شاهزادهها منتشر شد چشمان زیادی در پی دیدار آنها از نزدیک بودند. به راستی چه قدرت فوقالعادهای در این چیپها نهفته است؟ چه چیزی این پردازندهها را ویژه ساخته است؟ اگر عجله نکنید به برخی از ویژگیهای این پردازندهها پی خواهید برد.
بنا به اعلام AMD به طور تقریبی ۱۰۰ عدد از پردازندههای TWKR در کل دنیا موجود است. البته این پردازندهها نیز فقط در اختیار انجمنهای فوقحرفهای و معتبر اورکلاک در دنیا قرار میگیرند تا بتوانند با ثبت رکوردهای جدید سرعت مرزها و محدودیتها را در نوردند.
نکتهای که این پردازندهها را خاص کرده قابلیت تغییر و نفوذپذیری بالای آنهاست. این قابلیت در این متن به معنای قابلیت تغییر و نفوذ بالاتر این پردازندهها نسبت به پردازندههای Phenum II معمولی است. در نتیجه دمای آنها نیز بالاتر خواهد رفت و باعث بالا رفتن قابلیت اورکلاک این پردازندهها خواهد شد.
ولتاژ این پردازندهها را میتوان با استفاده از روشهای پیچیده خنکسازی تا میزان زیادی بالا برد.
زمانی که با دقت بیشتری به این پردازندهها نگاه کنیم نوشته Not for Sale (برای فروش نیست) را مشاهده میکنیم.
روی آنها هیچ شماره سریال یا شناسه دیگری وجود ندارد. دلیل این امر هم این است که پردازندههای مذکور برای دوره کنونی ساخته و عرضه شدهاند و به دلیل بالا رفتن بیش از حد دما و در نتیجه کاهش عمر آنها شامل ضمانتهای رسمی AMD نمیشوند.
● این پردازندهها فروشی نیستند
این پردازندهها قابل خرید نیستند و به تشخیص مسوولان و دستاندرکاران AMD در اختیار جوامع منتخب اورکلاک برای شکستن رکورد سرعت پردازنده و آزمایشهای جدید قرار میگیرند.
البته این پردازندهها به دلیل پایداری کم فقط برای اورکلاکرهای حرفهای مناسب هستند. این در حالی است که محصول فوقالعاده Phenom II X۴ ۹۵۵ Black Edition در دسترس آنها قرار دارد و دمای پردازش آن توسط AMD از حد تعیین شده بالاتر نمیرود و پایداری بیشتری نیز دارد. البته یک اورکلاکر حرفهای اهمیتی به دمای بالا و پایداری کم پردازنده نمیدهد و تنها به فکر بالا بردن سرعت، قدرت پردازش و شکستن رکوردهاست.
برای اورکلاک کردن پردازندهها تا سرحد ممکن بایستی به جای فن خنککننده از دیگچه (محفظههای مخصوص) مایعات زیر صفر درجه روی پردازنده استفاده کرد. این دیگچهها نه تنها از آلیاژهای مخصوصی برای انتقال سریع دمای بالای پردازنده ساخته شدهاند، بلکه به روشی مهندسی و با طراحی خاصی ساخته میشوند تا بتوانند بیشترین میزان انتقال گرما و خنککنندگی را فراهم کنند.
برای خنکسازی این نوع خاص از پردازندهها از دیگچههای بزرگتری استفاده شده است تا ظرفیت بیشتری برای مایعاتی مانند نیتروژن مایع داشته باشد و در هنگام اورکلاک دمای پردازنده تا آنجایی که ممکن است خنک بماند.
در گذشته بیشتر پردازندهها هنگام فعالیت در دمایی پایینتر از دمای مطمئنه دچار مشکل میشدند که این مسئله به دلیل وجود اختلالی موسوم به Cold Bug بود. این Cold Bugهای بدجنس! میتوانستند به راحتی از راههای مختلف سبب ناپایداری عملکرد و حتی قفل شدن پردازنده شوند. خوشبختانه در پردازنده نسل Phenom II خبری از این جانورها نیست! این پردازندهها در دمای پایین کارکرد مناسبی دارند و پایداری آنها در اورکلاک و هنگام استفاده از هلیم مایع به عنوان خنککننده (که ۷۰ درجه خنکتر از نیتروژن مایع است) ستودنی است.
از آنجایی که پردازندههای Phenom II مشکل Cold Bug را ندارند میتوان از آنها برای دورههای زمانی طولانی در دمای خیلی پایین استفاده کرد.
باید توجه داشت برای حفظ جان پردازنده و قطعات سیستم اورکلاک شده، عایق کاری اطراف پردازنده و سطح مادربرد یک ضرورت غیرقابل چشمپوشی است. فعالیت سیستم در دمای زیر صفر درجه باعث ایجاد مایع اطراف مخزن خنککننده و در نتیجه ایجاد یخزدگی میشود.
برای حفاظت قطعات از چنین مشکلی، منطقه نسبتا وسیعی در اطراف پردازنده به وسیله یک نوع مایع لاکی مخصوص پوشیده میشود.
برای یک اورکلاک در سطح حرفهای، به همراه خنککننده نیتروژن مایع، استفاده از قطعات و تجهیزات مناسب و کارآمد از اهمیت ویژهای برخوردار است. در تستی که گزارش آن در ادامه میآید از بهترین قطعات و تجهیزات ممکن و با دقت بالایی استفاده شده که لیست این قطعات به شرح زیر است:
▪ پردازنده: AMD Phenom II X۴ ۴۲ Black Edition TWKR
▪ سیستم خنککننده پردازنده: Venom and Dragon F۱ EE
▪ مادربرد: Gigabyte MA۷۹۰FXT-UD۵P
▪ حافظه: دو ماژول ۱ گیگابایتی Crucial Ballistix PC-۱۸۰۰۰ DDR۳
▪ منبع تغذیه: یک منبع تغذیه ۱۲۰۰ واتی Silverstone Decathlon
▪ کارت گرافیک: ترکیب دو کارت گرافیک Sapphire Radeon HD ۴۸۹۰
▪ هارددیسک: هارددیسک مدل Raptor از وسترن دیجیتال با سرعت دوران ۱۰هزار دور در دقیقه
▪ و سیستم خنککننده کارت گرافیک: Danger Den Maze ۴ GPU and ۲۴۰mm Black Ice Xtreme
در هنگام شروع اورکلاک ابتدا باید نیتروژن مایع را داخل دیگچه خنککننده ریخت. هنگام این کار نیتروژن مایع به سرعت شروع به بخار شدن میکند و دمای دیگچه و اطراف آن را تا ۱۸۰ درجه سانتیگراد زیر صفر پایین میآورد. دیگچه مخصوص حاضر در این آزمایش میتواند تا ظرفیت ۲ لیتر نیتروژن مایع را در خود جای دهد و از آنجایی که نیتروژن مایع به سرعت بخار میشود میزان مصرف آن رابطه مستقیمی با ولتاژ اعمالی به پردازنده و در نتیجه حرارت ایجاد شده دارد.
اکنون این سوال پیش میآید که چرا زمانی که ما در این پردازندهها محدودیتهای وجود مشکل Ice Bug و مشکل کاهش حرارت را نداریم از هلیم مایع که بسیار خنکتر است استفاده نمیکنیم؟ اولین دلیل، قیمت بالای هلیم مایع است که قیمتی بیش از ۵ برابر نیتروژن مایع دارد. دلیل دیگر تبخیر بسیار سریعتر هلیم مایع است به صورتی که ۱۶ لیتر هلیم مایع در هنگام انجام آزمایشها میتواند حدود ۱ ساعت نیاز خنککنندگی را برطرف کند.
اکنون برگردیم به اورکلاک و ببینیم این پردازنده که این همه از آن تعریف کردیم تا چه حد میتواند سریعتر فعالیت کند؟
زمانی که ولتاژ ورودی این پردازنده را تا ۷۵/۱ ولت افزایش میدهیم، این پردازنده میتواند رکورد ۴/۶ گیگاهرتز را بشکند. اکنون سوال این است که آیا این پردازنده میتواند بیش از این رکورد را نیز به دست آورد؟! باید گفت با قابلیتهایی که این پردازنده از خود بروز داد این توانایی را دارد اما اگر بخواهید میتوانید این مسئله را آزمایش کنید! زیرا تیم اورکلاکر این پردازنده ولتاژ ورودی را از این فراتر نبردند چون به کاهش بیشتر عمر پردازنده کمعمر یا از بین بردن آن علاقه نداشتند.
شاید با خود فکر کنید که آیا پردازنده قابل خرید و در دسترس Phenom II X۴ ۹۵۵ Black Edition نیز قابلیت رسیدن به این سرعت یا فراتر از آن را دارد؟ در کمال تعجب باید گفت که بله! شانس اورکلاک هر دو پردازنده برابر است اما چیزی که پردازندههای نسخه TWKR را برای اورکلاکرها خاص میکند این نکته است که پردازندههای مذکور تمامی مشخصات و قابلیتهای ممکن برای اورکلاک بهتر را دارند.
البته سرعت مطمئنه این پردازندهها نیز مانند پردازندههای مشابه موجود در بازار ۲ گیگاهرتز (۱۰ در ۲۰۰ مگاهرتز) است که این سرعت برای سیستمهای خنککننده معمولی پیشنهاد میشود. این افزایش چشمگیر سرعت به لطف استفاده از سیستمهای خنککننده حرفهایتر ممکن شده است.