چرا سرورهای HPE DL580 را نمی خرید؟!

 تاریخ انتشار :
/
  وبلاگ
چرا سرورهای HPE DL580 را نمی خرید؟!

یکی از عوامل تعیین کننده در تعیین قدرت محاسباتی یک سرور، تعداد سوکت های پردازنده قابل استفاده در آن است. هنگامی که دو سرور دارای CPUهای مشابه هستند، سرور با سوکت‌های CPU بیشتر می‌تواند قدرت پردازش بیشتری را ارائه کند، حجم کاری بزرگ‌تری را پشتیبانی کند و ماشین‌های مجازی بیشتری را میزبانی کند. به طور کلی با افزایش تعداد سوکت های پردازنده در سرور، ماژول های رم بیشتری در دسترس خواهند بود و از قطعات رایج کمتری (مانند مادربرد، هارد دیسک و غیره) استفاده می شود و می توان به کارایی بالاتری در پردازش در فضای کوچکتر دست یافت. به همین دلیل معمولا سرورها از نظر تعداد پردازنده های پشتیبانی شده در انواع مختلفی به بازار عرضه می شوند و انتخاب پلتفرم و تعداد پردازنده به عهده خریدار است. به عنوان مثال، HPE سرورهایی با یک، دو و چهار پردازنده می سازد. سرورهای DL325 G10 با یک سوکت پردازنده، سرورهای DL360 و DL380 با دو پردازنده، سرورهای DL560 و DL580 با چهار پردازنده از انواع مدل های قابل خرید در سرورهای نسل دهم HPE هستند. جالب است بدانید که در نسل هفتم سرورهای DL780 نیز با هشت پردازنده به فروش می رسید و به دلیل استقبال ضعیف از این نوع سرورها، تولید آنها در نسل های بعدی متوقف شد.

خریداران سرور در هنگام خرید انواع پلتفرم های پردازشی حق انتخاب زیادی دارند، اما بر اساس مطالعه ای که IDC در ایالات متحده و کانادا انجام داده است، بازار فروش سرور با استقبال یکسانی از سوی خریداران همه پلتفرم ها مواجه نشده است. از سرورهای 4 و 8 سوکت تنها 5.1 درصد از کل سرورهای فروخته شده در سال 2019 است، در این شرایط، میزان سرورهای با 2 سوکت پردازنده 81.8 درصد از کل فروش است. آمار بالا نشان می دهد که کاربران از سرورهای با تعداد سوکت استقبال نمی کنند، اما دلایل این عدم پذیرش چیست؟ چه مزایا و معایبی باعث می شود تا مراکز داده کمتری از سرورهای 4 سوکتی استفاده کنند؟

سرورهای HPE DL580

مزایای سرورهای دارای 4 سوکت پردازنده:

1. راندمان بالای نرم افزار SMP

در بسیاری از معماری‌های نرم‌افزاری، به‌ویژه معماری‌های یکپارچه، نمی‌توان فعالیت‌های نرم‌افزاری را به گونه‌ای تفکیک و تجزیه کرد که از قابلیت‌های چند سرور استفاده کرد و بنابراین در این نوع نرم‌افزارها ترجیح داده می‌شود منابع پردازشی سرور افزایش یابد. . بسیاری از نرم افزارهای ERP قدیمی، نرم افزارهای پردازش OLTP و برخی پایگاه های داده رابطه ای این نوع بار پردازشی را به سرور تحمیل می کنند و سرورهای 4 سوکتی یا خانواده سرورهای SuperDome انتخاب مناسبی برای این نوع پردازش هستند.

2. عدم نیاز به ارتباطات شبکه پیچیده

زمانی که بار پردازشی روی سرورها مقیاس‌بندی می‌شود، ارتباط بخش‌های مختلف نرم‌افزار باید به گونه‌ای متفاوت تضمین شود. شبکه های TCP/IP تا 100 گیگابیت بر ثانیه و شبکه های InfiniBand تا 40 گیگابیت بر ثانیه برای این نوع برنامه ها ایجاد شده اند. علاوه بر این، انواع فناوری‌های مورد استفاده در ارتباطات سرور به سرور با پهنای باند بالا و با تأخیر کم (مانند RDMA و RoCE) نیز تجاری شده و در دسترس کسب‌وکارها هستند.

با این حال، برقراری ارتباط شبکه علاوه بر هزینه های مربوط به کابل کشی، سوئیچینگ و مسیریابی، کارت های شبکه ویژه، ماژول های SFP ویژه و هزینه های عملیاتی بالا معمولاً منجر به افزایش پیچیدگی طراحی و نگهداری شبکه و همچنین افزایش می شود. در شرق و غرب موضوع دیگری است که باید در هنگام طراحی و خرید تجهیزات برای این نوع مرکز داده به آن توجه کرد. اگر حجم کاری نرم‌افزار را بتوان در یک سرور 4 سوکتی مدیریت کرد و نمی‌توان آن نیاز پردازش را در چندین سرور پخش کرد، یک راه‌حل صرفه‌جویی در هزینه ممکن است استفاده از سرورهای 4 سوکتی باشد. به این ترتیب ارتباطات شبکه با ارتباط بین ماژول های RAM در سرور جایگزین می شود و از اتصالات UPI/QPI بین چندین پردازنده استفاده می شود.

3. کاهش هزینه های اخذ مجوز

برای نرم افزارهایی که مدل مجوز آنها مبتنی بر گره، مبتنی بر نمونه یا مبتنی بر سرور است، هزینه دریافت مجوز معمولا کمتر است. در سرورهایی با قدرت پردازش بالا، در مقایسه با توزیع نرم‌افزار روی چندین سرور ضعیف‌تر، نیاز به تهیه مجوزهای کمتری است که باعث صرفه‌جویی در هزینه‌ها می‌شود. همچنین با کاهش تعداد سرورها، هزینه لایسنس BMC (مجوز چیپ مدیریت سرور از راه دور) و لایسنس Raid Controller نیز به همین نسبت کاهش می یابد.

4. تعداد کارت ها را افزایش دهید PCI-E قابل نصب (I/O یا نمودارها)

در سرورهای دارای 4 سوکت پردازنده معمولاً خطوط PCI-E بیشتری توسط پردازنده ها پشتیبانی می شود و امکان نصب کارت های توسعه بیشتری وجود دارد. این مورد در مواقعی بسیار کاربردی است که نیاز به نصب چند کارت گرافیک باشد یا تعداد زیادی کارت ورودی/خروجی مورد نیاز باشد. سرورهایی که اتصالات شبکه زیادی دارند، سرورهایی که به عنوان ذخیره سازی استفاده می شوند و سرورهایی که تعداد زیادی کارت گرافیک برای فرآیندهای یادگیری ماشین دارند، نمونه هایی از برنامه های کاربردی سرور با تعداد زیادی خطوط PCI-E هستند.

سرورهای HPE DL5805. هزینه های مشترک سرور و هزینه های انرژی را کاهش دهید

هنگامی که یک سرور 4 سوکتی به عنوان جایگزینی برای دو سرور 2 سوکتی آماده می شود، مقداری از سرباری که معمولاً برای هر سرور متحمل می شود باید کاهش یابد. به عنوان مثال، به جای دو کیت ریلی، می توان یکی تهیه کرد، تعداد مادربردها را به یک عدد کاهش داد، تعداد تراشه های BMC مانند ILO، IPMI، IDRAC را کاهش داد، تعداد تراشه های PCH (معادل عملکرد پل جنوبی در سرور) قدیمی) کاهش می یابد، تعداد PSU های مورد نیاز در سرور را می توان بنا به انتخاب کاربر از 4 به 2 کاهش داد و در نهایت درایوهای بوت کمتری مورد نیاز است. با کاهش تعداد قطعات و افزایش راندمان سرورها، مصرف برق آنها کاهش می یابد و میزان توان خنک کننده مورد نیاز نیز کاهش می یابد، بنابراین مصرف برق کلی کاهش یافته و PUE مرکز داده افزایش می یابد.

معایب سرورهای دارای 4 سوکت پردازنده:

1. ایجاد یک گلوگاه ارتباطی بین پردازنده ها

ارتباطات بین پردازنده‌ای که در نسل‌های جدید QPI یا UPI نامیده می‌شود، می‌تواند عملکرد سیستم را در نرم‌افزارهایی که نیاز به استفاده از تمام ظرفیت RAM سرور با تمام پهنای باند یا نیاز به استفاده از حافظه پنهان پردازنده‌های دیگر دارند، کند کند. . پهنای باند هر اتصال UPI بین نسل های پردازنده و سرور متفاوت است، اما عددی مانند 20 گیگابایت در ثانیه یا 10.4 GT/s را می توان متوسط ​​در نظر گرفت که می تواند در برخی از برنامه ها مشکلاتی ایجاد کند. ارتباطات داخلی پردازنده ها. کلاینت سرور همچنین می تواند با انتخاب پردازنده اشتباه، عملکرد سرور را بیشتر کاهش دهد. به عنوان مثال، پردازنده Platinum 8268 از 3 اتصال UPI پشتیبانی می کند، اما پردازنده Gold 5222 از 2 اتصال پشتیبانی می کند که می تواند مشکلات سیستم را تشدید کند.

چرا سرورهای HPE DL580 را نمی خرید؟!2. کندی سرور ناشی از عدم رعایت الزامات مربوط به NUMA

اگر سرور بدون استفاده از فناوری مجازی سازی استفاده شود، سیستم عامل از وضعیت سخت افزاری و شرایط Physical Proximity Domains سیستم آگاه است، به این معنی که سیستم عامل به درستی محدوده NUMA کل سرور را ترسیم می کند. در سرورهایی که فناوری مجازی سازی پیاده سازی می شود، در صورتی که مدیر سیستم از روش های بهینه تخصیص CPU و RAM به سرور آگاه نباشد، می تواند باعث کاهش عملکرد ماشین های مجازی شود به طوری که ماشین مجازی به اشتباه در قسمت های بیشتری قرار گیرد. یک عدد NUMA PPD و دسترسی به منابع سرور کند خواهد بود. در چنین شرایطی میزان تاخیر در دسترسی به منابع آماده به کار افزایش می یابد و ماشین مجازی باید از حافظه راه دور برای دسترسی به حافظه اصلی اختصاص داده شده استفاده کند. علاوه بر این، اگر VM بزرگتر از یک گره NUMA باشد و پردازنده های سرور از مدل های 2 کانالی UPI باشند، برخی از لینک های بین گره های NUMA فاصله ای برابر با دو HOP خواهند داشت که باعث کاهش عملکرد سرور و ماشین های مجازی بسیار بالا می شود. .

چرا سرورهای HPE DL580 را نمی خرید؟!3. روند کند بارگذاری سیستم عامل

به طور کلی کامپیوترها و سرورها فرآیندی به نام POST را از حافظه CMOS فراخوانی و اجرا می کنند تا از سلامت سخت افزار اطمینان حاصل کنند. یکی از وظایف این فرآیند بررسی و نقشه برداری رم سرور است. هنگام استفاده از سرورهای 4 سوکتی، معمولا حافظه اصلی بیشتری در سرور موجود است، بنابراین فرآیند POST و در نتیجه بارگذاری سیستم عامل می تواند بسیار طولانی باشد. این می تواند تا 15 دقیقه در سرور DL580 G8 با 1.5 ترابایت RAM طول بکشد.

4. کمبود منابع بیشتر در صورت خرابی سرور

توصیه کارشناسان مجازی سازی، رویکرد Scale-out به جای Scale-up است، در مواقعی که سرور از کار افتاده و در دسترس نیست، میزان آسیب به پایداری و SLA سرویس ها برابر با قدرت پردازش سرور است. استفاده از سرورهایی با 4 سوکت پردازنده منجر به در دسترس نبودن بخش زیادی از منابع در زمان خرابی می شود. همچنین به دلیل تراکم قطعات بیشتر در سرورهای دارای 4 سوکت پردازنده، این سرورها عموماً بیشتر در معرض خرابی سخت افزاری هستند، برای خنک شدن به توان بیشتری نیاز دارند و تعمیر آنها نیز دشوارتر است.

جالب است بدانید یکی از دلایلی که سرورهای چهار سوکت پردازنده در چین و آسیای شرقی فروش بالایی ندارند عدد 4 است. گویش و تلفظ عدد 4 در زبان چینی شباهت زیادی به کلمه مرگ دارد. حتی در چین و کشورهایی که مقصد مهاجران چینی هستند (مانند کانادا) ساختمان ها طبقه چهارم ندارند یا قیمت بسیار پایین تری دارند. طرف دیگر این مشکل فروش بالای 8 سرور سوکت در چین است که یکی از دلایل این مشکل است زیرا عدد 8 در فرهنگ چینی به فال نیک گرفته می شود.

با توجه به مزایا و معایب سرورهای چند سوکتی، سرورهای تک سوکتی نیز باید بررسی شوند. از مزایای این نوع سرورها به ویژه سرورهای دارای پردازنده AMD می توان به موارد زیر اشاره کرد:

  • سرورهای پردازنده AMD Epyc می توانند تا 64 رشته پردازشی را ارائه دهند که برای بسیاری از برنامه ها قدرت پردازش کافی است.
  • این نوع سرور می تواند جایگزین مناسبی برای سرورهای دارای دو سوکت پردازنده باشد که از منابع آنها به خوبی استفاده نمی شود، با خرید این نوع سرور عملا می توان سرورها را سایز کرد.
  • هزینه های راه اندازی یک کلاستر و بهره مندی از فناوری های مرتبط مانند HA/DRS/VSAN با این نوع سرور کمتر است.
  • در برخی مواقع و با یادگیری قوانین صدور مجوز نرم افزار، می توانید با استفاده از سرورهای تک سوکت هزینه کمتری برای لایسنس پرداخت کنید.
  • مشکلی با کاهش عملکرد به دلیل نداشتن تنظیمات NUMA مناسب در این نوع سرور وجود ندارد. از آنجایی که سرور تنها یک پردازنده دارد، امکان تنظیمات اشتباه به حداقل می رسد. (البته برخی از این سی پی یو ها از دو سی پی یو در یک پکیج سی پی یو استفاده می کردند که در فرصتی دیگر مسائل مربوط به آن سی پی یو ها را توضیح خواهیم داد.)
  • با کاهش تعداد سوکت های پردازنده، سرور خروجی حرارت کمتری خواهد داشت، بنابراین مصرف برق و خنک کننده کاهش می یابد و گرما به طور مساوی در سراسر مرکز داده توزیع می شود.
  • تعداد خطوط PCI-E به دلیل عدم اتصال بین پردازنده ها افزایش یافته و سرور قابلیت گسترش بیشتری دارد. به این ترتیب کارت های گرافیک، دستگاه های NVME و کارت های ورودی/خروجی بیشتری را می توان روی سرور نصب کرد.

با جمع بندی آنچه گفته شد، می توان نتیجه گرفت که در مراکز داده ای که از فناوری مجازی سازی برای طراحی لایه محاسباتی هر مرکز داده استفاده می کنند، در گام اول باید بیشترین حجم کاری آن مرکز داده شناسایی شود. اگر این حجم کاری در سرورهای تک سوکت، دو سوکت یا چهار سوکت قابل ارائه باشد، اولویت با کوچکترین سروری است که می توان تهیه کرد، زیرا این طراحی باعث می شود که مزایای مجازی سازی در مقیاس خدمات رنگارنگ تر شود.

با این حال، طراحی لایه Compute نباید با لایه Network و لایه Storage در تضاد باشد. به این معنی که اگر نیازهای یک لایه دیگر نیاز به نوع خاصی از سرورها داشته باشد، باید این مسائل به دقت بررسی شود.