در دسترس بودن “پنج- 9” تا چه میزان واقعی است؟

“پنج- 9” به معنای در دسترس بودن 99.999٪ است. این یک اصطلاح مهم در بخش های مختلف صنعت فناوری اطلاعات است.

اما این اصطلاح مهم به هیچ وجه واقعی نیست و دستیابی به این سطح عملکرد تقریباً غیرممکن است.

بیایید کمی روی ریاضیات تمرکز کنیم.

• در یک دقیقه واحد، “پنج- 9” به این معنی است که شما فقط 0.0006 ثانیه در دسترس نخواهید بود.
• در یک ساعت، شما می توانید 0.036 ثانیه زمان خرابی داشته باشید.
• در یک روز، سیستم شما 0.86 ثانیه زمان برای تنفس دارد.
• در یک هفته، می توانید یک استراحت 6.04 ثانیه ای داشته باشید.
• در کل یک ماه، فقط می توانید 24.192 ثانیه خرابی یا استراحت داشته باشید.
• در هر سه ماهه مالی، شما برای رفع قطعی تنها کمی بیش از یک دقیقه یعنی 72.576 ثانیه، زمان دارید.
• برای نیمی از سال کمی بیش از دو دقیقه 145.152 ثانیه دریافت می کنید.
• و در یک سال کامل، سیستم “پنج- 9″شما فقط کمتر از 5 دقیقه (290.304 ثانیه) خاموشی را تجربه خواهد کرد.

 

زمان پاسخگویی

آیا واقعا انتظار دارید که هر دستگاه، سرور یا خدمات در کل سال به جز 5 دقیقه، همیشه در دسترس همه کاربران باشد؟

این ادعا پیامدهایی را برای متخصصان مانیتورینگ در بر خواهد داشت. متخصصان مانیتورینگ کسانی هستند که وظیفه رصد سیستم ها را به عهده دارند. اگر یک سرویس کمتر از 99.999٪ در دسترس باشد، متخصصان مانیتورینگ هستند که باید پاسخگو باشند. متخصصین مانیتورینگ هستند که باید آمار را دوباره بررسی کنند، آستانه های خود را دوباره محاسبه کنند و برای هزارمین بار توضیح دهند که “در دسترس بودن” همیشه تعصب مشاهده ای را با خود به همراه دارد.

توضیحاتی شبیه به این:

“بله، آقای مدیرعامل، سرور در حال کار بود. سرور در یک دیتاسنتر در حال کار بود اما یک باغبان با پشت کفش مدار WAN را قطع کرد. ”
” آقای مدیرعامل، سرور در حال کار است و همه افراد می توانند این مساله را ببیند به جز شما، زیرا wifi لپ تاپ شما خاموش است.”
“سرور در حال فعالیت است اما در سیستم مانیتورینگ “از کار افتاده” نشان داده می شود زیرا یک نفر قوانین فایروال را تغییر داده است.”

یک واقعیت مهم دیگر هم وجود دارد. چرخه های سرشماری نه ثابت هستند و نه سریع. نتیجه دهی فواصل سرشماری واقع بینانه در حدود 1 تا 2 دقیقه برای بررسی نوع “پینگ” و 5 دقیقه برای جمع آوری داده ها است. اگر من هر دقیقه فقط وضعیت سرور را بررسی می کنم و سرور مانیتورینگ من با بیش از یک دستگاه سروکار داشته باشد، تنها 3 تا 5 دقیقه زمان می برد تا متوجه شوم که یکی از دستگاه ها کار نمی کند.

علاوه بر این درصورتی‌ که تیم سرور شرکت با ضمانت در دسترس بودن “پنج- 9” ثانیه با شما قرار داد بسته باشد، آیا تضمین می کند که روند پچ و راه اندازی مجدد ماهانه از آغاز تا پایان کمتر از نیم دقیقه طول خواهد کشید؟ قطعا این طور نخواهد بود.

برای امتیاز به این نوشته کلیک کنید!

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.

اسکرول به بالا