فهرست مطالب این مقاله:
در این مقاله طی مصاحبهای با کارشناس مانیتورینگ شرکت داناپرداز، به تشریح چند مزیت مهم مانیتورینگ شبکه و ابزارهای آن پرداختهایم.
در این مقاله مزایای استفاده از مانیتورینگ شبکه طی یک مصاحبه با کارشناس مانیتورینگ شرکت داناپرداز بررسی گردیده است. ما در این مصاحبه درباره مزایای یک راهکار مانیتورینگ Uptime/Downtime و همچنین مزایای محصولات مانیتورینگ پهنای باند و میزان مصرف شاخصهای عملکردی مثل نرم افزار مانیتورینگ شبکه و دیتاسنتر بینا صحبت کردهایم. مزایایی که در این مصاحبه عنوان گردیده است به شرح زیر میباشد.
مفهوم خطای سیستمی
سوال: خطاهای سیستمی به چه خطاهایی اطلاق میگردد؟ یک وب سرور که Down شده است؟ روترها یا سوییچهایی که به درخواستها پاسخ نمیدهند؟
کارشناس مانیتورینگ: منظور، هرگونه خطایی است که باعث از دست دادن داده شود. از یک پرینتر خراب که مانع پرینت گرفتن کارکنان فروش شده است و ارسال پیشنهادات به وب سایت خراب شده که سفارشات را از مشتریان نمیپذیرد. دلایل میتواند هر چیزی باشد: از یک تیونر کارتریج خالی تا یک کابل اترنت خراب شده، سیم برق قطع شده، از دست دادن برق کلی سازمان، خرابی روتر یا خط DSL و حتی قطع فیوز. به طور کلی هر مشکلی که سیستمها را از کار کردن در حالت نرمال بازدارد. به عنوان مثال، ما دمای اتاق دیتاسنتر را در سازمان مانیتور میکنیم. متوقف نشدن سیستم تهویه هوا برای ما بسیار حیاتی است چرا که در غیر این صورت باعث میگردد بلافاصله سرورهایمان به سمت خرابی کشیده شوند.
آرامش خاطر هنگام بروز مشکلات
سوال: در قالب چند مثال توضیح دهید که چه زمانی و در چه صورتی کارشناس IT سازمان از شبکه خود مطلع خواهد شد و هشدار دریافت خواهد کرد؟
کارشناس مانیتورینگ: برای هر چه که شما بتوانید مانتیور کنید، نرم افزار مانیتورینگ بینا میتواند برای شما اخطار ایجاد و ارسال کند. دلایل مختلفی برای ایجاد اخطار میتواند وجود داشته باشد، مانند سیستمهای خراب و معیوب شده، سیستمهایی که مدت طولانی کند باشند و غیره (به عنوان مثال، هنگامی که زمان پاسخ یک صفحه وب بیش از یک ثانیه باشد یا یک سیستم وب سرور با سربار بالا که به طور پیوسته ترافیک را روی وب سایت شما بالا میبرد). هنگامی که مانیتورینگ شبکه را برای شبکه خود پیکربندی میکنید، نرم افزار مانیتورینگی که انتخاب میکنید بسیار حائز اهمیت میباشد. در واقع هدف شما میبایست پوشش تمامی جنبههای مهم فرآیندهای سازمان باشد. به عنوان مثال، مانیتورینگ داخلی ما در سازمان در حال حاضر تقریبا با 200 سنسور فعالیت میکند. یکی از سرورهای اصلی ما “DanaPardaz1” نام دارد. این سرور در واقع سرور MS Exchange 2003، سرور DNS و ویندوز Domain Controller میباشد و این دلیل اصلی است که ما نیاز داریم این سرور را با سنسورهای مختلفی مانیتور کنیم. برخی از سنسورها تنها به صورت “OK” و “Error” مانیتور میشوند و برای بسیاری از آنها بازه زمانی عملکرد تعریف شده است. برای مثال شاخص “تعویض زمینه CPU در هر ثانیه” میبایست در سیستمهای ویندوزی همیشه کمتر از 8000 بر ثانیه باشد (بیشتر از 8000 بر ثانیه یعنی سیستم دارای سربار اضافی است). به هر ترتیب، تا زمانی که از سرویس ارسال اخطار بینا از طریق ایمیل، پیام کوتاه و غیره پیامی دریافت نکرده باشید، شما میدانید که همه چیز درست کار میکند و میتوانید بیشتر زمان خود را صرف مسائل مهمتر کاری خود بکنید.
استفاده و نگهداری آسان
سوال: آیا یک شرکت اینترنتی متمرکز میتواند از نرم افزار مانیتورینگ بینا بدون یک کارمند اختصاصی IT و تنها با استفاده از یک کارمند جزء با دانش فنی متوسط بهره ببرد؟ آیا سادگی و آسان بودن کار با آن به این دلیل است که پلتفرم آن بر پایه ویندوز است و با یک رابط بصری کاربرپسند و گزارشهایی خوانا کار میکند؟
کارشناس مانیتورینگ: هر کسی که بتواند یک شبکه ساده را پیکربندی کند (برای مثال یک روتر DSL نصب کند و یک شبکه کوچک راهاندازی کند) قادر است نرم افزار مانیتورنگ بینا را با تنظیمات ابتدایی و سادهای نصب و پیکربندی نماید و از آن در راستای مانیتورینگ جامع تجهیزات شبکه بهره گیرد. ما سعی داریم تمامی ایدهها و نظریات فنی را برای مشتریان در حالت پیشرفتهای عملی کنیم. تمام کاری که شما باید انجام دهید این است که مانیتورها را با استفاده ابزار پویشگر شبکه و سایر روشهای افزودن مانیتور، ایجاد و به سیستم مانیتورینگ بینا بیافزایید.
هرچه سریعتر جهت رفع مشکلات اقدام کنید
سوال: آیا یک کارشناس IT میتواند سریعا” جهت رفع یک خطای سیستمی اقدام نماید؟
کارشناس مانیتورینگ: طبق تجربه خودم 95% خطاهای سیستمی با یک ریبوت ساده برطرف خواهند شد. در چنین حالتی، ادمین میتواند یک سرویس را به یک سیستم بکاپ در حالت Redundant سوییچ کند (که میبایست قبلا برای حوادث غیرمنتظره آماده کرده باشد). برای سیستمهای بحرانی شما میبایست یک برنامه بازیابی (Recovery) در مواقع بحرانی (با یک طراحی خوب و دقیق) داشته باشید (به عنوان مثال سیستمهای Redundant). تنها در این حالت است که الزام به حضور یک سیستم مانیتورینگ مناسب به خوبی حس میشود. زیرا شما را قادر میسازد که بتوانید برنامه بحرانی خود را جهت انجام عکس العملی سریع در راستای رفع مشکل به کار گیرید. اگر جایگزینی سیستم دارای مشکل با سیستم Redundant مدت طولانی زمان ببرد، آنگاه دانستن اینکه در 2 دقیقه سیستم Crash کرده و با مشکل مواجه شده است بیفایده خواهد بود. در واقع مانیتورینگ شبکه تنها با یک استراتژی مناسب جهت اجرا در مواقع بحرانی کاربردی خواهد بود.
فرصت جاجایی به سیستمهای Redundant
سوال: آیا این به این معنی است که شما میتوانید خطاهای بحرانی سیستمی را پیش بینی کرده و به سیستمهای Redundant که از پیش ایجاد شدهاند سوییچ کنید؟
کارشناس مانیتورینگ: همانطور که پیشتر عنوان شد، شما به یک استراتژی بازیابی در مواقع بحرانی نیازمندید. شما میتوانید با بررسی سیستمهای سازمان، لیستی از سیستمهای ضروری را در سازمان خود بیابید و برای هر سیستم یک استراتژی بازیابی مناسب جهت اجرا در مواقع بحرانی طراحی نمایید. بسیاری از سیستمها پیش از بوجود آمدن، یکسری خطاهای کلی و رفتاری غیرعادی از خود بروز میدهند (مثال هنگامی که به افزایش سربار (Overload) نزدیک میشوند). با تعریف بازه مجاز عملکرد (Threshold) برای شاخصهای خود، میتوانید مشکلات کوچک را پیش از این که به یک کابوس بزرگ تبدیل شوند برطرف نمایید. لازم به ذکر است سیستم مانیتورینگ بینا امکان تعریف عملیات بازیابی را برای سرورها و کلاینتهای موجود در سازمان برای کاربران فراهم آورده است.
کشف مشکلات عملکردی پیش از مشتریان
سوال: آیا میتوان برای مشکلات عملکردی سیستمها تعریف خاصی در نظر گرفت؟ آیا تعداد زیاد کاربران که باعث میشود انجام عملیات بارگیری بر روی صفحات وب با سرعت کم انجام پذیرد از جمله مشکلات عملکردی محسوب میشود؟ پهنای باند بسیار زیاد که در یک بازه زمانی، پهنای باند شبکه را اشغال و موجب اختلال در سایر تراکنشها میشود چطور؟
کارشناس مانیتورینگ: در واقع تمامی این مواردی که عنوان شد! به گراف زیر که میزان استفاده از داده را با حداکثر نرخ داده 2Mbit/s نشان میدهد توجه کنید:
دادههای عملکردی بلند مدت، بدون نیاز به راهکارهای گمراه کننده
سوال: چگونه یک کارشناس IT و یا حتی کارشناس غیر IT دادهها را آنالیز و بررسی میکند؟ آیا گزارشات و واسط کاربری در نرم افزار بینا به اندازه کافی بصری و کاربرپسند هستند؟
کارشناس مانیتورینگ: این موارد به کمی دانش فنی نیاز دارد، اما استفاده از گرافها بسیار راحت و آسان است. به گراف بالا نگاه کنید. با این گرافها شما به راحتی میتوانید رفتارهای غیرمعمول را مثل رشد ثابت در ترافیک یا یک سربار (Overload) را کشف کنید. دادههای عملکردی بلند مدت، به شما امکان برنامهریزی و در پی آن ارتقا تجهیزات یا زیرساخت شبکه را خواهند داد (به عنوان مثال یک سخت افزار جدید سرور، یا خطوط Leased Line).
تطبیق سرویس Provider با توافقنامه SLA
سوال: با نگاهی واقع بینانه، یک شرکت فراهم کننده (Provider)/ هاستینگ شبکه چگونه میتواند هنگام نقض SLA (موافقت نامه سطح خدمات) این مشکل را جبران نماید؟ از طریق اعتبار شرکت؟ یا به عنوان مثال خدمات رایگان برای یک دوره؟
کارشناس مانیتورینگ: این بستگی به قرار داد میان شما و شرکت هاستینگ دارد. بسیاری از آنها تخفیف و یا خدمات ویژهای را برای ماهها به صورت رایگان ارائه میدهند. اما نکته اصلی این است که بدون داشتن مانیتورینگ، شما میبایست به گفتهها و ارزیابیهای شرکتهای هاستینگ خود اعتماد کنید. در صورتی که سرویس آنها مطابق با وعدههای آنها نباشد، تنها نتایج مانیتورینگ خودتان است که به شما فرصتی جهت شروع یک بحث واقعی بر سر دادههای حقیقی را با آنها خواهد داد.