نگهداری سرور با چک لیست حیاتی
فروش سرور اغلب با ارائه خدماتی مانند پشتیبانی نیز همراه است اما بهتر است سرویسهای دورهای و چک لیست نگهداری سرور را در برنامه داشته باشید. نگهداری و مانیتورینگ ساده سرور میتواند از بسیاری از خرابیهای سرور و منتهی شدن به فاجعه جلوگیری کند. مثلا اگر RAID سرور خراب است یا بکاپ گرفتن برای مدتی متوقف شده یا ظرفیت هاردها کاملا پر شده باشند، احتمالا باید منتظر خرابی و Fail شدن سرورتان باشید.
اگر از سرویسهای مدیریتی استفاده میکنید که نباید نگران این موارد نباشید اما اگر به صورت شخصی سرورتان را مدیریت میکنید، باید به چک لیست نگهداری سرور کاملا پایبند باشید تا خطرهای احتمالی سرورتان را تهدید نکنند. متخصصین با تجربه فالنیک نیز با ارائه خدمت جنرال سرویس دوره ای سرور در کنار شما هستند تا همواره شاهد عملکرد بینقص سرورتان باشید.
چک لیست نگهداری سرور ؛ 13 فاکتور کلیدی
در چک لیست نگهداری سرور که در ادامه میخوانید 13 نکته بیان شده که باعث میشود درک بهتری از آنچه برای نگهداری روتین سرور لازم است، پیدا کنید. نگهداری مداوم سرور باعث به حداقل رسیدن مشکلات آن میشود. بسیاری از این مشکلات قابل پیش بینی و پیشگیری است.
1. داشتن استراتژی بکاپ گیری
داشتن استراتژی خوب در بکاپ گیری نکته مهمی است که باید به آن توجه کنید. هر روز یا هر هفته زمانی را برای بکاپگیری اختصاص دهید. بهتر است بکاپ داشته باشید و به آنها احتیاج نداشته باشید تا اینکه به بکاپ نیاز داشته باشید اما بکاپی وجود نداشته باشد!
بررسی کنید آیا بکاپگیری به درستی کار میکند؟ قبل از اعمال هر تغییری در سیستم مطمئن شوید که بکاپگیری از اطلاعات بهدرستی انجام شده باشد؛ حتی میتوانید چند تست ریکاوری هم انجام دهید.
نکته مهم دیگر که اهمیتی کمتر از بکاپگیری ندارد، محل نگهداری بکاپ هاست که باید استانداردهای مربوط به آن را رعایت کنید.
خواندن مطلب “بهترین روش های بک آپ گیری از سرور و شبکه” را توصیه میکنیم.
اصولا Raid در سرورها پیاده سازی و اجرا میشود که طی آن چندین هارد به صورت یک هارد دیده میشوند. برخی انواع RAIDها برای افزایش کارایی و برخی برای افزونگی هستند. اگر از ابزار مدیریتی Raid استفاده کنید، میتوانید به سادگی از احتمال خرابی هارد درایو مطلع شوید در نتیجه فرصت کافی برای جایگزینی و ریبیلد کردن رید را دارید و در نهایت زمان Downtime کمتر میشود.
ممکن است سالانه تنها یک درصد خرابی رید رخ دهد. این عدد اگرچه به ظاهر کوچک به نظر میرسد، اما خرابی کامل سرور و down بودن چندین ساعته سیستم را در پی دارد.
2. بررسی مصرف هارد
به صورت دورهای میزان مصرف هارد درایوهای سرور را بررسی کنید. سرورها لاگهای زیاد، ایمیلهای قدیمی و پکهای نرم افزاری منقضی دارند. از سیستم خود به عنوان سیستم آرشیو استفاده نکنید و لاگ ها و ایمیل ها و نسخه های نرم افزاری که دیگر استفاده نمیکنید را پاک کنید. دیتای کمتر، ریکاوری را هم سریعتر میکند.
اگر نگهداری لاگهای قدیمی برایتان مهم است آنها را روی استوریج اکسترنال ذخیره و آرشیو کنید. ایمیلهای قدیمی را پاک یا آرشیو کنید. در برخی برنامهها پس از آپدیت، فایلهای قدیمی پاک نمیشود و باید از برنامههای Package Manager که دارای پروتکلهای Cleanup هستند، استفاده کنید. استفاده از برنامههای مدیریت فایلهای قدیمی نرم افزاری هم کمک کننده است.
هارد درایوها نه تنها برای ذخیره سازی استفاده میشوند بلکه از آنها به صورت Swap File هم استفاده میکنیم که همانند حافظه فیزیکی کار میکند، یعنی در صورت پر شدن رم از این قسمت از هارد استفاده میشود. اگر مصرف هارد به بیش از 90 درصد برسد، با Swap File تداخل پیدا میکند و کارایی به شدت کاهش مییابد.
همچنین در صورت استفاده بیش از 90 درصد از ظرفیت هارد باید مصرف را کم کنید یا فضای ذخیره سازی را افزایش دهید. اگر مصرف پارتیشن به 100 درصد برسد، سرور دیگر پاسخ نمیدهد، جداول دیتابیس خراب میشود و دیتا از دست خواهد رفت.
3. بررسی مصرف منابع سرور
علاوه بر بررسی مصرف هارد باید میزان مصرف دیگر منابع سرور را نیز بررسی کنید. مصرف حافظه و پردازنده نشانگر این است که سرور تا چه حد سنگین کار میکند. اگر مصرف سی پی یو و رم مرتبا به صد درصد میرسد، نشانگر Overtax شدن سرور است، یعنی بار روی آن بیش از حد مجاز است. برای رفع این مشکل باید بار را از سخت افزار سروتان با آپگرید کردن سرور یا اضاف کردن سرور جدید بردارید. خواندن مقاله “۶ دلیل برای جایگزینی سرور قدیمی با سرور جدید؛ پادکست” را از دست ندهید.
4. آپدیت برنامه ها و نرم افزارها
رعایت این نکته به خصوص برای برنامههای مبتنی بر وب مانند برنامه محبوب وردپرس مهم است. طبیعی است که بسته به نوع پیکربندی سرورتان از نرم افزارهای مختلفی استفاده کنید. برخی سیستمها دارای Package Manager هستند و به صورت خودکار نرم افزار را آپدیت میکنند اما آنهایی که این کار را نمیکنند باید بررسی شوند و زمانبندی بررسی آپدیتهای جدید را برای آنها در نظر گرفت.
توجه داشته باشید که برخی سیستم عاملها مانند پایتون 2 برای CentOS7 به نسخههای قدیمی برنامه نیاز دارند. در چنین مواردی باید مراقب باشید که چنین برنامههایی را در شبکه استفاده نکنید.
5. بررسی ابزارهای مدیریت از راه دور
ابزارهای مدیریت ریموت شامل ریموت کنسول، ریموت ریبوت و Rescue Mode است که سه ابزار اصلی برای مدیریت از راه دور سرور هستند. وجود این ابزارها هنگامی که قصد اجرای سرور مجازی مبتنی بر کلود را دارید یا سرورتان را از راه دور مدیریت میکنید، ضروری است و باید به صورت دورهای درست کار کردن آنها را بررسی کنید.
ریبوت کردن میتواند بسیاری مشکلات را حل کند، ریموت کنسول امکان لاگین کردن به سرور بدون حضور فیزیکی را فراهم میکند. Rescue Mode راهکار Redhat است و اغلب سیستم عاملهای سروری دارای حالت مدیریتی یا Safe هستند که با آن به صورت ریموت تعمیرات را انجام میدهند.
6. بررسی مصرف شبکه
مانند بررسی مصرف رم و CPU باید مصرف و ظرفیت شبکه را نیز بررسی کنید. اگر سرور به سمت حداکثر ظرفیت سخت افزاری شبکه پیش میرود، باید آن را آپدیت کنید. استفاده از ابزارهای مانیتورینگ شبکه هم توصیه میشود. این ابزارها ترافیک شبکه را برای استفاده غیرمعمول و دارای مشکل بررسی میکنند.
مانیتورینگ الگوهای ترافیک میتواند ترافیک وب را بهینه کند، مثلا ممکن است منابعی که مکررا استفاده میشوند را به سرور سریعتری منتقل کنید. بررسی رفتار غیر عادی برای تشخیص رخنهها و اتکها مفید است و مدیریت آنها را راحتتر میکند.
7. آپدیت سیستم عامل
آپدیت سیستم عامل به دلیل آنکه آپدیت پچ ها و آپدیت ها میتواند مشکلات امنیتی زیادی را رفع کند و کارایی را افزایش دهد، پروسه مهمی است. هکرها اغلب پچهای سیستم عاملی ارزیابی میکنند و به ضعیفها حمله میکنند، قبل آنکه بتوانید پچ جدید را نصب کنید. پس زمانهای خاصی را برای آپدیت سیستم عامل در نظر بگیرید.
8. تمیز کردن سخت افزارهای سرور
باید به صورت دورهای سخت افزار سرور را تمیز کنید. این کار از خرابی سخت افزار پیشگیری و گردوغبار را از سخت افزار و فنها دور میکند. گردوغبار در بالا رفتن دمای سرور تاثیر دارد و گرما دشمن کارایی سرور است. در این زمینه فالنیک سرویس جنرال سرویس را به شما ارائه میدهد. برای استفاده از آن روی لینک “خدمات جنرال سرویس در فالنیک” بزنید.
9. بررسی خطاهای سخت افزاری
سیستم عاملهای مدرن سروری دارای لاگهای خطاهای سخت افزاری هستند. ارور سخت افزاری میتواند شامل خطای SMART، خرابی هارد (مانند خطای خواندن)، خطای درایور و خطای حافظه باشد. مطلب “SMART در هارددیسک چیست؛ خطای اسمارت و رفع آن” را حتما بخوانید. بررسی لاگهای خطا باعث پیدا کردن مشکل و رفع آن، قبل از خرابی سیستم میشوند.
پیشنهاد مطالعه
چک لیست امنیتی ویندوز سرور چیست؟
10. بررسی لاگ های سروری
لاگهای نگهداری سرور، دسترسی و خطا را بررسی میکند. این لاگها ممکن است زیاد و گسترده باشند اما با ابزارها و رویهها میتوانید آنها را به آسانی مدیریت کنید.
بررسی مرتب لاگها شما را با عملکرد سرورتان مانوس میکند. لاگ میتواند مشکل سخت افزاری را به شما نشان دهد و در نتیجه قبل از خرابی آن را رفع میکنید. لاگهای دسترسی میزان استفاده غیرمجاز یا دسترسی غیرمجاز کاربران را نیز نشان میدهد.
11. بررسی امنیت پسورد
مرتبا باید امنیت پسورد را بررسی کنید. اگر از سیستم مدیریتی پسورد استفاده نمیکنید، همین حالا این کار را انجام دهید. باید سیستمی برای اتوماتیک کردن تغییر پسورد داشته باشید اگر ندارید باید از کاربران بخواهید، تغییر پسورد را دستی انجام دهند.
12. ارزیابی اکانت کاربران
به صورت دورهای لیست اکانت کاربران را بررسی کنید. همچنین Permissionهای اکانت را بررسی کنید تا از درستی اختصاص آن به هر کاربر مطمئن شوید. هنگام این بررسی ممکن است لازم باشد دیتا و اطلاعات کاربر و اکانت را هم بررسی کنید. همچنین باید امکان پاک کردن اطلاعات کاربر قبلی به صورت دستی وجود داشته باشد.
13. بررسی امنیت کلی سرور
سیاستهای امنیتی سرورتان را ارزیابی کنید تا مطمئن شوید در حال اجرا هستند. از ابزار امنیت شبکه برای تست شبکه از بیرون استفاده کنید. این کار باعث میشود جاهایی که از چشم شما دور مانده را تشخیص دهید و قبل از وقوع رخنه، آنها را بیابید. این بررسیها را ماهانه یا فصلی انجام دهید.
چرا سرویس دوره ای سرور مهم است؟
خرابی سرور علاوه بر تحمیل هزینههای بسیار زیاد، باعث توقف کار شما میشود، بنابراین بهتر است با انجام اقدامات پیشگیرانه از وقوع خرابی سرور جلوگیری کنید. برای جلوگیری از این تجربه ناخوشایند باید عواملی که سروتان را تهدید میکند، بشناسید؛ در ادامه این عوامل را بیان میکنیم:
گردوغبار: گردوغبار باعث افزایش دمای سرور و ایجاد خسارت جبران ناپذیر به شبکه میشود.
تغییر دمای استاندارد سرور: هر عاملی که باعث تغییر دمای سرور شود، روی کارایی و عملکرد سرور تاثیر میگذارد. افزایش دما باعث کاهش عمر مفید، خرابی قطعات دستگاه، افزایش مصرف برق، افزایش down time و افزایش هزینه تعمیر و نگهداری سرور میشود.
استفاده از مواد پاک کننده غیر استاندارد: استفاده از مواد پاک کننده معمولی برای تمیز کردن سرور نیز باعث ایجاد پوسیدگی، زنگ زدگی، داغ شدن و … میشود.
شرکت پیشران صنعت ویرا با اساس نامه اتوماسیون صنعتی و کنترل ابزار دقیق و ساخت تابلوهای برق فشار قوی و ضعیف از سال 92 تاسیس گشت و ازهمان ابتدا در حوزه کاربرد ابزار دقیق در bms و سپس تولید و ساخت آنها قدم نهاد و در ادامه مسیر توانست با اتکا به تجربیات چندین ساله و استخدام نیروهای متخصص برق عملا جزو شرکتهایی باشد که محصولات قابل اتکایی با عناوین مانیتورینگ شرایط محیطی اتاق سرور -کنترلرهای دمای دیتا سنتر -دیتالاگرهای سردخانه و انبار -هشدار دهنده های دمای یخچال و فریزر و شمارشگرهای نمایشگاهی و فروشگاهی و تابلوهای برق متنوع با کاربردهای مختلف روانه بازار نماید در حال حاضر سیستمهای کنترل دما و رطوبت اتاق سرور این شرکت تنها سیستم مبتنی بر سخت افزار صنعتی plc-hmi در ایران است.