نگهداری سرور با چک لیست حیاتی

 

نگهداری سرور با چک لیست حیاتی 

فروش سرور اغلب با ارائه خدماتی مانند پشتیبانی نیز همراه است اما بهتر است سرویس‌های دوره‌ای و چک لیست نگهداری سرور را در برنامه داشته باشید. نگهداری و مانیتورینگ ساده سرور می‌تواند از بسیاری از خرابی‌های سرور و منتهی شدن به فاجعه جلوگیری کند. مثلا اگر RAID سرور خراب است یا بکاپ گرفتن برای مدتی متوقف شده یا ظرفیت هاردها کاملا پر شده باشند، احتمالا باید منتظر خرابی و Fail شدن سرورتان باشید.

اگر از سرویس‌های مدیریتی استفاده می‌کنید که نباید نگران این موارد نباشید اما اگر به صورت شخصی سرورتان را مدیریت می‌کنید، باید به چک لیست نگهداری سرور کاملا پایبند باشید تا خطرهای احتمالی سرورتان را تهدید نکنند. متخصصین با تجربه فالنیک نیز با ارائه خدمت جنرال سرویس دوره‌ ای سرور در کنار شما هستند تا همواره شاهد عملکرد بی‌نقص سرورتان باشید.

چک لیست نگهداری سرور ؛ 13 فاکتور کلیدی
در چک لیست نگهداری سرور که در ادامه می‌خوانید 13 نکته بیان شده که باعث می‌شود درک بهتری از آنچه برای نگهداری روتین سرور لازم است، پیدا کنید. نگهداری مداوم سرور باعث به حداقل رسیدن مشکلات آن می‌شود. بسیاری از این مشکلات قابل پیش بینی و پیشگیری است.

1. داشتن استراتژی بکاپ گیری
داشتن استراتژی خوب در بکاپ گیری نکته مهمی است که باید به آن توجه کنید. هر روز یا هر هفته زمانی را برای بکاپگیری اختصاص دهید. بهتر است بکاپ داشته باشید و به آنها احتیاج نداشته باشید تا اینکه به بکاپ نیاز داشته باشید اما بکاپی وجود نداشته باشد!

بررسی کنید آیا بکاپگیری به درستی کار می‌کند؟ قبل از اعمال هر تغییری در سیستم مطمئن شوید که بکاپ‌‌گیری از اطلاعات به‌درستی انجام شده‌ باشد؛ حتی می‌توانید چند تست ریکاوری هم انجام دهید.

نکته مهم دیگر که اهمیتی کمتر از بکاپ‌گیری ندارد، محل نگهداری بکاپ هاست که باید استانداردهای مربوط به آن را رعایت کنید.

خواندن مطلب “بهترین روش های بک آپ گیری از سرور و شبکه” را توصیه می‌کنیم.

اصولا Raid در سرورها پیاده سازی و اجرا می‌شود که طی آن چندین هارد به صورت یک هارد دیده می‌شوند. برخی انواع RAIDها برای افزایش کارایی و برخی برای افزونگی هستند. اگر از ابزار مدیریتی Raid استفاده کنید، می‌توانید به سادگی از احتمال خرابی هارد درایو مطلع شوید در نتیجه فرصت کافی برای جایگزینی و ریبیلد کردن رید را دارید و در نهایت زمان Downtime کمتر می‌شود.

ممکن است سالانه تنها یک درصد خرابی رید رخ دهد. این عدد اگرچه به ظاهر کوچک به نظر می‌رسد، اما خرابی کامل سرور و down بودن چندین ساعته سیستم را در پی دارد.

2. بررسی مصرف هارد
به صورت دوره‌ای میزان مصرف هارد درایوهای سرور را بررسی کنید. سرورها لاگ‌های زیاد، ایمیل‌های قدیمی و پک‌های نرم افزاری منقضی دارند. از سیستم خود به عنوان سیستم آرشیو استفاده نکنید و لاگ ها و ایمیل ها و نسخه های نرم افزاری که دیگر استفاده نمی‌کنید را پاک کنید. دیتای کمتر، ریکاوری را هم سریعتر می‌کند.

اگر نگهداری لاگ‌های قدیمی برایتان مهم است آنها را روی استوریج اکسترنال ذخیره و آرشیو کنید. ایمیل‌های قدیمی را پاک یا آرشیو کنید. در برخی برنامه‌ها پس از آپدیت، فایل‌های قدیمی پاک نمی‌شود و باید از برنامه‌های Package Manager که دارای پروتکل‌های Cleanup هستند، استفاده کنید. استفاده از برنامه‌های مدیریت فایل‌های قدیمی نرم افزاری هم کمک کننده است.

هارد درایوها نه تنها برای ذخیره سازی استفاده می‌شوند بلکه از آنها به صورت Swap File هم استفاده می‌کنیم که همانند حافظه فیزیکی کار می‌کند، یعنی در صورت پر شدن رم از این قسمت از هارد استفاده می‌شود. اگر مصرف هارد به بیش از 90 درصد برسد، با Swap File تداخل پیدا می‌کند و کارایی به شدت کاهش می‌یابد.

همچنین در صورت استفاده بیش از 90 درصد از ظرفیت هارد باید مصرف را کم کنید یا فضای ذخیره سازی را افزایش دهید. اگر مصرف پارتیشن به 100 درصد برسد، سرور دیگر پاسخ نمی‌دهد، جداول دیتابیس خراب می‌شود و دیتا از دست خواهد رفت.

3. بررسی مصرف منابع سرور
علاوه بر بررسی مصرف هارد باید میزان مصرف دیگر منابع سرور را نیز بررسی کنید. مصرف حافظه و پردازنده نشانگر این است که سرور تا چه حد سنگین کار می‌کند. اگر مصرف سی پی یو و رم مرتبا به صد درصد می‌رسد، نشانگر Overtax شدن سرور است، یعنی بار روی آن بیش از حد مجاز است. برای رفع این مشکل باید بار را از سخت افزار سروتان با آپگرید کردن سرور یا اضاف کردن سرور جدید بردارید. خواندن مقاله “۶ دلیل برای جایگزینی سرور قدیمی با سرور جدید؛ پادکست” را از دست ندهید.


4. آپدیت برنامه ها و نرم افزارها
رعایت این نکته به خصوص برای برنامه‌های مبتنی بر وب مانند برنامه محبوب وردپرس مهم است. طبیعی است که بسته به نوع پیکربندی سرورتان از نرم افزارهای مختلفی استفاده کنید. برخی سیستم‌ها دارای Package Manager هستند و به صورت خودکار نرم افزار را آپدیت می‌کنند اما آنهایی که این کار را نمی‌کنند باید بررسی شوند و زمانبندی بررسی آپدیت‌های جدید را برای آنها در نظر گرفت.

توجه داشته باشید که برخی سیستم عامل‌ها مانند پایتون 2 برای CentOS7 به نسخه‌های قدیمی برنامه نیاز دارند. در چنین مواردی باید مراقب باشید که چنین برنامه‌هایی را در شبکه استفاده نکنید.

5. بررسی ابزارهای مدیریت از راه دور
ابزارهای مدیریت ریموت شامل ریموت کنسول، ریموت ریبوت و Rescue Mode است که سه ابزار اصلی برای مدیریت از راه دور سرور هستند. وجود این ابزارها هنگامی که قصد اجرای سرور مجازی مبتنی بر کلود را دارید یا سرورتان را از راه دور مدیریت می‌کنید، ضروری است و باید به صورت دوره‌ای درست کار کردن آنها را بررسی کنید.

ریبوت کردن می‌تواند بسیاری مشکلات را حل کند، ریموت کنسول امکان لاگین کردن به سرور بدون حضور فیزیکی را فراهم می‌کند. Rescue Mode راهکار Redhat است و اغلب سیستم عامل‌های سروری دارای حالت مدیریتی یا Safe هستند که با آن به صورت ریموت تعمیرات را انجام می‌دهند.

6. بررسی مصرف شبکه
مانند بررسی مصرف رم و CPU باید مصرف و ظرفیت شبکه را نیز بررسی کنید. اگر سرور به سمت حداکثر ظرفیت سخت افزاری شبکه پیش می‌رود، باید آن را آپدیت کنید. استفاده از ابزارهای مانیتورینگ شبکه هم توصیه می‌شود. این ابزارها ترافیک شبکه را برای استفاده غیرمعمول و دارای مشکل بررسی می‌کنند.

مانیتورینگ الگوهای ترافیک می‌تواند ترافیک وب را بهینه کند، مثلا ممکن است منابعی که مکررا استفاده می‌شوند را به سرور سریع‌تری منتقل کنید. بررسی رفتار غیر عادی برای تشخیص رخنه‌ها و اتک‌ها مفید است و مدیریت آنها را راحت‌تر می‌کند.

7. آپدیت سیستم عامل
آپدیت سیستم عامل به دلیل آنکه آپدیت پچ ها و آپدیت ها می‌تواند مشکلات امنیتی زیادی را رفع کند و کارایی را افزایش دهد، پروسه مهمی است. هکرها اغلب پچ‌های سیستم عاملی ارزیابی می‌کنند و به ضعیف‌ها حمله می‌کنند، قبل آنکه بتوانید پچ جدید را نصب کنید. پس زمان‌های خاصی را برای آپدیت سیستم عامل در نظر بگیرید.

8. تمیز کردن سخت افزارهای سرور
باید به صورت دوره‌ای سخت افزار سرور را تمیز کنید. این کار از خرابی سخت افزار پیشگیری و گردوغبار را از سخت افزار و فن‌ها دور می‌کند. گردوغبار در بالا رفتن دمای سرور تاثیر دارد و گرما دشمن کارایی سرور است. در این زمینه فالنیک سرویس جنرال سرویس را به شما ارائه می‌دهد. برای استفاده از آن روی لینک “خدمات جنرال سرویس در فالنیک” بزنید.

9. بررسی خطاهای سخت افزاری
سیستم عامل‌های مدرن سروری دارای لاگ‌های خطاهای سخت افزاری هستند. ارور سخت افزاری می‌تواند شامل خطای SMART، خرابی هارد (مانند خطای خواندن)، خطای درایور و خطای حافظه باشد. مطلب “SMART در هارددیسک چیست؛ خطای اسمارت و رفع آن” را حتما بخوانید. بررسی لاگ‌های خطا باعث پیدا کردن مشکل و رفع آن، قبل از خرابی سیستم می‌شوند.

پیشنهاد مطالعه
چک لیست امنیتی ویندوز سرور چیست؟
10. بررسی لاگ های سروری
لاگ‌های نگهداری سرور، دسترسی و خطا را بررسی می‌کند. این لاگ‌ها ممکن است زیاد و گسترده باشند اما با ابزارها و رویه‌ها می‌توانید آنها را به آسانی مدیریت کنید.

بررسی مرتب لاگ‌ها شما را با عملکرد سرورتان مانوس می‌کند. لاگ می‌تواند مشکل سخت افزاری را به شما نشان دهد و در نتیجه قبل از خرابی آن را رفع می‌کنید. لاگ‌های دسترسی میزان استفاده غیرمجاز یا دسترسی غیرمجاز کاربران را نیز نشان می‌دهد.

11. بررسی امنیت پسورد
مرتبا باید امنیت پسورد را بررسی کنید. اگر از سیستم مدیریتی پسورد استفاده نمی‌کنید، همین حالا این کار را انجام دهید. باید سیستمی برای اتوماتیک کردن تغییر پسورد داشته باشید اگر ندارید باید از کاربران بخواهید، تغییر پسورد را دستی انجام دهند.

12. ارزیابی اکانت کاربران
به صورت دوره‌ای لیست اکانت کاربران را بررسی کنید. همچنین Permissionهای اکانت را بررسی کنید تا از درستی اختصاص آن به هر کاربر مطمئن شوید. هنگام این بررسی ممکن است لازم باشد دیتا و اطلاعات کاربر و اکانت را هم بررسی کنید. همچنین باید امکان پاک کردن اطلاعات کاربر قبلی به صورت دستی وجود داشته باشد.

13. بررسی امنیت کلی سرور
سیاست‌های امنیتی سرورتان را ارزیابی کنید تا مطمئن شوید در حال اجرا هستند. از ابزار امنیت شبکه برای تست شبکه از بیرون استفاده کنید. این کار باعث می‌شود جاهایی که از چشم شما دور مانده را تشخیص دهید و قبل از وقوع رخنه، آنها را بیابید. این بررسی‌ها را ماهانه یا فصلی انجام دهید.

 چرا سرویس دوره ای سرور مهم است؟

خرابی سرور علاوه بر تحمیل هزینه‌های بسیار زیاد، باعث توقف کار شما می‌شود، بنابراین بهتر است با انجام اقدامات پیشگیرانه از وقوع خرابی سرور جلوگیری کنید. برای جلوگیری از این تجربه ناخوشایند باید عواملی که سروتان را تهدید می‌کند، بشناسید؛ در ادامه این عوامل را بیان می‌کنیم:

گردوغبار: گردوغبار باعث افزایش دمای سرور و ایجاد خسارت جبران ناپذیر به شبکه می‌شود.
تغییر دمای استاندارد سرور: هر عاملی که باعث تغییر دمای سرور شود، روی کارایی و عملکرد سرور تاثیر می‌گذارد. افزایش دما باعث کاهش عمر مفید، خرابی قطعات دستگاه، افزایش مصرف برق، افزایش down time و افزایش هزینه تعمیر و نگهداری سرور می‌شود.
استفاده از مواد پاک کننده غیر استاندارد: استفاده از مواد پاک کننده معمولی برای تمیز کردن سرور نیز باعث ایجاد پوسیدگی، زنگ زدگی، داغ شدن و … می‌شود.

شروع با پیشران

شرکت پیشران صنعت ویرا با اساس نامه اتوماسیون صنعتی و کنترل ابزار دقیق و ساخت تابلوهای برق فشار قوی و ضعیف  از سال 92 تاسیس گشت و ازهمان ابتدا در حوزه کاربرد ابزار دقیق در bms و سپس تولید و ساخت آنها قدم نهاد و در ادامه  مسیر توانست با اتکا به تجربیات چندین ساله و استخدام نیروهای متخصص  برق عملا جزو شرکتهایی باشد که محصولات قابل اتکایی با عناوین  مانیتورینگ شرایط محیطی اتاق سرور -کنترلرهای دمای دیتا سنتر -دیتالاگرهای سردخانه و انبار -هشدار دهنده های دمای یخچال و فریزر و شمارشگرهای نمایشگاهی و فروشگاهی و تابلوهای برق متنوع با کاربردهای مختلف روانه بازار نماید در حال حاضر سیستمهای کنترل دما و رطوبت اتاق سرور این شرکت تنها سیستم مبتنی بر سخت افزار صنعتی plc-hmi  در ایران است.

 تماس با پیشران    رزومه وپروژها

مشتریان پیشران

شرکتها - موسسات - ادارات دولتی و مشتریان خصوصی پیشران صنعت ویرا موسسات مشتریان پیشران صنعت شرکت های مشتری پیشران صنعت ویرا ادارات مشتری پیشران صنعت ویرا مشتریان ما