OSSを使用した数千台規模のServer監視運用について話せます
¥30,000~
■背景
私は、システムエンジニアとして、数千台のサーバーを監視する大規模なシステムの設計、構築、運用に携わっていました。当時は、OSSを活用して、自動化された監視・運用の仕組みを構築することが主な業務でした。
当時サーバー数が急増していました。また、サービスの可用性や安定性を確保することが重要な課題でした。
このような背景から、私たちはOSSを使用して、サーバーの監視、ログの収集、障害検知、具体的にはNagios、OME、SIM、などの監視ツールを使用し自動化された監視・運用プロセスを構築
このシステムは、ビジネスの成長に対応するために、常に改善・拡張されていました。また、私たちは、障害発生時の対応手順や、監視ポイントの設定など、運用マニュアルを整備しており、運用のスムーズな継続性を確保していました。
このようなシステムの構築・運用においては、ビジネスの規模やフェーズ、サービスの性質などを考慮し、適切な監視ツールや自動化ツールの選定、監視ポイントの設定、運用マニュアルの整備などを行うことが重要です。
■話せること
このような大規模なシステムの構築・運用には、多くの課題がありましたが、特に以下のような点が相談に乗れそうな事柄となると考えられます。
監視ツールの選定
サーバー数が数千台にも及ぶ大規模なシステムの監視には、適切な監視ツールの選定が重要です。私たちは、ツールを選定しましたが、その選定理由や利用した際のメリットについて説明することができます。
運用整備
大規模なシステムの運用においては、障害発生時の対応手順や、監視ポイントの設定など、運用マニュアルの整備が重要です。私たちは、運用マニュアルを整備することで、運用のスムーズな継続性を確保していました。運用マニュアルの整備方法や効果について説明することができます。
自動化の導入
サーバー数が多くなるにつれ、手動での運用は非効率的となってきます。私たちは、自動化ツールを導入することで、監視や復旧作業を自動化し、運用効率を向上させました。自動化の導入方法や効果について説明することができます。