MaxGauge(マックスゲージ)の迅速かつ確実な 障害原因追及
障害が発生した場合、障害原因の調査と対策を速やかに行わなければなりません。
正しい調査と原因把握が、同じ障害を2度と引き起こさないための正しい対処につながって行きます。
しかし、これらはいつも現場担当者の頭を悩ませます!
そこで!!MaxGaugeが、具現化への課題を克服し、理想の環境を確立します。
「データベースに負荷をかけること無く、稼動情報を収集する」
「インストール/初期設定を行うだけで障害の度に調査用の設定を行う必要もなし!」
※結果運用全体の生産性の向上を可能とします。
さらに、記録された稼動情報は、どのような加工もせず、専用の分析ツールで即座に効率の良い分析を始められます。また多くの情報は、レポートへ出力したり、EXCEL形式で出力も可能です。
MaxGaugeは障害対策のワークフロー構築の実現にお役立ちします!
障害対応を迅速に行うために
障害が起きた時、どうしますか?
発生したかを把握する「原因分析」が障害を乗り越える為に必須の事項です!
そして原因分析には、障害が起きた時点でのデータベースの稼働情報が絶対的に必要です。
しかし、実際にはその稼働情報の収集が完璧に行われているケースは多くないのが現状です。
何度も繰り返される再現待ち・・・
もちろん原因を特定する作業にかかる多くの工数、最優先で処理する必要となります。
他の業務が停止するケースもあります。また、ハイスキルのエンジニアの対応が必要となるケースが多く、一部担当者への作業負荷の集中を避ける事も大きな課題です。
再現待ちは、障害発生の損失や、障害対応のコストまで含め、爆弾を抱えたまま運用することとなり、運用エンジニアやユーザーの心的ストレスも多くなるうことでしょう。
理想の解決策と実現への課題
日々の稼動状況を「細かく」かつ「常時」収集し、いざ障害が起きた時に、収集した情報からその時、データベースに何が起きていたかを即座に把握できれば、再現待ちの必要も無くなります。
具体的に、以下の図のようにたくさんの作業やデータが必要です。

事実、この手法を確立することが、迅速な障害対応を実現できる環境を実現します。
しかし、何故このような環境の構築が多くの現場で成されていないのでしょうか?
実は、このような環境の実現にはクリアすべき技術的な問題が立ちはだかっているのです。
既存の技術の多くは、Oracle Databaseの稼動状態をデータベースへSQLで問い合わせる形で取得します。これはシステムに本来の動作には必要の無いアクセスを生み、想定外の負荷をデータベースに与える懸念が発生します。
この課題をどのようにクリアするかが、理想の障害対応の環境を実現するキーポイントとなります。
そこで!!MaxGaugeが、具現化への課題を克服し、理想の環境を確立します。

