(IT) 監視アラートが止まったら

現場:「なんだかアラートメールがさっぱり来ないけど監視止まってない?」ベンダー:「すんません!監視止まってました!もう動いてるからOKっす!」オレたち:「いやいや、原因調べて再発防止策いれてよ」ベンダー:「監視プロセスを監視するプロセス入れたからもうだいじょぶっす!」オレたち:「・・・」(続く)

Posted by Ryo Shirao on 2016年2月24日

facebookにはさらっと冗談みたいに書いたけど、これ、問題が2つ隠れている。
重要度と緊急度が逆なので、簡単な方に目がいくけど、実はもう一つの方の
問題の方がでかいと思ってる。

簡単な方は当然、このベンダーが原因の調査もせず、症状に対するパッチだけ
当ててて、確かに監視が止まることは検知できるかもしれないが、根本的に
その監視が止まらないようにすることをしていないことが問題。
監視プログラムの中の問題なのか、他のプロセスが悪さをするなど、外側の
問題なのか、すら調べていない。
よそのお客さんの監視はどうしてるんだと、心配になってしまうくらい。
そして、「監視の監視」をしたならば、次は「「監視の監視」の監視」に
なることも誰でも想像できる。

ただ、お父さんが一番気になったのは、「ひっきりなしにアラートを受信して
捨ててる」こと。アラートがたくさん来てると確かに、動いてるのはわかる。
昔から旧車好きの間では「オイルが漏れるのはオイルが入っている証拠」と
よく笑い話にしていたが、これは潜在的トラブルを見て見ぬフリをするための
言い訳で、それと同じ構造だ(笑)。

※画像はイメージです

※画像はイメージです

ひっきりなしに受けたアラートのすべてをちゃんと対応しているわけもなく、
そうなら、「本当にちゃんと対応しないといけない」警告だけがメールで
来るようにしきい値なり、トリガーを変更すべきだろう。
本当に「本当にちゃんと対応しないといけない」アラートがひっきりなしに
来るシステムは壊れてるだろ、って話だ。
そうしないと、「本当にちゃんと対応しないといけない」アラートが来た時に
気が着かずに対応が遅れるのが一番いかん。フィルタやルールを駆使して
「本当にちゃんと対応しないといけない」ものだけが見えるようにするのも
一時的ならいいけど、いつもそうするなら、読まないアラートは来ないように
チューニングするのが正解と思う。
読むべきアラートを読み飛ばしてしまう「オオカミ少年アラート」は撲滅すべきだ。

「はい、これが白尾さんのPC、IDとパスワードはこれです」って言われて、
初めて開いたOutLookに4桁通のアラートが届いていたことと、今回の小言は
まったく関係ありません(棒)。

皆さんも適正なアラートを受け取ってますか?
(皆さんって誰だw)