Oracle Cluster Health Monitor (IPD/OS) (formerly known as Oracle Instantaneous Problem Detection - OS Tool (IPD/OS))

Oracle Instantaneous Problem Detection - OS Tool (IPD/OS) - wmo6hash::blogで書いていたツールの再メモです。

名前や呼び方

名前が Oracle Instantaneous Problem Detection - OS Tool (IPD/OS) から Oracle Cluster Health Monitor (IPD/OS) に変わりました。*1
細かいことですが

This tool (formerly known as Instantaneous Problem Detector for Clusters)

http://www.oracle.com/technology/products/database/clustering/ipd_download_homepage.html

とも…
最初はアイピーディーオーエスと呼ばれていたのですが、数ヶ月前からは Cluster Health Monitorが通称のようです。そのうち(IPD/OS) を省いた表記になるかもしれませんね。 

EasyBlogsとSurachart Opunさんのブログから

EasyBlogsの http://blog.easyteam.fr/2009/09/21/11gr2-oracle-cluster-health-monitor/にインストール方法などが掲載されています。
http://easyteam.files.wordpress.com/2009/09/clusterhealthmonitor.png?w=600&h=295スクリーンショットが crfgui 実行時の2ノードの Cluster Viewの例です。
crfguiは起動するとタイトルバーでは IPD Cluster Monitor V1.10という表記のウインドウアプリケーションです。
こんな感じでクラスタを構成した、正確には crfinst.pl -i でインストール対象にしてインストールしたノードのすべてが表示されます。

ここからNODENAMEの列のところでそれぞれのノード名をクリックすると、そのノードのNode Viewが見れますが、同ブログに掲載されているhttp://easyteam.files.wordpress.com/2009/09/clusterhealthmonitor-black.png?w=600&h=425スクリーンショットがNode Viewの例です。

ちなみに 1ノードにインストールして使うこともできるので、その1ノードでのインストールから起動停止とビューを見るまでの一連の利用例は Surachart Opun's Blog: Oracle Cluster Health Monitor(IPD/OS) に掲載されています。こちらのブログではコマンドラインツール oclumon dumpnodeview の実行結果も掲載されていますね。

READMEからいくつか

crfgui -d  "::" -m 

という historical mode で、ある時点からのViewを見れます。
さっきCPU使用率が上がっていたみたいだったから確認するかなーという時とかに使えます。

oclumonは

$ oclumon dumpnodeview -allnodes -s "2008-11-12 12:30:00"
                                 -e "2008-11-12 13:30:00"

which will dump stats for all nodes from 12:30 to 13:30 on Nov 12th, 2008.

とかで特定時間帯にしぼって見たりすることもできます。

ただし、元なる記録に残るデフォルトは 24時間分なので、たとえば 72時間分にしたいときは、格納する Berkeley DB のリサイズを行う例が

oclumon manage -bdb resize 259200

と載っています。

*1:READMEを含むツールの中身は crfpack-linux.zip内では2009/04/01で crfpack-winnt.zip内では2009/04/02のままで特に新しくなってはいません