コンテンツにスキップ

Netcool OMNIbus V8.1 — トラブルシュート

Netcool/OMNIbus V8.1 — トラブルシュート(既知の症状と対処)

症状 原因 対処手順 関連ログ・コマンド 出典
Probe が ObjectServer に接続できない interfaces ファイルに対象 ObjectServer が無い/ポート閉塞/FIPS/SSL 設定不一致 1) ObjectServer ホストで nco_objserv プロセスと listen ポートを確認
2) Probe ホストで $NCHOME/etc/omni.dat と interfaces を確認、必要なら nco_xigen で再生成
3) Probe を MessageLevel debug で起動し接続エラー詳細を取得
4) FIPS / SSL 利用時は GSKit 証明書とキー DB の整合を確認
nco_xigen, MessageLevel debug, nc_gskcmd S1, S4
ObjectServer で性能ボトルネック(応答遅延) alerts.status の行数過多/非効率な custom trigger/Netcool/Impact からの過剰問い合わせ 1) Profiling log(trigger statistics)を見て高コスト trigger を特定
2) 非効率 trigger を generic_clear ベースに書き直し、UPDATE 文の WHERE には主キー (Identifier) を使う
3) Netcool/Impact ポリシーの ObjectServer read/write を最小化
4) 必要なら Display ObjectServer 層を分離してユーザクライアント負荷を逃がす
trigger statistics log, profiling log, alter trigger S1
Bidirectional Gateway で resync が終わらない / イベントが片寄せされない Gateway cache が不整合/cache サイズ不足/mapping table 定義漏れ 1) ObjectServer Gateway のログで cache 状態と Status Serial を確認
2) cache サイズ・mapping table(複製対象)の定義を見直し
3) 必要なら Gateway を再起動して cache を再構築(resynchronization 走行)
4) bidirectional 構成で trigger 内容が左右で異なると差分が止まらない → 両系の triggers を一致
nco_g_objserv のログ, alerts.status SELECT で diff 確認 S1
Web GUI でイベントが更新されない IDUC が動作していない/Granularity が長すぎる/ObjectServer 側で IDUC 接続拒否 1) ObjectServer の Iduc.ListeningPort と Granularity を確認
2) Web GUI 側で IDUC 接続が確立しているかログで確認
3) AEN 利用時は nco_aen が起動済みかチェック
4) 必要なら Granularity を一時的に短縮して反応性をテスト
Iduc.ListeningPort, Granularity, nco_aen S1
EIF イベントが alerts.status に到着しない tivoli_eif.rules / eif_default.rules の include 漏れ/EIF アダプタの送信先誤設定/GSKit パス不整合 1) Probe for Tivoli EIF (nco_p_tivoli_eif) のログで rules file 読み込みを確認
2) tivoli_eif.rules の include 文(predictive_event.rules 等)の comment-out を確認
3) C-based EIF アプリは LIBPATH / SHLIB_PATH / LD_LIBRARY_PATH に GSKit を含む
4) ObjectServer 側 alerts.status のスキーマ拡張が反映されているか確認
nco_p_tivoli_eif log, tivoli_eif.rules, eif_default.rules S2, S3
alerts.status が肥大化してメモリ逼迫 delete_clears が無効化されている/hk_set_expiretime が止まっている/DisableDetails 未設定で alerts.details が膨張 1) trigger_group の有効状態を確認(housekeeping / delete_clears を enable)
2) ExpireTime と master.properties の値を確認
3) alerts.details が不要な Probe には DisableDetails=1 を設定
4) 必要に応じて Aggregation 層を導入し ObjectServer の役割を分離
alter trigger group, master.properties, DisableDetails S1
WAAPI スクリプトがエラー応答を返す Web GUI 側ユーザ権限不足/XML 構文不正/runwaapi の接続先設定誤り 1) runwaapi の出力 XML をファイル化してエラーコードを確認
2) Web GUI ユーザのロールに WAAPI 操作権限が割当てられているか確認
3) DASH 側 Web GUI ログでサーバ側応答を確認
4) コマンドファイル XML を最小例に縮退して切り分け
runwaapi -file, Web GUI server log S5
Probe / Gateway のプロセスを nco_pa_status で見ても起動表示にならない Process Agent (nco_pad) が未起動/PA.Username 認証失敗/プロセス定義エントリ漏れ 1) nco_pad が動作していることを ps -ef で確認
2) PA.Username / PA.Password を再設定
3) nco_pad の設定ファイル(プロセス定義エントリ)を確認しエントリを追加
4) nco_pa_start でプロセス起動を再試行
nco_pad, nco_pa_status, nco_pa_start, nco_pa_stop S1
MIB Manager で SNMP Trap 生成が打ち切られる Number of Traps の上限超過/MIB ファイル構文不一致 1) Generating SNMP traps の Number of Traps を必要数まで引き上げ
2) MIB Manager で MIB を再ロードし構文エラーがないか確認
3) 生成された rules を Probe rules file に統合し、Probe を reload
Netcool MIB Manager, Probe HTTP コマンド reload S1