タスクプレイブック¶
22 セルを詳細化(v9)。各セルが目的/前提/手順/検証/rollback の構造で、関連する 08-config-procedures / 09-incident-procedures / 11-special-features への直接リンクを含みます。
マトリクス: 習熟度(入門/中級/上級)× シーン(構築/日常運用/バックアップ/障害対応/性能/マイグレ/セキュリティ/スケーリング)
マトリクス(クリックで該当セクションへ)¶
空セル
入門 × マイグレ、入門 × スケーリング は意図的に空(中級以降推奨)。
入門 × 構築: OS インストール → ホスト名/IP/DNS/NTP の基本設定¶
目的: 新規 LPAR を業務利用可能な最低限の状態まで構築する。
前提:
- PowerVM HMC で LPAR 作成済(CPU/メモリ/I/O 割当て)
- AIX 7.3 インストールメディア(DVD or NIM サーバ)アクセス可能
- 命名・IP 設計済み
手順:
- インストール媒体から boot
- HMC で LPAR を起動、SMS メニューで boot device 選択
-
インストーラの「Default Install」または「Custom Install」を選択
-
基本ロケール・タイムゾーン設定
- ロケール: ja_JP.UTF-8(または C)
-
タイムゾーン: JST-9(日本時間)
-
インストール完了後の root ログイン
-
初回ログイン時にパスワード設定要求
-
ホスト名・IP 設定
chdev -l inet0 -a hostname=my-server.example.comchdev -l en0 -a netaddr=192.168.10.10 -a netmask=255.255.255.0-
詳細: cfg-hostname-ip
-
DNS リゾルバ設定
vi /etc/resolv.conf(domain / search / nameserver 行追加)-
詳細: cfg-dns
-
NTP 時刻同期
vi /etc/ntp.conf(server 行追加)startsrc -s xntpdchrctcp -S -a xntpd- 詳細: cfg-ntp
検証:
hostnameで新ホスト名が返るifconfig en0で新 IP 表示nslookup www.ibm.comで DNS 解決成功lssrc -ls xntpdで synchronised 表示
rollback: 再 install または mksysb から restore。個別設定は各 cfg-* 手順の rollback 参照。
関連: cfg-hostname-ip, cfg-dns, cfg-ntp
入門 × 日常運用: errpt / df 定期チェック、syslog 設定¶
目的: 新人 AIX 管理者の日課 — エラー監視と容量監視。
前提:
- root 権限でログイン可能
- errpt サブシステム稼働(既定で起動)
手順:
- 朝の errpt チェック
errpt | head -20(最新 20 件)errpt -d H | head(ハードウェアエラーのみ)-
新規ハードエラーがあれば inc-errpt-hardware-error の手順へ
-
df で容量チェック
df -g(GB 単位で全 FS 表示)- %Used 80% 超 → 容量対応検討
-
%Used 95% 超 → 緊急対応(cfg-fs-extend)
-
syslog 出力確認
tail /var/log/messages(直近のシステムログ)-
異常メッセージがあれば原因調査
-
syslog 設定の一覧
cat /etc/syslog.conf-
詳細設定: cfg-syslog
-
プロセス確認
ps -ef | head -20-
topas(リアルタイム監視) -
errpt 古いログのクリア(月次)
errclear 30(30 日より古いログを削除)
検証:
- errpt の新規ハードエラー件数を毎日記録
- df -g の使用率推移を週次レポート
- /var/log/messages サイズが想定範囲
rollback: 監視作業に rollback はない。誤って errclear した場合は restore 困難(バックアップから復元のみ)。
関連: cfg-syslog, inc-fs-full, inc-errpt-hardware-error
入門 × バックアップ: mksysb で月次 rootvg バックアップ¶
目的: DR 対策の最低限 — rootvg の bootable バックアップを定期取得。
前提:
- root 権限
- 保管先 FS(/backup 等)に rootvg 容量以上の空き
手順:
- 保管先空き確認
df -g /backup-
rootvg 実使用量の 1.5 倍以上推奨
-
mksysb 実行
mksysb -i -X -e /backup/$(hostname)_$(date +%Y%m%d).mksysb-
数十分〜数時間(データ量による)
-
完了確認
- 出力末尾:
0512-038 mksysb: Backup Completed Successfully. -
ls -lh /backup/*.mksysb | tail -
md5sum 取得
-
md5sum /backup/$(hostname)_$(date +%Y%m%d).mksysb > /backup/$(hostname)_$(date +%Y%m%d).md5 -
古いバックアップ削除(世代管理)
- 直近 3 世代保持、それ以前は削除:
-
find /backup -name "*.mksysb" -mtime +90 -delete -
詳細手順: cfg-mksysb-backup
検証:
- ファイルサイズが妥当(数 GB〜数十 GB)
restore -Tqf <mksysb>で目次表示成功- md5sum 値を別保管先と照合
rollback: 取得 mksysb の削除のみ(取得自体に rollback なし)。
入門 × 障害対応: boot 失敗・ログイン不可・FS full の三大障害¶
目的: AIX 管理者が最初に覚える 3 つの基本障害対応。
前提:
- root 権限(または別 root ユーザでアクセス可能)
- コンソール接続手段(HMC、シリアル等)
手順:
- boot 失敗(LED hang)
- HMC のオペレータパネルで LED コード記録
- SMS メニュー進入 → boot device 確認
- サービスモード boot → bosboot 再作成
-
ログイン不可(user is locked)
- 別 root セッションから:
lsuser -a unsuccessful_login_count account_locked alicechsec -f /etc/security/lastlog -a unsuccessful_login_count=0 -s alicechuser account_locked=false alice-
詳細: inc-login-locked
-
FS 100%(disk full)
df -g | sort -k5 -r | headで対象 FS 特定- 不要ファイル削除 or
chfs -a size=+1G /varで拡張 -
詳細: inc-fs-full
-
発生時の対応原則
- 慌てない(観察 → 仮説 → 対処)
- 操作内容を全て記録(後の報告書用)
- 不明な場合は IBM サポートに先に相談
検証:
- それぞれの個別手順の検証セクション参照
rollback: 個別手順の rollback セクション参照。
関連: inc-boot-fail-led, inc-login-locked, inc-fs-full
入門 × 性能: topas / vmstat / iostat の読み方¶
目的: 性能監視の基本コマンド 3 つを使えるようになる。
前提:
- root 権限(一般ユーザでも実行可能だが詳細情報には root 必要)
手順:
- topas でリアルタイム概観
topas(5 秒間隔で更新)- 画面の見方:
- 上部: CPU, Memory, Network, Disk のサマリ
- 中部: Network/Disk 統計
- 下部: プロセス一覧(CPU% 順)
-
q で終了
-
vmstat で時系列観測
vmstat 5 12(5 秒ごとに 12 回)-
重要列:
- r = 実行待ちプロセス数(Runqueue)
- b = ブロック中プロセス数
- avm = active virtual memory
- fre = free pages
- pi/po = page in/out(paging 発生指標)
- us/sy/id/wa = User/Kernel/Idle/Wait CPU%
-
iostat でディスク I/O
iostat 5 6(5 秒ごとに 6 回)-
重要列:
- %tm_act = ディスクビジー率(80% 超で飽和)
- tps = transactions per second
- Kbps = throughput
-
記録(後で参照する)
nmon -f -s 60 -c 30 -m /tmpで 60 秒×30 = 30 分記録-
.nmon ファイルを Excel で開ける
-
詳細解析: inc-perf-degradation
検証:
- topas で平常時の値をメモ(ベースライン)
- vmstat の wa が常時 30%+ なら I/O ボトルネック疑い
- iostat の %tm_act が 80%+ 継続なら ディスク飽和
rollback: 監視作業に rollback なし。
入門 × セキュリティ: ユーザ追加とパスワードポリシー、SSH 鍵配置¶
目的: セキュリティ運用の基本 — ユーザ管理と SSH 鍵認証。
前提:
- root 権限
- 新規ユーザ情報(名前、UID、グループ)
手順:
- 新規ユーザ追加
mkuser id=2001 home=/home/alice shell=/usr/bin/ksh alice-
詳細: cfg-user-add
-
初期パスワード設定
passwd alice-
pwdadm -f ADMCHG alice(次回ログイン時に変更強制) -
パスワードポリシー設定
chuser maxage=12 minlen=12 minother=2 alice-
全ユーザ default に:
chsec -f /etc/security/user -a minlen=12 -s default -
SSH 鍵配置(鍵認証)
- alice の home に
.ssh/作成:mkdir -p /home/alice/.ssh; chmod 700 /home/alice/.ssh - 公開鍵を
/home/alice/.ssh/authorized_keysに追加 -
所有権・権限:
chown -R alice:staff /home/alice/.ssh; chmod 600 /home/alice/.ssh/authorized_keys -
/etc/ssh/sshd_config 確認(パスワード認証無効化する場合)
PasswordAuthentication no-
refresh -s sshd -
ロック解除(試行回数超のとき)
- 詳細: cfg-passwd-policy
検証:
- alice で ssh ログイン成功
- 鍵認証が効いている(パスワード入力なしで接続)
lsuser -a maxage minlen aliceでポリシー反映
rollback: rmuser -p alice でユーザ削除、rm -rf /home/alice で home 削除。
関連: cfg-user-add, cfg-passwd-policy
中級 × 構築: VG/LV 設計、JFS2 FS 配置、rootvg ミラー化¶
目的: 業務系 LPAR の本格構築 — ストレージ設計と冗長化。
前提:
- root 権限
- 新規 PV(または extendvg 用)
- 業務要件に基づく FS 設計(容量・配置)
手順:
- 新規 VG 設計と作成
- 業務隔離するため datavg を新規作成
mkvg -S -y datavg -s 64 hdisk1(scalable VG、PP=64MB)-
詳細: cfg-vg-lv
-
業務 LV と FS の作成
- DB データ用:
mklv -y dblv -t jfs2 datavg 1000(64GB) - DB ログ用:
mklv -y dbloglv -t jfs2 datavg 200(12.8GB) -
crfs -v jfs2 -d dblv -m /db -A yes -p rw -a logname=INLINE -
rootvg ミラー化
- 未使用 PV(hdisk1)を rootvg に追加
extendvg rootvg hdisk1mirrorvg -S rootvg hdisk1(同期モード、数十分〜)bosboot -ad /dev/hdisk0; bosboot -ad /dev/hdisk1bootlist -m normal hdisk0 hdisk1-
MPIO 属性確認
lsattr -El hdiskN -a reserve_policy -a algorithm -a queue_depth- HA/LPM 環境なら
reserve_policy=no_reserve必須 -
詳細: cfg-mpio-tuning
-
FS マウント自動化
chfs -A yes /db(boot 時自動マウント)mountで確認
検証:
lsvg datavgで active、lsvg -l rootvgで全 LV が PPs=LPs*2mountで全 FS マウント済bootlist -m normal -oで hdisk0 hdisk1 両方表示
rollback: 個別手順の rollback セクション参照。VG 削除は varyoffvg → exportvg。
関連: cfg-vg-lv, cfg-rootvg-mirror, cfg-mpio-tuning
中級 × 日常運用: errnotify でメール通知、cron 自動化、パッケージ更新管理¶
目的: 監視・通知の自動化と、パッケージ更新の管理ルーチン化。
前提:
- root 権限
- メールサーバ疎通可能
- cron デーモン稼働
手順:
- errnotify でメール通知設定
- ハードエラー(Class=H)発生時に admin@example.com へ通知
-
詳細: cfg-errnotify
-
cron で定期ジョブ登録
-
crontab -eで編集: -
パッケージ更新管理
- 月次で
oslevel -s確認、新 SP リリース確認 - 適用前に必ず mksysb 取得
- preview 実行:
installp -p -aXd <source> all - 本適用:
installp -aXY -d <source> all -
トラブル時の対応
- メール送信失敗 → inc-mail-fail
- cron ジョブ実行されず → inc-cron-fail
検証:
- メール通知のテスト(疑似 errlogger イベント)
- /var/adm/cron/log で cron 実行記録
- lslpp -L で適用済 fileset 確認
rollback: 個別手順の rollback セクション参照。
関連: cfg-errnotify, cfg-package-install, inc-cron-fail
中級 × バックアップ: mksysb + savevg、NIM image 連携¶
目的: rootvg + 非 rootvg 両方のバックアップを取り、NIM 経由でリストア可能にする。
前提:
- root 権限
- NIM サーバ稼働
- 保管先 FS の十分な空き
手順:
- rootvg バックアップ
mksysb -i -X -e /backup/$(hostname)_rootvg_$(date +%Y%m%d).mksysb-
datavg バックアップ
savevg -if /backup/$(hostname)_datavg_$(date +%Y%m%d).savevg datavg-
rootvg と違い bootable ではないが、データ復旧は可能
-
NIM resource として登録
- NIM サーバ側で:
-
確認:
lsnim -t mksysb -
クライアント定義
- NIM サーバ側で対象 LPAR を NIM client として登録
-
nim -o define -t standalone -a platform=chrp ... -
bootable restore のテスト(DR 演習)
- HMC で別 LPAR を network boot
- NIM 経由で
nim -o bos_inst -a source=mksysb ... -
restore 成功確認
-
保管期間管理
- 直近 3 世代の rootvg/datavg バックアップを保持
find /backup -name "*.mksysb" -mtime +90 -delete
検証:
- ファイルサイズと md5sum 整合性
- DR 演習で別 LPAR への restore 成功
- NIM resource list に登録済
rollback: バックアップファイルの削除のみ。
中級 × 障害対応: 性能低下切り分け、NFS stale、core 解析¶
目的: 中級レベルの障害切り分け — 複数仮説を立てて検証する手法。
前提:
- 性能基準値(ベースライン)取得済み
- dbx / truss が使える
手順:
- 性能低下の切り分け
- topas で CPU/Mem/Disk/Net の利用率を観察
- vmstat / iostat / netstat で詳細統計
- svmon -G でメモリ詳細
- 詳細: inc-perf-degradation
-
NFS stale 解消
ls /mnt/nfsdataでStale NFS file handleエラーfuser -cuk /mnt/nfsdataで使用プロセス確認umount -f /mnt/nfsdata→mount /mnt/nfsdata-
詳細: inc-nfs-stale
-
core dump 解析
file <core>で生成プロセス確認dbx <executable> <core>で起動whereでスタックトレース表示-
詳細: inc-core-dump
-
記録と報告
- 切り分けの過程・仮説・検証結果を記録
- 報告書作成(before/after 比較表)
検証:
- 性能ベースラインに復帰
- NFS マウントが通常動作
- core dump の真因特定(dbx の where 出力)
rollback: 個別手順の rollback セクション参照。
関連: inc-perf-degradation, inc-nfs-stale, inc-core-dump
中級 × 性能: TCP バッファ・MPIO queue_depth・j2_inodeCacheSize 調整¶
目的: tunable 調整による性能改善。
前提:
- root 権限
- ベースライン値取得済み
- 業務影響を測定する手段(ツール)
手順:
- TCP 送受信バッファ拡大
- 高遅延 WAN や 10GbE 環境で効果
no -p -o sb_max=4194304no -p -o tcp_sendspace=1048576no -p -o tcp_recvspace=1048576-
詳細: cfg-tcp-buffers
-
MPIO queue_depth 拡大
- DS8000 環境で
chdev -l hdiskN -a queue_depth=64 -U -
詳細: cfg-mpio-tuning
-
j2_inodeCacheSize 調整
ioo -p -o j2_inodeCacheSize=400 -o j2_metadataCacheSize=400-
詳細: cfg-ioo-tuning
-
効果測定
- ベースラインと比較(topas / vmstat / iostat / netperf)
-
変更前後のスナップショット比較
-
業務影響確認
- アプリのレスポンスタイム測定
- スループット測定
- エラー率確認
検証:
- tunable が CUR/BOOT に反映(ioo -L 等)
- 性能指標の改善(実測値)
- errpt にエラー新規発生なし
rollback: 各 tunable を -d オプションで既定値に戻す。
関連: cfg-tcp-buffers, cfg-mpio-tuning, cfg-ioo-tuning
中級 × マイグレ: AIX 7.x → 7.3.4 マイグレ(premigration script、廃止 fileset)¶
目的: 旧 AIX バージョンから 7.3.4 への in-place マイグレーション。
前提:
- 現状 AIX バージョン確認(7.1 / 7.2 / 7.3.x)
- マイグレ前 mksysb 取得済
- 業務停止時間の調整済
手順:
- premigration script 実行
- 旧版上で
/usr/lpp/bos/premig_chk実行 -
チェック結果に従い廃止 fileset 削除等の準備
-
廃止 fileset の事前削除
installp -u rsct.vsd(VSD は AIX 7.3 で廃止)installp -u rsct.lapi.rte(LAPI は AIX 7.3 で廃止)-
installp -u powersc.ts(PowerSC Trusted Surveyor、WPAR 含めて) -
hd5 容量確保
- hd5 ≥ 40MB、ディスク先頭 4GB 内の連続 PP
-
不足なら LV 移動で連続領域確保
-
base media または NIM でマイグレーション開始
- SMS で boot device 選択
- インストーラで
Migration Installを選択 -
bos.dsc fileset を最初に installp(base media 利用時)
-
個別問題への対処
- Java 8 32bit SR6FP35 ロード不能 → SR6FP30 強制降格
-
bos.net.tcp.sendmail libcrypto エラー → update_all で 7.3.3+ へ進める
-
post-migration 確認
oslevel -slppchk -v- 業務動作確認
検証:
oslevel -sで 7300-04-XX-XXXXlppchk -vで整合エラーなし- 業務アプリ動作確認
rollback: premigration 段階なら旧設定で続行。マイグレ実行後は mksysb から restore のみ。
関連: cfg-package-install, cfg-mksysb-backup, feature-03-patch-apply
中級 × セキュリティ: errnotify 監査連動、syslog 集中転送、LDAP クライアント¶
目的: セキュリティ監視の集約化と、認証基盤統合。
前提:
- root 権限
- 集中ログサーバ稼働
- LDAP サーバ(AD or ISVD 等)
手順:
- errnotify を監査ログに連動
- errnotify で USER_LOCKED 等のセキュリティイベントを集中ログサーバへ転送
-
詳細: cfg-errnotify
-
syslog 集中転送
/etc/syslog.confに*.info @logserver.example.comrefresh -s syslogd-
詳細: cfg-syslog
-
LDAP クライアント設定
- bos.net.tcp.client を含む base fileset インストール済確認
/etc/security/ldap/ldap.cfg編集(LDAP サーバ IP、bind DN 等)mksecldap -c -h ldap-srv.example.com -a cn=admin,dc=example,dc=com -p adminpassstart-secldapclntd-
lsuser -R LDAP <ldap-user>で確認 -
AD/LDAP 連携時の追加設定
- TL3 SP1 で defaulthomedirectory / pwdalgorithm / defaultloginshell 拡張あり
- これらフィールドを ldap.cfg に追加
検証:
- errpt 重要イベントが集中ログサーバで受信
- /var/log/messages 相当のログがサーバ側で受信
- LDAP ユーザでログイン成功
rollback: 個別手順の rollback セクション参照。LDAP 連携は stop-secldapclntd で停止可。
関連: cfg-errnotify, cfg-syslog
中級 × スケーリング: FS 拡張、PV 追加、新規 VG 作成¶
目的: 業務拡大に伴うストレージ追加と容量拡張。
前提:
- ストレージ管理者から新 LUN 払い出し済
- 業務影響が許容される時間帯
手順:
- 新規 PV の認識
cfgmgr -vで新 hdisk 認識lspvで hdisk2 等が現れる- PVID 付与:
chdev -l hdisk2 -a pv=yes -
詳細: cfg-disk-add
-
既存 VG への追加
extendvg datavg hdisk2-
lsvg datavgで TOTAL PVs 増加確認 -
新規 VG の作成
- 業務隔離する場合は別 VG:
mkvg -S -y newvg -s 64 hdisk3-
詳細: cfg-vg-lv
-
FS 拡張
chfs -a size=+5G /var-
詳細: cfg-fs-extend
-
特集記事: feature-01-disk-to-fs
検証:
lspvに新 PV、activelsvg <vg>で TOTAL PPs 増加df -g <fs>で容量増加
rollback: 個別手順の rollback セクション参照。
関連: cfg-disk-add, cfg-vg-lv, cfg-fs-extend
上級 × 構築: NIM サーバ、CAA リポジトリ、PowerHA 連携、暗号化 rootvg¶
目的: 高可用・大規模環境の基盤構築 — 上級者向けの専門手順群。
前提:
- root 権限
- PowerVM 仮想化環境
- ストレージ・ネットワーク・HA に関する設計知識
手順:
- NIM サーバ構築
- bos.sysmgt.nim.master fileset 導入
- LPP_SOURCE 作成(base media + 必要 update を統合)
- SPOT 作成(ramdisk/カーネルイメージ)
- クライアント定義
-
nim -o define -t standalone -a platform=chrp ... -
CAA リポジトリ構築
- 共有ディスクを確保(NVMe ディスクは TL3 から対応)
mkcluster -n mycluster -m node1,node2 -r hdisk_repos-
RSCT 3.3.0.0 稼働確認
-
PowerHA 連携
- PowerHA SystemMirror インストール
- service IP / boot IP / persistent IP 設計
-
リソースグループ定義
-
PKS による rootvg 暗号化
- 新規/上書き install 時 BOS install メニューで暗号化対象 LV 選択
pksctlで初期化-
hdcryptmgrで運用管理 -
詳細手順
- 本サイトの 08-config-procedures では概要のみ。詳細は IBM Redbooks / 公式マニュアル参照。
検証:
- NIM 経由で別 LPAR に AIX install 成功
- CAA cluster:
lscluster -mで全ノード active - PowerHA:
clRGinfoでリソースグループ稼働
rollback: 個別手順は環境依存。原則として事前バックアップから restore。
関連: cfg-mksysb-backup, feature-03-patch-apply
上級 × 日常運用: snap でサポート用情報定期取得、性能ベースライン取得(nmon)¶
目的: 上級運用の日課 — IBM サポート対応とトレンド分析の準備。
前提:
- /tmp /var/adm/ras に十分な空き
- 性能ツール(nmon analyser 等)使用可能
手順:
- 月次 snap 取得
snap -rで旧データクリアsnap -acで全情報取得/tmp/ibmsupt/snap.pax.gzを IBM ECurep アップロード(PMR がある場合)-
詳細: inc-snap-collect
-
性能ベースライン取得
- 平日代表時間帯(朝 9:00-11:00、午後 14:00-16:00 等)に nmon 記録
nmon -f -s 60 -c 60 -m /var/adm/perf -F baseline_$(hostname)_$(date +%Y%m%d).nmon-
.nmon ファイルを Excel + nmon analyser で可視化
-
ベースライン値の記録
- CPU%, Memory%, Disk Busy%, Network throughput を月次記録
-
増加トレンドがあれば容量計画に反映
-
トラブル時の比較材料
- 性能劣化発生時にベースラインと比較
- 詳細: feature-02-perf-investigation
検証:
- snap.pax.gz が定期生成(ファイルサイズ妥当)
- nmon ベースラインファイルが月次蓄積
- ベースライン値の月次変動を把握
rollback: snap データ削除のみ。
関連: inc-snap-collect, feature-02-perf-investigation
上級 × バックアップ: NIM 連携の bootable mksysb、別 LPAR への restore リハーサル¶
目的: DR 演習による実証 — mksysb から bootable restore できることを毎月確認。
前提:
- NIM サーバ稼働
- DR 用予備 LPAR 確保
- 業務影響最小限の時間帯
手順:
- mksysb 取得(本番)
-
NIM resource として登録
- NIM サーバ側で:
-
nim -o define -t mksysb -a server=master -a location=... mksysb_resource_$(date +%Y%m%d) -
DR LPAR を NIM 経由 bos_inst
- HMC で予備 LPAR を network boot
- NIM サーバから
nim -o bos_inst -a source=mksysb ...実行 -
restore 完了まで数十分
-
restore 後の動作確認
- OS 起動成功
- hostname、IP が mksysb 取得時のものに復元
-
アプリ起動確認
-
DR 演習レポート
- 取得→復元→起動までの所要時間記録
- 失敗時の対処手順を更新
検証:
- 予備 LPAR で OS 起動成功
- 業務アプリ起動・動作確認
- RTO(復旧目標時間)達成確認
rollback: 予備 LPAR を削除(HMC で)。
関連: cfg-mksysb-backup, feature-03-patch-apply
上級 × 障害対応: kdb / dbx でカーネル / プロセスダンプ解析、HMC SRC コード解析¶
目的: 上級レベルの障害解析 — カーネルダンプとハードウェア診断。
前提:
- root 権限
- kdb / dbx の使用経験
- HMC アクセス権
手順:
- カーネルダンプ取得確認
sysdumpdev -lで primary が /dev/dumplv であること-
詳細: cfg-dump-device
-
kdb でカーネルダンプ解析
kdb /var/adm/ras/vmcore.0(kdb) status、(kdb) stat、(kdb) th等で状態確認-
スタックトレース、レジスタ、ロック状態確認
-
dbx でプロセスダンプ解析
dbx <executable> <core>-
詳細: inc-core-dump
-
HMC SRC コード解析
- HMC オペレータパネルで Service Reference Code (SRC) 確認
- 例:
BA210000= メモリ ECC エラー - SRC コード一覧から原因部位特定(IBM Power Systems Service Information)
-
IBM サポート連絡時に SRC を提示
-
snap 取得 + IBM サポート提供
snap -ac- 詳細: inc-snap-collect
検証:
- ダンプから真因特定(スタックトレース等)
- ハードウェア交換 → errpt に新規エラーなし
- 業務復旧
rollback: ハードウェア交換は IBM CE 対応。OS 側 rollback はない。
関連: cfg-dump-device, inc-core-dump, inc-errpt-hardware-error, inc-snap-collect
上級 × 性能: ASO/DSO 利用、large page 適用、AIO チューニング、NUMA awareness¶
目的: 上級性能チューニング — ハードウェア特性を活かした最適化。
前提:
- 性能ベースライン取得済み
- ASO/DSO・large page・AIO の概念理解
手順:
- ASO/DSO 有効化
- Active System Optimizer / Dynamic System Optimizer
lssrc -s asoで状態確認- 起動:
startsrc -s aso -
自動最適化(large page、prefetch)
-
large page(16MB pages)適用
vmo -L lgpg_size -L lgpg_regions- DB 等の大量メモリプロセス向けに事前確保
vmo -p -o lgpg_size=16777216 -o lgpg_regions=N-
アプリ起動時に LDR_CNTRL=LARGE_PAGE_DATA=Y で利用
-
AIO チューニング
aioo -L- DB(Oracle/Db2)等で AIO サーバ数調整
-
kernel I/O queue 最適化
-
NUMA awareness
- Power10 で NUMA topology が重要
lssrad -avで NUMA 構成確認-
WLM や プロセスの NUMA 配置最適化
-
計測と効果確認
- ベースラインと比較
- 詳細: feature-02-perf-investigation
検証:
- tunable が反映
- 性能指標の改善
- errpt にエラー新規発生なし
rollback: 各 tunable を -d で既定値に戻す。large page は再起動必要な場合あり。
関連: cfg-vmo-tuning, feature-02-perf-investigation
上級 × マイグレ: Live Kernel Update、Live Library Update、別 LPAR への nimadm migration¶
目的: 業務無停止でのカーネル/ライブラリ更新と、別 LPAR への migration。
前提:
- AIX 7.2 / 7.3 で LKU 対応
- TL3 で LLU 新規導入
- NIM サーバ稼働(nimadm 用)
手順:
- Live Kernel Update (LKU)
- 業務無停止でカーネル更新
- 互換性確認(TL/SP)
vi /etc/lvupdate.data(ipsec_auto_migrate=yes 等)geninstall(LKU mode) または HMC ベース LKU- blackout 時間中、アプリは一時停止
-
TL3 で性能改善・blackout 短縮
-
Live Library Update (LLU)
- TL3 新規導入
-
libc 等のライブラリを業務無停止で更新
-
別 LPAR への nimadm migration
- 並列マイグレ(複数 LPAR を同時に)
- PowerVC 連携で nimadm 自動化
-
TL3 で複数 LPAR 並列マイグレーション対応
-
完了確認
oslevel -sで新レベル-
lppchk -vで整合性
検証:
- 業務継続中に oslevel -s が新値
- lppchk -v で整合性 OK
- アプリ動作継続確認
rollback: LKU は事前 snapshot から戻し可能。nimadm はソース LPAR を使い続ける選択。
関連: cfg-package-install, cfg-mksysb-backup
上級 × セキュリティ: RBAC 設計、Trusted Execution + CHKSHOBJS、AIX Key Manager (PKS)、IPsec¶
目的: 上級セキュリティ — fine-grained 権限制御と暗号化機能。
前提:
- root 権限
- RBAC 設計経験
- PKS 鍵管理ポリシー策定済
手順:
- RBAC 設計
- 業務別 role 定義:
mkrole authorizations=aix.network.config.* netadmin - ユーザに role 割当:
chuser roles=netadmin alice -
swrole で role 切替:
swrole netadmin -
Domain RBAC(追加機能)
- リソースをドメイン別にグループ化
-
詳細: AIX 7.3 Security ガイド
-
Trusted Execution + CHKSHOBJS
- Trusted Signature Database(TSD)に実行ファイルハッシュ登録
trustchk -s ONで起動時検証有効化-
TL3 SP1 で CHKSHOBJS(共有 .o 検証)追加
-
AIX Key Manager (PKS)
- PKS 初期化:
pksctl init - 暗号化 LV 用鍵管理
-
PowerVM Platform Keystore と連携
-
IPsec 設定
- DH groups 14/19/20/21/24(TL3 で 20/21 追加)
- SHA2_512 hash
mkfiltで IPsec フィルタ作成- LKU 時の IPsec 維持:
lvupdate.dataにipsec_auto_migrate=yes
検証:
- role 切替後の権限確認
- trustchk で実行ファイル検証成功
- PKS 鍵が PowerVM platform keystore に保存
rollback: 個別機能ごとに rollback 手順あり。RBAC は role 削除、TE は trustchk -s OFF。
関連: cfg-user-add, cfg-passwd-policy
上級 × スケーリング: DLPAR でリソース動的増減、LPM で別物理機へ移動、scalable VG(1024 PV)¶
目的: PowerVM 基盤を活かした動的スケーリング。
前提:
- PowerVM HMC アクセス
- scalable VG 設計
- LPM 用 VIOS 構成
手順:
- DLPAR でメモリ追加
- HMC でメモリ +XGB を実行
- AIX 側で
prtconf -mで認識確認 -
vmo tunable 見直し(minperm/maxperm 等)
-
DLPAR で CPU 追加
- HMC で entitled processor units 増加
-
AIX 側で
lparstatで確認 -
LPM で別物理機へ移動
- 事前条件: reserve_policy=no_reserve(cfg-mpio-tuning)
- HMC で migration 実行
- 数分〜数十分で移動完了
-
cthags critical resource monitoring に注意
-
scalable VG で大量 PV
- scalable VG(既定 1024 PV / 256 LV / 32768 PP)
-
既存の original VG(32 PV 制限)からの拡張は不可、新規 VG として作成
検証:
- DLPAR 後 prtconf -m / lparstat で増加確認
- LPM 後 hostname/IP 維持
- scalable VG: lsvg で MAX PVs=1024 表示
rollback: DLPAR は逆操作で減少。LPM は元物理機へ再 LPM。
関連: cfg-vg-lv, cfg-disk-add, cfg-fs-extend, cfg-mpio-tuning