[CentOS6][SOS JobScheduler] JobChain の異常時リトライ(手動)


Create: 2013/02/27
LastUpdate: 2013/03/27
[ メニューに戻る ]

下図の環境で、依存関係のある複数のジョブをHost-A、Host-Bで順番に実行してみます。
環境の詳細を知りたい場合は、メニューに戻って構築手順を参照してください。


ここでは、上図のJOB1とJOB3を OrderJob で作成し、JobChain で依存関係を定義します。このJOB1を、わざと異常終了させて処理を中断し、JOCから手動でリトライ実行してみます。
手順については、「JobScheduler QuickStart (PDF)」を参考にしました。
JOEを使用して OrderJob、JobChain の定義とリトライ設定を行い、JOCを使用してJobChainの計画実行(即時)、リトライ実行、結果の確認を行います。
JOEの環境(ホットフォルダなど)は、「 [CentOS6][SOS JobScheduler] Host-A、Host-B で複数ジョブ(JobChain)の計画実行(即時)」 で作成したものを流用します。

1.ジョブとJobChain の定義


[CentOS6][SOS JobScheduler] Host-A、Host-B で複数ジョブ(JobChain)の計画実行(即時)」と同じ手順で、OrderJob(job1/job3)とJobChain(jon_chain1)を作成します。
まず、JobChain で "job1" が異常終了した場合は、処理を中断(サスペンド)するように定義します。
"job_chain1" の [Steps/Nodes]をクリックすると、下図のような画面が表示されます。
一覧で、[step1] をクリックし、[OnError] で "suspend" を選択して、[Apply Chain Node]ボタンで確定します。


次に "step1" で実行する "job1" のスクリプトを、"exit 5" で異常終了するようにします。


[Options]タブを開き、[Stop on Error] のチェックを外します。
[Stop on Error]をチェックしていると、リトライ実行のスケジューリングがされません。


2.JobChain 実行と実行結果確認


JOCで [Job Chains]タブを開くと、下図のように "job_chain1" が表示されます。


"job_chain1" を右クリックして、メニューから [Add order] を選択します。


下図のポップアップが表示されたら、[submit]ボタンをクリックします。


下図のように、"job_chian1"がスケジューリングされて、直ちに実行されますが、"job1"が異常終了して、サスペンドします。


異常終了した "step1" をリトライ実行したい場合は、"suspended" と表示されている行を右クリックして、メニューから [Resume order]を選択します。


実行結果を参照する手順は、「 [CentOS6][SOS JobScheduler] JobChain の異常時リトライ(自動)」と同じです。