

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# のサービス環境の状態とライフサイクル AWS Batch
<a name="service-environment-states"></a>

サービス環境は、現在の運用ステータスと SageMaker トレーニングジョブを処理する準備状況を示すライフサイクル状態を維持します。これらの状態を理解することで、サービス環境の健全性をモニタリングし、設定の問題をトラブルシューティングし、信頼性の高いジョブ処理を確実に行えます。状態管理システムは、SageMaker トレーニングジョブ統合ならではの要件に対応しつつ、コンピューティング環境からの確立されたパターンに従います。

サービス環境の状態は、設定の検証、リソースの可用性、運用ヘルスチェック AWS Batch に基づいて、 によって自動的に管理されます。物理インフラストラクチャを管理するコンピューティング環境とは異なり、サービス環境は設定の検証と SageMaker AI サービスとの統合準備に重点を置いています。状態遷移は、サービス環境が SageMaker トレーニングジョブを正常に送信および管理できるかどうかを可視化します。

# サービス環境の状態の定義
<a name="service-environment-state-definitions"></a>

サービス環境は、現在の運用ステータスと SageMaker トレーニングジョブを処理する準備状況を示す 4 つの可能な状態のいずれかになります。個々の状態は、最初の作成から運用準備、最終的な削除まで、サービス環境ライフサイクルの具体的なフェーズを表します。各状態とその意味を次表に示します。


| State | 説明 | 
| --- | --- | 
| CREATING |  初期状態は、サービス環境を作成する状態です。この状態で、 は設定パラメータ AWS Batch を検証し、SageMaker AI サービスとの統合を確立します。サービス環境はジョブを処理できず、それに関連付けられたジョブキューはサービスジョブの送信を受け入れません。作成プロセスは通常、適切に設定されたサービス環境では数秒以内に完了します。  | 
| VALID |  運用状態は、サービス環境がすべての設定検証チェックに合格し、SageMaker トレーニングジョブを処理する準備が整っていることを示す状態です。この状態は、サービス環境設定が正しく、必要なアクセス許可がすべて設定されており、ユーザーに代わって SageMaker AI にジョブを正常に送信 AWS Batch できることを示します。サービス環境では、運用ライフサイクルのほとんどがこの状態になります。  | 
| INVALID |  サービス環境において、SageMaker トレーニングジョブの処理を妨げる設定またはアクセス許可の問題が発生したことを示す状態。無効なサービス環境に関連付けられたジョブキューは、根本的な問題が解決されるまで、新しいサービスジョブの送信を処理できません。  | 
| DELETING |  サービス環境の削除をリクエストしたときに発生する状態。この状態の間、 AWS Batch はアクティブな SageMaker トレーニングジョブが環境に関連付けられていないことを確認し、必要なクリーンアップオペレーションを実行します。この状態のサービス環境は新しいジョブ送信を処理できず、関連するすべてのリソースが適切にクリーンアップされると削除プロセスが完了します。  | 

## サービス環境の状態の遷移
<a name="service-environment-state-transitions"></a>

サービス環境の状態の遷移は、設定の変更、検証結果、運用状態のモニタリングに基づいて自動的に行われます。 AWS Batch サービスは、サービス環境のヘルスを継続的にモニタリングし、それに応じて状態を更新します。これらの遷移について理解することで、設定変更がいつ有効になるか、および無効な状態を引き起こす問題を解決する方法を予測できます。

作成と検証が成功すると、サービス環境は `CREATING` から `VALID` に遷移します。この遷移により、すべての設定パラメータが正しく、必要な IAM アクセス許可が正しく設定され、サービス環境が SageMaker AI サービスと正常に統合できることを確認します。`VALID` 状態になると、関連付けられたジョブキューはサービスジョブの送信の処理を開始できます。

サービス環境は、設定検証が失敗したとき、または依存関係が使用できなくなったときに、`VALID` から `INVALID` に遷移します。これは、IAM ロールの変更、クォータに違反する容量制限の変更、またはサービス環境の機能に影響する外部リソースの変更が原因で発生する可能性があります。[ステータス理由] フィールドには、無効な状態の原因に関する具体的な詳細が表示されます。

根本的な問題が解決されると、サービス環境は `INVALID` から `VALID` に戻る形で遷移することができます。これには、IAM アクセス許可の更新、キャパシティ設定の修正、必要な AWS リソースへのアクセスの復元が含まれる場合があります。遷移は通常、設定の問題が対処されたことを AWS Batch が検出すると自動的に行われます。