View a markdown version of this page

AWSSupport-RequestSageMakerLimitIncrease - AWS Systems Manager オートメーションランブックリファレンス

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

AWSSupport-RequestSageMakerLimitIncrease

説明

AWSSupport-RequestSageMakerLimitIncrease ランブックでは、1 回のオペレーションで複数の Amazon SageMaker AI (SageMaker AI) クォータ引き上げリクエストを一括送信できるため、大規模な機械学習ワークロードのクォータ管理が合理化されます。ランブックは、調整可能な SageMaker AI サービスクォータに対して各リクエストを検証し、自動承認しきい値内にリクエストをルーティングして即時処理を行い、手動レビューが必要なリクエスト AWS のサポートケースを作成します。クォータの引き上げは、ランブックが実行されるのと同じ AWS リージョンに適用されます。

重要

このランブックは、P4, P5および Trainium インスタンスタイプを含む特殊なコンピューティングインスタンスのクォータ引き上げリクエストをサポートしていません。これらのインスタンスタイプについては、 AWS Service Quotas コンソールまたは AWS サポートを通じて個別のクォータ引き上げリクエストを送信します。

ランブックは、Amazon Simple Notification Service (Amazon SNS) 通知を介して指定されたプリンシパルからの承認を待つ間、最大 1 時間一時停止します。承認されたクォータの増加は元に戻すことができないため、承認する前にApproveQuotaCodeLimitMappingステップ出力を慎重に確認してください。

このオートメーションを実行する (コンソール)

ドキュメントタイプ

オートメーション

[所有者]

Amazon

[Platforms] (プラットフォーム)

Linux、macOS、Windows

パラメータ

  • AutomationAssumeRole

    タイプ: AWS::IAM::Role::Arn

    説明: (オプション) (Systems Manager) Automation が AWS Identity and Access Management ユーザーに代わってアクションを実行することを許可する (IAM) ロールの Amazon リソースネーム AWS Systems Manager (ARN)。ロールを指定しない場合、Systems Manager Automation はこのランブックを開始するユーザーのアクセス許可を使用します。

  • ResourcesMapping

    タイプ: StringList

    説明: (必須) 増加する SageMaker AI サービスクォータ。コロン区切り値として指定されます。次の 3 つの形式をサポートします。

    • Category:Resource:NewValue — カテゴリ名とリソース名の両方が使用可能な場合。例: spot-training-job:ml.c4.xlarge:25

    • Resource:NewValue — リソース名のみが使用可能な場合。例: max_number_of_experiment_trial_associations:501

    • QuotaCode:NewValue — direct クォータコードを使用する場合。例: L-9xAxx23x:25

    カンマで区切って、同じリクエストで形式を混在させることができます。最大 50 項目。例: studio:CodeEditor-ml.r6id.large:787,spot-training-job:ml.c4.xlarge:34,L-99AEC235:2

  • SNSTopicArn

    タイプ: 文字列

    説明: (必須) 自動化の実行中に承認通知を送信するために使用される Amazon SNS トピックの ARN。

  • ApproverIAM

    タイプ: StringList

    説明: (必須) クォータ引き上げリクエストを承認または拒否できる AWS 認証済みプリンシパルのリスト。最大 10 人の承認者。使用できる形式: IAM ユーザー名、IAM ユーザー ARN、IAM ロール ARN、または IAM 継承ロールユーザー ARN。

  • MinimumRequiredApprovals

    タイプ: 整数

    有効な値: 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10

    デフォルト: 1

    説明: (オプション) 自動化を再開するために必要な承認の最小数。で定義されている承認者の数を超えることはできませんApproverIAM

必要な IAM アクセス許可

AutomationAssumeRole パラメータでは、ランブックを正常に使用するために、次のアクションが必要です。

  • servicequotas:ListServiceQuotas

  • servicequotas:RequestServiceQuotaIncrease

  • servicequotas:GetRequestedServiceQuotaChange

  • sns:Publish

  • ssm:SendAutomationSignal

ドキュメントステップ

  1. VerifyCategoriesAndResources - Service AWS Service Quotas API を使用して、指定されたすべてのカテゴリとリソースを調整可能な SageMaker AI サービスクォータと照合します。各カテゴリとリソース名が存在し、変更可能であることを確認し、新しい制限が現在の値よりも低いリクエストを特定します。

  2. BranchOnValidCategoriesFound - 有効なクォータマッピングが見つかったかどうかを確認します。有効なマッピングが存在する場合は、 に進みますApproveQuotaCodeLimitMapping。それ以外の場合、 は に直接スキップしますGenerateSummaryReport

  3. ApproveQuotaCodeLimitMapping - 処理の準備が整った有効なリクエスト、説明付きの無効なリクエスト (現在の値よりも低い制限やサポートされていないクォータコードなど)、および承認前にレビューするすべてのクォータ引き上げリクエストの完全な内訳を示す詳細な承認メッセージを準備します。

  4. WaitingForApproval - オートメーションを一時停止し、指定された Amazon SNS トピックに承認通知を送信します。指定された承認者は、ApproveQuotaCodeLimitMappingステップ出力を確認し、リクエストを承認または拒否する必要があります。このステップは、アクションが実行されない場合、3600 秒 (1 時間) 後にタイムアウトします。

  5. RequestQuotaIncreases - AWS Service Quotas API を介して、有効なリソースごとに個別のクォータ引き上げリクエストを送信します。API スロットリングを防ぐために、リクエストは 1 秒あたり 1 回のペースで行われます。エクスポネンシャル再試行で API 例外を処理します。

  6. WaitForRequestQuotaIncreaseResults - 送信されたすべてのクォータ引き上げリクエストのステータスを、どのリクエストも PENDING状態になるまでポーリングします。使用できるターミナルステータスは、CASE_OPENED、、APPROVEDDENIEDNOT_APPROVEDCASE_CLOSED、および ですINVALID_REQUEST

  7. GetRequestQuotaIncreaseResults - AWS Service Quotas API から送信されたすべてのクォータ引き上げリクエストの最終ステータスを取得し、サポートケース IDs を対応するリソースとレポート用のリクエスト IDs にマッピングします。

  8. GenerateSummaryReport - すべてのクォータ引き上げリクエストとその結果の包括的な概要をコンパイルします。これには、リクエストの合計数、リクエストごとの詳細、手動レビューが必要なリクエストのサポートケース IDs、実行可能な次のステップが含まれます。

[出力]

GenerateSummaryReport.SummaryReport - すべてのクォータ引き上げリクエスト、そのステータス、および手動レビュー用に作成されたサポートケース IDsの包括的な概要。