View a markdown version of this page

AWSSupport-RequestSageMakerLimitIncrease - AWS Systems Manager Referensi Buku Runbook Otomasi

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

AWSSupport-RequestSageMakerLimitIncrease

Deskripsi

AWSSupport-RequestSageMakerLimitIncreaseRunbook memungkinkan pengiriman massal beberapa permintaan peningkatan kuota Amazon SageMaker AI (SageMaker AI) dalam satu operasi, merampingkan manajemen kuota untuk beban kerja pembelajaran mesin skala besar. Runbook memvalidasi setiap permintaan terhadap kuota layanan SageMaker AI yang dapat disesuaikan, merutekan permintaan dalam ambang persetujuan otomatis untuk pemrosesan segera, dan membuat kasus AWS Support untuk permintaan yang memerlukan peninjauan manual. Peningkatan kuota diterapkan di AWS Wilayah yang sama tempat runbook dijalankan.

penting

Runbook ini tidak mendukung permintaan peningkatan kuota untuk instans komputasi khusus termasuk jenis instans P4, P5, dan Trainium. Untuk jenis instans ini, kirimkan permintaan peningkatan kuota individual melalui konsol AWS Service Quotas atau AWS Support.

Runbook berhenti hingga satu jam sambil menunggu persetujuan dari kepala sekolah yang ditunjuk melalui pemberitahuan Amazon Simple Notification Service (Amazon SNS). Tinjau output ApproveQuotaCodeLimitMapping langkah dengan cermat sebelum menyetujui, karena kenaikan kuota yang disetujui tidak dapat dibalik.

Jalankan Otomasi ini (konsol)

Jenis dokumen

Otomatisasi

Pemilik

Amazon

Platform

Linux,macOS, Windows

Parameter

  • AutomationAssumeRole

    Jenis: AWS::IAM::Role: :Arn

    Deskripsi: (Opsional) Nama Sumber Daya Amazon (ARN) peran AWS Identity and Access Management (IAM) yang memungkinkan Otomasi (Systems AWS Systems Manager Manager) untuk melakukan tindakan atas nama Anda. Jika tidak ada peran yang ditentukan, Systems Manager Automation menggunakan izin pengguna yang memulai runbook ini.

  • ResourcesMapping

    Jenis: StringList

    Deskripsi: (Wajib) Kuota layanan SageMaker AI meningkat, ditentukan sebagai nilai yang dipisahkan titik dua. Mendukung tiga format:

    • Category:Resource:NewValue— ketika nama kategori dan sumber daya tersedia. Contoh: spot-training-job:ml.c4.xlarge:25

    • Resource:NewValue— ketika hanya nama sumber daya yang tersedia. Contoh: max_number_of_experiment_trial_associations:501

    • QuotaCode:NewValue— saat menggunakan kode kuota langsung. Contoh: L-9xAxx23x:25

    Anda dapat mencampur format dalam permintaan yang sama, dipisahkan dengan koma. Maksimal 50 item. Contoh: studio:CodeEditor-ml.r6id.large:787,spot-training-job:ml.c4.xlarge:34,L-99AEC235:2

  • SNSTopicArn

    Tipe: String

    Deskripsi: (Wajib) ARN topik Amazon SNS digunakan untuk mengirim pemberitahuan persetujuan selama eksekusi otomatisasi.

  • ApproverIAM

    Jenis: StringList

    Deskripsi: (Wajib) Daftar kepala sekolah yang AWS diautentikasi yang dapat menyetujui atau menolak permintaan peningkatan kuota. Maksimal 10 pemberi persetujuan. Format yang diterima: nama pengguna IAM, ARN pengguna IAM, ARN peran IAM, atau IAM menganggap ARN pengguna peran.

  • MinimumRequiredApprovals

    Jenis: Integer

    Nilai yang valid: 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10

    Default: 1

    Deskripsi: (Opsional) Jumlah minimum persetujuan yang diperlukan untuk melanjutkan otomatisasi. Tidak dapat melebihi jumlah pemberi persetujuan yang ditentukan dalamApproverIAM.

Izin IAM yang diperlukan

AutomationAssumeRoleParameter memerlukan tindakan berikut untuk menggunakan runbook dengan sukses.

  • servicequotas:ListServiceQuotas

  • servicequotas:RequestServiceQuotaIncrease

  • servicequotas:GetRequestedServiceQuotaChange

  • sns:Publish

  • ssm:SendAutomationSignal

Langkah Dokumen

  1. VerifyCategoriesAndResources- Memvalidasi semua kategori dan sumber daya yang ditentukan terhadap kuota layanan SageMaker AI yang dapat disesuaikan menggunakan Service AWS Quotas API. Mengonfirmasi bahwa setiap kategori dan nama sumber daya ada dan dapat dimodifikasi, dan mengidentifikasi permintaan di mana batas baru lebih rendah dari nilai saat ini.

  2. BranchOnValidCategoriesFound- Memeriksa apakah ada pemetaan kuota yang valid ditemukan. Jika pemetaan yang valid ada, lanjutkan ke. ApproveQuotaCodeLimitMapping Jika tidak, lompat langsung keGenerateSummaryReport.

  3. ApproveQuotaCodeLimitMapping- Menyiapkan pesan persetujuan terperinci yang menunjukkan permintaan valid yang siap diproses, permintaan tidak valid dengan penjelasan (seperti batas yang lebih rendah dari nilai saat ini atau kode kuota yang tidak didukung), dan rincian lengkap dari semua permintaan peningkatan kuota untuk ditinjau sebelum persetujuan.

  4. WaitingForApproval- Menjeda otomatisasi dan mengirimkan pemberitahuan persetujuan ke topik Amazon SNS yang ditentukan. Penyetuju yang ditunjuk harus meninjau output ApproveQuotaCodeLimitMapping langkah dan menyetujui atau menolak permintaan. Langkah ini akan habis setelah 3600 detik (satu jam) jika tidak ada tindakan yang diambil.

  5. RequestQuotaIncreases- Mengirimkan permintaan peningkatan kuota individual untuk setiap sumber daya yang valid melalui Service AWS Quotas API. Permintaan dilakukan dengan kecepatan satu per detik untuk mencegah pelambatan API. Menangani pengecualian API dengan percobaan ulang eksponensial.

  6. WaitForRequestQuotaIncreaseResults- Polling status semua permintaan peningkatan kuota yang diajukan hingga tidak ada yang tetap dalam PENDING negara bagian. Status terminal yang diterima adalahCASE_OPENED,,APPROVED,DENIED, NOT_APPROVEDCASE_CLOSED, danINVALID_REQUEST.

  7. GetRequestQuotaIncreaseResults- Mengambil status akhir dari semua permintaan peningkatan kuota yang dikirimkan dari Service AWS Quotas API dan memetakan IDs kasus dukungan ke sumber daya yang sesuai dan IDs permintaan pelaporan.

  8. GenerateSummaryReport- Menyusun ringkasan komprehensif dari semua permintaan peningkatan kuota dan hasilnya, termasuk jumlah permintaan total, detail per permintaan, kasus dukungan IDs untuk permintaan yang memerlukan peninjauan manual, dan langkah selanjutnya yang dapat ditindaklanjuti.

Keluaran

GenerateSummaryReport.SummaryReport- Ringkasan lengkap dari semua permintaan peningkatan kuota, statusnya, dan kasus dukungan apa pun yang IDs dibuat untuk tinjauan manual.