Membuat pembagian kuota - AWS Batch

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Membuat pembagian kuota

Pembagian kuota berfungsi sebagai antrian virtual dalam antrian pekerjaan terkait yang diulang oleh AWS Batch penjadwal saat penjadwalan. Mereka memungkinkan administrator mengalokasikan kuota komputasi ke tim atau proyek melalui capacity limits , dengan konfigurasi eksplisit untuk strategi berbagi sumber daya.

Prasyarat

Sebelum membuat pembagian kuota, pastikan Anda memiliki:

  • Kebijakan penjadwalan manajemen kuota, lingkungan layanan, dan antrian pekerjaan — Kebijakan penjadwalan manajemen kuota, lingkungan layanan, dan antrian pekerjaan dengan manajemen kuota diaktifkan. Untuk informasi selengkapnya, lihat Buat sumber daya manajemen kuota.

  • Izin IAM — Izin untuk membuat dan mengelola AWS Batch pembagian kuota. Untuk informasi selengkapnya, lihat AWS Batch Kebijakan, peran, dan izin IAM.

Configure quota shares (AWS Batch console)
  1. Buka AWS Batch konsol di https://console.aws.amazon.com/batch/.

  2. Di panel navigasi, pilih Antrian pekerjaan dan pilih antrian pekerjaan yang diaktifkan manajemen kuota dari daftar. Pilih tautan nama antrian pekerjaan.

  3. Di bagian Berbagi kuota, pilih Buat pembagian kuota.

  4. Berikan Nama untuk pembagian kuota.

  5. Untuk batas Kapasitas, pilih Tambahkan batas kapasitas. Setidaknya satu batas kapasitas harus ditentukan.

    1. Pilih jenis Instance dari dropdown, dan atur Instance Maksimum yang telah dialokasikan oleh pembagian kuota ini.

    2. (Opsional) Pilih Tambahkan batas kapasitas dan ulangi untuk melampirkan paling banyak lima batas kapasitas.

  6. Untuk Pembagian Kapasitas, pilih bagaimana pembagian kuota ini membagi kapasitasnya dengan pembagian kuota lainnya dalam antrian pekerjaan yang sama:

    • Pilih Cadangan jika pembagian kuota tidak boleh meminjamkan atau meminjam komputasi idle.

    • Pilih Lend jika pembagian kuota dapat meminjamkan idle compute ke saham kuota lainnya.

    • Pilih Lend dan pinjam jika pembagian kuota dapat meminjamkan dan meminjam komputasi idle, dengan komputasi pinjamkan direklamasi melalui preemption cross-share saat pekerjaan tiba.

  7. (Opsional) Untuk preemption In-share, pilih apakah akan mengaktifkan atau menonaktifkan preemption in-share. Mengaktifkan preemption in-share memungkinkan pekerjaan dengan prioritas lebih tinggi untuk mendahului pekerjaan dengan prioritas lebih rendah yang sudah ada di,, atau status. SCHEDULED STARTING RUNNING Menonaktifkan preemption in-share berarti bahwa pekerjaan prioritas yang lebih tinggi akan menunggu kapasitas tersedia.

  8. Pilih Buat pembagian kuota.

Configure quota shares (AWS CLI)

Gunakan create-quota-share perintah untuk membuat pembagian kuota. Anda harus memilih strategi berbagi sumber daya dan apakah akan mengaktifkan preemption in-share.

Meminjamkan dan meminjam contoh

Contoh berikut membuat pembagian kuota yang dapat meminjamkan dan meminjam kapasitas idle, dengan batas pinjaman 100% dari batas kapasitas yang dikonfigurasi. Ini juga memungkinkan preemption in-share, sehingga pekerjaan prioritas yang lebih tinggi tidak menunggu pekerjaan prioritas rendah yang telah dijadwalkan dalam SageMaker AI untuk diselesaikan.

aws batch create-quota-share \ --quota-share-name lend_and_borrow_qs \ --job-queue my-qm-sagemaker-jq \ --capacity-limits maxCapacity=5,capacityUnit=ml.m6i.large \ --resource-sharing-configuration strategy=LEND_AND_BORROW,borrowLimit=100 \ --preemption-configuration inSharePreemption=ENABLED

Pinjamkan hanya contoh

Pembagian kuota dapat dikonfigurasi untuk hanya meminjamkan kapasitas idle, tetapi tidak meminjamnya sendiri. Contoh berikut berpasangan LEND dengan menonaktifkan preemption in-share.

aws batch create-quota-share \ --quota-share-name lend_qs \ --job-queue my-qm-sagemaker-jq \ --capacity-limits maxCapacity=8,capacityUnit=ml.m6i.large \ --resource-sharing-configuration strategy=LEND \ --preemption-configuration inSharePreemption=DISABLED

Contoh cadangan

Saham kuota juga dapat dikonfigurasi untuk mencadangkan kapasitas idle. Pekerjaan yang baru diajukan ketika pembagian kuota memiliki kapasitas idle dapat dimulai lebih cepat, tetapi pemanfaatan antrian secara keseluruhan akan lebih rendah jika pembagian kuota tidak memiliki pekerjaan.

aws batch create-quota-share \ --quota-share-name reserved_qs \ --job-queue my-qm-sagemaker-jq \ --capacity-limits maxCapacity=2,capacityUnit=ml.m6i.large \ --resource-sharing-configuration strategy=RESERVE \ --preemption-configuration inSharePreemption=DISABLED