

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Pagar pembatas penyebaran untuk memperbarui model dalam produksi
<a name="deployment-guardrails"></a>

Pagar pembatas penerapan adalah serangkaian opsi penerapan model di Inferensi SageMaker AI Amazon untuk memperbarui model pembelajaran mesin Anda dalam produksi. Dengan menggunakan opsi penerapan yang dikelola sepenuhnya, Anda dapat mengontrol sakelar dari model saat ini dalam produksi ke yang baru. Mode perpindahan lalu lintas dalam penerapan biru/hijau, seperti kenari dan linier, memberi Anda kontrol terperinci atas proses perpindahan lalu lintas dari model Anda saat ini ke yang baru selama pembaruan. Ada juga perlindungan bawaan seperti auto-rollback yang membantu Anda menangkap masalah lebih awal dan secara otomatis mengambil tindakan korektif sebelum berdampak signifikan pada produksi.

Pagar pembatas penyebaran memberikan manfaat berikut:
+ **Keamanan penerapan saat memperbarui lingkungan produksi.** Pembaruan regresif ke lingkungan produksi dapat menyebabkan downtime dan dampak bisnis yang tidak direncanakan, seperti peningkatan latensi model dan tingkat kesalahan yang tinggi. Pagar pembatas penerapan membantu Anda mengurangi risiko tersebut dengan menyediakan praktik terbaik dan pagar keselamatan operasional bawaan.
+ **Penyebaran yang dikelola sepenuhnya.** SageMaker AI menangani pengaturan dan mengatur penerapan ini dan mengintegrasikannya dengan mekanisme pembaruan titik akhir. Anda tidak perlu membangun dan memelihara mekanisme orkestrasi, pemantauan, atau rollback. Anda dapat memanfaatkan SageMaker AI untuk mengatur dan mengatur penerapan ini dan fokus pada pemanfaatan ML untuk aplikasi Anda.
+ **Visibilitas.** Anda dapat melacak kemajuan penerapan Anda melalui [DescribeEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeEndpoint.html)API atau melalui Amazon CloudWatch Events (untuk [titik akhir yang didukung](deployment-guardrails-exclusions.md)). Untuk mempelajari lebih lanjut tentang peristiwa di SageMaker AI, lihat bagian Perubahan status penerapan titik akhir di. [Peristiwa yang dikirimkan Amazon SageMaker AI ke Amazon EventBridge](automating-sagemaker-with-eventbridge.md) Perhatikan bahwa jika titik akhir Anda menggunakan salah satu fitur di [Pengecualian](deployment-guardrails-exclusions.md) halaman, Anda tidak dapat menggunakan CloudWatch Acara.

**catatan**  
Pagar pembatas penerapan hanya berlaku untuk [Inferensi asinkron](async-inference.md) dan [Inferensi waktu nyata](realtime-endpoints.md) tipe titik akhir.

## Cara memulai
<a name="deployment-guardrails-get-started"></a>

Kami mendukung dua jenis penerapan untuk memperbarui model dalam produksi: penerapan biru/hijau dan penerapan bergulir.
+ [Deployment Blue/Green](deployment-guardrails-blue-green.md): Anda dapat mengalihkan lalu lintas dari armada lama Anda (armada biru) ke armada baru (armada hijau) dengan pembaruan. Penerapan biru/hijau menawarkan [beberapa](https://docs.aws.amazon.com/sagemaker/latest/dg/deployment-guardrails-blue-green.html) mode perpindahan lalu lintas. Mode perpindahan lalu lintas adalah konfigurasi yang menentukan bagaimana SageMaker AI merutekan lalu lintas titik akhir ke armada baru yang berisi pembaruan Anda. Mode perpindahan lalu lintas berikut memberi Anda berbagai tingkat kontrol atas proses pembaruan titik akhir:
  + [Gunakan sekaligus pergeseran lalu lintas](deployment-guardrails-blue-green-all-at-once.md)menggeser semua lalu lintas titik akhir Anda dari armada biru ke armada hijau. Setelah lalu lintas bergeser ke armada hijau, CloudWatch alarm Amazon Anda yang telah ditentukan sebelumnya mulai memantau armada hijau untuk jangka waktu tertentu (periode *pemanggangan*). Jika tidak ada alarm yang tersandung selama periode pemanggangan, maka SageMaker AI menghentikan armada biru.
  + [Gunakan perpindahan lalu lintas kenari](deployment-guardrails-blue-green-canary.md)menggeser satu bagian kecil dari lalu lintas Anda (*kenari*) ke armada hijau dan memantaunya untuk periode pemanggangan. Jika kenari berhasil di armada hijau, maka SageMaker AI menggeser sisa lalu lintas dari armada biru ke armada hijau sebelum mengakhiri armada biru.
  + [Gunakan perpindahan lalu lintas linier](deployment-guardrails-blue-green-linear.md)menyediakan lebih banyak penyesuaian atas jumlah langkah pergeseran lalu lintas dan persentase lalu lintas yang harus digeser untuk setiap langkah. Sementara pergeseran kenari memungkinkan Anda menggeser lalu lintas dalam dua langkah, pergeseran linier memperluas ini ke *n* langkah spasi linier.
+ [Gunakan penerapan bergulir](deployment-guardrails-rolling.md): Anda dapat memperbarui titik akhir Anda karena SageMaker AI secara bertahap menyediakan kapasitas dan mengalihkan lalu lintas ke armada baru dalam langkah-langkah ukuran batch yang Anda tentukan. Instans pada armada baru diperbarui dengan konfigurasi penyebaran baru, dan jika tidak ada CloudWatch alarm yang tersandung selama periode pemanggangan, maka SageMaker AI membersihkan instance pada armada lama. Opsi ini memberi Anda kontrol terperinci atas jumlah instans atau persentase kapasitas yang digeser selama setiap langkah.

Anda dapat membuat dan mengelola penyebaran Anda melalui [CreateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateEndpoint.html) SageMaker API [UpdateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateEndpoint.html)dan AWS Command Line Interface perintah. Lihat halaman penerapan individual untuk detail selengkapnya tentang cara mengatur penerapan Anda. Perhatikan bahwa jika titik akhir Anda menggunakan salah satu fitur yang tercantum di [Pengecualian](deployment-guardrails-exclusions.md) halaman, Anda tidak dapat menggunakan pagar pembatas penerapan.

Untuk mengikuti contoh terpandu yang menunjukkan cara menggunakan pagar pembatas penerapan, lihat contoh [notebook Jupyter kami untuk mode perpindahan lalu lintas kenari](https://github.com/aws/amazon-sagemaker-examples/tree/master/sagemaker-inference-deployment-guardrails) dan linier.

# Konfigurasi dan Pemantauan Auto-Rollback
<a name="deployment-guardrails-configuration"></a>

 CloudWatch Alarm Amazon adalah prasyarat untuk menggunakan periode pemanggangan di pagar pembatas penyebaran. Anda hanya dapat menggunakan fungsionalitas auto-rollback di pagar pembatas penerapan jika Anda mengatur CloudWatch alarm yang dapat memantau titik akhir. Jika ada alarm Anda yang tersandar selama periode pemantauan yang ditentukan, SageMaker AI memulai pengembalian lengkap ke titik akhir lama untuk melindungi aplikasi Anda. Jika Anda tidak memiliki CloudWatch alarm yang diatur untuk memantau titik akhir Anda, fungsionalitas auto-rollback tidak berfungsi selama penerapan Anda.

Untuk mempelajari lebih lanjut tentang Amazon CloudWatch, lihat [Apa itu Amazon CloudWatch?](https://docs.aws.amazon.com/IAM/latest/UserGuide/access.html) di *Panduan CloudWatch Pengguna Amazon*.

**catatan**  
Pastikan bahwa peran eksekusi IAM Anda memiliki izin untuk melakukan `cloudwatch:DescribeAlarms` tindakan pada alarm auto-rollback yang Anda tentukan.

## Contoh Alarm
<a name="deployment-guardrails-configuration-alarm-examples"></a>

Untuk membantu Anda memulai, kami memberikan contoh berikut untuk menunjukkan kemampuan CloudWatch alarm. Selain menggunakan atau memodifikasi contoh berikut, Anda dapat membuat alarm sendiri dan mengonfigurasi alarm untuk memantau berbagai metrik pada armada yang ditentukan untuk jangka waktu tertentu. Untuk melihat lebih banyak metrik dan dimensi SageMaker AI yang dapat Anda tambahkan ke alarm, lihat. [Metrik Amazon SageMaker AI di Amazon CloudWatch](monitoring-cloudwatch.md)

**Topics**
+ [Pantau kesalahan pemanggilan pada armada lama dan baru](#deployment-guardrails-configuration-alarm-examples-errors-both)
+ [Pantau latensi model pada armada baru](#deployment-guardrails-configuration-alarm-examples-latency-new)

### Pantau kesalahan pemanggilan pada armada lama dan baru
<a name="deployment-guardrails-configuration-alarm-examples-errors-both"></a>

 CloudWatch Alarm berikut memonitor tingkat kesalahan rata-rata titik akhir. Anda dapat menggunakan alarm ini dengan jenis pemindahan lalu lintas pagar pembatas penyebaran apa pun untuk memberikan pemantauan keseluruhan pada armada lama dan baru. Jika alarm tersandung, maka SageMaker AI memulai rollback ke armada lama.

Kesalahan pemanggilan yang berasal dari armada lama dan armada baru berkontribusi pada tingkat kesalahan rata-rata. Jika tingkat kesalahan rata-rata melebihi ambang batas yang ditentukan, maka alarm akan tersandung. Contoh khusus ini memantau kesalahan 4xx (kesalahan klien) pada armada lama dan baru selama durasi penerapan. Anda juga dapat memantau kesalahan 5xx (kesalahan server) dengan menggunakan metrik`Invocation5XXErrors`.

**catatan**  
Untuk jenis alarm ini, jika armada lama Anda tersandung alarm selama penyebaran, SageMaker AI menghentikan penyebaran Anda. Oleh karena itu, jika armada produksi Anda saat ini sudah menyebabkan kesalahan, pertimbangkan untuk menggunakan atau memodifikasi salah satu contoh berikut yang hanya memantau armada baru untuk kesalahan.

```
#Applied deployment type: all types
{
    "AlarmName": "EndToEndDeploymentHighErrorRateAlarm",
    "AlarmDescription": "Monitors the error rate of 4xx errors",
    "MetricName": "Invocation4XXErrors",
    "Namespace": "AWS/SageMaker",
    "Statistic": "Average",
    "Dimensions": [
        {
            "Name": "EndpointName",
            "Value": <your-endpoint-name>
        },
        {
            "Name": "VariantName",
            "Value": "AllTraffic"
        }
    ],
    "Period": 600,
    "EvaluationPeriods": 2,
    "Threshold": 1,
    "ComparisonOperator": "GreaterThanThreshold",
    "TreatMissingData": "notBreaching"
}
```

Pada contoh sebelumnya, perhatikan nilai untuk bidang berikut:
+ Untuk `AlarmName` dan`AlarmDescription`, masukkan nama dan deskripsi yang Anda pilih untuk alarm.
+ Untuk`MetricName`, gunakan nilai `Invocation4XXErrors` untuk memantau kesalahan 4xx pada titik akhir
+ Untuk`Namespace`, gunakan nilainya`AWS/SageMaker`. Anda juga dapat menentukan metrik kustom Anda sendiri, jika berlaku.
+ Untuk`Statistic`, gunakan`Average`. Ini berarti bahwa alarm mengambil tingkat kesalahan rata-rata selama periode evaluasi saat menghitung apakah tingkat kesalahan telah melebihi ambang batas.
+ Untuk dimensi`EndpointName`, gunakan nama titik akhir yang Anda perbarui sebagai nilainya.
+ Untuk dimensi`VariantName`, gunakan nilai `AllTraffic` untuk menentukan semua lalu lintas titik akhir.
+ Untuk`Period`, gunakan`600`. Ini mengatur periode evaluasi alarm menjadi 10 menit.
+ Untuk`EvaluationPeriods`, gunakan`2`. Nilai ini memberi tahu alarm untuk mempertimbangkan dua periode evaluasi terbaru saat menentukan status alarm.

### Pantau latensi model pada armada baru
<a name="deployment-guardrails-configuration-alarm-examples-latency-new"></a>

Contoh CloudWatch alarm berikut memantau latensi model armada baru selama penerapan Anda. Anda dapat menggunakan alarm ini untuk memantau hanya armada baru dan mengecualikan armada lama. Alarm berlangsung untuk seluruh penyebaran. Contoh ini memberi Anda end-to-end pemantauan armada baru yang komprehensif dan memulai rollback ke armada lama jika armada baru memiliki masalah waktu respons.

CloudWatch menerbitkan metrik dengan dimensi `EndpointConfigName:{New-Ep-Config}` setelah armada baru mulai menerima lalu lintas, dan metrik ini bertahan bahkan setelah penerapan selesai.

Anda dapat menggunakan contoh alarm berikut dengan jenis penerapan apa pun.

```
#Applied deployment type: all types
{
    "AlarmName": "NewEndpointConfigVersionHighModelLatencyAlarm",
    "AlarmDescription": "Monitors the model latency on new fleet",
    "MetricName": "ModelLatency",
    "Namespace": "AWS/SageMaker",
    "Statistic": "Average",
    "Dimensions": [
        {
            "Name": "EndpointName",
            "Value": <your-endpoint-name>
        },
        {
            "Name": "VariantName",
            "Value": "AllTraffic"
        },
        {
            "Name": "EndpointConfigName",
            "Value": <your-config-name>
    ],
    "Period": 300,
    "EvaluationPeriods": 2,
    "Threshold": 100000, # 100ms
    "ComparisonOperator": "GreaterThanThreshold",
    "TreatMissingData": "notBreaching"
}
```

Pada contoh sebelumnya, perhatikan nilai untuk bidang berikut:
+ Untuk`MetricName`, gunakan nilai `ModelLatency` untuk memantau waktu respons model.
+ Untuk`Namespace`, gunakan nilainya`AWS/SageMaker`. Anda juga dapat menentukan metrik kustom Anda sendiri, jika berlaku.
+ Untuk dimensi`EndpointName`, gunakan nama titik akhir yang Anda perbarui sebagai nilainya.
+ Untuk dimensi`VariantName`, gunakan nilai `AllTraffic` untuk menentukan semua lalu lintas titik akhir.
+ Untuk dimensi`EndpointConfigName`, nilai harus merujuk ke nama konfigurasi titik akhir untuk titik akhir baru atau yang diperbarui.

**catatan**  
Jika Anda ingin memantau armada lama Anda alih-alih armada baru, Anda dapat mengubah dimensi `EndpointConfigName` untuk menentukan nama konfigurasi armada lama Anda.

# Deployment Blue/Green
<a name="deployment-guardrails-blue-green"></a>

Saat memperbarui titik akhir, Amazon SageMaker AI secara otomatis menggunakan blue/green deployment to maximize the availability of your endpoints. In a blue/green deployment, SageMaker AI provisions a new fleet with the updates (the green fleet). Then, SageMaker AI shifts traffic from the old fleet (the blue fleet) to the green fleet. Once the green fleet operates smoothly for a set evaluation period (called the baking period), SageMaker AI terminates the blue fleet. With the additional capabilities in blue/green penerapan, Anda dapat memanfaatkan mode perpindahan lalu lintas dan pemantauan rollback otomatis untuk melindungi titik akhir Anda dari dampak produksi yang signifikan.

Daftar berikut menjelaskan fitur utama penerapan biru/hijau di AI: SageMaker 
+ **Mode perpindahan lalu lintas.** Mode perpindahan lalu lintas untuk pagar pembatas penyebaran memungkinkan Anda mengontrol volume lalu lintas dan jumlah langkah perpindahan lalu lintas antara armada biru dan armada hijau. Kemampuan ini memberi Anda kemampuan untuk mengevaluasi kinerja armada hijau secara progresif tanpa sepenuhnya berkomitmen untuk pergeseran lalu lintas 100%.
+ **Periode memanggang.** Periode pemanggangan adalah jumlah waktu yang ditetapkan untuk memantau armada hijau sebelum melanjutkan ke tahap penyebaran berikutnya. Jika salah satu alarm yang telah ditentukan sebelumnya tersandung selama periode pemanggangan apa pun, maka semua lalu lintas titik akhir kembali ke armada biru. Periode memanggang membantu Anda membangun kepercayaan pada pembaruan Anda sebelum membuat pergeseran lalu lintas permanen.
+ **Rollback otomatis.** Anda dapat menentukan CloudWatch alarm Amazon yang digunakan SageMaker AI untuk memantau armada hijau. Jika masalah dengan kode yang diperbarui tersandung salah satu alarm, SageMaker AI memulai pengembalian otomatis ke armada biru untuk menjaga ketersediaan sehingga meminimalkan risiko.

## Mode Pergeseran Lalu Lintas
<a name="deployment-guardrails-blue-green-traffic-modes"></a>

Berbagai mode perpindahan lalu lintas dalam blue/green deployments give you more granular control over traffic shifting between the blue fleet and the green fleet. The available traffic shifting modes for blue/green penyebaran semuanya sekaligus, kenari, dan linier. Tabel berikut menunjukkan perbandingan opsi.

**penting**  
Untuk blue/green deployments that involve multiple stage traffic shifting or baking periods, you are billed for both the fleets for the duration of the update, irrespective of the traffic to the fleet. This is in contrast to blue/green penyebaran dengan perpindahan lalu lintas sekaligus dan tidak ada periode pemanggangan, di mana Anda hanya ditagih untuk satu armada selama pembaruan.


| Nama | Apa itu? | Pro | Kontra | Rekomendasi | 
| --- | --- | --- | --- | --- | 
| Semua sekaligus | Menggeser semua lalu lintas ke armada baru dalam satu langkah. | Meminimalkan durasi pembaruan secara keseluruhan. | Pembaruan regresif memengaruhi 100% lalu lintas. | Gunakan opsi ini untuk meminimalkan waktu dan biaya pembaruan. | 
| Kenari | Lalu lintas bergeser dalam dua langkah. Langkah pertama (kenari) menggeser sebagian kecil lalu lintas diikuti oleh langkah kedua, yang menggeser sisa lalu lintas. | Membatasi radius ledakan pembaruan regresif hanya untuk armada kenari. | Kedua armada beroperasi secara paralel untuk seluruh penyebaran. | Gunakan opsi ini untuk menyeimbangkan antara meminimalkan radius ledakan pembaruan regresif dan meminimalkan waktu dua armada beroperasi. | 
| Linear | Sebagian tetap dari lalu lintas bergeser dalam jumlah yang telah ditentukan sebelumnya dari langkah dengan jarak yang sama. | Meminimalkan risiko pembaruan regresif dengan mengalihkan lalu lintas melalui beberapa langkah. | Durasi dan biaya pembaruan sebanding dengan jumlah langkah. | Gunakan opsi ini untuk meminimalkan risiko dengan menyebarkan penyebaran di beberapa langkah. | 

## Mulai
<a name="deployment-guardrails-blue-green-get-started"></a>

Setelah Anda menentukan konfigurasi penerapan yang diinginkan, SageMaker AI menangani penyediaan instance baru, menghentikan instans lama, dan mengalihkan lalu lintas untuk Anda. Anda dapat membuat dan mengelola penyebaran Anda melalui [CreateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateEndpoint.html) SageMaker API [UpdateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateEndpoint.html)dan AWS Command Line Interface perintah yang ada. Perhatikan bahwa jika titik akhir Anda menggunakan salah satu fitur yang tercantum di [Pengecualian](deployment-guardrails-exclusions.md) halaman, Anda tidak dapat menggunakan pagar pembatas penerapan. Lihat halaman penerapan individual untuk detail selengkapnya tentang cara mengatur penerapan Anda:
+ [Pembaruan Biru/Hijau dengan Pergeseran Lalu Lintas Sekaligus](deployment-guardrails-blue-green-all-at-once.md)
+ [Pembaruan Biru/Hijau dengan Pergeseran Lalu Lintas Canary](deployment-guardrails-blue-green-canary.md)
+ [Pembaruan Biru/Hijau dengan Pergeseran Lalu Lintas Linear](deployment-guardrails-blue-green-linear.md)

Untuk mengikuti contoh terpandu yang menunjukkan cara menggunakan pagar pembatas penerapan, lihat contoh [notebook Jupyter kami untuk mode perpindahan lalu lintas kenari](https://github.com/aws/amazon-sagemaker-examples/tree/master/sagemaker-inference-deployment-guardrails) dan linier.

# Gunakan sekaligus pergeseran lalu lintas
<a name="deployment-guardrails-blue-green-all-at-once"></a>

Dengan pergeseran lalu lintas sekaligus, Anda dapat dengan cepat meluncurkan pembaruan titik akhir menggunakan pagar pengaman penerapan. blue/green deployment. You can use this traffic shifting option to minimize the update duration while still taking advantage of the availability guarantees of blue/green Fitur baking period membantu Anda memantau kinerja dan fungsionalitas instans baru Anda sebelum menghentikan instans lama Anda, memastikan bahwa armada baru Anda beroperasi penuh.

Diagram berikut menunjukkan bagaimana sekaligus pergeseran lalu lintas mengelola armada lama dan baru.

![\[Pergeseran lalu lintas 100% yang sukses dari armada lama ke armada baru.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/deployment-guardrails-blue-green-all-at-once.png)


Saat Anda menggunakan perpindahan lalu lintas sekaligus, SageMaker AI merutekan 100% lalu lintas ke armada baru (armada hijau). Setelah armada hijau mulai menerima lalu lintas, periode pemanggangan dimulai. Periode memanggang adalah jumlah waktu yang ditentukan di mana CloudWatch alarm Amazon yang telah ditentukan sebelumnya memantau kinerja armada hijau. Jika tidak ada alarm yang tersandung selama periode pemanggangan, SageMaker AI menghentikan armada lama (armada biru). Jika ada alarm yang tersandung selama periode pemanggangan, maka rollback otomatis dimulai dan 100% lalu lintas bergeser kembali ke armada biru.

## Prasyarat
<a name="deployment-guardrails-blue-green-all-at-once-prereqs"></a>

Sebelum menyiapkan penerapan dengan perpindahan lalu lintas sekaligus, Anda harus membuat CloudWatch alarm Amazon untuk menonton metrik dari titik akhir Anda. Jika ada alarm yang tersandung selama periode memanggang, lalu lintas kembali ke armada biru Anda. Untuk mempelajari cara mengatur CloudWatch alarm pada titik akhir, lihat halaman prasyarat. [Konfigurasi dan Pemantauan Auto-Rollback](deployment-guardrails-configuration.md) Untuk mempelajari lebih lanjut tentang CloudWatch alarm, lihat [Menggunakan CloudWatch alarm Amazon](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) di * CloudWatch Panduan Pengguna Amazon*.

## Konfigurasikan Pergeseran Lalu Lintas Sekaligus
<a name="deployment-guardrails-blue-green-all-at-once-configure"></a>

Setelah Anda siap untuk penerapan dan telah menyiapkan CloudWatch alarm untuk titik akhir Anda, Anda dapat menggunakan SageMaker AI [UpdateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateEndpoint.html)API atau perintah [update-endpoint](https://docs.aws.amazon.com/cli/latest/reference/sagemaker/update-endpoint.html) di untuk memulai penerapan. AWS Command Line Interface 

**Topics**
+ [Cara memperbarui titik akhir (API)](#deployment-guardrails-blue-green-all-at-once-configure-api-update)
+ [Cara memperbarui titik akhir dengan kebijakan pembaruan biru/hijau (API) yang ada](#deployment-guardrails-blue-green-all-at-once-configure-api-existing)
+ [Cara memperbarui titik akhir (CLI)](#deployment-guardrails-blue-green-all-at-once-configure-cli-update)

### Cara memperbarui titik akhir (API)
<a name="deployment-guardrails-blue-green-all-at-once-configure-api-update"></a>

Contoh berikut menunjukkan bagaimana Anda dapat memperbarui titik akhir Anda dengan pergeseran lalu lintas sekaligus menggunakan [UpdateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateEndpoint.html)di Amazon SageMaker API.

```
import boto3
client = boto3.client("sagemaker")

response = client.update_endpoint(
    EndpointName="<your-endpoint-name>",
    EndpointConfigName="<your-config-name>",
    DeploymentConfig={
        "BlueGreenUpdatePolicy": {
            "TrafficRoutingConfiguration": {
                "Type": "ALL_AT_ONCE"
            },
            "TerminationWaitInSeconds": 600,
            "MaximumExecutionTimeoutInSeconds": 1800
        },
        "AutoRollbackConfiguration": {
            "Alarms": [
                {
                    "AlarmName": "<your-cw-alarm>"
                },
            ]
        }
    }
)
```

Untuk mengonfigurasi opsi pemindahan lalu lintas sekaligus, lakukan hal berikut:
+ Untuk`EndpointName`, gunakan nama titik akhir yang ada yang ingin Anda perbarui.
+ Untuk`EndpointConfigName`, gunakan nama konfigurasi titik akhir yang ingin Anda gunakan.
+ Di bawah `DeploymentConfig` dan `BlueGreenUpdatePolicy``TrafficRoutingConfiguration`, di, atur `Type` parameter ke`ALL_AT_ONCE`. Ini menentukan bahwa penyebaran menggunakan mode perpindahan lalu lintas sekaligus.
+ Untuk`TerminationWaitInSeconds`, gunakan`600`. Parameter ini memberi tahu SageMaker AI untuk menunggu jumlah waktu yang ditentukan (dalam detik) setelah armada hijau Anda sepenuhnya aktif sebelum menghentikan instance di armada biru. Dalam contoh ini, SageMaker AI menunggu selama 10 menit setelah periode pemanggangan terakhir sebelum menghentikan armada biru.
+ Untuk`MaximumExecutionTimeoutInSeconds`, gunakan`1800`. Parameter ini menetapkan jumlah waktu maksimum yang dapat dijalankan penerapan sebelum waktu habis. Pada contoh sebelumnya, penerapan Anda memiliki batas 30 menit untuk diselesaikan.
+ Di`AutoRollbackConfiguration`, di dalam `Alarms` bidang, Anda dapat menambahkan CloudWatch alarm berdasarkan nama. Buat satu `AlarmName: <your-cw-alarm>` entri untuk setiap alarm yang ingin Anda gunakan.

### Cara memperbarui titik akhir dengan kebijakan pembaruan biru/hijau (API) yang ada
<a name="deployment-guardrails-blue-green-all-at-once-configure-api-existing"></a>

Saat Anda menggunakan [CreateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateEndpoint.html)API untuk membuat titik akhir, Anda dapat menentukan konfigurasi penerapan yang akan digunakan kembali untuk pembaruan titik akhir di masa mendatang. Anda dapat menggunakan `DeploymentConfig` opsi yang sama seperti contoh UpdateEndpoint API sebelumnya. Tidak ada perubahan pada perilaku CreateEndpoint API. Menentukan konfigurasi penerapan tidak secara otomatis melakukan pembaruan biru/hijau di titik akhir Anda.

Opsi untuk menggunakan konfigurasi penerapan sebelumnya terjadi saat menggunakan [UpdateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateEndpoint.html)API untuk memperbarui titik akhir Anda. Saat memperbarui titik akhir, Anda dapat menggunakan `RetainDeploymentConfig` opsi untuk menjaga konfigurasi penerapan yang Anda tentukan saat membuat titik akhir.

Saat memanggil [UpdateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateEndpoint.html)API, atur `RetainDeploymentConfig` `True` untuk menjaga `DeploymentConfig` opsi dari konfigurasi titik akhir asli Anda.

```
response = client.update_endpoint(
    EndpointName="<your-endpoint-name>",
    EndpointConfigName="<your-config-name>",
    RetainDeploymentConfig=True
)
```

### Cara memperbarui titik akhir (CLI)
<a name="deployment-guardrails-blue-green-all-at-once-configure-cli-update"></a>

[Jika Anda menggunakan AWS CLI, contoh berikut menunjukkan cara memulai penerapan biru/hijau sekaligus menggunakan perintah update-endpoint.](https://docs.aws.amazon.com/cli/latest/reference/sagemaker/update-endpoint.html)

```
update-endpoint
--endpoint-name <your-endpoint-name> 
--endpoint-config-name <your-config-name> 
--deployment-config '"BlueGreenUpdatePolicy": {"TrafficRoutingConfiguration": {"Type": "ALL_AT_ONCE"},
    "TerminationWaitInSeconds": 600, "MaximumExecutionTimeoutInSeconds": 1800},
    "AutoRollbackConfiguration": {"Alarms": [{"AlarmName": "<your-alarm>"}]}'
```

Untuk mengonfigurasi opsi pemindahan lalu lintas sekaligus, lakukan hal berikut:
+ Untuk`endpoint-name`, gunakan nama titik akhir yang ingin Anda perbarui.
+ Untuk`endpoint-config-name`, gunakan nama konfigurasi titik akhir yang ingin Anda gunakan.
+ Untuk`deployment-config`, gunakan objek [BlueGreenUpdatePolicy](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_BlueGreenUpdatePolicy.html)JSON.

**catatan**  
Jika Anda lebih suka menyimpan objek JSON Anda dalam sebuah file, lihat [Menghasilkan AWS CLI kerangka dan parameter input](https://docs.aws.amazon.com/cli/latest/userguide/cli-usage-skeleton.html) di *AWS CLI Panduan Pengguna*.

# Gunakan perpindahan lalu lintas kenari
<a name="deployment-guardrails-blue-green-canary"></a>

Dengan pergeseran lalu lintas kenari, Anda dapat menguji sebagian lalu lintas titik akhir Anda pada armada baru sementara armada lama melayani sisa lalu lintas. Langkah pengujian ini adalah pagar pembatas keselamatan yang memvalidasi fungsionalitas armada baru sebelum memindahkan semua lalu lintas Anda ke armada baru. Anda masih memiliki manfaat dari penyebaran biru/hijau, dan fitur kenari yang ditambahkan memungkinkan Anda memastikan bahwa armada baru (hijau) Anda dapat melayani inferensi sebelum membiarkannya menangani 100% lalu lintas.

Bagian dari armada hijau Anda yang menyala untuk menerima lalu lintas disebut kenari, dan Anda dapat memilih ukuran kenari ini. Perhatikan bahwa ukuran kenari harus kurang dari atau sama dengan 50% dari kapasitas armada baru. Setelah periode pemanggangan selesai dan tidak ada perjalanan CloudWatch alarm Amazon yang ditentukan sebelumnya, sisa lalu lintas bergeser dari armada lama (biru) ke armada hijau. Perpindahan lalu lintas kenari memberi Anda lebih banyak keamanan selama penerapan karena masalah apa pun dengan model yang diperbarui hanya memengaruhi kenari.

Diagram berikut menunjukkan bagaimana pergeseran lalu lintas kenari mengelola distribusi lalu lintas antara armada biru dan hijau.

![\[Lalu lintas kenari dua langkah yang sukses bergeser dari armada lama ke armada baru.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/deployment-guardrails-blue-green-canary.png)


Setelah SageMaker AI menyediakan armada hijau, SageMaker AI merutekan sebagian dari lalu lintas yang masuk (misalnya, 25%) ke kenari. Kemudian periode memanggang dimulai, di mana CloudWatch alarm Anda memantau kinerja armada hijau. Selama waktu ini, armada biru dan armada hijau sebagian aktif dan menerima lalu lintas. Jika ada alarm yang tersandung selama periode pemanggangan, maka SageMaker AI memulai rollback dan semua lalu lintas kembali ke armada biru. Jika tidak ada alarm yang tersandung, maka semua lalu lintas bergeser ke armada hijau dan ada periode pemanggangan terakhir. Jika periode pemanggangan terakhir selesai tanpa tersandung alarm, maka armada hijau melayani semua lalu lintas dan SageMaker AI menghentikan armada biru.

## Prasyarat
<a name="deployment-guardrails-blue-green-canary-prereqs"></a>

Sebelum menyiapkan penerapan dengan pemindahan lalu lintas kenari, Anda harus membuat CloudWatch alarm Amazon untuk memantau metrik dari titik akhir Anda. Alarm aktif selama periode pemanggangan, dan jika ada alarm yang tersandung, maka semua lalu lintas titik akhir kembali ke armada biru. Untuk mempelajari cara mengatur CloudWatch alarm pada titik akhir, lihat halaman prasyarat. [Konfigurasi dan Pemantauan Auto-Rollback](deployment-guardrails-configuration.md) Untuk mempelajari lebih lanjut tentang CloudWatch alarm, lihat [Menggunakan CloudWatch alarm Amazon](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) di * CloudWatch Panduan Pengguna Amazon*.

## Konfigurasikan Pergeseran Lalu Lintas Canary
<a name="deployment-guardrails-blue-green-canary-configure"></a>

Setelah Anda siap untuk penerapan dan telah menyiapkan CloudWatch alarm Amazon untuk titik akhir Anda, Anda dapat menggunakan Amazon SageMaker AI [UpdateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateEndpoint.html)API atau perintah [update-endpoint](https://docs.aws.amazon.com/cli/latest/reference/sagemaker/update-endpoint.html) di untuk memulai penerapan. AWS CLI 

**Topics**
+ [Cara memperbarui titik akhir (API)](#deployment-guardrails-blue-green-canary-configure-api-update)
+ [Cara memperbarui titik akhir dengan kebijakan pembaruan biru/hijau (API) yang ada](#deployment-guardrails-blue-green-canary-configure-api-existing)
+ [Cara memperbarui titik akhir (CLI)](#deployment-guardrails-blue-green-canary-configure-cli-update)

### Cara memperbarui titik akhir (API)
<a name="deployment-guardrails-blue-green-canary-configure-api-update"></a>

Contoh [UpdateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateEndpoint.html)API berikut menunjukkan bagaimana Anda dapat memperbarui titik akhir dengan pergeseran lalu lintas kenari.

```
import boto3
client = boto3.client("sagemaker")

response = client.update_endpoint(
    EndpointName="<your-endpoint-name>",
    EndpointConfigName="<your-config-name>",
    DeploymentConfig={
        "BlueGreenUpdatePolicy": {
            "TrafficRoutingConfiguration": {
                "Type": "CANARY",
                "CanarySize": {
                    "Type": "CAPACITY_PERCENT",
                    "Value": 30
                },
                "WaitIntervalInSeconds": 600
            },
            "TerminationWaitInSeconds": 600,
            "MaximumExecutionTimeoutInSeconds": 1800
        },
        "AutoRollbackConfiguration": {
            "Alarms": [
                {
                    "AlarmName": "<your-cw-alarm>"
                }
            ]
        }
    }
)
```

Untuk mengonfigurasi opsi pemindahan lalu lintas kenari, lakukan hal berikut:
+ Untuk`EndpointName`, gunakan nama titik akhir yang ada yang ingin Anda perbarui.
+ Untuk`EndpointConfigName`, gunakan nama konfigurasi titik akhir yang ingin Anda gunakan.
+ Di bawah `DeploymentConfig` dan `BlueGreenUpdatePolicy``TrafficRoutingConfiguration`, di, atur `Type` parameter ke`CANARY`. Ini menentukan bahwa penyebaran menggunakan perpindahan lalu lintas kenari.
+ Di `CanarySize` lapangan, Anda dapat mengubah ukuran kenari dengan memodifikasi `Type` dan `Value` parameter. Untuk`Type`, gunakan`CAPACITY_PERCENT`, artinya persentase armada hijau Anda yang ingin Anda gunakan sebagai kenari, dan kemudian atur `Value` ke`30`. Dalam contoh ini, Anda menggunakan 30% dari kapasitas armada hijau sebagai kenari. Perhatikan bahwa ukuran kenari harus sama dengan atau kurang dari 50% dari kapasitas armada hijau.
+ Untuk`WaitIntervalInSeconds`, gunakan`600`. Parameter memberitahu SageMaker AI untuk menunggu jumlah waktu yang ditentukan (dalam detik) antara setiap pergeseran interval. Interval ini adalah durasi periode memanggang kenari. Dalam contoh sebelumnya, SageMaker AI menunggu selama 10 menit setelah pergeseran kenari dan kemudian menyelesaikan pergeseran lalu lintas kedua dan terakhir.
+ Untuk`TerminationWaitInSeconds`, gunakan`600`. Parameter ini memberi tahu SageMaker AI untuk menunggu jumlah waktu yang ditentukan (dalam detik) setelah armada hijau Anda sepenuhnya aktif sebelum menghentikan instance di armada biru. Dalam contoh ini, SageMaker AI menunggu selama 10 menit setelah periode pemanggangan terakhir sebelum menghentikan armada biru.
+ Untuk`MaximumExecutionTimeoutInSeconds`, gunakan`1800`. Parameter ini menetapkan jumlah waktu maksimum yang dapat dijalankan penerapan sebelum waktu habis. Pada contoh sebelumnya, penerapan Anda memiliki batas 30 menit untuk diselesaikan.
+ Di`AutoRollbackConfiguration`, di dalam `Alarms` bidang, Anda dapat menambahkan CloudWatch alarm berdasarkan nama. Buat satu `AlarmName: <your-cw-alarm>` entri untuk setiap alarm yang ingin Anda gunakan.

### Cara memperbarui titik akhir dengan kebijakan pembaruan biru/hijau (API) yang ada
<a name="deployment-guardrails-blue-green-canary-configure-api-existing"></a>

Saat Anda menggunakan [CreateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateEndpoint.html)API untuk membuat titik akhir, Anda dapat secara opsional menentukan konfigurasi penerapan yang akan digunakan kembali untuk pembaruan titik akhir di masa mendatang. Anda dapat menggunakan `DeploymentConfig` opsi yang sama seperti contoh UpdateEndpoint API sebelumnya. Tidak ada perubahan pada perilaku CreateEndpoint API. Menentukan konfigurasi penerapan tidak secara otomatis melakukan pembaruan biru/hijau di titik akhir Anda.

Opsi untuk menggunakan konfigurasi penerapan sebelumnya terjadi saat menggunakan [UpdateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateEndpoint.html)API untuk memperbarui titik akhir Anda. Saat memperbarui titik akhir, Anda dapat menggunakan `RetainDeploymentConfig` opsi untuk menjaga konfigurasi penerapan yang Anda tentukan saat membuat titik akhir.

Saat memanggil [UpdateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateEndpoint.html)API, atur `RetainDeploymentConfig` `True` untuk menjaga `DeploymentConfig` opsi dari konfigurasi titik akhir asli Anda.

```
response = client.update_endpoint(
    EndpointName="<your-endpoint-name>",
    EndpointConfigName="<your-config-name>",
    RetainDeploymentConfig=True
)
```

### Cara memperbarui titik akhir (CLI)
<a name="deployment-guardrails-blue-green-canary-configure-cli-update"></a>

[Jika Anda menggunakan AWS CLI, contoh berikut menunjukkan cara memulai penerapan kenari biru/hijau menggunakan perintah update-endpoint.](https://docs.aws.amazon.com/cli/latest/reference/sagemaker/update-endpoint.html)

```
update-endpoint
--endpoint-name <your-endpoint-name>
--endpoint-config-name <your-config-name> 
--deployment-config '"BlueGreenUpdatePolicy": {"TrafficRoutingConfiguration": {"Type": "CANARY",
    "CanarySize": {"Type": "CAPACITY_PERCENT", "Value": 30}, "WaitIntervalInSeconds": 600},
    "TerminationWaitInSeconds": 600, "MaximumExecutionTimeoutInSeconds": 1800},
    "AutoRollbackConfiguration": {"Alarms": [{"AlarmName": "<your-alarm>"}]}'
```

Untuk mengonfigurasi opsi pemindahan lalu lintas kenari, lakukan hal berikut:
+ Untuk`endpoint-name`, gunakan nama titik akhir yang ingin Anda perbarui.
+ Untuk`endpoint-config-name`, gunakan nama konfigurasi titik akhir yang ingin Anda gunakan.
+ Untuk`deployment-config`, gunakan objek [BlueGreenUpdatePolicy](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_BlueGreenUpdatePolicy.html)JSON.

**catatan**  
Jika Anda lebih suka menyimpan objek JSON Anda dalam sebuah file, lihat [Menghasilkan AWS CLI kerangka dan parameter input](https://docs.aws.amazon.com/cli/latest/userguide/cli-usage-skeleton.html) di *AWS CLI Panduan Pengguna*.

# Gunakan perpindahan lalu lintas linier
<a name="deployment-guardrails-blue-green-linear"></a>

Pergeseran lalu lintas linier memungkinkan Anda untuk secara bertahap mengalihkan lalu lintas dari armada lama Anda (armada biru) ke armada baru Anda (armada hijau). Dengan pergeseran lalu lintas linier, Anda dapat menggeser lalu lintas dalam beberapa langkah, meminimalkan kemungkinan gangguan pada titik akhir Anda. Opsi penyebaran biru/hijau ini memberi Anda kontrol paling terperinci atas pergeseran lalu lintas.

Anda dapat memilih jumlah instance atau persentase kapasitas armada hijau untuk diaktifkan selama setiap langkah. Setiap langkah linier seharusnya hanya antara 10-50% dari kapasitas armada hijau. Untuk setiap langkah, ada periode pemanggangan di mana CloudWatch alarm Amazon Anda yang telah ditentukan sebelumnya memantau metrik pada armada hijau. Setelah periode pemanggangan selesai dan tidak ada alarm, bagian aktif armada hijau Anda terus menerima lalu lintas dan langkah baru dimulai. Jika alarm tersandung selama salah satu periode memanggang, 100% lalu lintas titik akhir berputar kembali ke armada biru.

Diagram berikut menunjukkan bagaimana lalu lintas linier menggeser rute lalu lintas ke armada biru dan hijau.

![\[Pergeseran lalu lintas linier tiga langkah yang sukses dari armada lama ke armada baru.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/deployment-guardrails-blue-green-linear.png)


Setelah SageMaker AI menyediakan armada baru, bagian pertama dari armada hijau menyala dan menerima lalu lintas. SageMaker AI menonaktifkan porsi ukuran yang sama dari armada biru, dan periode pemanggangan dimulai. Jika ada alarm yang tersandung, semua lalu lintas titik akhir bergulir kembali ke armada biru. Jika periode memanggang selesai, maka langkah selanjutnya dimulai. Bagian lain dari armada hijau mengaktifkan dan menerima lalu lintas, bagian dari armada biru dinonaktifkan, dan periode pemanggangan lainnya dimulai. Proses yang sama berulang sampai armada biru dinonaktifkan sepenuhnya dan armada hijau sepenuhnya aktif dan menerima semua lalu lintas. Jika alarm berbunyi kapan saja, SageMaker AI menghentikan proses pergeseran dan 100% lalu lintas kembali ke armada biru.

## Prasyarat
<a name="deployment-guardrails-blue-green-linear-prereqs"></a>

Sebelum menyiapkan penerapan dengan pergeseran lalu lintas linier, Anda harus membuat CloudWatch alarm untuk memantau metrik dari titik akhir Anda. Alarm aktif selama periode pemanggangan, dan jika ada alarm yang tersandung, maka semua lalu lintas titik akhir kembali ke armada biru. Untuk mempelajari cara mengatur CloudWatch alarm pada titik akhir, lihat halaman prasyarat. [Konfigurasi dan Pemantauan Auto-Rollback](deployment-guardrails-configuration.md) Untuk mempelajari lebih lanjut tentang CloudWatch alarm, lihat [Menggunakan CloudWatch alarm Amazon](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) di * CloudWatch Panduan Pengguna Amazon*.

## Konfigurasikan Pergeseran Lalu Lintas Linear
<a name="deployment-guardrails-blue-green-linear-configure"></a>

Setelah Anda siap untuk penerapan dan telah menyiapkan CloudWatch alarm untuk titik akhir Anda, Anda dapat menggunakan Amazon SageMaker AI [UpdateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateEndpoint.html)API atau perintah [update-endpoint](https://docs.aws.amazon.com/cli/latest/reference/sagemaker/update-endpoint.html) di untuk memulai penerapan. AWS CLI 

**Topics**
+ [Cara memperbarui titik akhir (API)](#deployment-guardrails-blue-green-linear-configure-api-update)
+ [Cara memperbarui titik akhir dengan kebijakan pembaruan biru/hijau (API) yang ada](#deployment-guardrails-blue-green-linear-configure-api-existing)
+ [Cara memperbarui titik akhir (CLI)](#deployment-guardrails-blue-green-canary-configure-cli-update)

### Cara memperbarui titik akhir (API)
<a name="deployment-guardrails-blue-green-linear-configure-api-update"></a>

Contoh [UpdateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateEndpoint.html)API berikut menunjukkan bagaimana Anda dapat memperbarui titik akhir dengan pergeseran lalu lintas linier.

```
import boto3
client = boto3.client("sagemaker")

response = client.update_endpoint(
    EndpointName="<your-endpoint-name>",
    EndpointConfigName="<your-config-name>",
    DeploymentConfig={
        "BlueGreenUpdatePolicy": {
            "TrafficRoutingConfiguration": {
                "Type": "LINEAR",
                "LinearStepSize": {
                    "Type": "CAPACITY_PERCENT",
                    "Value": 20
                },
                "WaitIntervalInSeconds": 300
            },
            "TerminationWaitInSeconds": 300,
            "MaximumExecutionTimeoutInSeconds": 3600
        },
        "AutoRollbackConfiguration": {
            "Alarms": [
                {
                    "AlarmName": "<your-cw-alarm>"
                }
            ]
        }
    }
)
```

Untuk mengonfigurasi opsi pemindahan lalu lintas linier, lakukan hal berikut:
+ Untuk`EndpointName`, gunakan nama titik akhir yang ada yang ingin Anda perbarui.
+ Untuk`EndpointConfigName`, gunakan nama konfigurasi titik akhir yang ingin Anda gunakan.
+ Di bawah `DeploymentConfig` dan `BlueGreenUpdatePolicy``TrafficRoutingConfiguration`, di, atur `Type` parameter ke`LINEAR`. Ini menentukan bahwa penyebaran menggunakan pergeseran lalu lintas linier.
+ Di `LinearStepSize` lapangan, Anda dapat mengubah ukuran langkah dengan memodifikasi `Type` dan `Value` parameter. Untuk`Type`, gunakan`CAPACITY_PERCENT`, artinya persentase armada hijau Anda yang ingin Anda gunakan sebagai ukuran langkah, dan kemudian atur `Value` ke`20`. Dalam contoh ini, Anda mengaktifkan 20% dari kapasitas armada hijau untuk setiap langkah perpindahan lalu lintas. Perhatikan bahwa saat menyesuaikan ukuran langkah linier Anda, Anda hanya boleh menggunakan langkah yang 10-50% dari kapasitas armada hijau.
+ Untuk`WaitIntervalInSeconds`, gunakan`300`. Parameter memberitahu SageMaker AI untuk menunggu jumlah waktu yang ditentukan (dalam detik) antara setiap pergeseran lalu lintas. Interval ini adalah durasi periode pemanggangan antara setiap langkah linier. Dalam contoh sebelumnya, SageMaker AI menunggu selama 5 menit di antara setiap shift lalu lintas.
+ Untuk`TerminationWaitInSeconds`, gunakan`300`. Parameter ini memberi tahu SageMaker AI untuk menunggu jumlah waktu yang ditentukan (dalam detik) setelah armada hijau Anda sepenuhnya aktif sebelum menghentikan instance di armada biru. Dalam contoh ini, SageMaker AI menunggu selama 5 menit setelah periode pemanggangan terakhir sebelum menghentikan armada biru.
+ Untuk`MaximumExecutionTimeoutInSeconds`, gunakan`3600`. Parameter ini menetapkan jumlah waktu maksimum yang dapat dijalankan penerapan sebelum waktu habis. Pada contoh sebelumnya, penerapan Anda memiliki batas 1 jam untuk diselesaikan.
+ Di`AutoRollbackConfiguration`, di dalam `Alarms` bidang, Anda dapat menambahkan CloudWatch alarm berdasarkan nama. Buat satu `AlarmName: <your-cw-alarm>` entri untuk setiap alarm yang ingin Anda gunakan.

### Cara memperbarui titik akhir dengan kebijakan pembaruan biru/hijau (API) yang ada
<a name="deployment-guardrails-blue-green-linear-configure-api-existing"></a>

Saat Anda menggunakan [CreateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateEndpoint.html)API untuk membuat titik akhir, Anda dapat secara opsional menentukan konfigurasi penerapan yang akan digunakan kembali untuk pembaruan titik akhir di masa mendatang. Anda dapat menggunakan `DeploymentConfig` opsi yang sama seperti contoh UpdateEndpoint API sebelumnya. Tidak ada perubahan pada perilaku CreateEndpoint API. Menentukan konfigurasi penerapan tidak secara otomatis melakukan pembaruan biru/hijau di titik akhir Anda.

Opsi untuk menggunakan konfigurasi penerapan sebelumnya terjadi saat menggunakan [UpdateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateEndpoint.html)API untuk memperbarui titik akhir Anda. Saat memperbarui titik akhir, Anda dapat menggunakan `RetainDeploymentConfig` opsi untuk menjaga konfigurasi penerapan yang Anda tentukan saat membuat titik akhir.

Saat memanggil [UpdateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateEndpoint.html)API, atur `RetainDeploymentConfig` `True` untuk menjaga `DeploymentConfig` opsi dari konfigurasi titik akhir asli Anda.

```
response = client.update_endpoint(
    EndpointName="<your-endpoint-name>",
    EndpointConfigName="<your-config-name>",
    RetainDeploymentConfig=True
)
```

### Cara memperbarui titik akhir (CLI)
<a name="deployment-guardrails-blue-green-canary-configure-cli-update"></a>

[Jika Anda menggunakan AWS CLI, contoh berikut menunjukkan cara memulai penerapan linier biru/hijau menggunakan perintah update-endpoint.](https://docs.aws.amazon.com/cli/latest/reference/sagemaker/update-endpoint.html)

```
update-endpoint
--endpoint-name <your-endpoint-name>
--endpoint-config-name <your-config-name> 
--deployment-config '{"BlueGreenUpdatePolicy": {"TrafficRoutingConfiguration": {"Type": "LINEAR",
    "LinearStepSize": {"Type": "CAPACITY_PERCENT", "Value": 20}, "WaitIntervalInSeconds": 300},
    "TerminationWaitInSeconds": 300, "MaximumExecutionTimeoutInSeconds": 3600},
    "AutoRollbackConfiguration": {"Alarms": [{"AlarmName": "<your-alarm>"}]}'
```

Untuk mengonfigurasi opsi pemindahan lalu lintas linier, lakukan hal berikut:
+ Untuk`endpoint-name`, gunakan nama titik akhir yang ingin Anda perbarui.
+ Untuk`endpoint-config-name`, gunakan nama konfigurasi titik akhir yang ingin Anda gunakan.
+ Untuk`deployment-config`, gunakan objek [BlueGreenUpdatePolicy](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_BlueGreenUpdatePolicy.html)JSON.

**catatan**  
Jika Anda lebih suka menyimpan objek JSON Anda dalam sebuah file, lihat [Menghasilkan AWS CLI kerangka dan parameter input](https://docs.aws.amazon.com/cli/latest/userguide/cli-usage-skeleton.html) di *AWS CLI Panduan Pengguna*.

# Gunakan penerapan bergulir
<a name="deployment-guardrails-rolling"></a>

Saat memperbarui titik akhir, Anda dapat menentukan penerapan bergulir untuk secara bertahap mengalihkan lalu lintas dari armada lama ke armada baru. Anda dapat mengontrol ukuran langkah perpindahan lalu lintas, serta menentukan periode evaluasi untuk memantau instans baru untuk masalah sebelum menghentikan instance dari armada lama. Dengan penerapan bergulir, instance pada armada lama dibersihkan setelah setiap pergeseran lalu lintas ke armada baru, mengurangi jumlah instance tambahan yang diperlukan untuk memperbarui titik akhir Anda. Ini berguna terutama untuk contoh yang dipercepat yang banyak diminati.

Penerapan bergulir secara bertahap menggantikan penerapan versi model Anda sebelumnya dengan versi baru dengan memperbarui titik akhir Anda dalam ukuran batch yang dapat dikonfigurasi. Perilaku pergeseran lalu lintas dari penerapan bergulir mirip dengan [mode perpindahan lalu lintas linier](https://docs.aws.amazon.com/sagemaker/latest/dg/deployment-guardrails-blue-green-linear.html) dalam blue/green penerapan, tetapi penerapan bergulir memberi Anda manfaat dari persyaratan kapasitas yang berkurang jika dibandingkan dengan penerapan. blue/green Dengan penerapan bergulir, lebih sedikit instans yang aktif pada satu waktu, dan Anda memiliki kontrol yang lebih terperinci atas berapa banyak instance yang ingin Anda perbarui di armada baru. Anda harus mempertimbangkan untuk menggunakan penerapan bergulir alih-alih blue/green penerapan jika Anda memiliki model besar atau titik akhir besar dengan banyak instance.

Daftar berikut menjelaskan fitur utama penerapan bergulir di Amazon SageMaker AI:
+ **Periode memanggang.**Periode pemanggangan adalah jumlah waktu yang ditetapkan untuk memantau armada baru sebelum melanjutkan ke tahap penyebaran berikutnya. Jika salah satu alarm yang telah ditentukan sebelumnya tersandung selama periode pemanggangan apa pun, maka semua lalu lintas titik akhir kembali ke armada lama. Periode memanggang membantu Anda membangun kepercayaan pada pembaruan Anda sebelum membuat pergeseran lalu lintas permanen.
+ **Ukuran batch bergulir.** Anda memiliki kontrol granular atas ukuran setiap batch untuk pergeseran lalu lintas, atau jumlah instance yang ingin Anda perbarui di setiap batch. Jumlah ini dapat berkisar antara 5-50% dari ukuran armada Anda. Anda dapat menentukan ukuran batch sebagai sejumlah instance atau sebagai persentase keseluruhan armada Anda.
+ **Rollback otomatis.**Anda dapat menentukan CloudWatch alarm Amazon yang digunakan SageMaker AI untuk memantau armada baru. Jika masalah dengan kode yang diperbarui tersandung salah satu alarm, SageMaker AI memulai pengembalian otomatis ke armada lama untuk menjaga ketersediaan, sehingga meminimalkan risiko.

**catatan**  
Jika titik akhir Anda menggunakan salah satu fitur yang tercantum di halaman [Pengecualian](https://docs.aws.amazon.com/sagemaker/latest/dg/deployment-guardrails-exclusions.html), Anda tidak dapat menggunakan penerapan bergulir.

## Cara kerjanya
<a name="deployment-guardrails-rolling-how-it-works"></a>

Selama penyebaran bergulir, SageMaker AI menyediakan infrastruktur untuk mengalihkan lalu lintas dari armada lama ke armada baru tanpa harus menyediakan semua instance baru sekaligus. SageMaker AI menggunakan langkah-langkah berikut untuk mengalihkan lalu lintas:

1. SageMaker AI menyediakan batch pertama instance dalam armada baru.

1. Sebagian lalu lintas dialihkan dari instance lama ke batch pertama instance baru.

1. Setelah periode pemanggangan, jika tidak ada CloudWatch alarm Amazon yang tersandung, maka SageMaker AI membersihkan sejumlah contoh lama.

1. SageMaker AI terus menyediakan, menggeser, dan membersihkan instance dalam batch hingga penerapan selesai.

Jika alarm tersandung selama salah satu periode memanggang, lalu lintas digulung kembali ke armada lama dalam batch dengan ukuran yang Anda tentukan. Atau, Anda dapat menentukan penyebaran bergulir untuk menggeser 100% lalu lintas kembali ke armada lama jika alarm tersandung.

Diagram berikut menunjukkan perkembangan penerapan bergulir yang berhasil, seperti yang dijelaskan pada langkah-langkah sebelumnya.

![\[Langkah-langkah lalu lintas penyebaran bergulir berhasil bergeser dari yang lama ke armada baru.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/deployment-guardrails-rolling-diagram.png)


Untuk membuat penerapan bergulir, Anda hanya perlu menentukan konfigurasi penerapan yang Anda inginkan. Kemudian SageMaker AI menangani penyediaan instance baru, menghentikan instans lama, dan mengalihkan lalu lintas untuk Anda. Anda dapat membuat dan mengelola penyebaran Anda melalui [CreateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateEndpoint.html) SageMaker API [UpdateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateEndpoint.html)dan AWS Command Line Interface perintah yang ada.

## Prasyarat
<a name="deployment-guardrails-prereqs"></a>

Sebelum menyiapkan penerapan bergulir, Anda harus membuat CloudWatch alarm Amazon untuk menonton metrik dari titik akhir Anda. Jika ada alarm yang tersandung selama periode memanggang, maka lalu lintas mulai bergulir kembali ke armada lama Anda. [Untuk mempelajari cara mengatur CloudWatch alarm pada titik akhir, lihat halaman prasyarat Auto-Rollback Configuration and Monitoring.](https://docs.aws.amazon.com/sagemaker/latest/dg/deployment-guardrails-configuration.html) Untuk mempelajari lebih lanjut tentang CloudWatch alarm, lihat [Menggunakan CloudWatch alarm Amazon](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) di * CloudWatch Panduan Pengguna Amazon*.

Juga, tinjau halaman [Pengecualian](https://docs.aws.amazon.com/sagemaker/latest/dg/deployment-guardrails-exclusions.html) untuk memastikan bahwa titik akhir Anda memenuhi persyaratan untuk penerapan bergulir.

## Tentukan ukuran batch bergulir
<a name="deployment-guardrails-rolling-batch-size"></a>

Sebelum memperbarui titik akhir Anda, tentukan ukuran batch yang ingin Anda gunakan untuk memindahkan lalu lintas secara bertahap ke armada baru.

Untuk penerapan bergulir, Anda dapat menentukan ukuran batch yang 5-50% dari kapasitas armada Anda. Jika Anda memilih ukuran batch yang besar, penerapan selesai lebih cepat. Namun, perlu diingat bahwa titik akhir membutuhkan lebih banyak kapasitas saat memperbarui, kira-kira overhead ukuran batch. Jika Anda memilih ukuran batch yang lebih kecil, penerapan akan memakan waktu lebih lama, tetapi Anda menggunakan lebih sedikit kapasitas selama penerapan.

## Konfigurasikan penerapan bergulir
<a name="deployment-guardrails-rolling-configure"></a>

Setelah Anda siap untuk penerapan dan telah menyiapkan CloudWatch alarm untuk titik akhir Anda, Anda dapat menggunakan SageMaker AI [UpdateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateEndpoint.html)API atau perintah [update-endpoint](https://docs.aws.amazon.com/cli/latest/reference/sagemaker/update-endpoint.html) di untuk memulai penerapan. AWS Command Line Interface 

**Cara memperbarui titik akhir**

Contoh berikut menunjukkan bagaimana Anda dapat memperbarui titik akhir Anda dengan penerapan bergulir menggunakan metode [update\$1endpoint](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/sagemaker/client/update_endpoint.html) dari klien AI Boto3. SageMaker 

Untuk mengonfigurasi penerapan bergulir, gunakan contoh dan bidang berikut:
+ Untuk`EndpointName`, gunakan nama titik akhir yang ada yang ingin Anda perbarui.
+ Untuk`EndpointConfigName`, gunakan nama konfigurasi titik akhir yang ingin Anda gunakan.
+ Di `AutoRollbackConfiguration` objek, di dalam `Alarms` bidang, Anda dapat menambahkan CloudWatch alarm Anda dengan nama. Buat satu `AlarmName: <your-cw-alarm>` entri untuk setiap alarm yang ingin Anda gunakan.
+ Di bawah`DeploymentConfig`, untuk `RollingUpdatePolicy` objek, tentukan bidang berikut:
  + `MaximumExecutionTimeoutInSeconds`— Batas waktu untuk total penyebaran. Melebihi batas ini menyebabkan batas waktu. Nilai maksimum yang dapat Anda tentukan untuk bidang ini adalah 28800 detik, atau 8 jam.
  + `WaitIntervalInSeconds`— Lamanya periode pemanggangan, di mana SageMaker AI memantau alarm untuk setiap batch pada armada baru.
  + `MaximumBatchSize`— Tentukan `Type` batch yang ingin Anda gunakan (baik jumlah instance atau persentase keseluruhan armada Anda) dan`Value`, atau ukuran setiap batch.
  + `RollbackMaximumBatchSize`— Gunakan objek ini untuk menentukan strategi rollback jika alarm tersandung. Tentukan `Type` batch yang ingin Anda gunakan (baik jumlah instans atau persentase keseluruhan armada Anda)`Value`, dan, atau ukuran setiap batch. Jika Anda tidak menentukan bidang ini, atau jika Anda menetapkan nilainya menjadi 100% dari titik akhir Anda, maka SageMaker AI menggunakan strategi blue/green rollback dan memutar semua lalu lintas kembali ke armada lama saat alarm tersandung.

```
import boto3
client = boto3.client("sagemaker")

response = client.update_endpoint(
    EndpointName="<your-endpoint-name>",
    EndpointConfigName="<your-config-name>",
    DeploymentConfig={
        "AutoRollbackConfiguration": {
            "Alarms": [
                {
                    "AlarmName": "<your-cw-alarm>"
                },
            ]
        },
        "RollingUpdatePolicy": { 
            "MaximumExecutionTimeoutInSeconds": number,
            "WaitIntervalInSeconds": number,
            "MaximumBatchSize": {
                "Type": "INSTANCE_COUNT" | "CAPACITY_PERCENTAGE" (default),
                "Value": number
            },
            "RollbackMaximumBatchSize": {
                "Type": "INSTANCE_COUNT" | "CAPACITY_PERCENTAGE" (default),
                "Value": number
            },
        }  
    }
)
```

Setelah memperbarui titik akhir Anda, Anda mungkin ingin memeriksa status penerapan bergulir Anda dan memeriksa kesehatan titik akhir Anda. Anda dapat meninjau status titik akhir Anda di konsol SageMaker AI, atau Anda dapat meninjau status titik akhir Anda dengan menggunakan API. [DescribeEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeEndpoint.html)

Di `VariantStatus` objek yang dikembalikan oleh `DescribeEndpoint` API, `Status` bidang memberi tahu Anda penerapan atau status operasional titik akhir Anda saat ini. Untuk informasi lebih lanjut tentang kemungkinan status dan apa artinya, lihat [ProductionVariantStatus](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ProductionVariantStatus.html).

Jika Anda mencoba melakukan penerapan bergulir dan status endpoint Anda adalah`UpdateRollbackFailed`, lihat bagian berikut untuk bantuan pemecahan masalah.

## Penanganan kegagalan
<a name="deployment-guardrails-rolling-failures"></a>

Jika penerapan bergulir Anda gagal dan rollback otomatis gagal juga, titik akhir Anda dapat dibiarkan dengan status. `UpdateRollbackFailed` Status ini berarti bahwa konfigurasi titik akhir yang berbeda diterapkan ke instance di belakang titik akhir Anda, dan titik akhir Anda dalam layanan dengan campuran konfigurasi titik akhir lama dan baru.

Anda dapat melakukan panggilan lain ke [UpdateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateEndpoint.html)API untuk mengembalikan titik akhir Anda ke status sehat. Tentukan konfigurasi titik akhir dan konfigurasi penerapan yang Anda inginkan (baik sebagai penerapan bergulir, penerapan biru/hijau, atau tidak keduanya) untuk memperbarui titik akhir Anda.

Anda dapat memanggil [DescribeEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeEndpoint.html)API untuk memeriksa kesehatan titik akhir Anda lagi, yang dikembalikan dalam `VariantStatus` objek sebagai `Status` bidang. Jika pembaruan Anda berhasil, titik akhir Anda `Status` kembali ke`InService`.

# Pengecualian
<a name="deployment-guardrails-exclusions"></a>

Saat melakukan blue/green or rolling deployment, your new endpoint configuration must have the same variant name as the old endpoint configuration. There are also feature-based exclusions that make your endpoint incompatible with deployment guardrails at this time. If your endpoint uses any of the following features, you cannot use deployment guardrails on your endpoint, and your endpoint will fall back to using a blue/green penyebaran dengan pergeseran lalu lintas sekaligus dan tidak ada periode pemanggangan akhir:
+ Kontainer Marketplace
+ Titik akhir yang menggunakan instance Inf1 (berbasis inferensia)

Jika Anda melakukan penerapan bergulir, ada pengecualian berbasis fitur tambahan:
+ Titik akhir inferensi tanpa server
+ Titik akhir inferensi multi-varian