

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Alarm dan log untuk melacak metrik dari titik akhir asinkron
<a name="async-inference-monitor"></a>

Anda dapat memantau SageMaker AI menggunakan Amazon CloudWatch, yang mengumpulkan data mentah dan memprosesnya menjadi metrik yang dapat dibaca, mendekati waktu nyata. Dengan Amazon CloudWatch, Anda dapat mengakses informasi historis dan mendapatkan perspektif yang lebih baik tentang kinerja aplikasi atau layanan web Anda. Untuk informasi selengkapnya tentang Amazon CloudWatch, lihat [Apa itu Amazon CloudWatch?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html)

## Pemantauan CloudWatch dengan
<a name="async-inference-monitor-cloudwatch"></a>

Metrik di bawah ini adalah daftar lengkap metrik untuk titik akhir asinkron dan berada di namespace. `AWS/SageMaker` Metrik apa pun yang tidak tercantum di bawah ini tidak dipublikasikan jika titik akhir diaktifkan untuk inferensi asinkron. Metrik tersebut mencakup (tetapi tidak terbatas pada):
+ OverheadLatency
+ Invokasi
+ InvocationsPerInstance

### Metrik Titik Akhir Umum
<a name="async-inference-monitor-cloudwatch-common"></a>

Metrik ini sama dengan metrik yang diterbitkan untuk titik akhir waktu nyata hari ini. Untuk informasi selengkapnya tentang metrik lain di Amazon CloudWatch, lihat [Memantau SageMaker AI dengan Amazon CloudWatch](https://docs.aws.amazon.com/sagemaker/latest/dg/monitoring-cloudwatch.html).


| Nama Metrik | Deskripsi | Unit/Statistik | 
| --- | --- | --- | 
| `Invocation4XXErrors` | Jumlah permintaan di mana model mengembalikan kode respons HTTP 4xx. Untuk setiap respons 4xx, 1 dikirim; jika tidak, 0 dikirim. | Satuan: Tidak adaStatistik yang valid: Rata-rata, Jumlah | 
| `Invocation5XXErrors` | Jumlah InvokeEndpoint permintaan di mana model mengembalikan kode respons HTTP 5xx. Untuk setiap respons 5xx, 1 dikirim; jika tidak, 0 dikirim. | Satuan: Tidak adaStatistik yang valid: Rata-rata, Jumlah | 
| `ModelLatency` | Interval waktu yang dibutuhkan oleh model untuk merespons seperti yang dilihat dari SageMaker AI. Interval ini mencakup waktu komunikasi lokal yang diambil untuk mengirim permintaan dan untuk mengambil respons dari wadah model dan waktu yang dibutuhkan untuk menyelesaikan inferensi dalam wadah. | Unit: Mikrodetik Statistik yang valid: Rata-rata, Jumlah, Min, Maks, Jumlah Sampel | 

### Metrik Titik Akhir Inferensi Asinkron
<a name="async-inference-monitor-cloudwatch-async"></a>

Metrik ini diterbitkan untuk titik akhir yang diaktifkan untuk inferensi asinkron. Metrik berikut diterbitkan dengan `EndpointName` dimensi:


| Nama Metrik | Deskripsi | Unit/Statistik | 
| --- | --- | --- | 
| `ApproximateBacklogSize` | Jumlah item dalam antrian untuk titik akhir yang saat ini sedang diproses atau belum diproses. | Unit: Jumlah Statistik yang valid: Rata-rata, Maks, Min  | 
| `ApproximateBacklogSizePerInstance` | Jumlah item dalam antrian dibagi dengan jumlah instance di belakang titik akhir. Metrik ini terutama digunakan untuk menyiapkan penskalaan otomatis aplikasi untuk titik akhir berkemampuan asinkron. | Unit: JumlahStatistik yang valid: Rata-rata, Maks, Min | 
| `ApproximateAgeOfOldestRequest` | Usia permintaan tertua dalam antrian. | Unit: detikStatistik yang valid: Rata-rata, Maks, Min | 
| `HasBacklogWithoutCapacity` | Nilai metrik ini adalah `1` ketika ada permintaan dalam antrian tetapi nol contoh di belakang titik akhir. Nilainya ada `0` di waktu lainnya. Anda dapat menggunakan metrik ini untuk menskalakan otomatis titik akhir Anda dari nol instance setelah menerima permintaan baru dalam antrian. | Unit: JumlahStatistik yang valid: Rata-rata | 

Metrik berikut diterbitkan dengan `VariantName` dimensi `EndpointName` dan:


| Nama Metrik | Deskripsi | Unit/Statistik | 
| --- | --- | --- | 
| `RequestDownloadFailures` | Ketika kegagalan inferensi terjadi karena masalah saat mengunduh permintaan dari Amazon S3. | Unit: JumlahStatistik yang valid: Jumlah | 
| `ResponseUploadFailures` | Ketika kegagalan inferensi terjadi karena masalah saat mengunggah respons ke Amazon S3. | Unit: JumlahStatistik yang valid: Jumlah | 
| `NotificationFailures` | Saat terjadi masalah, publikasi notifikasi. | Unit: JumlahStatistik yang valid: Jumlah | 
| `RequestDownloadLatency` | Total waktu untuk mengunduh payload permintaan. | Unit: MikrodetikStatistik yang valid: Rata-rata, Jumlah, Min, Maks, Jumlah Sampel | 
| `ResponseUploadLatency` | Total waktu untuk mengunggah payload respons. | Unit: Mikrodetik Statistik yang valid: Rata-rata, Jumlah, Min, Maks, Jumlah Sampel | 
| `ExpiredRequests` | Jumlah permintaan dalam antrian yang gagal karena mencapai permintaan TTL yang ditentukan. | Unit: JumlahStatistik yang valid: Jumlah | 
| `InvocationFailures` | Jika doa gagal karena alasan apa pun. | Unit: JumlahStatistik yang valid: Jumlah | 
| `InvocationsProcesssed` | Jumlah pemanggilan asinkron yang diproses oleh titik akhir. | Unit: JumlahStatistik yang valid: Jumlah | 
| `TimeInBacklog` | Total waktu permintaan antri sebelum diproses. Ini tidak termasuk waktu pemrosesan aktual (yaitu waktu pengunduhan, waktu unggah, latensi model). | Unit: MilidetikStatistik yang valid: Rata-rata, Jumlah, Min, Maks, Jumlah Sampel | 
| `TotalProcessingTime` | Waktu permintaan inferensi diterima oleh SageMaker AI hingga saat permintaan selesai diproses. Ini termasuk waktu dalam backlog dan waktu untuk mengunggah dan mengirim pemberitahuan respons, jika ada. | Unit: MilidetikStatistik yang valid: Rata-rata, Jumlah, Min, Maks, Jumlah Sampel | 

Inferensi SageMaker Asinkron Amazon juga mencakup metrik tingkat host. Untuk informasi tentang metrik tingkat host, lihat [Pekerjaan SageMaker AI dan](https://docs.aws.amazon.com/sagemaker/latest/dg/monitoring-cloudwatch.html#cloudwatch-metrics-jobs) Metrik Titik Akhir.

## Log
<a name="async-inference-monitor-logs"></a>

Selain [log wadah Model](https://docs.aws.amazon.com/sagemaker/latest/dg/logging-cloudwatch.html) yang dipublikasikan ke Amazon CloudWatch di akun Anda, Anda juga mendapatkan log platform baru untuk melacak dan men-debug permintaan inferensi.

Log baru diterbitkan di bawah Endpoint Log Group:

```
/aws/sagemaker/Endpoints/[EndpointName]
```

Nama log stream terdiri dari: 

```
[production-variant-name]/[instance-id]/data-log.
```

Baris log berisi ID inferensi permintaan sehingga kesalahan dapat dengan mudah dipetakan ke permintaan tertentu.