Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Konfigurasi pelatihan lanjutan
<a name="adv-training-configs"></a>

## Konfigurasi laju sampel
<a name="sample-rate-configuration"></a>

**Laju sampel** menentukan seberapa sering pembacaan sensor direkam (misalnya, sekali setiap detik, atau sekali setiap menit). Pengaturan ini secara langsung berdampak pada **perincian** data pelatihan, dan memengaruhi kemampuan model untuk menangkap variasi jangka pendek dalam perilaku sensor.

Kunjungi [Pengambilan sampel untuk data frekuensi tinggi dan konsistensi antara pelatihan dan inferensi](ano-best-practices.md#apply-sampling-high-frequency-data) untuk mempelajari praktik terbaik.

### Konfigurasikan laju pengambilan sampel target
<a name="configuring-target-sampling-rate"></a>

Anda dapat secara opsional menentukan a `TargetSamplingRate` dalam konfigurasi pelatihan Anda, untuk mengontrol frekuensi di mana data diambil sampelnya. Nilai yang didukung adalah:

```
PT1S | PT5S | PT10S | PT15S | PT30S | PT1M | PT5M | PT10M | PT15M | PT30M | PT1H
```

Ini adalah format durasi ISO 8601, yang mewakili format waktu berikut:
+ `PT1S`= 1 detik
+ `PT1M`= 1 menit
+ `PT1H`= 1 jam

Pilih laju pengambilan sampel yang mencapai keseimbangan yang tepat antara **resolusi data**, dan efisiensi **pelatihan**. Tarif berikut tersedia:
+ **Tingkat pengambilan sampel yang lebih tinggi** (`PT1S`) menawarkan detail yang lebih halus tetapi dapat meningkatkan volume data dan waktu pelatihan.
+ **Tingkat pengambilan sampel yang lebih rendah** (`PT10M`,`PT1H`) mengurangi ukuran dan biaya data tetapi mungkin melewatkan anomali berumur pendek.

### Menangani ketidaksejajaran stempel waktu
<a name="handling-timestamp-misalignment"></a>

AWS IoT SiteWise secara otomatis mengkompensasi **ketidaksejajaran stempel waktu** di beberapa aliran data selama pelatihan. Ini memastikan perilaku model yang konsisten bahkan jika sinyal input tidak selaras sempurna dalam waktu.

Kunjungi [Pengambilan sampel untuk data frekuensi tinggi dan konsistensi antara pelatihan dan inferensi](ano-best-practices.md#apply-sampling-high-frequency-data) untuk mempelajari praktik terbaik.

### Aktifkan pengambilan sampel
<a name="enable-sampling"></a>

Tambahkan kode berikut ke`anomaly-detection-training-payload.json`.

Konfigurasikan pengambilan sampel `TargetSamplingRate` dengan menambahkan muatan tindakan pelatihan, dengan laju pengambilan sampel data. Nilai yang diizinkan adalah:`PT1S | PT5S | PT10S | PT15S | PT30S | PT1M | PT5M | PT10M | PT15M | PT30M | PT1H`.

```
{
    "exportDataStartTime": StartTime,
    "exportDataEndTime": EndTime,
    "targetSamplingRate": "TargetSamplingRate"
}
```

**Example dari konfigurasi laju sampel:**  

```
{
    "exportDataStartTime": 1717225200,
    "exportDataEndTime": 1722789360,
    "targetSamplingRate": "PT1M"
}
```

## Beri label data Anda
<a name="ano-labeling-data"></a>

Saat memberi label pada data Anda, Anda harus menentukan interval waktu yang mewakili periode perilaku peralatan abnormal. Informasi pelabelan ini disediakan sebagai `CSV` file, di mana setiap baris menentukan rentang waktu di mana peralatan tidak beroperasi dengan benar.

Setiap baris berisi dua stempel waktu:
+ **Waktu mulai**, menunjukkan kapan perilaku abnormal diyakini telah dimulai.
+ **Waktu akhir**, mewakili kapan kegagalan atau masalah pertama kali diamati.

File CSV ini disimpan dalam bucket Amazon S3 dan digunakan selama pelatihan model untuk membantu sistem belajar dari contoh perilaku abnormal yang diketahui. Contoh berikut menunjukkan bagaimana data label Anda akan muncul sebagai `.csv` file. File tidak memiliki header.

**Example dari file CSV:**  

```
2024-06-21T00:00:00.000000,2024-06-21T12:00:00.000000
2024-07-11T00:00:00.000000,2024-07-11T12:00:00.000000
2024-07-31T00:00:00.000000,2024-07-31T12:00:00.000000
```

**Baris 1** mewakili acara pemeliharaan pada **21 Juni 2024**, dengan **jendela 12 jam** (dari `2024-06-21T00:00:00.000000Z` ke`2024-06-21T12:00:00.000000Z`) AWS IoT SiteWise untuk mencari perilaku abnormal.

**Baris 2** mewakili acara pemeliharaan pada **11 Juli 2024**, dengan **jendela 12 jam** (dari `2024-07-11T00:00:00.000000Z` ke`2024-07-11T12:00:00.000000Z`) AWS IoT SiteWise untuk mencari perilaku abnormal.

**Baris 3** mewakili acara pemeliharaan pada **31 Juli 2024**, dengan **jendela 12 jam** (dari `2024-07-31T00:00:00.000000Z` ke`2024-07-31T12:00:00.000000Z`) AWS IoT SiteWise untuk mencari perilaku abnormal.

AWS IoT SiteWise menggunakan semua jendela waktu ini untuk melatih dan mengevaluasi model yang dapat mengidentifikasi perilaku abnormal di sekitar peristiwa ini. Perhatikan bahwa tidak semua peristiwa dapat dideteksi, dan hasilnya sangat bergantung pada kualitas dan karakteristik data yang mendasarinya.

Untuk detail tentang praktik terbaik untuk pengambilan sampel, lihat[Praktik terbaik](ano-best-practices.md).

### Langkah-langkah pelabelan data
<a name="label-data-steps"></a>
+ [Konfigurasikan bucket Amazon S3 Anda sesuai dengan prasyarat pelabelan pada prasyarat data Pelabelan.](anomaly-prerequisites.md#label-data) 
+ Unggah file ke ember pelabelan Anda.
+ Tambahkan yang berikut ini ke`anomaly-detection-training-payload.json`.
  + Berikan lokasi di `labelInputConfiguration` bagian file. Ganti `labels-bucket` dengan nama bucket dan `files-prefix` dengan jalur file atau bagian awalan mana pun. Semua file di lokasi diurai, dan (pada keberhasilan) digunakan sebagai file label.

```
{
    "exportDataStartTime": StartTime,
    "exportDataEndTime": EndTime,
    "labelInputConfiguration": 
      {
       "bucketName": "label-bucket",
       "prefix": "files-prefix"
      }
}
```

**Example dari konfigurasi label:**  

```
{
    "exportDataStartTime": 1717225200,
    "exportDataEndTime": 1722789360,
    "labelInputConfiguration": {
      "bucketName": "anomaly-detection-customer-data-278129555252-iad",
      "prefix": "Labels/model=b2d8ab3e-73af-48d8-9b8f-a290bef931b4/asset[d3347728-4796-4c5c-afdb-ea2f551ffe7a]/Lables.csv"
    }
}
```

## Evaluasi model Anda
<a name="evaluating-model"></a>

Diagnostik model pointwise untuk model AWS IoT SiteWise pelatihan adalah evaluasi kinerja model pada acara individu. Selama pelatihan, AWS IoT SiteWise hasilkan skor anomali, dan diagnostik kontribusi sensor untuk setiap baris dalam kumpulan data input. Skor anomali yang lebih tinggi menunjukkan kemungkinan kejadian abnormal yang lebih tinggi.

Diagnostik pointwise tersedia, saat Anda melatih model dengan [ExecuteAction](https://docs.aws.amazon.com/iot-sitewise/latest/APIReference/API_ExecuteAction.html)API, dan `AWS/ANOMALY_DETECTION_TRAINING` tipe tindakan.

Untuk mengkonfigurasi evaluasi model,
+ [Konfigurasikan bucket Amazon S3 Anda sesuai dengan prasyarat pelabelan pada prasyarat data Pelabelan.](anomaly-prerequisites.md#label-data)
+ Tambahkan yang berikut ini ke`anomaly-detection-training-payload.json`.
  + Berikan `evaluationStartTime` dan `evaluationEndTime` (keduanya dalam epoch seconds) untuk data di jendela yang digunakan untuk mengevaluasi kinerja model.
  + Berikan lokasi bucket Amazon S3 (`resultDestination`) agar diagnostik evaluasi ditulis.

**catatan**  
Interval evaluasi model (`dataStartTime`to`dataEndtime`) harus tumpang tindih, atau berdekatan dengan interval pelatihan. Tidak ada celah yang diizinkan.

```
{
  "exportDataStartTime": StartTime,
  "exportDataEndTime": EndTime,
  "modelEvaluationConfiguration": {
    "dataStartTime": evaluationStartTime,
    "dataEndTime": evaluationEndTime
    "resultDestination": {
      "bucketName": "s3BucketName",
      "prefix": "bucketPrefix"
    }
  }
}
```

**Example dari konfigurasi evaluasi model:**  

```
{
  "exportDataStartTime": 1717225200,
  "exportDataEndTime": 1722789360,
  "modelEvaluationConfiguration": {
    "dataStartTime": 1722789360,
    "dataEndTime": 1725174000,
    "resultDestination": {
      "bucketName": "anomaly-detection-customer-data-278129555252-iad",
      "prefix": "Evaluation/asset[d3347728-4796-4c5c-afdb-ea2f551ffe7a]/1747681026-evaluation_results.jsonl"
    }
  }
}
```

## Hasilkan metrik model
<a name="generating-model-metrics"></a>

Metrik model memberikan wawasan komprehensif tentang kinerja dan kualitas model deteksi anomali terlatih Anda. Proses pelatihan secara otomatis menghasilkan metrik ini dan menerbitkannya ke bucket Amazon S3 yang Anda tentukan, sehingga mudah diakses untuk analisis, perbandingan model, dan keputusan promosi dalam alur kerja pelatihan ulang.

### Memahami metrik model
<a name="understanding-model-metrics"></a>

Proses pelatihan secara otomatis menghasilkan metrik model dan memberikan informasi terperinci tentang:
+ **Kinerja Model**: Ukuran kuantitatif seperti presisi, penarikan, dan AUC saat data berlabel tersedia
+ **Kualitas Data**: Informasi tentang data pelatihan yang digunakan dan periode waktu yang tercakup
+ **Deteksi Peristiwa**: Statistik tentang anomali yang diidentifikasi dan peristiwa berlabel
+ **Perbandingan Model**: Metrik perbandingan antara versi model yang berbeda selama pelatihan ulang

### Konfigurasikan tujuan metrik model
<a name="configuring-model-metrics-destination"></a>

Untuk mengaktifkan pembuatan metrik model, konfigurasikan tujuan Amazon S3 tempat metrik dipublikasikan.

1. Konfigurasikan bucket Amazon S3 Anda sesuai. [Prasyarat evaluasi model](anomaly-prerequisites.md#prerequisites-model-evaluation)

1. Tambahkan yang berikut ini ke payload tindakan pelatihan Anda untuk menentukan di mana metrik model harus disimpan:

   ```
   {
       "trainingMode": "TRAIN_MODEL",
       "exportDataStartTime": StartTime,
       "exportDataEndTime": EndTime,
       "modelMetricsDestination": {
           "bucketName": "bucket-name",
           "prefix": "prefix"
       }
   }
   ```  
**Example Contoh konfigurasi metrik model**  

   ```
   {
       "exportDataStartTime": 1717225200,
       "exportDataEndTime": 1722789360,
       "modelMetricsDestination": {
           "bucketName": "anomaly-detection-metrics-bucket-123456789012-iad",
           "prefix": "ModelMetrics/computation-model-id/asset-id/training-metrics.json"
       }
   }
   ```

### Konfigurasikan metrik model untuk pelatihan ulang
<a name="configuring-model-metrics-retraining"></a>

Saat Anda menyiapkan jadwal pelatihan ulang, tujuan metrik model diperlukan untuk mengaktifkan pelacakan dan perbandingan kinerja model yang komprehensif:

```
{
    "trainingMode": "START_RETRAINING_SCHEDULER",
    "modelMetricsDestination": {
        "bucketName": "bucket-name",
        "prefix": "prefix"
    },
    "retrainingConfiguration": {
        "lookbackWindow": "P180D",
        "promotion": "SERVICE_MANAGED",
        "retrainingFrequency": "P30D",
        "retrainingStartDate": "StartDate"
    }
}
```Parameter

`bucketName`  
Bucket Amazon S3 tempat metrik model akan disimpan

`prefix`  
Amazon S3 prefix/path untuk mengatur file metrik model

### Struktur metrik model
<a name="model-metrics-structure"></a>

Metrik model disimpan sebagai file JSON di bucket Amazon S3 Anda dalam struktur berikut:

```
{
    "labeled_ranges": [],
    "labeled_event_metrics": {
        "num_labeled": 0,
        "num_identified": 0,
        "total_warning_time_in_seconds": 0
    },
    "predicted_ranges": [],
    "unknown_event_metrics": {
        "num_identified": 0,
        "total_duration_in_seconds": 0
    },
    "data_start_time": "2023-11-01",
    "data_end_time": "2023-12-31",
    "labels_present": false,
    "model_version_metrics": {
        "precision": 1.0,
        "recall": 1.0,
        "mean_fractional_lead_time": 0.7760964912280702,
        "auc": 0.5971207364893062
    }
}
```Metrik kunci

`labeled_ranges`  
Rentang waktu di mana anomali berlabel diberikan selama pelatihan

`labeled_event_metrics`  
Statistik tentang seberapa baik model mengidentifikasi peristiwa berlabel yang diketahui

`num_labeled`  
Jumlah total acara berlabel dalam data pelatihan

`num_identified`  
Jumlah peristiwa berlabel yang diidentifikasi dengan benar oleh model

`total_warning_time_in_seconds`  
Total waktu yang dihabiskan model dalam status peringatan untuk acara berlabel

`predicted_ranges`  
Rentang waktu di mana model memprediksi anomali selama evaluasi

`unknown_event_metrics`  
Statistik tentang anomali yang terdeteksi dalam data yang tidak berlabel

`data_start_time / data_end_time`  
Jendela waktu yang dicakup oleh data pelatihan

`labels_present`  
Boolean menunjukkan apakah data berlabel digunakan selama pelatihan

`model_version_metrics`  
Metrik khusus versi tambahan untuk perbandingan model

### Metrik lanjutan untuk model berlabel
<a name="advanced-metrics-labeled-models"></a>

Saat Anda memberikan data berlabel selama pelatihan, metrik kinerja tambahan disertakan dalam file Amazon S3:
+ **Ingat**: Proporsi peristiwa yang diidentifikasi AWS IoT SiteWise dengan benar pada peristiwa yang Anda beri label selama periode yang sama. Misalnya, Anda mungkin telah memberi label 10 peristiwa, tetapi AWS IoT SiteWise hanya mengidentifikasi 9 di antaranya. Dalam hal ini, penarikan kembali adalah 90%.
+ **Presisi**: Proporsi positif sejati terhadap total peristiwa yang diidentifikasi. Misalnya, jika AWS IoT SiteWise mengidentifikasi 10 peristiwa, tetapi hanya 7 dari peristiwa tersebut yang sesuai dengan peristiwa yang Anda beri label, maka ketepatannya adalah 70%.
+ **MeanFractionalLeadTime**: Pengukuran seberapa cepat (relatif terhadap panjang acara), rata-rata, AWS IoT SiteWise mendeteksi setiap peristiwa. Misalnya, acara khas di fasilitas Anda dapat berlangsung 10 jam. Rata-rata, mungkin diperlukan model 3 jam untuk mengidentifikasi acara tersebut. Dalam hal ini, lead time fraksional rata-rata adalah 0,7.
+ **AUC**: Area Under the Curve (AUC) mengukur kemampuan model pembelajaran mesin untuk memprediksi skor yang lebih tinggi untuk contoh positif dibandingkan dengan contoh negatif. Nilai antara 0 dan 1 yang menunjukkan seberapa baik model Anda dapat memisahkan kategori dalam kumpulan data Anda. Nilai 1 menunjukkan bahwa ia mampu memisahkan kategori dengan sempurna.

### Promosi dan metrik model
<a name="model-promotion-metrics"></a>

Selama pelatihan ulang alur kerja, metrik yang disimpan di Amazon S3 memungkinkan keputusan promosi model yang terinformasi:

#### Mode terkelola (Promosi otomatis)
<a name="managed-mode-promotion"></a>
+ Sistem secara otomatis membandingkan metrik antara versi model lama dan baru menggunakan data yang disimpan Amazon S3
+ Model dipromosikan berdasarkan indikator kinerja yang ditingkatkan
+ Keputusan promosi mencakup kode alasan spesifik yang disimpan bersama metrik:
  + `AUTO_PROMOTION_SUCCESSFUL`: Metrik model baru lebih baik dari versi saat ini
  + `MODEL_METRICS_DIDNT_IMPROVE`: Kinerja model baru tidak membaik
  + `POOR_MODEL_QUALITY_DETECTED`: Model baru memiliki penilaian kualitas yang buruk

#### Mode manual (Promosi yang dikendalikan pelanggan)
<a name="manual-mode-promotion"></a>
+ Anda dapat mengunduh dan menganalisis metrik terperinci dari Amazon S3 untuk membuat keputusan promosi
+ Semua versi model historis dan metriknya tetap dapat diakses di Amazon S3
+ Anda dapat membuat dasbor khusus dan alat analisis menggunakan metrik yang disimpan Amazon S3