

# OPS 8. Bagaimana cara memanfaatkan observabilitas beban kerja di organisasi Anda?
<a name="ops-08"></a>

Memastikan kondisi beban kerja yang optimal dengan memanfaatkan observabilitas. Memanfaatkan metrik, log, dan jejak yang relevan untuk mendapatkan pandangan komprehensif tentang kinerja beban kerja Anda dan mengatasi masalah secara efisien.

**Topics**
+ [

# OPS08-BP01 Menganalisis metrik beban kerja
](ops_workload_observability_analyze_workload_metrics.md)
+ [

# OPS08-BP02 Menganalisis log beban kerja
](ops_workload_observability_analyze_workload_logs.md)
+ [

# OPS08-BP03 Menganalisis jejak beban kerja
](ops_workload_observability_analyze_workload_traces.md)
+ [

# OPS08-BP04 Membuat peringatan yang dapat ditindaklanjuti
](ops_workload_observability_create_alerts.md)
+ [

# OPS08-BP05 Membuat dasbor
](ops_workload_observability_create_dashboards.md)

# OPS08-BP01 Menganalisis metrik beban kerja
<a name="ops_workload_observability_analyze_workload_metrics"></a>

 Setelah mengimplementasikan telemetri aplikasi, lakukan analisis terhadap metrik yang dikumpulkan secara rutin. Latensi, permintaan, kesalahan, dan kapasitas (atau kuota) memang memberikan wawasan tentang performa sistem, tetapi memprioritaskan peninjauan terhadap metrik hasil bisnis adalah hal yang sangat penting. Ini akan memastikan Anda mengambil keputusan berbasis data yang selaras dengan tujuan-tujuan bisnis Anda. 

 **Hasil yang diharapkan:** Wawasan akurat tentang performa beban kerja yang mendorong keputusan berdasarkan informasi data, sehingga memastikan keselarasan dengan tujuan bisnis. 

 **Anti-pola umum:** 
+  Menganalisis metrik secara terpisah tanpa mempertimbangkan dampak-dampak yang ditimbulkannya terhadap hasil bisnis. 
+  Ketergantungan berlebihan pada metrik teknis sekaligus mengesampingkan metrik bisnis. 
+  Peninjauan metrik jarang dilakukan, sehingga peluang pengambilan keputusan waktu nyata terlewatkan. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Peningkatan pemahaman tentang korelasi antara performa teknis dan hasil bisnis. 
+  Perbaikan proses pengambilan keputusan yang berlandaskan data waktu nyata. 
+  Melakukan identifikasi dan mitigasi masalah secara proaktif sebelum hasil bisnis terkena dampaknya. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Manfaatkan alat seperti Amazon CloudWatch untuk melakukan analisis metrik. AWS layanan seperti deteksi CloudWatch anomali dan Amazon DevOps Guru dapat digunakan untuk mendeteksi anomali, terutama ketika ambang batas statis tidak diketahui atau ketika pola perilaku lebih cocok untuk deteksi anomali. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  **Lakukan analisis dan peninjauan:** Tinjau dan tafsirkan metrik beban kerja Anda secara rutin. 

   1.  Memprioritaskan metrik hasil bisnis daripada metrik teknis murni. 

   1.  Memahami arti penting dari lonjakan, penurunan, atau pola dalam data Anda. 

1.  **Manfaatkan Amazon CloudWatch:** Gunakan Amazon CloudWatch untuk tampilan terpusat dan analisis mendalam. 

   1.  Konfigurasikan CloudWatch dasbor untuk memvisualisasikan metrik Anda dan membandingkannya dari waktu ke waktu. 

   1.  Gunakan [persentil CloudWatch](https://aws-observability.github.io/observability-best-practices/guides/operational/business/sla-percentile/) untuk mendapatkan pandangan yang jelas tentang distribusi metrik, yang dapat membantu dalam mendefinisikan SLAs dan memahami outlier. 

   1.  Siapkan [deteksi CloudWatch anomali](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) untuk mengidentifikasi pola yang tidak biasa tanpa bergantung pada ambang batas statis. 

   1.  Menerapkan [observabilitas CloudWatch lintas akun](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-Unified-Cross-Account.html) untuk memantau dan memecahkan masalah aplikasi yang menjangkau beberapa akun dalam suatu Wilayah. 

   1.  Gunakan [Wawasan CloudWatch Metrik](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/query_with_cloudwatch-metrics-insights.html) untuk menanyakan dan menganalisis data metrik di seluruh akun dan Wilayah, mengidentifikasi tren dan anomali. 

   1.  Terapkan [CloudWatch Metric Math](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/using-metric-math.html) untuk mengubah, menggabungkan, atau melakukan perhitungan pada metrik Anda untuk wawasan yang lebih dalam. 

1.  **Mempekerjakan Amazon DevOps Guru:** Gabungkan [Amazon DevOps Guru](https://aws.amazon.com/devops-guru/) untuk deteksi anomali yang ditingkatkan pembelajaran mesin untuk mengidentifikasi tanda-tanda awal masalah operasional untuk aplikasi tanpa server Anda dan memperbaikinya sebelum berdampak pada pelanggan Anda. 

1.  **Lakukan optimalisasi berdasarkan wawasan:** Ambil keputusan cerdas berdasarkan analisis metrik Anda untuk menyesuaikan dan meningkatkan beban kerja Anda. 

 **Tingkat upaya untuk Rencana Implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS04-BP01 Identifikasi indikator kinerja utama](ops_observability_identify_kpis.md) 
+  [OPS04-BP02 Melaksanakan telemetri aplikasi](ops_observability_application_telemetry.md) 

 **Dokumen terkait:** 
+ [ The Wheel Blog - Menekankan pentingnya peninjauan metrik secara terus-menerus ](https://aws.amazon.com/blogs/opensource/the-wheel/)
+ [ Persentil itu penting ](https://aws-observability.github.io/observability-best-practices/guides/operational/business/sla-percentile/)
+ [Menggunakan AWS Cost Anomaly Detection](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html)
+ [ CloudWatch observabilitas lintas akun](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-Unified-Cross-Account.html)
+ [Kueri metrik Anda dengan Wawasan CloudWatch Metrik](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/query_with_cloudwatch-metrics-insights.html)

 **Video terkait:** 
+ [Aktifkan Observabilitas Lintas Akun di Amazon CloudWatch](https://www.youtube.com/watch?v=lUaDO9dqISc)
+ [Pengantar Amazon DevOps Guru](https://www.youtube.com/watch?v=2uA8q-8mTZY)
+ [Terus Menganalisis Metrik menggunakan AWS Cost Anomaly Detection](https://www.youtube.com/watch?v=IpQYBuay5OE)

 **Contoh terkait:** 
+ [ Lokakarya Satu Observabilitas ](https://catalog.workshops.aws/observability/en-US/intro)
+ [Mendapatkan wawasan operasi dengan AIOps menggunakan Amazon Guru DevOps](https://catalog.us-east-1.prod.workshops.aws/workshops/f92df379-6add-4101-8b4b-38b788e1222b/en-US)

# OPS08-BP02 Menganalisis log beban kerja
<a name="ops_workload_observability_analyze_workload_logs"></a>

 Melakukan analisis log beban kerja secara rutin merupakan hal yang sangatlah penting untuk mendapatkan pemahaman yang lebih mendalam tentang aspek-aspek operasional aplikasi Anda. Dengan memilah-milah, memvisualisasikan, dan menafsirkan data log secara efisien, Anda akan dapat terus mengoptimalkan performa dan keamanan aplikasi. 

 **Hasil yang diinginkan:** Wawasan yang kaya tentang perilaku dan operasi aplikasi yang berasal dari analisis log yang dilakukan secara menyeluruh, sehingga akan memastikan deteksi dan mitigasi masalah yang proaktif. 

 **Anti-pola umum:** 
+  Mengabaikan analisis log sampai ada masalah kritis yang muncul. 
+  Tidak menggunakan rangkaian alat lengkap yang tersedia untuk melakukan analisis log, sehingga ada wawasan kritis yang terlewatkan. 
+  Hanya mengandalkan tinjauan log manual tanpa memanfaatkan kemampuan-kemampuan otomatisasi dan kueri. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Lakukan identifikasi kemacetan operasional, ancaman keamanan, dan masalah-masalah potensial lain secara proaktif. 
+  Pemanfaatan data log yang efisien untuk optimalisasi aplikasi yang berkelanjutan. 
+  Peningkatan pemahaman tentang perilaku aplikasi, sehingga itu akan membantu Anda dalam melakukan upaya debugging dan pemecahan masalah. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 [Amazon CloudWatch Logs](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/WhatIsCloudWatchLogs.html) adalah alat yang ampuh untuk analisis log. Fitur terintegrasi seperti Wawasan CloudWatch Log dan Wawasan Kontributor membuat proses memperoleh informasi yang bermakna dari log menjadi intuitif dan efisien. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  **Siapkan CloudWatch Log**: Konfigurasikan aplikasi dan layanan untuk mengirim CloudWatch log ke Log. 

1.  **Gunakan deteksi anomali log: Manfaatkan deteksi** [anomali CloudWatch Amazon Logs](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/LogsAnomalyDetection.html) untuk secara otomatis mengidentifikasi dan memperingatkan pola log yang tidak biasa. Alat ini akan membantu Anda secara proaktif mengelola anomali-anomali yang terjadi dalam log Anda dan mendeteksi setiap potensi masalah sejak dini. 

1.  **Siapkan Wawasan CloudWatch Log**: Gunakan [Wawasan CloudWatch Log](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/AnalyzingLogData.html) untuk mencari dan menganalisis data log Anda secara interaktif. 

   1.  Buat kueri untuk mengekstrak pola, memvisualisasikan data log, dan memperoleh wawasan yang dapat Anda tindaklanjuti. 

   1.  Gunakan [analisis pola Wawasan CloudWatch Log](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CWL_AnalyzeLogData_Patterns.html) untuk menganalisis dan memvisualisasikan pola log yang sering. Fitur ini akan membantu Anda memahami tren operasional umum dan setiap potensi penyimpangan yang ada dalam data log Anda. 

   1.  Gunakan [perbandingan CloudWatch Log (diff)](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CWL_AnalyzeLogData_Compare.html) untuk melakukan analisis diferensial antara periode waktu yang berbeda atau di seluruh grup log yang berbeda. Gunakan kemampuan ini untuk mendeteksi perubahan-perubahan yang terjadi dan menilai dampaknya terhadap kinerja atau perilaku sistem Anda. 

1.  **Pantau log secara real-time dengan Live Tail:** Gunakan [Amazon CloudWatch Logs Live Tail](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CloudWatchLogs_LiveTail.html) untuk melihat data log secara real-time. Anda dapat secara aktif memantau aktivitas operasional aplikasi Anda saat sedang berlangsung, yang memberikan visibilitas langsung kepada Anda mengenai kinerja sistem dan potensi masalah. 

1.  **Manfaatkan Wawasan Kontributor: Gunakan Wawasan CloudWatch** [Kontributor](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/ContributorInsights.html) untuk mengidentifikasi pembicara teratas dalam dimensi kardinalitas tinggi seperti alamat IP atau agen pengguna. 

1.  **Menerapkan filter metrik CloudWatch Log**: Konfigurasikan [filter metrik CloudWatch Log](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/MonitoringLogData.html) untuk mengonversi data log menjadi metrik yang dapat ditindaklanjuti. Ini memungkinkan Anda untuk mengatur alarm atau melakukan analisis pola lebih lanjut. 

1.  **Menerapkan [observabilitas CloudWatch lintas akun](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-Unified-Cross-Account.html):** Pantau dan pecahkan masalah aplikasi yang menjangkau beberapa akun dalam suatu Wilayah. 

1.  **Lakukan peninjauan dan penyempurnaan secara rutin**: Tinjau strategi analisis log Anda secara berkala untuk menangkap semua informasi yang relevan dan terus mengoptimalkan performa aplikasi. 

 **Tingkat upaya untuk rencana implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS04-BP01 Identifikasi indikator kinerja utama](ops_observability_identify_kpis.md) 
+  [OPS04-BP02 Melaksanakan telemetri aplikasi](ops_observability_application_telemetry.md) 
+  [OPS08-BP01 Menganalisis metrik beban kerja](ops_workload_observability_analyze_workload_metrics.md) 

 **Dokumen terkait:** 
+  [Menganalisis Data Log dengan Wawasan CloudWatch Log](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/AnalyzingLogData.html) 
+  [Menggunakan CloudWatch Wawasan Kontributor](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/ContributorInsights.html) 
+  [Membuat dan Mengelola Filter Metrik CloudWatch Log](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/MonitoringLogData.html) 

 **Video terkait:** 
+  [Menganalisis Data Log dengan Wawasan CloudWatch Log](https://www.youtube.com/watch?v=2s2xcwm8QrM) 
+  [Gunakan Wawasan CloudWatch Kontributor untuk Menganalisis Data Kardinalitas Tinggi](https://www.youtube.com/watch?v=ErWRBLFkjGI) 

 **Contoh terkait:** 
+  [CloudWatch Pertanyaan Contoh Log](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CWL_QuerySyntax-examples.html) 
+  [Lokakarya Satu Observabilitas](https://catalog.workshops.aws/observability/en-US/intro) 

# OPS08-BP03 Menganalisis jejak beban kerja
<a name="ops_workload_observability_analyze_workload_traces"></a>

 Menganalisis data jejak sangatlah penting untuk mencapai pandangan yang komprehensif tentang perjalanan operasional aplikasi. Dengan memvisualisasikan dan memahami interaksi antara berbagai komponen, performa dapat disesuaikan, kemacetan dapat diidentifikasi, dan pengalaman pengguna dapat ditingkatkan. 

 **Hasil yang dinginkan:** Dapatkan visibilitas yang jelas tentang operasi terdistribusi yang dimiliki aplikasi Anda, sehingga memungkinkan penyelesaian masalah yang lebih cepat dan pengalaman pengguna yang disempurnakan. 

 **Anti-pola umum:** 
+  Mengabaikan data jejak, dan hanya mengandalkan log serta metrik. 
+  Tidak melakukan korelasi antara data jejak dengan log terkait. 
+  Mengabaikan metrik-metrik yang berasal dari jejak, seperti latensi dan tingkat kesalahan. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Tingkatkan pemecahan masalah dan kurangi waktu rata-rata ke resolusi ()MTTR. 
+  Mendapatkan wawasan tentang dependensi dan dampaknya. 
+  Identifikasi dan perbaikan masalah performa secara cepat. 
+  Memanfaatkan metrik-metrik yang berasal dari jejak untuk pengambilan keputusan yang tepat berdasarkan informasi. 
+  Pengalaman pengguna yang ditingkatkan melalui interaksi komponen yang dioptimalkan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 [AWS X-Ray](https://www.docs.aws.com/xray/latest/devguide/aws-xray.html) menawarkan serangkaian fitur komprehensif untuk melakukan analisis data jejak, yang dapat menyediakan pandangan yang menyeluruh tentang interaksi layanan, memantau aktivitas pengguna, dan mendeteksi masalah-masalah performa. Fitur seperti ServiceLens, X-Ray Insights, X-Ray Analytics, dan Amazon DevOps Guru meningkatkan kedalaman wawasan yang dapat ditindaklanjuti yang berasal dari data jejak. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

 Langkah-langkah berikut menawarkan pendekatan terstruktur untuk menerapkan analisis data jejak secara efektif menggunakan AWS layanan: 

1.  **Integrasikan AWS X-Ray**: Pastikan X-Ray terintegrasi dengan aplikasi Anda untuk menangkap data jejak. 

1.  **Analisis metrik X-Ray**: Selidiki metrik yang berasal dari jejak X-Ray, seperti latensi, tingkat permintaan, tingkat kesalahan, dan distribusi waktu respons, dengan menggunakan [peta layanan](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-servicemap.html#xray-console-servicemap-view) untuk memantau kesehatan aplikasi. 

1.  **Gunakan ServiceLens**: Manfaatkan [ServiceLenspeta](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/servicelens_service_map.html) untuk meningkatkan observabilitas layanan dan aplikasi Anda. Fitur ini memungkinkan Anda untuk menampilkan jejak, metrik, log, alarm, dan informasi kondisi lainnya secara terpadu. 

1.  **Aktifkan Wawasan X-Ray**: 

   1.  Aktifkan [Wawasan X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-insights.html) untuk deteksi anomali otomatis dalam jejak. 

   1.  Periksa wawasan untuk menentukan pola dan memastikan akar masalah, misalnya peningkatan tingkat kesalahan atau latensi. 

   1.  Pelajari lini waktu wawasan untuk mendapatkan analisis kronologis dari masalah-masalah yang terdeteksi. 

1.  **Gunakan Analitik X-Ray**: [Analitik X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-analytics.html) akan memungkinkan Anda menjelajahi data jejak secara menyeluruh, menentukan pola, dan mengekstrak wawasan. 

1.  **Gunakan grup di X-Ray**: Buat grup di X-Ray untuk memfilter jejak berdasarkan kriteria seperti latensi tinggi, sehingga memungkinkan analisis yang lebih tertarget. 

1.  **Menggabungkan Amazon DevOps Guru**: Libatkan [Amazon DevOps Guru](https://aws.amazon.com/devops-guru/) untuk mendapatkan manfaat dari model pembelajaran mesin yang menunjukkan dengan tepat anomali operasional dalam jejak. 

1.  **Gunakan CloudWatch Synthetics**: Gunakan [CloudWatchSynthetics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries_tracing.html) untuk membuat kenari untuk terus memantau titik akhir dan alur kerja Anda. Canary ini dapat terintegrasi dengan X-Ray untuk menyediakan data jejak untuk analisis aplikasi yang sedang diuji secara mendalam. 

1.  **Gunakan Real User Monitoring (RUM)**: Dengan [AWS X-Ray dan CloudWatch RUM](https://docs.aws.amazon.com/xray/latest/devguide/xray-services-RUM.html), Anda dapat menganalisis dan men-debug jalur permintaan mulai dari pengguna akhir aplikasi Anda melalui layanan AWS terkelola hilir. Ini akan membantu Anda untuk mengidentifikasi tren latensi dan kesalahan yang berdampak pada pengguna akhir Anda. 

1.  **Berkorelasi dengan log**: Korelasikan [data jejak dengan log terkait](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/servicelens_troubleshooting.html#servicelens_troubleshooting_Nologs) dalam tampilan jejak X-Ray untuk perspektif mendetail tentang perilaku aplikasi. Ini memungkinkan Anda untuk melihat peristiwa log yang terkait langsung dengan transaksi-transaksi yang dilacak. 

1.  **Menerapkan [observabilitas CloudWatch lintas akun](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-Unified-Cross-Account.html):** Pantau dan pecahkan masalah aplikasi yang menjangkau beberapa akun dalam suatu Wilayah. 

 **Tingkat upaya untuk rencana implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS08-BP01 Menganalisis metrik beban kerja](ops_workload_observability_analyze_workload_metrics.md) 
+  [OPS08-BP02 Menganalisis log beban kerja](ops_workload_observability_analyze_workload_logs.md) 

 **Dokumen terkait:** 
+  [Menggunakan ServiceLens untuk Memantau Kesehatan Aplikasi](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/ServiceLens.html) 
+  [Menjelajahi Data Jejak dengan Analitik X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-analytics.html) 
+  [Mendeteksi Anomali di dalam Jejak dengan Wawasan X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/xray-insights.html) 
+  [Pemantauan Berkelanjutan dengan CloudWatch Synthetics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html) 

 **Video terkait:** 
+  [Analisis dan Debug Aplikasi Menggunakan Amazon CloudWatch Synthetics & AWS X-Ray](https://www.youtube.com/watch?v=s2WvaV2eDO4) 
+  [Gunakan Wawasan AWS X-Ray](https://www.youtube.com/watch?v=tl8OWHl6jxw) 

 **Contoh terkait:** 
+  [Lokakarya Satu Observabilitas](https://catalog.workshops.aws/observability/en-US/intro) 
+  [Menerapkan X-Ray dengan AWS Lambda](https://docs.aws.amazon.com/lambda/latest/dg/services-xray.html) 
+  [CloudWatchTemplat Canary Synthetics](https://github.com/aws-samples/cloudwatch-synthetics-canary-terraform) 

# OPS08-BP04 Membuat peringatan yang dapat ditindaklanjuti
<a name="ops_workload_observability_create_alerts"></a>

 Sangat penting untuk mendeteksi dan merespons penyimpangan dalam perilaku aplikasi Anda segera. Lebih penting lagi adalah mengenali ketika hasil yang didasarkan pada indikator kinerja utama (KPI) berisiko atau ketika muncul anomali yang tak terduga. Mendasarkan peringatan pada KPI akan memastikan bahwa sinyal yang Anda terima berkaitan langsung dengan dampak bisnis atau operasional. Pendekatan terhadap peringatan yang dapat ditindaklanjuti ini mempromosikan respons proaktif dan akan membantu Anda untuk mempertahankan performa dan keandalan sistem. 

 **Hasil yang diinginkan:** Menerima peringatan yang tepat waktu, relevan, dan dapat ditindaklanjuti untuk identifikasi dan mitigasi potensi masalah dengan cepat, terutama ketika hasil KPI berisiko. 

 **Anti-pola umum:** 
+  Menyiapkan terlalu banyak peringatan non-kritis, yang mengakibatkan kewalahan. 
+  Tidak memprioritaskan peringatan berdasarkan KPI, sehingga dampak masalah terhadap bisnis menjadi sulit dipahami. 
+  Mengabaikan penanganan akar masalah, yang berimbas pada munculnya peringatan berulang untuk masalah yang sama. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Berkurangnya kewalahan akibat peringatan dengan memusatkan perhatian pada peringatan-peringatan yang dapat ditindaklanjuti dan relevan. 
+  Waktu aktif dan keandalan sistem yang lebih baik melalui deteksi dan mitigasi masalah yang proaktif. 
+  Kolaborasi tim yang disempurnakan dan penyelesaian masalah yang lebih cepat dengan melakukan integrasi alat-alat peringatan dan komunikasi populer. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Untuk membuat sebuah mekanisme peringatan yang efektif, Anda harus menggunakan metrik, log, dan data jejak yang menandai kapan hasil yang didasarkan pada KPI berisiko atau terdapat anomali yang terdeteksi. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  **Tentukan indikator kinerja utama (KPI)**: Identifikasi KPI yang dimiliki aplikasi Anda. Peringatan harus dikaitkan dengan KPI ini agar mencerminkan dampak bisnis secara akurat. 

1.  **Implementasikan deteksi anomali**: 
   +  **Gunakan deteksi anomali Amazon CloudWatch**: Siapkan [deteksi anomali Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) untuk mendeteksi pola yang tidak biasa secara otomatis, yang membantu Anda hanya menghasilkan peringatan untuk anomali yang asli. 
   +  **Gunakan Wawasan AWS X-Ray**: 

     1.  Siapkan [Wawasan X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-insights.html) untuk mendeteksi anomali dalam data jejak. 

     1.  Konfigurasikan [notifikasi untuk Wawasan X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-insights.html#xray-console-insight-notifications) agar Anda mendapat notifikasi tentang masalah yang terdeteksi. 
   +  **Integrasikan dengan Amazon DevOps Guru**: 

     1.  Manfaatkan [Amazon DevOps Guru](https://aws.amazon.com/devops-guru/) untuk kemampuan machine learning-nya dalam mendeteksi anomali operasional pada data yang ada. 

     1.  Arahkan ke [pengaturan notifikasi](https://docs.aws.amazon.com/devops-guru/latest/userguide/update-notifications.html#navigate-to-notification-settings) di DevOps Guru untuk menyiapkan peringatan anomali. 

1.  **Implementasikan peringatan yang dapat ditindaklanjuti**: Rancang peringatan yang menyediakan informasi yang memadai untuk tindakan cepat. 

   1.  Pantau [peristiwa AWS Health dengan aturan Amazon EventBridge](https://docs.aws.amazon.com/health/latest/ug/cloudwatch-events-health.html), atau integrasikan secara terprogram dengan API AWS Health untuk mengotomatiskan tindakan saat Anda menerima peristiwa AWS Health. Ini bisa berupa tindakan-tindakan umum, seperti mengirimkan semua pesan peristiwa siklus hidup yang direncanakan ke antarmuka obrolan, atau tindakan tertentu, seperti inisiasi alur kerja di alat manajemen layanan IT. 

1.  **Kurangi kelelahan karena peringatan**: Minimalkan peringatan non-kritis. Ketika tim kewalahan dengan banyaknya peringatan yang tidak penting, mereka bisa jadi melewatkan masalah-masalah kritis, sehingga mengurangi efektivitas mekanisme peringatan secara keseluruhan. 

1.  **Siapkan alarm komposit**: Gunakan [alarm komposit Amazon CloudWatch](https://aws.amazon.com/bloprove-monitoring-efficiency-using-amazon-cloudwatch-composite-alarms-2/) untuk mengkonsolidasikan beberapa alarm. 

1.  **Integrasikan dengan alat peringatan**: Gabungkan alat seperti [Ops Genie](https://www.atlassian.com/software/opsgenie) dan [PagerDuty](https://www.pagerduty.com/). 

1.  **Gunakan kemampuan Amazon Q Developer dalam aplikasi obrolan**: Integrasikan [Amazon Q Developer dalam aplikasi obrolan](https://aws.amazon.com/chatbot/) untuk menyampaikan peringatan ke Amazon Chime, Microsoft Teams, dan Slack. 

1.  **Peringatan berdasarkan log**: Gunakan [filter metrik log](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/MonitoringLogData.html) di CloudWatch untuk membuat alarm berdasarkan peristiwa log tertentu. 

1.  **Tinjau dan ulangi**: Tinjau ulang dan sempurnakan konfigurasi peringatan secara rutin. 

 **Tingkat upaya untuk rencana implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS04-BP01 Identifikasi indikator kinerja utama](ops_observability_identify_kpis.md) 
+  [OPS04-BP02 Melaksanakan telemetri aplikasi](ops_observability_application_telemetry.md) 
+  [OPS04-BP03 Menerapkan telemetri pengalaman pengguna](ops_observability_customer_telemetry.md) 
+  [OPS04-BP04 Mengimplementasikan telemetri dependensi](ops_observability_dependency_telemetry.md) 
+  [OPS04-BP05 Melaksanakan penelusuran terdistribusi](ops_observability_dist_trace.md) 
+  [OPS08-BP01 Menganalisis metrik beban kerja](ops_workload_observability_analyze_workload_metrics.md) 
+  [OPS08-BP02 Menganalisis log beban kerja](ops_workload_observability_analyze_workload_logs.md) 
+  [OPS08-BP03 Menganalisis jejak beban kerja](ops_workload_observability_analyze_workload_traces.md) 

 **Dokumen terkait:** 
+  [Menggunakan alarm Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 
+  [Membuat sebuah alarm gabungan](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Create_Composite_Alarm.html) 
+  [Membuat sebuah alarm CloudWatch berdasarkan pada deteksi anomali](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Create_Anomaly_Detection_Alarm.html) 
+  [Notifikasi DevOps Guru](https://docs.aws.amazon.com/devops-guru/latest/userguide/update-notifications.html) 
+  [Notifikasi wawasan X-ray](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-insights.html#xray-console-insight-notifications) 
+  [Pantau, operasikan, dan pecahkan masalah sumber daya AWS Anda dengan ChatOps interaktif](https://aws.amazon.com/chatbot/) 
+  [Panduan Integrasi Amazon CloudWatch \$1 PagerDuty](https://support.pagerduty.com/docs/amazon-cloudwatch-integration-guide) 
+  [Integrasikan Opsgenie dengan Amazon CloudWatch](https://support.atlassian.com/opsgenie/docs/integrate-opsgenie-with-amazon-cloudwatch/) 

 **Video terkait:** 
+  [Membuat Alarm Gabungan di Amazon CloudWatch](https://www.youtube.com/watch?v=0LMQ-Mu-ZCY) 
+  [Ikhtisar Amazon Q Developer dalam aplikasi obrolan](https://www.youtube.com/watch?v=0jUSEfHbTYk) 
+  [AWS On Air dengan Perintah Mutatif di Amazon Q Developer dalam aplikasi obrolan](https://www.youtube.com/watch?v=u2pkw2vxrtk) 

 **Contoh terkait:** 
+  [Alarm, manajemen insiden, dan remediasi di cloud dengan Amazon CloudWatch](https://aws.amazon.com/bloarms-incident-management-and-remediation-in-the-cloud-with-amazon-cloudwatch/) 
+  [Tutorial: Membuat aturan Amazon EventBridge yang mengirimkan notifikasi ke Amazon Q Developer dalam aplikasi obrolan](https://docs.aws.amazon.com/chatbot/latest/adminguide/create-eventbridge-rule.html) 
+  [Lokakarya Satu Observabilitas](https://catalog.workshops.aws/observability/en-US/intro) 

# OPS08-BP05 Membuat dasbor
<a name="ops_workload_observability_create_dashboards"></a>

 Dasbor adalah tampilan yang berpusat pada manusia tentang data telemetri beban kerja Anda. Meskipun menyediakan antarmuka visual yang vital, dasbor tidak boleh menggantikan mekanisme peringatan, melainkan hanya melengkapinya. Ketika dibuat dengan cermat, dasbor tidak hanya dapat menawarkan wawasan yang disajikan dengan cepat tentang kondisi dan kinerja sistem, tetapi juga dapat menyajikan informasi waktu nyata kepada para pemangku kepentingan tentang hasil bisnis dan dampak dari masalah yang ditimbulkannya. 

 **Hasil yang diinginkan:** 

 Wawasan yang jelas dan dapat ditindaklanjuti tentang kondisi sistem dan bisnis menggunakan representasi visual. 

 **Anti-pola umum:** 
+  Dasbor yang terlalu rumit yang mempunyai terlalu banyak metrik. 
+  Mengandalkan dasbor tanpa peringatan untuk deteksi anomali. 
+  Tidak memperbarui dasbor seiring perkembangan beban kerja. 

 **Manfaat praktik terbaik ini:** 
+  Visibilitas langsung tentang metrik sistem penting dan KPI. 
+  Komunikasi dan pemahaman para pemangku kepentingan yang ditingkatkan. 
+  Wawasan yang disajikan dengan cepat tentang dampak masalah operasional. 

 **Tingkat risiko yang dihadapi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 **Dasbor yang berpusat pada bisnis** 

 Dasbor yang disesuaikan dengan KPI bisnis melibatkan lebih banyak pemangku kepentingan. Meskipun orang-orang ini mungkin tidak tertarik pada metrik sistem, namun mereka tertarik untuk memahami implikasi bisnis dari angka-angka ini. Dasbor yang berpusat pada bisnis memastikan semua metrik teknis dan operasional yang dipantau dan dianalisis selaras dengan tujuan-tujuan bisnis secara keseluruhan. Penyelarasan ini memberikan kejelasan, memastikan semua orang memiliki pemahaman yang sama mengenai hal-hal yang penting dan hal-hal yang tidak penting. Selain itu, dasbor yang menyoroti KPI bisnis cenderung lebih mudah untuk ditindaklanjuti. Para pemangku kepentingan dapat dengan cepat memahami kondisi operasi, area yang perlu diperhatikan, dan dampak yang mungkin ditimbulkan terhadap hasil bisnis. 

 Dengan mempertimbangkan hal ini, saat membuat dasbor Anda, pastikan ada keseimbangan antara metrik-metrik teknis dan KPI bisnis. Keduanya penting, tetapi melayani audiens yang berbeda. Idealnya, Anda harus memiliki dasbor yang memberikan pandangan menyeluruh tentang kondisi dan performa sistem sekaligus menekankan hasil bisnis utama serta implikasinya. 

 Dasbor Amazon CloudWatch adalah halaman beranda yang dapat disesuaikan di konsol CloudWatch yang dapat digunakan untuk memantau sumber daya Anda dalam satu tampilan, bahkan sumber daya yang tersebar di berbagai Wilayah AWS dan akun yang berbeda. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  **Buat dasbor dasar:** [Buatlah sebuah dasbor baru di CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/create_dashboard.html), berikan nama yang deskriptif. 

1.  **Gunakan widget Markdown:** Sebelum menggunakan metrik, [gunakan widget Markdown](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/add_remove_text_dashboard.html) untuk menambahkan konteks tekstual di bagian atas dasbor Anda. Widget ini akan menjelaskan cakupan dasbor, tingkat pentingnya metrik yang ditampilkan, dan juga dapat diisi dengan tautan-tautan ke dasbor serta alat-alat pemecahan masalah lainnya. 

1.  **Buat variabel dasbor:** [Gabungkan variabel dasbor](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/cloudwatch_dashboard_variables.html) jika sesuai agar dasbor mempunyai tampilan yang dinamis dan fleksibel. 

1.  **Buat widget metrik:** [Tambahkan widget metrik](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/create-and-work-with-widgets.html) untuk memberikan visualisasi dari berbagai metrik yang dihasilkan oleh aplikasi Anda, lalu sesuaikan semua widget agar efektif menampilkan kondisi sistem dan hasil bisnis. 

1.  **Kueri Wawasan Log:** Manfaatkan [Wawasan Log CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CWL_ExportQueryResults.html) untuk mendapatkan metrik yang dapat ditindaklanjuti dari log Anda dan menampilkan wawasan ini di dasbor Anda. 

1.  **Siapkan alarm:** Integrasikan [Alarm CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/add_remove_alarm_dashboard.html) ke dasbor Anda untuk melihat sekilas metrik apa pun yang melanggar ambang batas mereka. 

1.  **Gunakan Wawasan Kontributor:** Gabungkan [Wawasan Kontributor CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/ContributorInsights-ViewReports.html) untuk menganalisis bidang kardinalitas tinggi dan mendapatkan pemahaman yang lebih jelas tentang kontributor utama sumber daya Anda. 

1.  **Desain widget kustom:** Untuk kebutuhan spesifik yang tidak dipenuhi oleh widget standar, sebaiknya Anda membuat [widget kustom](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/add_custom_widget_dashboard.html). Widget kustom ini dapat menarik dari berbagai sumber data atau menyajikan data dengan cara yang unik. 

1.  **Gunakan AWS Health:** AWS Health adalah sumber informasi otoritatif tentang kondisi sumber daya AWS Cloud Anda. Gunakan [Dasbor AWS Health](https://health.aws.amazon.com/health/status) langsung, atau gunakan data AWS Health di dasbor dan alat Anda sendiri sehingga Anda memiliki informasi tepat yang tersedia untuk membuat keputusan yang tepat. 

1.  **Ulangi dan sempurnakan:** Saat aplikasi Anda berkembang, tinjau kembali dasbor Anda secara teratur untuk memastikan relevansinya. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS04-BP01 Identifikasi indikator kinerja utama](ops_observability_identify_kpis.md) 
+  [OPS08-BP01 Menganalisis metrik beban kerja](ops_workload_observability_analyze_workload_metrics.md) 
+  [OPS08-BP02 Menganalisis log beban kerja](ops_workload_observability_analyze_workload_logs.md) 
+  [OPS08-BP03 Menganalisis jejak beban kerja](ops_workload_observability_analyze_workload_traces.md) 
+  [OPS08-BP04 Membuat peringatan yang dapat ditindaklanjuti](ops_workload_observability_create_alerts.md) 

 **Dokumen terkait:** 
+  [Membangun Dasbor untuk Visibilitas Operasional](https://aws.amazon.com/builders-library/building-dashboards-for-operational-visibility/) 
+  [Menggunakan Dasbor Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html) 

 **Video terkait:** 
+  [Membuat Dasbor CloudWatch Lintas Akun & Lintas Wilayah](https://www.youtube.com/watch?v=eIUZdaqColg) 
+  [AWS re:Invent 2021 - Mendapatkan visibilitas korporasi dengan dasbor operasional AWS Cloud)](https://www.youtube.com/watch?v=NfMpYiGwPGo) 

 **Contoh terkait:** 
+  [Lokakarya Satu Observabilitas](https://catalog.workshops.aws/observability/en-US/intro) 
+  [Pemantauan Aplikasi dengan Amazon CloudWatch](https://aws.amazon.com/solutions/implementations/application-monitoring-with-cloudwatch/) 
+  [Dasbor dan Wawasan Intelijen Peristiwa AWS Health](https://aws.amazon.com/blogs/mt/aws-health-events-intelligence-dashboards-insights/) 
+  [Visualisasikan peristiwa AWS Health menggunakan Amazon Managed Grafana](https://aws.amazon.com/blogs/mt/visualize-aws-health-events-using-amazon-managed-grafana/) 