

# OPS 4. Bagaimana Anda mengimplementasikan observabilitas dalam beban kerja Anda?
<a name="ops-04"></a>

Terapkan observabilitas dalam beban kerja Anda sehingga Anda dapat memahami statusnya dan membuat keputusan berbasis data berdasarkan persyaratan bisnis.

**Topics**
+ [OPS04-BP01 Identifikasi indikator kinerja utama](ops_observability_identify_kpis.md)
+ [OPS04-BP02 Melaksanakan telemetri aplikasi](ops_observability_application_telemetry.md)
+ [OPS04-BP03 Menerapkan telemetri pengalaman pengguna](ops_observability_customer_telemetry.md)
+ [OPS04-BP04 Mengimplementasikan telemetri dependensi](ops_observability_dependency_telemetry.md)
+ [OPS04-BP05 Melaksanakan penelusuran terdistribusi](ops_observability_dist_trace.md)

# OPS04-BP01 Identifikasi indikator kinerja utama
<a name="ops_observability_identify_kpis"></a>

 Untuk mengimplementasikan observabilitas dalam beban kerja, Anda memulainya dengan memahami statusnya dan mengambil keputusan berbasis data berdasarkan persyaratan bisnis. Salah satu cara paling efektif untuk memastikan keselarasan antara kegiatan pemantauan dan tujuan bisnis adalah dengan mendefinisikan dan memantau indikator kinerja utama ()KPIs. 

 **Hasil yang diinginkan:** Praktik-praktik observabilitas yang efisien yang sangat selaras dengan tujuan bisnis, sehingga memastikan upaya pemantauan selalu memenuhi hasil bisnis yang nyata. 

 **Anti-pola umum:** 
+  Tidak terdefinisiKPIs: Bekerja tanpa jelas KPIs dapat menyebabkan pemantauan terlalu banyak atau terlalu sedikit, kehilangan sinyal vital. 
+  StatisKPIs: Tidak meninjau kembali atau menyempurnakan KPIs karena beban kerja atau tujuan bisnis berkembang. 
+  Ketidakselarasan: Berfokus pada metrik-metrik teknis yang tidak berkorelasi langsung dengan hasil bisnis atau yang lebih sulit untuk berkorelasi dengan masalah-masalah dunia nyata. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Kemudahan identifikasi masalah: Bisnis KPIs sering memunculkan masalah lebih jelas daripada metrik teknis. Penurunan dalam bisnis KPI dapat menunjukkan masalah dengan lebih efektif daripada memilah-milah berbagai metrik teknis. 
+  Keselarasan bisnis: Memastikan bahwa kegiatan pemantauan secara langsung adalah aktivitas yang mendukung tujuan bisnis. 
+  Efisiensi: Prioritaskan untuk melakukan pemantauan sumber daya dan memberikan perhatian pada metrik-metrik yang penting. 
+  Proaktif: Kenali dan atasi masalah sebelum masalah itu memunculkan dampak bisnis yang lebih luas. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Untuk secara efektif mendefinisikan beban kerjaKPIs: 

1.  **Mulai dengan hasil bisnis:** Sebelum menyelami metrik, pahami dahulu hasil bisnis yang diinginkan. Apakah peningkatan penjualan, keterlibatan pengguna yang lebih tinggi, atau waktu respons yang lebih cepat? 

1.  **Korelasikan metrik teknis dengan tujuan bisnis:** Tidak semua metrik teknis memiliki dampak langsung pada hasil bisnis Anda. Identifikasi mereka yang melakukannya, tetapi seringkali lebih mudah untuk mengidentifikasi masalah menggunakan bisnis. KPI 

1.  **Gunakan [Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html):** Gunakan CloudWatch untuk menentukan dan memantau metrik yang mewakili Anda. KPIs 

1.  **Tinjau dan perbarui secara teraturKPIs:** Saat beban kerja dan bisnis Anda berkembang, jaga agar tetap relevan. KPIs 

1.  **Libatkan pemangku kepentingan:** Libatkan tim teknis dan bisnis dalam mendefinisikan dan meninjau. KPIs 

 **Tingkat upaya untuk rencana implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+ [OPS04-BP02 Melaksanakan telemetri aplikasi](ops_observability_application_telemetry.md)
+ [OPS04-BP03 Menerapkan telemetri pengalaman pengguna](ops_observability_customer_telemetry.md)
+ [OPS04-BP04 Mengimplementasikan telemetri dependensi](ops_observability_dependency_telemetry.md)
+ [OPS04-BP05 Melaksanakan penelusuran terdistribusi](ops_observability_dist_trace.md)

 **Dokumen terkait:** 
+ [AWS Praktik Terbaik Observabilitas](https://aws-observability.github.io/observability-best-practices/)
+ [ CloudWatch Panduan Pengguna](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html)
+ [AWS Kursus Pembuat Keterampilan Observabilitas](https://explore.skillbuilder.aws/learn/course/external/view/elearning/14688/aws-observability)

 **Video terkait:** 
+ [ Mengembangkan strategi observabilitas ](https://www.youtube.com/watch?v=Ub3ATriFapQ)

 **Contoh terkait:** 
+  [Lokakarya Satu Observabilitas](https://catalog.workshops.aws/observability/en-US) 

# OPS04-BP02 Melaksanakan telemetri aplikasi
<a name="ops_observability_application_telemetry"></a>

 Telemetri aplikasi berfungsi sebagai fondasi observabilitas beban kerja Anda. Sangat penting bagi Anda untuk menghadirkan telemetri yang menawarkan wawasan yang dapat ditindaklanjuti tentang keadaan aplikasi Anda serta pencapaian hasil teknis dan bisnis. Dari pemecahan masalah hingga mengukur dampak fitur baru atau memastikan keselarasan dengan indikator kinerja kunci bisnis (KPIs), telemetri aplikasi menginformasikan cara Anda membangun, mengoperasikan, dan mengembangkan beban kerja Anda. 

 Metrik, log, dan jejak merupakan tiga pilar observabilitas utama. Ketiganya berfungsi sebagai alat diagnostik yang mampu menggambarkan keadaan aplikasi Anda. Seiring waktu, tiga hal ini akan membantu menciptakan garis acuan dan mengidentifikasi setiap anomali. Namun, untuk memastikan keselarasan antara kegiatan pemantauan dan tujuan bisnis, penting untuk menentukan dan memantau. KPIs Bisnis KPIs sering membuatnya lebih mudah untuk mengidentifikasi masalah dibandingkan dengan metrik teknis saja. 

 Jenis telemetri lainnya, seperti pemantauan pengguna nyata (RUM) dan transaksi sintetis, melengkapi sumber data primer ini. RUMmenawarkan wawasan tentang interaksi pengguna waktu nyata, sedangkan transaksi sintetis mensimulasikan perilaku pengguna potensial, membantu mendeteksi kemacetan sebelum pengguna nyata menghadapinya. 

 **Hasil yang diinginkan:** Dapatkan wawasan yang dapat ditindaklanjuti mengenai performa beban kerja Anda. Wawasan ini akan memungkinkan Anda untuk mengambil keputusan yang proaktif tentang optimalisasi performa, mencapai peningkatan stabilitas beban kerja, merampingkan proses CI/CD, dan memanfaatkan sumber daya secara efektif. 

 **Anti-pola umum:** 
+  **Observabilitas yang tidak lengkap:** Mengabaikan penggunaan observabilitas di setiap lapisan beban kerja, sehingga mengakibatkan titik buta yang dapat membuat performa sistem vital dan wawasan perilaku menjadi tidak jelas. 
+  **Tampilan data terfragmentasi:** Ketika data tersebar di beberapa alat dan sistem, mempertahankan pandangan yang menyeluruh tentang kondisi dan performa beban kerja Anda akan menjadi sesuatu yang sulit dilakukan. 
+  **Masalah yang dilaporkan pengguna:** Tanda bahwa deteksi masalah proaktif melalui telemetri dan pemantauan bisnis kurang. KPI 

 **Manfaat menjalankan praktik terbaik ini:** 
+  **Pengambilan keputusan berdasarkan informasi:** Dengan wawasan dari telemetri dan bisnisKPIs, Anda dapat membuat keputusan berbasis data. 
+  **Peningkatan efisiensi operasional:** Pemanfaatan sumber daya berbasis data akan menghasilkan efektivitas biaya. 
+  **Penyempurnaan stabilitas beban kerja:** Deteksi dan penyelesaian masalah yang lebih cepat akan menghasilkan peningkatan waktu aktif. 
+  **Perampingan proses CI/CD:** Wawasan dari data telemetri dapat memfasilitasi penyempurnaan proses dan pengiriman kode yang andal. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 [Untuk menerapkan telemetri aplikasi untuk beban kerja Anda, gunakan layanan AWS seperti Amazon dan. CloudWatch [AWS X-Ray](https://aws.amazon.com/xray/)](https://aws.amazon.com/cloudwatch/) Amazon CloudWatch menyediakan rangkaian alat pemantauan yang komprehensif, memungkinkan Anda mengamati sumber daya dan aplikasi di dalam AWS dan lingkungan lokal. Layanan ini mengumpulkan, melacak, dan menganalisis metrik, menggabungkan dan memantau data log, dan memberikan respons terhadap perubahan yang terjadi dalam sumber daya Anda, menyempurnakan pemahaman Anda tentang bagaimana beban kerja Anda beroperasi. Secara bersamaan, AWS X-Ray memungkinkan Anda melacak, menganalisis, dan men-debug aplikasi Anda, memberi Anda pemahaman mendalam tentang perilaku beban kerja Anda. Dengan fitur seperti peta layanan, distribusi latensi, dan jadwal penelusuran, AWS X-Ray memberikan wawasan tentang kinerja beban kerja Anda dan hambatan yang mempengaruhinya. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  **Identifikasi data apa yang akan dikumpulkan:** Pastikan metrik, log, dan jejak penting yang akan menawarkan wawasan substansial tentang kondisi, performa, dan perilaku beban kerja Anda. 

1.  **Menyebarkan [CloudWatchagen: Agen](https://aws.amazon.com/cloudwatch/)** berperan penting dalam pengadaan metrik dan log sistem dan aplikasi dari beban kerja Anda dan infrastruktur dasarnya. CloudWatch CloudWatch Agen juga dapat digunakan untuk mengumpulkan OpenTelemetry atau jejak X-Ray dan mengirimkannya ke X-Ray. 

1.  **Menerapkan deteksi anomali untuk log dan metrik:** Gunakan deteksi [anomali CloudWatch Log dan deteksi anomali CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/LogsAnomalyDetection.html) [Metrik untuk secara otomatis mengidentifikasi aktivitas yang tidak biasa](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) dalam operasi aplikasi Anda. Alat-alat ini menggunakan algoritma machine learning untuk mendeteksi dan memberikan peringatan tentang anomali yang ditemukan, yang dapat meningkatkan kemampuan pemantauan Anda dan mempercepat waktu respons terhadap adanya potensi gangguan atau ancaman keamanan. Siapkan fitur-fitur ini untuk mengelola kesehatan dan keamanan aplikasi secara proaktif. 

1.  **Mengamankan data log sensitif:** Gunakan [perlindungan data Amazon CloudWatch Logs](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/mask-sensitive-log-data.html) untuk menutupi informasi sensitif di dalam log Anda. Fitur ini akan membantu Anda menjaga privasi dan kepatuhan dengan melakukan deteksi otomatis dan pengaburan data sensitif sebelum diakses. Menerapkan penyembunyian data untuk menangani dan melindungi detail sensitif dengan aman seperti informasi yang dapat diidentifikasi secara pribadi (). PII 

1.  **Tentukan dan pantau bisnisKPIs:** Tetapkan [metrik khusus](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/publishingMetrics.html) yang selaras dengan hasil [bisnis](https://aws-observability.github.io/observability-best-practices/guides/operational/business/monitoring-for-business-outcomes/) Anda. 

1.  **Instrumentasikan aplikasi Anda dengan AWS X-Ray:** Selain menggunakan CloudWatch agen, penting untuk [menginstruksikan aplikasi Anda](https://docs.aws.amazon.com/xray/latest/devguide/xray-instrumenting-your-app.html) untuk memancarkan data jejak. Proses ini dapat memberikan wawasan lebih lanjut tentang perilaku dan performa beban kerja Anda. 

1.  **Standardisasi pengumpulan data di seluruh aplikasi Anda:** Lakukan standardisasi terhadap praktik-praktik pengumpulan data di seluruh aplikasi Anda. Keseragaman bermanfaat dalam mengorelasikan dan menganalisis data, sehingga itu akan memberikan pandangan yang komprehensif tentang perilaku aplikasi Anda. 

1.  **Menerapkan observabilitas lintas akun:** Tingkatkan efisiensi pemantauan di beberapa akun dengan observabilitas [ CloudWatch lintas akun Akun AWS Amazon](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-Unified-Cross-Account.html). Dengan fitur ini, Anda dapat menggabungkan metrik, log, dan alarm dari akun yang berbeda ke dalam satu tampilan, yang menyederhanakan manajemen dan meningkatkan waktu respons untuk masalah yang diidentifikasi di seluruh lingkungan organisasi Anda. AWS 

1.  **Menganalisis dan bertindak berdasarkan data:** Setelah pengumpulan dan normalisasi data dilakukan, gunakan [Amazon CloudWatch](https://aws.amazon.com/cloudwatch/features/) untuk analisis metrik dan log, dan [AWS X-Ray](https://aws.amazon.com/xray/features/)untuk analisis jejak. Analisis tersebut dapat menghasilkan wawasan penting tentang kondisi, performa, dan perilaku beban kerja Anda, sehingga dapat memandu Anda dalam proses pengambilan keputusan. 

 **Tingkat upaya untuk rencana implementasi:** Tinggi 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS04-BP01 Tentukan beban kerja KPIs](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_identify_kpis.html) 
+  [OPS04-BP03 Melaksanakan telemetri aktivitas pengguna](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_customer_telemetry.html) 
+  [OPS04-BP04 Menerapkan telemetri ketergantungan](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_dependency_telemetry.html) 
+  [OPS04-BP05 Menerapkan ketertelusuran transaksi](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_dist_trace.html) 

 **Dokumen terkait:** 
+  [Praktik Terbaik Observabilitas AWS](https://aws-observability.github.io/observability-best-practices/) 
+  [Panduan Pengguna CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) 
+  [AWS X-Ray Panduan Pengembang](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html) 
+  [Menginstrumentasikan sistem terdistribusi untuk visibilitas operasional](https://aws.amazon.com/builders-library/instrumenting-distributed-systems-for-operational-visibility) 
+  [Kursus Skill Builder Observabilitas AWS](https://explore.skillbuilder.aws/learn/course/external/view/elearning/14688/aws-observability) 
+  [Apa yang Baru dengan Amazon CloudWatch](https://aws.amazon.com/about-aws/whats-new/management-and-governance/?whats-new-content.sort-by=item.additionalFields.postDateTime&whats-new-content.sort-order=desc&awsf.whats-new-products=general-products%23amazon-cloudwatch) 
+  [Apa yang baru dengan AWS X-Ray](https://aws.amazon.com/about-aws/whats-new/developer-tools/?whats-new-content.sort-by=item.additionalFields.postDateTime&whats-new-content.sort-order=desc&awsf.whats-new-products=general-products%23aws-x-ray) 

 **Video terkait:** 
+  [AWS re:invent 2022 - Praktik terbaik observabilitas di Amazon](https://youtu.be/zZPzXEBW4P8) 
+  [AWS re:invent 2022 - Mengembangkan strategi observabilitas](https://youtu.be/Ub3ATriFapQ) 

 **Contoh terkait:** 
+  [Lokakarya Satu Observabilitas](https://catalog.workshops.aws/observability) 
+  [AWS Perpustakaan Solusi: Pemantauan Aplikasi dengan Amazon CloudWatch](https://aws.amazon.com/solutions/implementations/application-monitoring-with-cloudwatch) 

# OPS04-BP03 Menerapkan telemetri pengalaman pengguna
<a name="ops_observability_customer_telemetry"></a>

 Memperoleh wawasan yang mendalam tentang pengalaman dan interaksi pelanggan dengan aplikasi Anda adalah hal yang krusial. Pemantauan pengguna nyata (RUM) dan transaksi sintetis berfungsi sebagai alat yang ampuh untuk tujuan ini. RUMmenyediakan data tentang interaksi pengguna nyata yang memberikan perspektif kepuasan pengguna tanpa filter, sementara transaksi sintetis mensimulasikan interaksi pengguna, membantu mendeteksi potensi masalah bahkan sebelum berdampak pada pengguna nyata. 

 **Hasil yang diinginkan:** Pandangan yang menyeluruh tentang pengalaman pelanggan, deteksi masalah yang proaktif, dan optimalisasi interaksi pengguna untuk memberikan pengalaman digital yang mulus (seamless). 

 **Anti-pola umum:** 
+  Aplikasi tanpa pemantauan pengguna nyata (RUM): 
  +  Deteksi masalah yang tertunda: TanpaRUM, Anda mungkin tidak menyadari kemacetan atau masalah kinerja hingga pengguna mengeluh. Pendekatan reaktif ini dapat menyebabkan pelanggan menjadi tidak puas. 
  +  Kurangnya wawasan pengalaman pengguna: Tidak menggunakan RUM berarti Anda kehilangan data penting yang menunjukkan bagaimana pengguna nyata berinteraksi dengan aplikasi Anda, sehingga membatasi kemampuan Anda untuk mengoptimalkan pengalaman pengguna. 
+  Aplikasi tanpa transaksi sintetis: 
  +  Kasus edge yang terlewatkan: Transaksi-transaksi sintetis akan membantu Anda untuk menguji jalur dan fungsi yang mungkin jarang digunakan oleh pengguna biasa, tetapi sangat penting untuk fungsi bisnis tertentu. Tanpanya, jalur-jalur tersebut bisa mengalami kesalahan fungsi dan luput dari perhatian. 
  +  Memeriksa masalah saat aplikasi tidak digunakan: Pengujian sintetis yang dilakukan secara rutin dapat memberikan simulasi saat-saat ketika pengguna nyata tidak berinteraksi secara aktif dengan aplikasi Anda, sehingga hal itu akan memastikan sistem selalu berfungsi dengan benar. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Deteksi masalah proaktif: Identifikasi dan atasi potensi masalah sebelum berdampak pada pengguna nyata. 
+  Pengalaman pengguna yang dioptimalkan: Umpan balik berkelanjutan dari RUM bantuan dalam menyempurnakan dan meningkatkan pengalaman pengguna secara keseluruhan. 
+  Wawasan tentang performa perangkat dan browser: Memahami performa aplikasi Anda di berbagai perangkat dan browser, sehingga memungkinkan optimalisasi lebih lanjut. 
+  Alur kerja bisnis yang divalidasi: Transaksi-transaksi sintetis rutin akan memastikan fungsionalitas inti dan jalur-jalur penting tetap berjalan dan efisien. 
+  Performa aplikasi yang ditingkatkan: Manfaatkan wawasan yang dikumpulkan dari data pengguna nyata untuk meningkatkan responsivitas dan keandalan aplikasi. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Untuk memanfaatkan RUM dan transaksi sintetis untuk telemetri aktivitas pengguna, AWS menawarkan layanan seperti Amazon dan [ CloudWatch RUMAmazon CloudWatch ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-RUM.html) [Synthetics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html). Metrik, log, dan jejak, ditambah dengan data aktivitas pengguna, memberikan sebuah pandangan yang komprehensif tentang status operasional aplikasi dan pengalaman pengguna. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  **Menerapkan Amazon CloudWatch RUM:** Integrasikan aplikasi Anda CloudWatch RUM untuk mengumpulkan, menganalisis, dan menyajikan data pengguna nyata. 

   1.  Gunakan [CloudWatch RUM JavaScript perpustakaan](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-RUM.html) untuk berintegrasi RUM dengan aplikasi Anda. 

   1.  Siapkan dasbor untuk memvisualisasikan dan memantau data pengguna nyata. 

1.  **Configure CloudWatch Synthetics:** Buat kenari, atau rutinitas skrip, yang mensimulasikan interaksi pengguna dengan aplikasi Anda. 

   1.  Tentukan alur kerja dan jalur aplikasi kritis. 

   1.  Desain kenari menggunakan skrip [CloudWatch Synthetics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html) untuk mensimulasikan interaksi pengguna untuk jalur ini. 

   1.  Jadwalkan dan pantau canary agar berjalan pada interval-interval tertentu, sehingga memastikan pemeriksaan performa yang konsisten. 

1.  **Menganalisis dan bertindak berdasarkan data:** Memanfaatkan data dari RUM dan transaksi sintetis untuk mendapatkan wawasan dan mengambil tindakan korektif ketika anomali terdeteksi. Gunakan CloudWatch dasbor dan alarm untuk tetap mendapat informasi. 

 **Tingkat upaya untuk rencana implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS04-BP01 Identifikasi indikator kinerja utama](ops_observability_identify_kpis.md) 
+  [OPS04-BP02 Melaksanakan telemetri aplikasi](ops_observability_application_telemetry.md) 
+  [OPS04-BP04 Mengimplementasikan telemetri dependensi](ops_observability_dependency_telemetry.md) 
+  [OPS04-BP05 Melaksanakan penelusuran terdistribusi](ops_observability_dist_trace.md) 

 **Dokumen terkait:** 
+ [ CloudWatch RUMPanduan Amazon](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-RUM.html)
+ [Panduan Amazon CloudWatch Synthetics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html)

 **Video terkait:** 
+ [Optimalkan aplikasi melalui wawasan pengguna akhir dengan Amazon CloudWatch RUM](https://www.youtube.com/watch?v=NMaeujY9A9Y)
+ [AWS di Air ft. Pemantauan Pengguna Nyata untuk Amazon CloudWatch](https://www.youtube.com/watch?v=r6wFtozsiVE)

 **Contoh terkait:** 
+ [ Lokakarya Satu Observabilitas ](https://catalog.workshops.aws/observability/en-US/intro)
+ [Git Repository untuk Amazon CloudWatch RUM Web Client](https://github.com/aws-observability/aws-rum-web)
+ [Menggunakan Amazon CloudWatch Synthetics untuk mengukur waktu buka halaman](https://github.com/aws-samples/amazon-cloudwatch-synthetics-page-performance)

# OPS04-BP04 Mengimplementasikan telemetri dependensi
<a name="ops_observability_dependency_telemetry"></a>

 Telemetri dependensi sangat penting untuk memantau kondisi dan performa layanan dan komponen eksternal yang diandalkan oleh beban kerja Anda. Hal ini memberikan wawasan berharga tentang keterjangkauan, batas waktu, dan peristiwa penting lainnya yang terkait dengan dependensi seperti DNS, basis data, atau API pihak ketiga. Ketika Anda menginstrumentasi aplikasi Anda agar menghasilkan metrik, log, dan jejak tentang dependensi ini, Anda mendapatkan pemahaman yang lebih jelas tentang potensi kemacetan, masalah performa, atau kegagalan yang dapat memengaruhi beban kerja Anda. 

 **Hasil yang diinginkan:** Pastikan bahwa dependensi yang diandalkan beban kerja Anda menunjukkan performa yang sesuai harapan, sehingga Anda dapat secara proaktif mengatasi masalah-masalah dan memastikan performa beban kerja yang optimal. 

 **Anti-pola umum:** 
+  **Mengabaikan dependensi eksternal:** Hanya berfokus pada metrik aplikasi internal sambil mengabaikan metrik yang berkaitan dengan dependensi eksternal. 
+  **Kurangnya pemantauan proaktif:** Menunggu masalah muncul alih-alih terus memantau kondisi dan performa dependensi. 
+  **Pemantauan model silo:** Menggunakan beberapa alat pemantauan yang berbeda-beda sehingga wawasan tentang kondisi dependensi menjadi terfragmentasi dan tidak konsisten. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  **Peningkatan keandalan beban kerja:** Dengan memastikan bahwa dependensi eksternal terus-menerus tersedia dan berkinerja optimal. 
+  **Deteksi dan penyelesaian masalah yang lebih cepat:** Secara proaktif mengidentifikasi dan menangani masalah pada dependensi sebelum berdampak pada beban kerja. 
+  **Pandangan menyeluruh:** Mendapatkan pandangan yang menyeluruh tentang komponen internal dan eksternal yang memengaruhi kondisi beban kerja. 
+  **Peningkatan skalabilitas beban kerja:** Dengan memahami batas skalabilitas dan karakteristik performa dependensi eksternal. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Implementasikan telemetri dependensi dengan memulai melakukan identifikasi layanan, infrastruktur, dan proses yang digunakan oleh beban kerja Anda. Ukur seperti apa kondisi yang baik ketika dependensi berfungsi sesuai harapan, kemudian tentukan data apa yang akan diperlukan untuk mengukur kondisi-kondisi itu. Dengan informasi tersebut, Anda dapat membuat dasbor dan peringatan yang memberikan wawasan kepada tim operasi Anda tentang status dependensi tersebut. Gunakan alat-alat AWS untuk menemukan dan mengukur dampak yang ditimbulkan ketika dependensi tidak dapat menunjukkan hasil yang sesuai kebutuhan. Selalu tinjau ulang strategi Anda agar memperhitungkan perubahan-perubahan dalam prioritas, sasaran, dan wawasan yang diperoleh. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

 Cara mengimplementasikan telemetri dependensi secara efektif: 

1.  **Identifikasi dependensi eksternal:** Lakukan kolaborasi dengan pemangku kepentingan untuk menentukan dependensi eksternal yang diandalkan oleh beban kerja Anda. Dependensi eksternal dapat mencakup layanan-layanan seperti basis data eksternal, API pihak ketiga, rute konektivitas jaringan ke lingkungan lain, dan layanan DNS. Langkah pertama menuju telemetri dependensi yang efektif adalah memiliki pemahaman yang menyeluruh tentang apa saja dependensi tersebut. 

1.  **Kembangkan strategi pemantauan:** Setelah Anda memiliki gambaran yang jelas tentang dependensi eksternal Anda, rancanglah strategi pemantauan yang disesuaikan dengan dependensi tersebut. Hal ini melibatkan pemahaman terhadap tingkat kekritisan setiap dependensi, perilaku yang diharapkan, dan perjanjian atau target tingkat layanan (SLA atau SLT) terkait. Siapkan peringatan proaktif untuk memberi tahu Anda tentang perubahan status atau penyimpangan-penyimpangan performa. 

1.  **Gunakan [pemantauan jaringan](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-Network-Monitoring-Sections.html):** Gunakan [Monitor Internet](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-InternetMonitor.html) dan [Monitor Jaringan](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/what-is-network-monitor.html), yang memberikan wawasan komprehensif mengenai kondisi internet dan jaringan global. Alat-alat ini akan membantu Anda untuk memahami dan merespons pemadaman, gangguan, atau penurunan kinerja yang memengaruhi dependensi eksternal Anda. 

1.  **Terus dapatkan informasi dengan [AWS Health](https://aws.amazon.com/premiumsupport/technology/aws-health/).** AWS Health adalah sumber informasi otoritatif tentang kondisi sumber daya AWS Cloud Anda. Gunakan AWS Health untuk memvisualisasikan dan menerima notifikasi tentang peristiwa layanan terkini dan perubahan yang akan datang, seperti peristiwa siklus hidup yang direncanakan, sehingga Anda dapat mengambil langkah-langkah untuk mengurangi dampaknya. 

   1.  [Buat notifikasi peristiwa AWS Health sesuai keperluan](https://docs.aws.amazon.com/health/latest/ug/user-notifications.html) yang dikirim ke saluran email dan obrolan melalui [Notifikasi Pengguna AWS](https://docs.aws.amazon.com/notifications/latest/userguide/what-is-service.html) serta integrasikan secara programatis dengan [alat pemantauan dan peringatan Anda melalui Amazon EventBridge](https://docs.aws.amazon.com/health/latest/ug/cloudwatch-events-health.html) atau [API AWS Health](https://docs.aws.amazon.com/health/latest/APIReference/Welcome.html). 

   1.  Rencanakan dan lacak progres pada peristiwa kesehatan yang memerlukan tindakan dengan mengintegrasikan dengan manajemen perubahan atau alat ITSM (seperti [Jira atau](https://docs.aws.amazon.com/smc/latest/ag/cloud-sys-health.html) [ServiceNow](https://docs.aws.amazon.com/smc/latest/ag/sn-aws-health.html)) yang mungkin sudah Anda gunakan melalui Amazon EventBridge atau API AWS Health. 

   1.  Jika Anda menggunakan AWS Organizations, aktifkan [tampilan organisasi untuk AWS Health](https://docs.aws.amazon.com/health/latest/ug/aggregate-events.html) guna menggabungkan peristiwa AWS Health di seluruh akun. 

1.  **Lakukan instrumentasi pada aplikasi Anda dengan [AWS X-Ray](https://aws.amazon.com/xray/):** AWS X-Ray memberikan wawasan tentang bagaimana performa aplikasi dan dependensi yang mendasarinya. Dengan melacak permintaan dari awal hingga akhir, Anda dapat mengidentifikasi kemacetan atau kegagalan yang terjadi dalam layanan eksternal atau komponen yang diandalkan oleh aplikasi Anda. 

1.  **Gunakan [Amazon DevOps Guru](https://aws.amazon.com/devops-guru/):** Layanan berbasis machine learning ini mengidentifikasi masalah operasional, memprediksi kapan masalah kritis mungkin terjadi, dan merekomendasikan tindakan spesifik yang harus diambil. Layanan ini sangat bermanfaat untuk mendapatkan wawasan tentang dependensi dan memastikan bahwa dependensi bukan merupakan sumber masalah operasional. 

1.  **Pantau secara rutin:** Terus pantau metrik dan log yang berkaitan dengan dependensi eksternal. Siapkan peringatan untuk perilaku tak terduga atau performa yang menurun. 

1.  **Lakukan validasi setelah perubahan:** Setiap kali ada pembaruan atau perubahan yang dilakukan pada salah satu dependensi eksternal, Anda harus melakukan validasi terhadap performa dan memeriksa keselarasannya dengan persyaratan-persyaratan aplikasi Anda. 

 **Tingkat upaya untuk rencana implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS04-BP01 Menentukan KPI beban kerja](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_identify_kpis.html) 
+  [OPS04-BP02 Mengimplementasikan telemetri aplikasi](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_application_telemetry.html) 
+  [OPS04-BP03 Mengimplementasikan telemetri aktivitas pengguna](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_customer_telemetry.html) 
+  [OPS04-BP05 Mengimplementasikan keterlacakan transaksi](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_dist_trace.html) 
+  [OPS08-BP04 Membuat peringatan yang dapat ditindaklanjuti](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_workload_observability_create_alerts.html) 

 **Dokumen terkait:** 
+  [Panduan Pengguna Dasbor Health Pribadi Amazon](https://docs.aws.amazon.com/health/latest/ug/what-is-aws-health.html) 
+  [Panduan Pengguna Monitor Internet AWS](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-InternetMonitor.html) 
+  [Panduan Developer AWS X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html) 
+  [Panduan Pengguna DevOps Guru AWS](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html) 

 **Video terkait:** 
+  [Visibilitas tentang bagaimana masalah internet memengaruhi performa aplikasi](https://www.youtube.com/watch?v=Kuc_SG_aBgQ) 
+  [Pengantar tentang Amazon DevOps Guru](https://www.youtube.com/watch?v=2uA8q-8mTZY) 
+  [Mengelola peristiwa siklus hidup sumber daya dalam skala besar dengan AWS Health](https://www.youtube.com/watch?v=VoLLNL5j9NA) 

 **Contoh terkait:** 
+  [AWS Health Aware](https://github.com/aws-samples/aws-health-aware/) 
+  [Menggunakan Penyaringan Berbasis Tag untuk Mengelola Pemantauan dan Peringatan AWS Health dengan Skala Besar](https://aws.amazon.com/blogs/mt/using-tag-based-filtering-to-manage-health-monitoring-and-alerting-at-scale/) 

# OPS04-BP05 Melaksanakan penelusuran terdistribusi
<a name="ops_observability_dist_trace"></a>

 Penelusuran terdistribusi menawarkan cara untuk memantau dan memvisualisasikan permintaan yang melintasi berbagai komponen sistem terdistribusi. Dengan menangkap data jejak dari berbagai sumber dan menganalisisnya dalam tampilan terpadu, tim dapat lebih memahami bagaimana permintaan mengalir, di mana kemacetan terjadi, dan di mana upaya pengoptimalan harus difokuskan. 

 **Hasil yang diinginkan:** Dapatkan tampilan menyeluruh permintaan-permintaan yang mengalir melewati sistem terdistribusi Anda, sehingga akan memungkinkan Anda untuk melakukan debugging yang presisi, performa yang dioptimalkan, dan pengalaman pengguna yang lebih baik. 

 **Anti-pola umum:** 
+  Instrumentasi yang tidak konsisten: Tidak semua layanan yang ada dalam sebuah sistem terdistribusi diinstrumentasi untuk penelusuran. 
+  Mengabaikan latensi: Hanya berfokus pada kesalahan dan tidak mempertimbangkan latensi atau penurunan performa yang terjadi secara bertahap. 

 **Manfaat menjalankan praktik terbaik ini:** 
+ Gambaran umum sistem yang komprehensif: Memberikan visualisasi dari seluruh jalur permintaan, dari masuk hingga keluar.
+  Debugging yang disempurnakan: Mengidentifikasi dengan cepat di mana kegagalan atau masalah performa terjadi. 
+  Pengalaman pengguna yang ditingkatkan: Melakukan pemantauan dan optimalisasi berdasarkan data pengguna aktual, yang akan memastikan bahwa sistem memenuhi tuntutan dunia nyata. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Mulailah dengan mengidentifikasi semua elemen beban kerja Anda yang memerlukan instrumentasi. Setelah semua komponen diperhitungkan, manfaatkan alat seperti AWS X-Ray dan OpenTelemetry untuk mengumpulkan data jejak untuk analisis dengan alat seperti X-Ray dan Amazon CloudWatch ServiceLens Map. Terlibat dalam ulasan reguler dengan pengembang, dan lengkapi diskusi ini dengan alat seperti Amazon DevOps Guru, X-Ray Analytics, dan X-Ray Insights untuk membantu mengungkap temuan yang lebih dalam. Buatlah peringatan dari data jejak untuk memberikan notifikasi kapan hasil, sebagaimana didefinisikan dalam rencana pemantauan beban kerja, mengandung risiko. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

 Cara mengimplementasikan penelusuran terdistribusi secara efektif: 

1.  **Adopsi [AWS X-Ray](https://aws.amazon.com/xray/):** Integrasikan X-Ray ke dalam aplikasi Anda untuk mendapatkan wawasan tentang perilakunya, memahami performanya, dan mengenali kemacetan. Manfaatkan Wawasan X-Ray untuk analisis jejak otomatis. 

1.  **Instrumen layanan Anda:** Verifikasi bahwa setiap layanan, dari [AWS Lambda](https://aws.amazon.com/lambda/)fungsi hingga [EC2instance](https://aws.amazon.com/ec2/), mengirimkan data jejak. Semakin banyak layanan yang Anda instrumen, semakin jelas end-to-end tampilan. 

1.  **Menggabungkan [Pemantauan Pengguna CloudWatch Nyata](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-RUM.html) dan [pemantauan sintetis](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html):** Integrasikan Pemantauan Pengguna Nyata (RUM) dan pemantauan sintetis dengan X-Ray. Hal ini akan memungkinkan perekaman pengalaman pengguna dunia nyata dan simulasi interaksi pengguna untuk mengidentifikasi masalah-masalah potensial yang mungkin terjadi. 

1.  **Gunakan [CloudWatch agen: Agen](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html)** dapat mengirim jejak dari X-Ray atau OpenTelemetry, meningkatkan kedalaman wawasan yang diperoleh. 

1.  **Gunakan [Amazon DevOps Guru: DevOps Guru](https://aws.amazon.com/devops-guru/)** menggunakan data dari X-Ray,, CloudWatch AWS Config, dan AWS CloudTrail untuk memberikan rekomendasi yang dapat ditindaklanjuti. 

1.  **Lakukan analisis jejak:** Tinjau data jejak secara rutin untuk membedakan pola, anomali, atau kemacetan yang dapat memengaruhi performa aplikasi Anda. 

1.  **Siapkan peringatan:** Konfigurasikan alarm [CloudWatch](https://aws.amazon.com/cloudwatch/)untuk pola yang tidak biasa atau latensi yang diperpanjang, memungkinkan pengalamatan masalah proaktif. 

1.  **Peningkatan terus-menerus:** Tinjau ulang strategi penelusuran Anda saat layanan ditambahkan atau dimodifikasi untuk menangkap semua titik data yang relevan. 

 **Tingkat upaya untuk rencana implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS04-BP01 Identifikasi indikator kinerja utama](ops_observability_identify_kpis.md) 
+  [OPS04-BP02 Melaksanakan telemetri aplikasi](ops_observability_application_telemetry.md) 
+  [OPS04-BP03 Menerapkan telemetri pengalaman pengguna](ops_observability_customer_telemetry.md) 
+  [OPS04-BP04 Mengimplementasikan telemetri dependensi](ops_observability_dependency_telemetry.md) 

 **Dokumen terkait:** 
+ [AWS X-Ray Panduan Pengembang](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html)
+ [Panduan Pengguna CloudWatch agen Amazon](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html)
+ [Panduan Pengguna Amazon DevOps Guru](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html)

 **Video terkait:** 
+ [Gunakan AWS X-Ray Wawasan](https://www.youtube.com/watch?v=tl8OWHl6jxw)
+ [AWS di Air ft. Observabilitas: Amazon CloudWatch ](https://www.youtube.com/watch?v=qBDBnPkZ-KI) dan AWS X-Ray

 **Contoh terkait:** 
+ [Instrumentasi aplikasi Anda untuk AWS X-Ray](https://aws.amazon.com/xray/latest/devguide/xray-instrumenting-your-app.html)