# Keunggulan operasional
<a name="a-operational-excellence"></a>

Keunggulan operasional (OE) merupakan komitmen untuk membangun perangkat lunak dengan benar sambil memberikan pengalaman pelanggan yang luar biasa secara konsisten. Pilar keunggulan operasional berisi praktik terbaik untuk mengatur tim Anda, mendesain beban kerja Anda, mengoperasikannya dalam skala besar, dan mengembangkannya seiring waktu. Anda dapat menemukan panduan preskriptif tentang implementasi di [laporan resmi Pilar Keunggulan Operasional](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/welcome.html). 

**Topics**
+ [Organisasi](a-organization.md)
+ [Persiapkan](a-prepare.md)
+ [Jalankan](a-operate.md)
+ [Kembangkan](a-evolve.md)

# Organisasi
<a name="a-organization"></a>

**Topics**
+ [OPS 1. Bagaimana cara menentukan apa saja prioritas Anda?](ops-01.md)
+ [OPS 2. Bagaimana cara menyusun struktur organisasi untuk mendukung hasil bisnis Anda?](ops-02.md)
+ [OPS 3. Bagaimana budaya organisasi Anda mendukung hasil bisnis Anda?](ops-03.md)

# OPS 1. Bagaimana cara menentukan apa saja prioritas Anda?
<a name="ops-01"></a>

 Setiap orang harus memahami peran mereka dalam mewujudkan kesuksesan bisnis. Miliki sasaran bersama guna menetapkan prioritas untuk sumber daya. Ini akan memaksimalkan manfaat dari upaya Anda. 

**Topics**
+ [OPS01-BP01 Mengevaluasi kebutuhan pelanggan eksternal](ops_priorities_ext_cust_needs.md)
+ [OPS01-BP02 Mengevaluasi kebutuhan nasabah internal](ops_priorities_int_cust_needs.md)
+ [OPS01-BP03 Mengevaluasi persyaratan tata kelola](ops_priorities_governance_reqs.md)
+ [OPS01-BP04 Evaluasi persyaratan kepatuhan](ops_priorities_compliance_reqs.md)
+ [OPS01-BP05 Mengevaluasi lanskap ancaman](ops_priorities_eval_threat_landscape.md)
+ [OPS01-BP06 Mengevaluasi kompromi sambil mengelola manfaat dan risiko](ops_priorities_eval_tradeoffs.md)

# OPS01-BP01 Mengevaluasi kebutuhan pelanggan eksternal
<a name="ops_priorities_ext_cust_needs"></a>

 Libatkan pemangku kepentingan utama, termasuk tim bisnis, pengembangan, dan operasional, untuk menentukan ke mana harus memfokuskan usaha terkait kebutuhan pelanggan eksternal. Hal ini memverifikasi bahwa Anda memiliki pemahaman menyeluruh mengenai dukungan operasi yang dibutuhkan untuk mencapai hasil bisnis yang diinginkan. 

 **Hasil yang diinginkan:** 
+  Anda bekerja dengan berpatokan pada hasil pelanggan. 
+  Anda memahami bagaimana praktik operasional Anda mendukung hasil dan tujuan bisnis. 
+  Anda melibatkan semua pihak yang relevan. 
+  Anda memiliki mekanisme untuk merekam kebutuhan pelanggan eksternal. 

 **Anti-pola umum:** 
+  Anda memutuskan untuk tidak menyediakan dukungan pelanggan di luar jam kerja, tetapi Anda belum meninjau riwayat data permintaan dukungan. Anda tidak tahu apakah hal ini akan memengaruhi pelanggan Anda. 
+  Anda mengembangkan fitur baru, tetapi belum melibatkan pelanggan untuk mencari tahu apakah hal tersebut diinginkan—jika diinginkan, dalam bentuk apa—dan belum menjalankan eksperimen untuk memvalidasi kebutuhan serta metode penyediaannya. 

 **Manfaat penerapan praktik terbaik:** Pelanggan yang kebutuhannya terpenuhi akan sangat berpotensi menjadi pelanggan tetap. Mengevaluasi dan memahami kebutuhan pelanggan eksternal akan menginformasikan cara Anda memprioritaskan usaha untuk memberikan nilai bisnis. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 **Pahami kebutuhan bisnis:** Kesuksesan bisnis terwujud dengan tujuan dan pemahaman bersama di seluruh pemangku kepentingan, termasuk tim bisnis, pengembangan, dan operasional. 

 **Tinjau tujuan bisnis, kebutuhan, dan prioritas pelanggan eksternal:** Libatkan para pemangku kepentingan utama, termasuk tim bisnis, pengembangan, dan operasional, untuk mendiskusikan tujuan, kebutuhan, dan prioritas pelanggan eksternal. Hal ini memastikan bahwa Anda memiliki pemahaman menyeluruh mengenai dukungan operasional yang dibutuhkan untuk mencapai hasil bisnis dan pelanggan. 

 **Tetapkan pemahaman bersama:** Tetapkan pemahaman bersama terkait fungsi bisnis beban kerja, peran masing-masing tim dalam mengoperasikan beban kerja, dan bagaimana faktor-faktor ini mendukung tujuan bisnis bersama bagi seluruh pelanggan internal dan eksternal. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS11-BP03 Mengimplementasikan loop umpan balik](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_evolve_ops_feedback_loops.html) 

# OPS01-BP02 Mengevaluasi kebutuhan nasabah internal
<a name="ops_priorities_int_cust_needs"></a>

 Libatkan pemangku kepentingan utama, termasuk tim bisnis, pengembangan, dan operasional, untuk menentukan ke mana harus memfokuskan usaha terkait kebutuhan pelanggan internal. Hal ini akan memastikan bahwa Anda memiliki pemahaman menyeluruh mengenai dukungan operasi yang dibutuhkan untuk mencapai hasil bisnis yang diinginkan. 

 **Hasil yang diinginkan:** 
+  Anda menggunakan prioritas yang ditetapkan untuk memfokuskan usaha peningkatan yang dapat memberikan dampak paling besar (misalnya, mengembangkan keterampilan tim, meningkatkan kinerja beban kerja, mengurangi biaya, mengotomatiskan runbook, atau meningkatkan pemantauan). 
+  Anda memperbarui prioritas Anda sesuai perubahan kebutuhan. 

 **Anti-pola umum:** 
+  Anda memutuskan untuk mengubah alokasi alamat IP untuk tim produk tanpa berkonsultasi dengan mereka agar manajemen jaringan menjadi lebih mudah. Anda tidak tahu dampak yang akan ditimbulkan kepada tim produk. 
+  Anda mengimplementasikan alat pengembangan baru tetapi belum melibatkan pelanggan internal untuk mencari tahu apakah alat itu dibutuhkan atau kompatibel dengan praktik yang sudah ada. 
+  Anda mengimplementasikan sistem pemantauan baru, tetapi belum menghubungi pelanggan internal untuk mencari tahu apakah mereka memiliki kebutuhan pemantauan atau pelaporan yang perlu dipertimbangkan. 

 **Manfaat menerapkan praktik terbaik:** Mengevaluasi dan memahami kebutuhan pelanggan internal akan menginformasikan cara Anda memprioritaskan usaha untuk memberikan nilai bisnis. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Pahami kebutuhan bisnis: Kesuksesan bisnis diciptakan dengan tujuan dan pemahaman bersama di seluruh pemangku kepentingan termasuk tim bisnis, pengembangan, dan operasional. 
+  Tinjau tujuan bisnis, kebutuhan, dan prioritas pelanggan internal: Libatkan pemangku kepentingan utama, termasuk tim bisnis, pengembangan, dan operasional, untuk mendiskusikan tujuan, kebutuhan, dan prioritas pelanggan internal. Hal ini memastikan bahwa Anda memiliki pemahaman menyeluruh mengenai dukungan operasional yang dibutuhkan untuk mencapai hasil bisnis dan pelanggan. 
+  Tetapkan pemahaman bersama: Tetapkan pemahaman bersama terkait fungsi bisnis beban kerja, peran masing-masing tim dalam mengoperasikan beban kerja, dan bagaimana faktor-faktor ini mendukung tujuan bisnis bersama bagi seluruh pelanggan internal dan eksternal. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:**
+  [OPS11-BP03 Menerapkan loop umpan balik](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_evolve_ops_feedback_loops.html) 

# OPS01-BP03 Mengevaluasi persyaratan tata kelola
<a name="ops_priorities_governance_reqs"></a>

 Tata kelola adalah serangkaian kebijakan, aturan, atau kerangka kerja yang digunakan perusahaan untuk mencapai sasaran bisnisnya. Persyaratan tata kelola dibuat dari dalam organisasi Anda. Persyaratan ini dapat memengaruhi jenis teknologi yang Anda pilih atau memengaruhi cara Anda mengoperasikan beban kerja Anda. Sertakan persyaratan tata kelola organisasi ke dalam beban kerja Anda. Konformitas adalah kemampuan untuk menunjukkan bahwa Anda telah mengimplementasikan persyaratan tata kelola. 

 **Hasil yang diinginkan:** 
+  Persyaratan tata kelola disertakan ke dalam operasi dan desain arsitektur beban kerja Anda. 
+  Anda dapat memberikan bukti bahwa Anda telah mengikuti persyaratan tata kelola. 
+  Persyaratan tata kelola ditinjau dan diperbarui secara teratur. 

 **Anti-pola umum:** 
+ Organisasi Anda memerintahkan agar akun root memiliki autentikasi multi-faktor. Anda gagal mengimplementasikan persyaratan ini dan akun root terancam bahaya.
+ Selama desain beban kerja Anda, Anda memilih jenis instans yang tidak disetujui oleh departemen IT. Anda tidak dapat meluncurkan beban kerja Anda dan harus mendesain ulang.
+ Anda diwajibkan memiliki rencana pemulihan bencana. Anda tidak membuat rencana pemulihan bencana dan beban kerja Anda mengalami pemadaman yang berdurasi lama.
+  Tim Anda ingin menggunakan instans baru tetapi persyaratan tata kelola Anda belum diperbarui untuk memungkinkannya. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Mengikuti persyaratan tata kelola akan menyelaraskan beban kerja Anda dengan kebijakan lebih besar dalam organisasi. 
+  Persyaratan tata kelola mencerminkan standar industri dan praktik terbaik untuk organisasi Anda. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

Identifikasi persyaratan tata kelola melalui kerja sama dengan pemangku kepentingan dan organisasi tata kelola. Sertakan persyaratan tata kelola ke dalam beban kerja Anda. Dapat menunjukkan bukti bahwa Anda telah mengikuti persyaratan tata kelola.

 **Contoh pelanggan** 

 Di AnyCompany Retail, tim operasi cloud bekerja dengan pemangku kepentingan di seluruh organisasi untuk mengembangkan persyaratan tata kelola. Misalnya, mereka melarang SSH akses ke EC2 instans Amazon. Jika tim memerlukan akses ke sistem, mereka harus menggunakan AWS Systems Manager Session Manager. Tim operasi cloud secara teratur memperbarui persyaratan tata kelola saat layanan baru tersedia. 

 **Langkah-langkah implementasi** 

1.  Identifikasi pemangku kepentingan untuk beban kerja Anda, termasuk semua tim tersentralisasi. 

1.  Bekerja sama dengan pemangku kepentingan untuk mengidentifikasi persyaratan tata kelola. 

1.  Setelah Anda membuat daftar, prioritaskan item untuk ditingkatkan, dan mulai implementasikan ke dalam beban kerja Anda. 

   1.  Gunakan layanan seperti [AWS Config](https://aws.amazon.com/blogs/industries/best-practices-for-aws-organizations-service-control-policies-in-a-multi-account-environment/)untuk membuat governance-as-code dan memvalidasi bahwa persyaratan tata kelola diikuti. 

   1.  Jika Anda menggunakan [AWS Organizations](https://docs.aws.amazon.com/organizations/latest/userguide/orgs_manage_policies_scps.html), Anda dapat memanfaatkan Kebijakan Kontrol Layanan untuk menerapkan persyaratan tata kelola. 

1.  Berikan dokumentasi yang memvalidasi implementasinya. 

 **Tingkat upaya untuk rencana implementasi:** Sedang. Mengimplementasikan persyaratan tata kelola yang tidak ada dapat mengakibatkan beban kerja Anda harus dikerjakan ulang. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS01-BP04 Evaluasi persyaratan kepatuhan](ops_priorities_compliance_reqs.md) - Kepatuhan itu seperti tata kelola tetapi kepatuhan berasal dari luar organisasi. 

 **Dokumen terkait:** 
+ [AWS Panduan Lingkungan Cloud Manajemen dan Tata Kelola](https://docs.aws.amazon.com/wellarchitected/latest/management-and-governance-guide/management-and-governance-cloud-environment-guide.html)
+ [Praktik Terbaik untuk Kebijakan Kontrol AWS Organizations Layanan di Lingkungan Multi-Akun](https://aws.amazon.com/blogs/industries/best-practices-for-aws-organizations-service-control-policies-in-a-multi-account-environment/)
+ [Tata Kelola dalam AWS Cloud: Keseimbangan yang Tepat Antara Kelincahan dan Keamanan](https://aws.amazon.com/blogs/apn/governance-in-the-aws-cloud-the-right-balance-between-agility-and-safety/)
+ [Apa itu Tata Kelola, Risiko, dan Kepatuhan (GRC)?](https://aws.amazon.com/what-is/grc/)

 **Video terkait:** 
+ [AWS Manajemen dan Tata Kelola: Konfigurasi, Kepatuhan, dan Audit - AWS Pembicaraan Teknologi Online](https://www.youtube.com/watch?v=79ud1ZAaoj0)
+ [AWS re: Inforce 2019: Tata Kelola untuk Zaman Awan (-R1) DEM12](https://www.youtube.com/watch?v=y3WmHnavuN8)
+ [AWS re:invent 2020: Mencapai kepatuhan sebagai menggunakan kode AWS Config](https://www.youtube.com/watch?v=m8vTwvbzOfw)
+ [AWS Re:invent 2020: Tata kelola tangkas di AWS GovCloud (US)](https://www.youtube.com/watch?v=hv6B17eriHQ)

 **Contoh terkait:** 
+ [AWS Config Sampel Paket Kesesuaian](https://docs.aws.amazon.com/config/latest/developerguide/conformancepack-sample-templates.html)

 **Layanan terkait:** 
+ [AWS Config](https://aws.amazon.com/config/)
+ [AWS Organizations - Kebijakan Pengendalian Layanan](https://docs.aws.amazon.com/organizations/latest/userguide/orgs_manage_policies_scps.html)

# OPS01-BP04 Evaluasi persyaratan kepatuhan
<a name="ops_priorities_compliance_reqs"></a>

Persyaratan kepatuhan peraturan, industri, dan internal merupakan pendorong penting dalam menentukan prioritas organisasi Anda. Kerangka kerja kepatuhan Anda dapat menghalangi Anda untuk menggunakan teknologi atau lokasi geografi tertentu. Terapkan uji tuntas jika tidak ada kerangka kerja kepatuhan eksternal yang diidentifikasi. Buatlah audit atau laporan yang memvalidasi kepatuhan.

 Jika Anda mengiklankan bahwa produk Anda memenuhi standar kepatuhan tertentu, maka Anda harus memiliki proses internal untuk memastikan kepatuhan yang berkelanjutan. Contoh standar kepatuhan antara lain PCI DSS, FedRAMP, dan HIPAA. Standar kepatuhan yang berlaku akan ditentukan oleh berbagai faktor, seperti jenis data yang disimpan atau dikirim oleh solusi, serta wilayah geografis mana yang didukung oleh solusi. 

 **Hasil yang diinginkan:** 
+  Persyaratan kepatuhan berdasarkan regulasi, industri, dan internal disertakan ke dalam pemilihan arsitektur. 
+  Anda dapat memvalidasi kepatuhan dan membuat laporan audit. 

 **Anti-pola umum:** 
+ Bagian dari beban kerja Anda termasuk dalam kerangka kerja Standar Keamanan Data Industri Kartu Pembayaran (Payment Card Industry Data Security Standard, PCI-DSS) tetapi beban kerja Anda menyimpan data kartu kredit yang tidak dienkripsi.
+ Arsitek dan pengembang perangkat lunak Anda tidak mengetahui kerangka kerja kepatuhan yang harus ditaati oleh organisasi Anda.
+  Audit tahunan terhadap Kontrol Sistem dan Organisasi (SOC2) Tipe II akan segera diadakan dan Anda tidak dapat memverifikasi bahwa kontrol tersebut sudah ada atau tidak. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Mengevaluasi dan memahami persyaratan kepatuhan yang berlaku untuk beban kerja Anda akan menginformasikan bagaimana Anda memprioritaskan upaya-upaya Anda untuk memberikan nilai bisnis. 
+  Anda memilih teknologi dan lokasi yang tepat yang selaras dengan kerangka kerja kepatuhan Anda. 
+  Mendesain beban kerja Anda agar dapat diaudit akan membantu Anda membuktikan bahwa Anda menaati kerangka kerja kepatuhan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Mengimplementasikan praktik terbaik ini berarti Anda menyertakan persyaratan kepatuhan ke dalam proses desain arsitektur Anda. Anggota tim Anda mengetahui kerangka kerja kepatuhan yang diperlukan. Anda memvalidasi bahwa kepatuhan selaras dengan kerangka kerja. 

 **Contoh pelanggan** 

 AnyCompany Retail menyimpan informasi kartu kredit bagi para pelanggan. Para pengembang di tim penyimpanan kartu memahami bahwa mereka harus mematuhi kerangka kerja PCI-DSS. Mereka telah mengambil langkah-langkah yang diperlukan untuk memverifikasi bahwa informasi kartu kredit disimpan dan diakses dengan aman sesuai dengan kerangka kerja PCI-DSS. Setiap tahun mereka bekerja sama dengan tim keamanan mereka untuk melakukan validasi kepatuhan. 

 **Langkah-langkah implementasi** 

1.  Bekerjasamalah dengan tim tata kelola dan kepatuhan Anda untuk menentukan kerangka kerja kepatuhan industri, peraturan, atau internal apa yang harus ditaati oleh beban kerja Anda. Sertakan kerangka kerja kepatuhan ke dalam beban kerja Anda. 

   1.  Lakukan validasi kepatuhan berkelanjutan terhadap sumber daya AWS dengan mengunakan layanan seperti [AWS Compute Optimizer](https://docs.aws.amazon.com/compute-optimizer/latest/ug/what-is-compute-optimizer.html) dan [AWS Security Hub CSPM](https://docs.aws.amazon.com/securityhub/latest/userguide/what-is-securityhub.html). 

1.  Didik anggota tim Anda mengenai persyaratan kepatuhan sehingga mereka dapat mengoperasikan dan mengubah beban kerja sesuai dengan persyaratan kepatuhan. Persyaratan kepatuhan harus disertakan dalam pilihan-pilihan berkaitan dengan arsitektur dan teknologi. 

1.  Tergantung pada kerangka kerja kepatuhan yang diterapkan, Anda mungkin diharuskan untuk membuat laporan kepatuhan atau audit. Bekerjasamalah dengan organisasi Anda untuk melakukan otomatisasi terhadap proses ini sebanyak mungkin. 

   1.  Gunakan layanan-layanan seperti [AWS Audit Manager](https://docs.aws.amazon.com/audit-manager/latest/userguide/what-is.html) untuk memvalidasi kepatuhan dan menghasilkan laporan audit. 

   1.  Anda dapat mengunduh dokumen-dokumen keamanan dan kepatuhan AWS dengan [AWS Artifact](https://docs.aws.amazon.com/artifact/latest/ug/what-is-aws-artifact.html). 

 **Tingkat upaya untuk rencana implementasi:** Sedang. Mengimplementasikan kerangka kerja kepatuhan bisa jadi sulit dilakukan. Membuat laporan audit atau dokumen kepatuhan menambahkan kompleksitas tambahan. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [SEC01-BP03 Melakukan identifikasi dan validasi tujuan kontrol](https://docs.aws.amazon.com/wellarchitected/latest/framework/sec_securely_operate_control_objectives.html) - Tujuan pengendalian keamanan adalah bagian penting dari kepatuhan secara keseluruhan. 
+  [SEC01-BP06 Melakukan otomatisasi terhadap pengujian dan validasi kontrol keamanan di pipeline](https://docs.aws.amazon.com/wellarchitected/latest/framework/sec_securely_operate_test_validate_pipeline.html) - Sebagai bagian dari pipeline Anda, validasi kontrol keamanan. Anda juga dapat membuat dokumentasi kepatuhan untuk perubahan-perubahan baru. 
+  [SEC07-BP02 Tentukan kontrol perlindungan data](https://docs.aws.amazon.com/wellarchitected/latest/framework/sec_data_classification_define_protection.html) - Banyak kerangka kerja kepatuhan memiliki penanganan data dan kebijakan yang berbasis penyimpanan. 
+  [SEC10-BP03 Siapkan kemampuan forensik](https://docs.aws.amazon.com/wellarchitected/latest/framework/sec_incident_response_prepare_forensic.html) - Kemampuan forensik terkadang dapat digunakan dalam kepatuhan audit. 

 **Dokumen terkait:** 
+ [Pusat Kepatuhan AWS](https://aws.amazon.com/financial-services/security-compliance/compliance-center/)
+ [Sumber Daya Kepatuhan AWS](https://aws.amazon.com/compliance/resources/)
+ [Laporan Resmi Risiko dan Kepatuhan AWS](https://docs.aws.amazon.com/whitepapers/latest/aws-risk-and-compliance/welcome.html)
+ [Model Tanggung Jawab Bersama AWS](https://aws.amazon.com/compliance/shared-responsibility-model/)
+ [Layanan AWS dalam lingkup sesuai program kepatuhan ](https://aws.amazon.com/compliance/services-in-scope/)

 **Video terkait:** 
+ [AWS re:Invent 2020: Capai kepatuhan sebagai kode dengan menggunakan AWS Compute Optimizer](https://www.youtube.com/watch?v=m8vTwvbzOfw)
+ [AWS re:Invent 2021 - Kepatuhan, jaminan, dan audit cloud](https://www.youtube.com/watch?v=pdrYGVgb08Y)
+ [AWS Summit ATL 2022 - Menerapkan kepatuhan, jaminan, dan audit pada AWS (COP202) ](https://www.youtube.com/watch?v=i7XrWimhqew)

 **Contoh terkait:** 
+ [ PCI DSS dan Praktik Terbaik Keamanan Dasar AWS pada AWS](https://aws.amazon.com/solutions/partners/compliance-pci-fsbp-remediation/)

 **Layanan terkait:** 
+ [AWS Artifact](https://docs.aws.amazon.com/artifact/latest/ug/what-is-aws-artifact.html)
+ [AWS Audit Manager](https://docs.aws.amazon.com/audit-manager/latest/userguide/what-is.html)
+ [AWS Compute Optimizer](https://docs.aws.amazon.com/config/latest/developerguide/WhatIsConfig.html)
+ [AWS Security Hub CSPM](https://docs.aws.amazon.com/securityhub/latest/userguide/what-is-securityhub.html)

# OPS01-BP05 Mengevaluasi lanskap ancaman
<a name="ops_priorities_eval_threat_landscape"></a>

 Evaluasi ancaman pada bisnis (misalnya, persaingan, risiko dan kewajiban bisnis, risiko operasional, serta ancaman keamanan informasi) dan pelihara informasi yang ada di registri risiko. Sertakan dampak risiko ketika menentukan ke mana upaya harus difokuskan. 

 [Kerangka Kerja Well-Architected](https://aws.amazon.com/architecture/well-architected/) menekankan pembelajaran, pengukuran, dan peningkatan. Ini memberikan pendekatan yang konsisten bagi Anda untuk mengevaluasi arsitektur, dan menerapkan desain yang akan skala dari waktu ke waktu. AWS menyediakan [AWS Well-Architected Tool](https://aws.amazon.com/well-architected-tool/)untuk membantu Anda meninjau pendekatan Anda sebelum pengembangan, keadaan beban kerja Anda sebelum produksi, dan keadaan beban kerja Anda dalam produksi. Anda dapat membandingkannya dengan praktik terbaik AWS arsitektur terbaru, memantau status keseluruhan beban kerja Anda, dan mendapatkan wawasan tentang potensi risiko. 

 AWS pelanggan memenuhi syarat untuk Tinjauan Well-Architected yang dipandu dari beban kerja kritis misi mereka [untuk](https://aws.amazon.com/premiumsupport/programs/) mengukur arsitektur mereka terhadap praktik terbaik. AWS Pelanggan Dukungan Perusahaan memenuhi syarat untuk [Peninjauan Operasi](https://aws.amazon.com/premiumsupport/programs/), yang dirancang untuk membantu mereka mengidentifikasi kesenjangan yang ada dalam pendekatan mereka untuk beroperasi di cloud. 

 Interaksi lintas tim pada tinjauan ini akan membantu Anda dalam membangun pemahaman bersama tentang beban kerja Anda serta bagaimana peran tim akan membantu meraih keberhasilan. Kebutuhan yang diidentifikasi melalui tinjauan tersebut dapat membantu membentuk prioritas Anda. 

 [AWS Trusted Advisor](https://aws.amazon.com/premiumsupport/technology/trusted-advisor/) adalah sebuah alat yang menyediakan akses ke set inti pemeriksaan yang menyarankan optimalisasi yang dapat membantu membentuk prioritas Anda. [Pelanggan Dukungan Bisnis dan Perusahaan](https://aws.amazon.com/premiumsupport/plans/) menerima akses ke pemeriksaan tambahan yang berfokus pada keamanan, keandalan, kinerja, dan optimisasi biaya yang dapat membantu membentuk prioritas mereka lebih lanjut. 

 **Hasil yang diinginkan:** 
+  Anda secara teratur meninjau dan bertindak berdasarkan Well-Architected dan output Trusted Advisor 
+  Anda mengetahui status patch terbaru layanan Anda 
+  Anda memahami risiko dan dampak ancaman yang diketahui dan bertindak sebagaimana mestinya 
+  Anda mengimplementasikan mitigasi sesuai keperluan 
+  Anda mengomunikasikan tindakan dan konteks 

 **Anti-pola umum:** 
+  Anda menggunakan pustaka perangkat lunak versi lama dalam produk Anda. Anda tidak mengetahui bahwa ada pembaruan keamanan pustaka untuk masalah-masalah yang mungkin memiliki dampak yang tidak diinginkan pada beban kerja Anda. 
+  Kompetitor Anda baru saja merilis sebuah versi produk mereka yang dapat mengatasi keluhan pelanggan Anda tentang produk Anda. Anda belum memprioritaskan penanganan masalah-masalah yang sudah diketahui ini. 
+  Pembuat peraturan telah menyasar perusahaan-perusahaan yang tidak mematuhi persyaratan kepatuhan hukum seperti Anda. Anda belum memprioritaskan penanganan persyaratan kepatuhan Anda yang belum terpenuhi. 

 **Manfaat menerapkan praktik terbaik ini:** Anda dapat mengidentifikasi dan memahami ancaman terhadap organisasi dan beban kerja Anda, hal ini akan membantu Anda menentukan ancaman mana yang harus ditangani, tingkat prioritasnya, serta sumber daya yang diperlukan untuk melakukannya. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  **Evaluasi lanskap ancaman:** Evaluasi ancaman terhadap bisnis (misalnya kompetisi, risiko dan kewajiban bisnis, risiko operasional, dan ancaman keamanan informasi), sehingga Anda dapat menyertakan dampaknya ketika menentukan ke mana upaya perlu difokuskan. 
  +  [Buletin Keamanan Terkini AWS](https://aws.amazon.com/security/security-bulletins/) 
  +  [AWS Trusted Advisor](https://aws.amazon.com/premiumsupport/trustedadvisor/) 
+  **Pelihara model ancaman:** Buat dan pelihara model ancaman yang mengidentifikasi potensi ancaman, mitigasi terencana dan sedang diterapkan, serta prioritasnya. Tinjau kemungkinan ancaman yang berwujud insiden, biaya untuk melakukan pemulihan dari insiden tersebut serta perkiraan bahaya yang ditimbulkan, dan biaya untuk mencegah terjadinya insiden tersebut. Revisi proritas seiring perubahan konten model ancaman. 

## Sumber daya
<a name="resources"></a>

 **Praktik terbaik terkait:** 
+  [SEC01-BP07 Mengidentifikasi ancaman dan memprioritaskan mitigasi menggunakan model ancaman](https://docs.aws.amazon.com/wellarchitected/latest/security-pillar/sec_securely_operate_threat_model.html) 

 **Dokumen terkait:** 
+  [Kepatuhan AWS Cloud](https://aws.amazon.com/compliance/) 
+  [Buletin Keamanan Terkini AWS](https://aws.amazon.com/security/security-bulletins/) 
+  [AWS Trusted Advisor](https://aws.amazon.com/premiumsupport/trustedadvisor/) 

 **Video terkait:** 
+  [AWS re: Inforce 2023 - Alat untuk membantu Anda meningkatkan pemodelan ancaman Anda](https://youtu.be/CaYCsmjuiHg?si=e_CXPGqRF4WeBr1u) 

# OPS01-BP06 Mengevaluasi kompromi sambil mengelola manfaat dan risiko
<a name="ops_priorities_eval_tradeoffs"></a>

 Kepentingan yang saling berbenturan dari berbagai pihak dapat menyulitkan Anda dalam membuat prioritas upaya, pembangunan kemampuan, dan pemberian hasil yang selaras dengan strategi bisnis. Misalnya, Anda mungkin diminta untuk memprioritaskan peningkatan kecepatan masuk pasar untuk fitur-fitur baru daripada optimalisasi biaya infrastruktur IT. Hal ini dapat menjadikan dua pihak yang berkepentingan mengalami konflik satu sama lain. Dalam situasi seperti ini, keputusan perlu dibawa ke otoritas yang lebih tinggi untuk menyelesaikan konflik. Data diperlukan agar tidak ada keterikatan emosional dalam proses pengambilan keputusan. 

 Tantangan yang sama dapat terjadi pada tingkatan taktis. Misalnya, ketika ada pilihan antara menggunakan teknologi basis data relasional atau non-relasional, hal itu dapat berdampak signifikan pada pengoperasian aplikasi. Sangat penting bagi Anda untuk memahami hasil yang dapat diprediksi dari berbagai pilihan. 

 AWS dapat membantu mengedukasi tim Anda tentang AWS beserta layanannya untuk meningkatkan pemahaman mereka tentang bagaimana pilihan mereka dapat menimbulkan dampak pada beban kerja. Gunakan sumber daya yang disediakan oleh [Dukungan](https://aws.amazon.com/premiumsupport/programs/) ([Pusat Pengetahuan AWS](https://aws.amazon.com/premiumsupport/knowledge-center/), [Forum Diskusi AWS](https://forums.aws.amazon.com/index.jspa), dan [ Pusat Dukungan](https://console.aws.amazon.com/support/home/)) serta [Dokumentasi AWS](https://docs.aws.amazon.com/) untuk memberikan edukasi bagi tim Anda. Untuk pertanyaan lebih lanjut, hubungi Dukungan. 

 AWS juga membagikan pola dan praktik terbaik di [Amazon Builders’ Library](https://aws.amazon.com/builders-library/). Beragam informasi berguna lainnya dapat diakses melalui [Blog AWS](https://aws.amazon.com/blogs/) dan [Siniar Resmi AWS](https://aws.amazon.com/podcasts/aws-podcast/). 

 **Hasil yang diharapkan:** Anda memiliki kerangka kerja pengambilan keputusan yang jelas untuk memudahkan Anda mengambil keputusan penting di setiap level dalam organisasi pengiriman cloud Anda. Kerangka kerja ini mencakup fitur-fitur seperti pencatatan risiko, peran yang ditentukan untuk wewenang pengambilan keputusan, dan model yang ditentukan untuk masing-masing tingkat keputusan yang dapat diambil. Kerangka kerja ini juga menetapkan di awal bagaimana konflik akan diselesaikan, data apa yang perlu disajikan, dan bagaimana opsi diprioritaskan, sehingga setelah keputusan diambil, Anda dapat menjalankannya tanpa jeda. Kerangka pengambilan keputusan ini mencakup pendekatan terstandardisasi dalam meninjau dan menimbang manfaat-manfaat serta risiko dari setiap keputusan yang diambil untuk memahami kompromi. Ini mungkin mencakup faktor-faktor eksternal, seperti misalnya, kepatuhan terhadap persyaratan kepatuhan berdasarkan regulasi. 

 **Anti-pola umum:** 
+  Investor Anda meminta Anda untuk mendemonstrasikan kepatuhan terhadap Standar Keamanan Data Industri Kartu Pembayaran (PCI DSS). Anda tidak mempertimbangkan kompromi antara memenuhi permintaan mereka dan melanjutkan upaya-upaya pengembangan yang Anda lakukan saat ini. Alih-alih, Anda melanjutkan upaya-upaya pengembangan tanpa menunjukkan kepatuhan. Investor Anda menghentikan dukungan untuk perusahaan Anda karena mengkhawatirkan keamanan platform Anda serta investasi yang mereka tanamkan. 
+  Anda telah memutuskan untuk menyertakan pustaka yang ditemukan oleh salah satu developer Anda di internet. Anda belum mengevaluasi risiko adopsi pustaka ini dari sumber tak dikenal dan Anda tidak tahu jika pustaka ini memiliki kerentanan atau kode berbahaya. 
+  Pembenaran bisnis asli untuk migrasi Anda didasarkan pada modernisasi 60% beban kerja aplikasi Anda. Namun demikian, karena hambatan teknis, akhirnya diputuskan untuk melakukan modernisasi terhadap hanya 20% beban kerja tersebut, yang mengakibatkan berkurangnya manfaat yang direncanakan dalam jangka panjang, bertambahnya beban operasional bagi tim infrastruktur untuk mendukung sistem warisan secara manual, dan ketergantungan yang lebih besar pada pengembangan keterampilan baru di dalam tim infrastruktur yang tidak merencanakan perubahan ini. 

 **Manfaat menerapkan praktik terbaik ini:** Sepenuhnya menyelaraskan dan mendukung prioritas bisnis tingkat dewan, memahami risiko untuk mencapai kesuksesan, membuat keputusan yang tepat berdasarkan informasi, dan bertindak dengan tepat ketika ada risiko yang menghambat peluang untuk mencapai kesuksesan. Memahami implikasi dan konsekuensi keputusan yang Anda ambil akan membantu Anda dalam menyusun prioritas opsi dan menghadirkan kesepakatan para pemimpin dengan lebih cepat, yang akan mengarahkan Anda pada hasil bisnis yang lebih baik. Mengidentifikasi manfaat-manfaat yang bisa dihadirkan oleh pilihan Anda dan menyadari risiko yang ditimbulkannya terhadap organisasi akan membantu Anda mengambil keputusan dengan berlandaskan data, bukan opini. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Manajemen manfaat dan risiko harus ditentukan oleh badan pengatur yang mendorong persyaratan untuk pengambilan keputusan utama. Anda ingin keputusan diambil dan diprioritaskan berdasarkan bagaimana keputusan tersebut menguntungkan organisasi, dengan memahami risiko-risiko yang mungkin dihadapi. Informasi yang akurat sangat penting untuk mengambil keputusan organisasi. Hal ini harus didasarkan pada pengukuran yang solid dan ditentukan oleh praktik industri umum mengenai analisis manfaat biaya. Untuk mengambil keputusan semacam ini, bangun keseimbangan antara otoritas tersentralisasi dan terdesentralisasi. Kompromi akan selalu ada, dan penting untuk memahami bagaimana setiap pilihan akan memengaruhi strategi yang ditentukan dan hasil bisnis yang diinginkan. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  Susun praktik pengukuran manfaat dalam sebuah kerangka kerja tata kelola cloud yang menyeluruh. 

   1.  Seimbangkan kontrol pengambilan keputusan tersentralisasi dengan otoritas terdesentralisasi untuk beberapa keputusan. 

   1.  Pahami bahwa proses pengambilan keputusan yang memberatkan yang diterapkan pada setiap keputusan akan memperlambat Anda. 

   1.  Sertakan faktor-faktor eksternal ke dalam proses pengambilan keputusan Anda (seperti persyaratan kepatuhan). 

1.  Tetapkan kerangka kerja pengambilan keputusan yang telah disepakati untuk berbagai tingkat keputusan, yang menyertakan orang yang diminta untuk menengahi keputusan yang mengalami benturan kepentingan. 

   1.  Pusatkan pengambilan keputusan satu arah yang tidak dapat dibatalkan. 

   1.  Izinkan pengambilan keputusan dua arah oleh pemimpin organisasi tingkat bawah. 

1.  Pahami dan kelola manfaat serta risiko. Seimbangkan manfaat keputusan sesuai risiko yang terlibat. 

   1.  **Identifikasi manfaat**: Identifikasi manfaat berdasarkan tujuan, kebutuhan, dan prioritas bisnis. Contohnya antara lain dampak kasus bisnis, waktu masuk pasar, keamanan, keandalan, performa, dan biaya. 

   1.  **Identifikasi risiko:** Identifikasi risiko berdasarkan tujuan, kebutuhan, dan prioritas bisnis. Contohnya antara lain waktu masuk pasar, keamanan, keandalan, performa, dan biaya. 

   1.  **Evaluasi manfaat dibandingkan risiko dan ambil keputusan yang bijaksana**: Tentukan dampak manfaat dan risiko berdasarkan tujuan, kebutuhan, dan prioritas pemangku kepentingan utama Anda, termasuk bagian bisnis, pengembangan, dan operasi. Lakukan evaluasi terhadap nilai dari manfaat yang didapatkan dibanding dengan probabilitas terjadinya risiko dan kerugian yang ditimbulkan oleh dampaknya. Sebagai contoh, menekankan pada kecepatan masuk pasar dan bukannya keandalan dapat memberikan keunggulan dalam persaingan. Tetapi, hal ini dapat mengakibatkan berkurangnya waktu aktif jika ada masalah keandalan yang terjadi. 

1.  Secara terprogram, berlakukan keputusan utama yang mengotomatiskan kesesuaian Anda terhadap persyaratan-persyaratan kepatuhan. 

1.  Manfaatkan kerangka kerja dan kemampuan industri yang sudah diketahui, seperti Value Stream Analysis dan LEAN, untuk membuat garis acuan performa saat ini, metrik bisnis, dan menentukan iterasi progres menuju peningkatan terhadap metrik-metrik ini. 

 **Tingkat upaya untuk rencana implementasi:** Sedang cenderung Tinggi 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS01-BP05 Mengevaluasi lanskap ancaman](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_priorities_eval_threat_landscape.html) 

 **Dokumen terkait:** 
+  [Elemen-elemen Amazon, Hari 1 Budaya \$1 Buat keputusan berkualitas tinggi dan berkecepatan tinggi](https://aws.amazon.com/executive-insights/content/how-amazon-defines-and-operationalizes-a-day-1-culture/) 
+  [Tata Kelola Cloud](https://aws.amazon.com/cloudops/cloud-governance/) 
+  [Manajemen dan Tata Kelola Lingkungan Cloud](https://docs.aws.amazon.com/wellarchitected/latest/management-and-governance-guide/management-and-governance-cloud-environment-guide.html?did=wp_card&trk=wp_card) 
+  [Tata Kelola di Cloud dan di Era Digital: Bagian Satu & Dua](https://aws.amazon.com/blogs/enterprise-strategy/governance-in-the-cloud-and-in-the-digital-age-part-one/) 

 **Video terkait:** 
+  [Siniar \$1 Jeff Bezos \$1 Tentang cara membuat keputusan](https://www.youtube.com/watch?v=VFwCGECvq4I) 

 **Contoh terkait:** 
+  [Buat keputusan berdasarkan informasi dengan menggunakan data (DevOps Sagas)](https://docs.aws.amazon.com/wellarchitected/latest/devops-guidance/oa.bcl.10-make-informed-decisions-using-data.html) 
+  [Menggunakan pemetaan aliran nilai pengembangan untuk mengidentifikasi kendala pada hasil DevOps](https://docs.aws.amazon.com/prescriptive-guidance/latest/strategy-devops-value-stream-mapping/introduction.html) 

# OPS 2. Bagaimana cara menyusun struktur organisasi untuk mendukung hasil bisnis Anda?
<a name="ops-02"></a>

 Tim Anda harus memahami peran mereka dalam mencapai hasil bisnis. Tim harus memahami peran mereka dalam kesuksesan tim lain, peran tim lain dalam kesuksesan mereka, dan memiliki sasaran bersama. Memahami tanggung jawab, kepemilikan, bagaimana keputusan diambil, dan siapa yang memiliki otoritas untuk mengambil keputusan akan membantu memfokuskan upaya dan memaksimalkan manfaat dari tim Anda. 

**Topics**
+ [OPS02-BP01 Sumber daya telah mengidentifikasi pemilik](ops_ops_model_def_resource_owners.md)
+ [OPS02-BP02 Proses dan Prosedur memiliki pemilik teridentifikasi](ops_ops_model_def_proc_owners.md)
+ [OPS02-BP03 Aktivitas operasi memiliki pemilik teridentifikasi yang bertanggung jawab atas performanya](ops_ops_model_def_activity_owners.md)
+ [OPS02-BP04 Mekanisme tersedia untuk mengelola tanggung jawab dan kepemilikan](ops_ops_model_def_responsibilities_ownership.md)
+ [OPS02-BP05 Mekanisme tersedia untuk meminta penambahan, perubahan, dan pengecualian](ops_ops_model_req_add_chg_exception.md)
+ [OPS02-BP06 Tanggung jawab antara tim telah dinegosiasikan atau ditetapkan sebelumnya](ops_ops_model_def_neg_team_agreements.md)

# OPS02-BP01 Sumber daya telah mengidentifikasi pemilik
<a name="ops_ops_model_def_resource_owners"></a>

 Sumber daya untuk beban kerja Anda harus memiliki pemilik yang teridentifikasi untuk pengontrolan perubahan, penyelesaian masalah, dan fungsi-fungsi lainnya. Pemilik ditetapkan untuk beban kerja, akun, infrastruktur, platform, dan aplikasi. Kepemilikan dicatat menggunakan alat seperti daftar sentral atau metadata yang dilampirkan ke sumber daya. Nilai bisnis komponen menginformasikan proses dan prosedur yang diterapkan kepadanya. 

 **Hasil yang diinginkan:** 
+  Sumber daya telah mengidentifikasi pemilik dengan menggunakan metadata atau daftar sentral. 
+  Anggota tim dapat mengidentifikasi siapa pemilik sumber daya. 
+  Akun memiliki satu pemilik apabila mungkin. 

 **Anti-pola umum:** 
+  Kontak alternatif untuk Akun AWS Anda tidak diisi. 
+  Sumber daya tidak memiliki tag yang mengidentifikasi tim mana yang memilikinya. 
+  Anda memiliki ITSM antrian tanpa pemetaan email. 
+  Dua tim sama-sama merupakan pemilik bagian penting dari infrastruktur. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Kontrol perubahan untuk sumber daya akan menjadi mudah dilakukan dengan ditetapkannya kepemilikan. 
+  Anda dapat melibatkan pemilik yang benar ketika menyelesaikan masalah. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Tentukan pentingnya kepemilikan untuk kasus penggunaan sumber daya di lingkungan Anda. Kepemilikan dapat berarti siapa yang mengawasi perubahan pada sumber daya, yang mendukung sumber daya selama penyelesaian masalah, atau siapa yang bertanggung jawab terhadapnya secara finansial. Sebutkan dan catat pemilik untuk sumber daya, termasuk nama, informasi kontak, organisasi, serta tim. 

 **Contoh pelanggan** 

 AnyCompany Ritel mendefinisikan kepemilikan sebagai tim atau individu yang memiliki perubahan dan dukungan untuk sumber daya. Mereka memanfaatkan AWS Organizations untuk mengelola mereka Akun AWS. Kontak akun alternatif dikonfigurasi menggunakan kotak masuk grup. Setiap ITSM antrian memetakan ke alias email. Tag mengidentifikasi siapa yang memiliki AWS sumber daya. Untuk infrastruktur dan platform-platform lainnya, mereka memiliki halaman wiki yang mengidentifikasi kepemilikan dan informasi kontak. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  Mulai dengan menentukan kepemilikan untuk organisasi Anda. Kepemilikan dapat menyiratkan siapa yang memiliki risiko untuk sumber daya, siapa yang memiliki perubahan pada sumber daya, atau siapa yang mendukung sumber daya ketika melakukan penyelesaian masalah. Kepemilikan juga dapat menyiratkan kepemilikan sumber daya secara finansial atau administratif. 

1.  Gunakan [AWS Organizations](https://aws.amazon.com/organizations/) untuk mengelola akun. Anda dapat mengelola kontak alternatif untuk akun Anda secara terpusat. 

   1.  Penggunaan alamat email dan nomor telepon milik perusahaan untuk informasi kontak akan membantu Anda untuk mengaksesnya meskipun orang yang memilikinya sudah tidak bekerja di organisasi Anda. Misalnya, buatlah daftar distribusi email terpisah untuk penagihan, operasional, dan keamanan lalu konfigurasikan ketiganya sebagai kontak Penagihan, Keamanan, dan Operasional di masing-masing Akun AWS yang aktif. Beberapa orang akan menerima AWS pemberitahuan dan dapat merespons, bahkan jika seseorang sedang berlibur, mengubah peran, atau meninggalkan perusahaan. 

   1.  Jika akun tidak dikelola oleh [AWS Organizations](https://aws.amazon.com/organizations/), kontak akun alternatif dapat membantu AWS menghubungi personel yang tepat jika diperlukan. Konfigurasikan kontak alternatif akun sehingga menunjuk ke sebuah grup, bukan ke individu perseorangan. 

1.  Gunakan tag untuk mengidentifikasi pemilik AWS sumber daya. Anda dapat menentukan pemilik maupun informasi kontak mereka dalam tag terpisah. 

   1.  Anda dapat menggunakan aturan [AWS Config](https://aws.amazon.com/config/) untuk menegaskan bahwa sumber daya memiliki tag kepemilikan yang diperlukan. 

   1.  Untuk panduan mendalam tentang cara membangun strategi pemberian tag untuk organisasi Anda, silakan lihat [laporan resmi mengenai Praktik Terbaik Pemberian Tag AWS](https://docs.aws.amazon.com/whitepapers/latest/tagging-best-practices/tagging-best-practices.html). 

1.  Gunakan [Amazon Q Business](https://aws.amazon.com/q/business/), sebuah asisten percakapan yang menggunakan AI generatif untuk meningkatkan produktivitas tenaga kerja, menjawab pertanyaan, dan menyelesaikan tugas berdasarkan informasi dalam sistem perusahaan Anda. 

   1.  Hubungkan Amazon Q Business ke sumber data perusahaan Anda. Amazon Q Business menawarkan konektor bawaan ke lebih dari 40 sumber data yang didukung, termasuk Amazon Simple Storage Service (Amazon S3), SharePoint Microsoft, Salesforce, dan Atlassian Confluence. Untuk informasi selengkapnya, silakan lihat [Konektor Amazon Q](https://aws.amazon.com/q/business/connectors/). 

1.  Untuk sumber daya, platform, dan infrastruktur lainnya, buatlah dokumentasi yang mengidentifikasi kepemilikan. Dokumentasi ini harus dapat diakses oleh semua anggota tim. 

 **Tingkat upaya untuk rencana implementasi:** Rendah. Manfaatkan informasi kontak akun dan tag untuk menetapkan kepemilikan AWS sumber daya. Untuk sumber daya lain, Anda dapat menggunakan sesuatu yang sederhana seperti tabel di wiki untuk mencatat kepemilikan dan informasi kontak, atau menggunakan ITSM alat untuk memetakan kepemilikan. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS02-BP02 Proses dan prosedur telah mengidentifikasi pemilik](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_ops_model_def_proc_owners.html) 
+  [OPS02-BP04 Mekanisme ada untuk mengelola tanggung jawab dan kepemilikan](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_ops_model_def_responsibilities_ownership.html) 

 **Dokumen terkait:** 
+  [Manajemen Akun AWS - Memperbarui informasi kontak](https://docs.aws.amazon.com/accounts/latest/reference/manage-acct-update-contact.html) 
+  [AWS Organizations - Memperbarui kontak alternatif di organisasi Anda](https://docs.aws.amazon.com/organizations/latest/userguide/orgs_manage_accounts_update_contacts.html) 
+  [Laporan resmi Praktik Terbaik Pemberian Tag AWS](https://docs.aws.amazon.com/whitepapers/latest/tagging-best-practices/tagging-best-practices.html) 
+  [Bangun aplikasi AI generatif perusahaan pribadi dan aman dengan Amazon Q Business and AWS IAM Identity Center](https://aws.amazon.com/blogs/machine-learning/build-private-and-secure-enterprise-generative-ai-apps-with-amazon-q-business-and-aws-iam-identity-center/) 
+  [Amazon Q Business, sekarang tersedia secara umum dan dapat membantu Anda meningkatkan produktivitas tenaga kerja dengan AI generatif](https://aws.amazon.com/blogs/aws/amazon-q-business-now-generally-available-helps-boost-workforce-productivity-with-generative-ai/) 
+  [AWS Cloud Blog Operasi & Migrasi - Menerapkan kontrol penandaan otomatis dan terpusat dengan dan AWS ConfigAWS Organizations](https://aws.amazon.com/blogs/mt/implementing-automated-and-centralized-tagging-controls-with-aws-config-and-aws-organizations/) 
+  [AWS Blog Keamanan - Perpanjang kait pra-komit Anda dengan AWS CloudFormation Guard](https://aws.amazon.com/blogs/security/extend-your-pre-commit-hooks-with-aws-cloudformation-guard/) 
+  [AWS DevOps Blog - Mengintegrasikan AWS CloudFormation Guard ke dalam pipa CI/CD](https://aws.amazon.com/blogs/devops/integrating-aws-cloudformation-guard/) 

 **Lokakarya terkait:** 
+  [Lokakarya - Pemberian Tag AWS](https://catalog.workshops.aws/tagging/) 

 **Contoh terkait:** 
+  [Aturan AWS Config - Amazon EC2 dengan tag yang diperlukan dan nilai yang valid](https://github.com/awslabs/aws-config-rules/blob/master/python/ec2_require_tags_with_valid_values.py) 

 **Layanan terkait:** 
+  [Aturan AWS Config - tag yang dibutuhkan](https://docs.aws.amazon.com/config/latest/developerguide/required-tags.html) 
+  [AWS Organizations](https://aws.amazon.com/organizations/) 

# OPS02-BP02 Proses dan Prosedur memiliki pemilik teridentifikasi
<a name="ops_ops_model_def_proc_owners"></a>

 Pahami siapa pemegang kepemilikan atas definisi dari masing-masing proses dan prosedur, alasan prosedur dan proses tertentu digunakan, serta alasan adanya kepemilikan tersebut. Dengan memahami alasan untuk menggunakan proses dan prosedur tertentu, peluang pengembangan dapat lebih mudah diidentifikasi. 

 **Hasil yang diinginkan:** Organisasi Anda memiliki serangkaian proses dan prosedur yang terdefinisi dengan baik dan terpelihara untuk tugas-tugas operasional. Proses dan prosedur-prosedur tersebut disimpan di lokasi terpusat dan tersedia untuk anggota tim Anda. Proses dan prosedur-prosedur sering diperbarui, dengan kepemilikan yang ditetapkan dengan jelas. Jika memungkinkan, skrip, templat, dan dokumen otomatisasi diimplementasikan sebagai kode. 

 **Anti-pola umum:** 
+  Proses tidak didokumentasikan. Mungkin terdapat skrip yang terfragmentasi di stasiun kerja operator yang terisolasi. 
+  Pengetahuan tentang cara menggunakan skrip dipegang oleh beberapa individu perorangan atau secara informal sebagai pengetahuan tim. 
+  Proses warisan sudah harus diperbarui, tetapi kepemilikan pembaruan masih tidak jelas, dan penulis aslinya sudah bukan bagian dari organisasi. 
+  Proses dan skrip tidak dapat ditemukan, sehingga tidak tersedia saat diperlukan (misalnya, dalam merespons sebuah insiden). 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Proses dan prosedur-prosedur akan meningkatkan upaya Anda untuk mengoperasikan beban kerja Anda. 
+  Anggota tim baru menjadi lebih efektif dengan lebih cepat. 
+  Mengurangi waktu mitigasi insiden. 
+  Anggota tim (dan tim) yang berbeda dapat menggunakan proses dan prosedur yang sama secara konsisten. 
+  Tim dapat menskalakan proses mereka dengan proses yang dapat diulang. 
+  Proses dan prosedur standar membantu mengurangi dampak pengalihan tanggung jawab beban kerja antar-tim. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Proses dan prosedur-prosedur memiliki pemilik yang jelas untuk bertanggung jawab atas penetapannya. 
  +  Identifikasi aktivitas operasi yang dijalankan untuk mendukung beban kerja Anda. Buatlah dokumentasi dari aktivitas ini di lokasi yang mudah ditemukan. 
  +  Identifikasi secara khusus individu atau tim yang bertanggung jawab atas spesifikasi dari sebuah aktivitas. Mereka bertanggung jawab untuk memverifikasi bahwa aktivitas dapat dijalankan dengan sukses oleh anggota tim yang memiliki keterampilan memadai serta memiliki izin, akses, serta alat yang sesuai. Jika terdapat masalah saat menjalankan aktivitas tersebut, maka anggota tim yang menjalankannya bertanggung jawab untuk memberikan umpan balik mendetail yang diperlukan agar aktivitas tersebut dapat ditingkatkan. 
  +  Rekam kepemilikan dalam metadata artefak aktivitas melalui layanan seperti AWS Systems Manager, melalui dokumen, dan AWS Lambda. Rekam kepemilikan sumber daya menggunakan grup sumber daya atau tag, dengan menentukan informasi kontak dan kepemilikan. Gunakan AWS Organizations untuk membuat kebijakan penandaan dan merekam informasi kontak serta kepemilikan. 
+  Seiring waktu, prosedur ini harus dikembangkan agar dapat dijalankan sebagai kode, sehingga mengurangi kebutuhan akan campur tangan manusia. 
  +  Misalnya, pertimbangkan fungsi AWS Lambda, templat CloudFormation, atau dokumen AWS Systems Manager Automation. 
  +  Jalankan kontrol versi di repositori yang sesuai. 
  +  Sertakan tanda sumber daya yang sesuai sehingga pemilik dan dokumentasi dapat diidentifikasi dengan mudah. 

 **Contoh pelanggan** 

 AnyCompany Retail mendefinisikan kepemilikan sebagai tim atau individu perseorangan yang memiliki proses untuk suatu aplikasi atau kelompok aplikasi (yang memiliki teknologi dan praktik arsitektur yang sama). Awalnya, proses dan prosedur didokumentasikan dalam bentuk panduan langkah demi langkah di dalam sistem manajemen dokumen, yang dapat ditemukan menggunakan tag pada Akun AWS yang meng-host aplikasi dan di kelompok sumber daya tertentu yang ada di dalam akun. Mereka memanfaatkan AWS Organizations untuk mengelola Akun AWS mereka. Seiring waktu, proses-proses tersebut dikonversi menjadi kode, dan sumber daya didefinisikan dengan menggunakan infrastruktur sebagai kode (seperti templat CloudFormation atau AWS Cloud Development Kit (AWS CDK)). Proses operasional menjadi dokumen otomatisasi di dalam AWS Systems Manager atau fungsi AWS Lambda, yang dapat diaktifkan sebagai tugas terjadwal, sebagai respons terhadap peristiwa-peristiwa seperti alarm CloudWatch AWS atau peristiwa AWS EventBridge, atau diaktifkan berdasarkan permintaan di dalam platform manajemen layanan TI (ITSM). Semua proses memiliki tanda untuk mengidentifikasi kepemilikan. Dokumentasi untuk otomatisasi dan proses dipertahankan di halaman wiki yang dihasilkan oleh repositori kode untuk proses tersebut. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  Dokumentasikan proses dan prosedur yang ada. 

   1.  Tinjau dan terus perbarui proses dan prosedur tersebut. 

   1.  Identifikasi pemilik untuk setiap proses atau prosedur. 

   1.  Tempatkan mereka di bawah kontrol versi. 

   1.  Jika memungkinkan, bagikan proses dan prosedur-prosedur itu di seluruh beban kerja dan lingkungan yang berbagi desain arsitektur. 

1.  Buat mekanisme untuk umpan balik dan perbaikan. 

   1.  Tentukan kebijakan untuk frekuensi peninjauan proses. 

   1.  Tentukan proses untuk peninjau dan pemberi persetujuan. 

   1.  Implementasikan permasalahan-permasalahan atau antrean tiket untuk umpan balik yang akan diberikan dan dilacak. 

   1.  Jika memungkinkan, proses dan prosedur harus memiliki klasifikasi risiko dan persetujuan di awal dari dewan persetujuan perubahan (CAB). 

1.  Verifikasi bahwa proses dan prosedur dapat diakses dan ditemukan oleh orang-orang yang perlu menjalankannya. 

   1.  Gunakan tanda untuk menunjukkan di mana proses dan prosedur dapat diakses untuk beban kerja. 

   1.  Gunakan pesan kesalahan dan peristiwa yang dapat dipahami untuk menunjukkan proses atau prosedur yang sesuai untuk mengatasi sebuah permasalahan. 

   1.  Gunakan wiki dan manajemen dokumen, dan jadikan proses dan prosedur dapat dicari secara konsisten di seluruh organisasi. 

1.  Gunakan [Amazon Q Business](https://aws.amazon.com/q/business/), sebuah asisten percakapan yang menggunakan AI generatif untuk meningkatkan produktivitas tenaga kerja, menjawab pertanyaan, dan menyelesaikan tugas berdasarkan informasi dalam sistem perusahaan Anda. 

   1.  Hubungkan Amazon Q Business ke sumber data perusahaan Anda. Amazon Q Business menawarkan konektor-konektor bawaan ke lebih dari 40 sumber data yang didukung, termasuk Amazon S3, Microsoft SharePoint, Salesforce, dan Atlassian Confluence. Untuk informasi selengkapnya, silakan lihat [Konektor Amazon Q](https://aws.amazon.com/q/business/connectors/). 

1.  Lakukan otomatisasi jika perlu. 

   1.  Otomatisasi harus dikembangkan ketika layanan dan teknologi menyediakan API. 

   1.  Berikan edukasi secara memadai tentang proses. Kembangkan kisah dan persyaratan pengguna untuk mengotomatiskan proses-proses tersebut. 

   1.  Ukur penggunaan proses dan prosedur Anda dengan sukses, dan laporkan masalah atau ajukan tiket untuk mendukung perbaikan berulang. 

 **Tingkat upaya untuk rencana implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS02-BP01 Sumber daya memiliki pemilik teridentifikasi](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_ops_model_def_resource_owners.html) 
+  [OPS02-BP04 Mekanisme tersedia untuk mengelola tanggung jawab dan kepemilikan](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_ops_model_def_responsibilities_ownership.html) 
+  [OPS11-BP04 Menjalankan manajemen pengetahuan](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_evolve_ops_knowledge_management.html) 

 **Dokumen terkait:** 
+  [AWS Laporan resmi - Pengantar DevOps di AWS](https://docs.aws.amazon.com/whitepapers/latest/introduction-devops-aws/automation.html) 
+  [Laporan resmi AWS - Praktik Terbaik Penandaan Sumber Daya AWS](https://docs.aws.amazon.com/whitepapers/latest/tagging-best-practices/tagging-best-practices.html) 
+  [Laporan resmi AWS - Mengatur Lingkungan AWS Anda dengan Menggunakan Beberapa Akun](https://docs.aws.amazon.com/whitepapers/latest/organizing-your-aws-environment/organizing-your-aws-environment.html) 
+ [Blog Operasi dan Migrasi AWS Cloud - Menggunakan Amazon Q Business untuk merampingkan operasi Anda ](https://aws.amazon.com/blogs/mt/streamline-operations-using-amazon-q-for-business/)
+  [AWS Cloud Blog Operasi & Migrasi - Membangun Praktik Otomatisasi Cloud untuk Keunggulan Operasional: Praktik Terbaik dari AWS Managed Services](https://aws.amazon.com/blogs/mt/build-a-cloud-automation-practice-for-operational-excellence-best-practices-from-aws-managed-services/) 
+  [Blog Operasi & Migrasi AWS Cloud - Menerapkan kontrol penandaan otomatis dan tersentralisasi dengan AWS Config dan AWS Organizations](https://aws.amazon.com/blogs/mt/implementing-automated-and-centralized-tagging-controls-with-aws-config-and-aws-organizations/) 
+  [Blog Keamanan AWS - Perpanjang hook pra-commit Anda dengan AWS CloudFormation Guard](https://aws.amazon.com/blogs/security/extend-your-pre-commit-hooks-with-aws-cloudformation-guard/) 
+  [Blog DevOps AWS - Mengintegrasikan AWS CloudFormation Guard ke dalam pipeline CI/CD](https://aws.amazon.com/blogs/devops/integrating-aws-cloudformation-guard/) 

 **Lokakarya terkait:** 
+  [AWS Lokakarya Keunggulan Operasional Well-Architected](https://catalog.workshops.aws/well-architected-operational-excellence/en-US/) 
+  [Lokakarya - Penandaan AWS](https://catalog.workshops.aws/tagging/) 

 **Video terkait:** 
+  [Cara melakukan otomatisasi Operasi IT di AWS](https://www.youtube.com/watch?v=GuWj_mlyTug) 
+  [AWS re:Invent 2020 - Melakukan otomatisasi atas apa pun dengan AWS Systems Manager](https://www.youtube.com/watch?v=AaI2xkW85yE) 
+  [AWS re:Inforce 2022 - Melakukan otomatisasi manajemen dan kepatuhan patch dengan menggunakan AWS (NIS306)](https://www.youtube.com/watch?v=gL3baXQJvc0) 
+  [Dukungans You - Memahami Lebih Dalam AWS Systems Manager](https://www.youtube.com/watch?v=xHNLNTa2xGU) 

 **Layanan terkait:** 
+  [AWS Systems Manager - Otomatisasi](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-automation.html) 
+  [AWS Service Management Connector](https://aws.amazon.com/service-management-connector/) 

# OPS02-BP03 Aktivitas operasi memiliki pemilik teridentifikasi yang bertanggung jawab atas performanya
<a name="ops_ops_model_def_activity_owners"></a>

 Pahami siapa yang bertanggung jawab untuk menjalankan aktivitas tertentu terhadap beban kerja yang ditentukan serta alasan adanya tanggung jawab tersebut. Memahami siapa yang bertanggung jawab untuk menjalankan aktivitas dapat memberikan informasi tentang siapa yang akan melakukan aktivitas tersebut, memvalidasi hasilnya, serta memberikan umpan balik kepada pemilik aktivitas. 

 **Hasil yang diinginkan:** 

 Organisasi Anda secara jelas menetapkan tanggung jawab untuk menjalankan aktivitas tertentu pada beban kerja yang ditentukan dan merespons peristiwa-peristiwa yang dihasilkan oleh beban kerja tersebut. Organisasi mendokumentasikan kepemilikan proses dan pemenuhan dan membuat informasi ini dapat ditemukan. Anda meninjau dan memperbarui tanggung jawab ketika ada perubahan yang terjadi pada organisasi, dan tim melacak serta mengukur performa aktivitas identifikasi kekurangan dan inefisiensi. Anda mengimplementasikan mekanisme umpan balik untuk melacak kekurangan dan perbaikan serta mendukung perbaikan berulang. 

 **Anti-pola umum:** 
+  Anda tidak mendokumentasikan tanggung jawab. 
+  Terdapat skrip yang terfragmentasi di stasiun kerja operator yang terisolasi. Hanya sedikit orang saja yang tahu cara menggunakannya atau secara informal menyebutnya sebagai *pengetahuan tim*. 
+  Proses warisan sudah harus diperbarui, tetapi tidak ada yang tahu siapa yang memiliki proses tersebut, dan penulis aslinya sudah tidak lagi menjadi bagian dari organisasi. 
+  Proses dan skrip tidak dapat ditemukan, dan tidak tersedia saat diperlukan (misalnya, saat merespons insiden). 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Anda memahami siapa yang bertanggung jawab untuk menjalankan sebuah aktivitas, siapa yang harus mendapatkan notifikasi saat diperlukan tindakan, dan siapa yang melakukan tindakan, memvalidasi hasilnya, serta memberikan umpan balik kepada pemilik aktivitas tersebut. 
+  Proses dan prosedur-prosedur akan meningkatkan upaya Anda untuk mengoperasikan beban kerja Anda. 
+  Anggota tim baru menjadi lebih efektif dengan lebih cepat. 
+  Anda mengurangi waktu yang dibutuhkan untuk memitigasi insiden. 
+  Tim yang berbeda menggunakan proses dan prosedur yang sama untuk melakukan tugas-tugas secara konsisten. 
+  Tim dapat menskalakan proses mereka dengan proses yang dapat diulang. 
+  Proses dan prosedur standar membantu memitigasi dampak pengalihan tanggung jawab beban kerja antar-tim. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Untuk mulai menentukan tanggung jawab, mulailah dengan dokumentasi yang sudah ada sekarang, seperti matriks tanggung jawab, proses dan prosedur, peran dan tanggung jawab, serta alat-alat dan otomatisasi. Tinjau dan lakukan diskusi mengenai tanggung jawab untuk proses yang terdokumentasi. Lakukan peninjauan bersama tim untuk mengidentifikasi ketidakselarasan antara tanggung jawab dokumen dan proses. Diskusikan layanan-layanan yang ditawarkan dengan pelanggan internal tim tersebut untuk mengidentifikasi perbedaan ekspektasi di antara tim. 

 Analisis dan atasi perbedaan. Identifikasi setiap peluang perbaikan, dan cari aktivitas padat sumber daya yang sering diminta, yang biasanya merupakan kandidat kuat untuk perbaikan. Jelajahi praktik terbaik, pola, dan panduan preskriptif untuk menyederhanakan dan melakukan standardisasi perbaikan. Dokumentasikan peluang-peluang perbaikan, dan lacak perbaikan hingga selesai. 

 Seiring waktu, prosedur-prosedur ini harus dikembangkan agar dapat dijalankan sebagai kode, sehingga akan mengurangi kebutuhan akan campur tangan manusia. Misalnya, prosedur-prosedur itu dapat dimulai dalam bentuk fungsi AWS Lambda, templat CloudFormation, atau dokumen Otomatisasi AWS Systems Manager. Pastikan bahwa semua prosedur ini memiliki kontrol versi di repositori yang sesuai, dan sertakan tag sumber daya yang sesuai sehingga tim dapat mengidentifikasi pemilik dan dokumentasi dengan mudah. Buatlah dokumentasi tanggung jawab untuk melaksanakan aktivitas, kemudian pantau otomatisasi untuk inisiasi dan operasi yang berhasil, serta kinerja hasil yang diinginkan. 

 **Contoh pelanggan** 

 AnyCompany Retail mendefinisikan kepemilikan sebagai tim atau individu perseorangan yang memiliki proses untuk suatu aplikasi atau kelompok aplikasi yang memiliki teknologi dan praktik arsitektur yang sama. Awalnya, perusahaan ini mendokumentasikan proses dan prosedur dalam bentuk panduan langkah demi langkah di dalam sistem manajemen dokumen. Mereka membuat prosedur tersebut dapat ditemukan dengan menggunakan tag pada Akun AWS yang meng-host aplikasi dan pada kelompok sumber daya tertentu di dalam akun, dengan menggunakan AWS Organizations untuk mengelola Akun AWS mereka. Seiring waktu, AnyCompany Retail mengonversi proses-proses tersebut menjadi kode dan mendefinisikan sumber daya dengan menggunakan infrastruktur sebagai kode (melalui layanan seperti CloudFormation atau templat AWS Cloud Development Kit (AWS CDK)). Proses operasional menjadi dokumen otomatisasi di dalam fungsi AWS System Manager atau fungsi AWS Lambda, yang dapat dimulai sebagai tugas terjadwal untuk merespons peristiwa seperti alarm Amazon CloudWatch atau peristiwa Amazon EventBridge, atau berdasarkan permintaan di dalam platform manajemen layanan IT (ITSM). Semua proses memiliki tag untuk mengidentifikasi pemiliknya. Tim mengelola dokumentasi untuk otomatisasi dan proses di dalam halaman wiki yang dihasilkan oleh repositori kode untuk proses tersebut. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  Dokumentasikan proses dan prosedur yang ada. 

   1.  Tinjau dan pastikan dokumentasi tersebut mutakhir. 

   1.  Pastikan bahwa setiap proses atau prosedur mempunyai pemilik. 

   1.  Tempatkan prosedur di bawah kontrol versi. 

   1.  Jika memungkinkan, bagikan proses dan prosedur-prosedur itu di seluruh beban kerja dan lingkungan yang berbagi desain arsitektur. 

1.  Buat mekanisme untuk umpan balik dan perbaikan. 

   1.  Tentukan kebijakan untuk frekuensi peninjauan proses. 

   1.  Tentukan proses untuk peninjau dan pemberi persetujuan. 

   1.  Implementasikan permasalahan-permasalahan atau antrean tiket untuk memberikan dan melacak umpan balik. 

   1.  Jika memungkinkan, sediakan klasifikasi risiko dan persetujuan awal untuk proses dan prosedur dari dewan persetujuan perubahan (CAB). 

1.  Buat proses dan prosedur dapat diakses dan ditemukan oleh pengguna yang perlu menjalankannya. 

   1.  Gunakan tanda untuk menunjukkan di mana proses dan prosedur dapat diakses untuk beban kerja. 

   1.  Gunakan pesan kesalahan dan peristiwa yang dapat dipahami untuk menunjukkan proses atau prosedur yang sesuai untuk mengatasi masalah. 

   1.  Gunakan wiki atau manajemen dokumen agar proses dan prosedur dapat dicari secara konsisten di seluruh organisasi. 

1.  Lakukan otomatisasi jika perlu. 

   1.  Kembangkan otomatisasi ketika layanan dan teknologi menyediakan API. 

   1.  Pastikan bahwa proses tersebut dapat dipahami dengan baik, dan kembangkan kisah serta persyaratan pengguna untuk mengotomatiskan proses tersebut. 

   1.  Ukur penggunaan proses dan prosedur yang sukses, dengan pelacakan masalah untuk mendukung perbaikan berulang. 

 **Tingkat upaya untuk rencana implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS02-BP01 Sumber daya memiliki pemilik teridentifikasi](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_ops_model_def_resource_owners.html) 
+  [OPS02-BP02 Proses dan Prosedur memiliki pemilik teridentifikasi](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_ops_model_def_resource_owners.html) 
+  [OPS02-BP04 Mekanisme tersedia untuk mengelola tanggung jawab dan kepemilikan](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_ops_model_def_responsibilities_ownership.html) 
+  [OPS02-BP05 Mekanisme tersedia untuk mengidentifikasi tanggung jawab dan kepemilikan](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_ops_model_find_owner.html) 
+  [OPS11-BP04 Menjalankan manajemen pengetahuan](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_evolve_ops_knowledge_management.html) 

 **Dokumen terkait:** 
+  [Laporan Resmi AWS \$1 Pengantar DevOps di AWS](https://docs.aws.amazon.com/whitepapers/latest/introduction-devops-aws/automation.html) 
+  [Laporan resmi AWS \$1 Praktik Terbaik Pemberian Tag Sumber Daya AWS](https://docs.aws.amazon.com/whitepapers/latest/tagging-best-practices/tagging-best-practices.html) 
+  [Laporan resmi AWS \$1 Mengatur Lingkungan AWS Anda dengan Menggunakan Beberapa Akun](https://docs.aws.amazon.com/whitepapers/latest/organizing-your-aws-environment/organizing-your-aws-environment.html) 
+  [Blog Operasi & Migrasi AWS Cloud \$1 Membangun Praktik Otomatisasi Cloud untuk Keunggulan Operasional: Praktik Terbaik dari AWS Managed Services](https://aws.amazon.com/blogs/mt/build-a-cloud-automation-practice-for-operational-excellence-best-practices-from-aws-managed-services/) 
+  [Lokakarya - Pemberian Tag AWS](https://catalog.workshops.aws/tagging/) 
+  [Konektor Manajemen Layanan AWS](https://aws.amazon.com/service-management-connector/) 

 **Video terkait:** 
+  [Pusat Pengetahuan Langsung AWS \$1 Pemberian Tag pada Sumber Daya AWS](https://www.youtube.com/watch?v=MX9DaAQS15I) 
+  [AWS re:Invent 2020 \$1 Melakukan otomatisasi atas apa pun dengan AWS Systems Manager](https://www.youtube.com/watch?v=AaI2xkW85yE) 
+  [AWS re:Inforce 2022 \$1 Melakukan otomatisasi manajemen dan kepatuhan patch dengan menggunakan AWS (NIS306)](https://www.youtube.com/watch?v=gL3baXQJvc0) 
+  [AWS Dukungans You \$1 Diving Deep into AWS Systems Manager](https://www.youtube.com/watch?v=xHNLNTa2xGU) 

# OPS02-BP04 Mekanisme tersedia untuk mengelola tanggung jawab dan kepemilikan
<a name="ops_ops_model_def_responsibilities_ownership"></a>

 Pahami tanggung jawab yang dimiliki oleh peran Anda dan bagaimana Anda berkontribusi terhadap hasil bisnis, karena pemahaman ini akan mendasari penentuan prioritas tugas Anda dan mengapa peran Anda itu penting. Hal ini akan membantu anggota tim untuk mengenali kebutuhan dan merespons dengan tepat. Ketika anggota tim mengetahui peran mereka, mereka dapat membangun kepemilikan, mengidentifikasi peluang perbaikan, dan memahami cara untuk memengaruhi atau membuat perubahan yang sesuai. 

 Kadang-kadang, sebuah tanggung jawab mungkin tidak memiliki pemilik yang jelas. Dalam situasi seperti ini, rancang sebuah mekanisme untuk mengatasi kesenjangan ini. Buat jalur eskalasi yang ditentukan dengan baik kepada seseorang yang memiliki wewenang untuk menetapkan kepemilikan atau rencana untuk memenuhi kebutuhan tersebut. 

 **Hasil yang diinginkan:** Tim-tim yang ada dalam organisasi Anda memiliki tanggung jawab yang sudah ditentukan dengan jelas yang mencakup bagaimana kaitan mereka dengan sumber daya, tindakan yang harus dilakukan, proses, dan prosedur. Tanggung jawab ini selaras dengan tanggung jawab dan sasaran tim, serta tanggung jawab yang dimiliki tim lain. Anda mendokumentasikan rute eskalasi dengan cara yang konsisten dan dapat ditemukan dan memasukkan keputusan tersebut ke dalam artefak dokumentasi, misalnya matriks tanggung jawab, definisi tim, atau halaman wiki. 

 **Anti-pola umum:** 
+  Tanggung jawab tim yang bersifat ambigu atau tidak ditentukan dengan baik. 
+  Tim tidak menyelaraskan peran dengan tanggung jawab. 
+  Tim tidak menyelaraskan tujuan dan sasarannya dengan tanggung jawabnya, sehingga kesuksesan menjadi sulit diukur. 
+  Tanggung jawab anggota tim tidak selaras dengan tim dan organisasi yang lebih luas. 
+  Tim Anda tidak memperbarui tanggung jawab mereka, sehingga tanggung jawab tidak konsisten dengan tugas yang dilakukan oleh tim. 
+  Jalur eskalasi untuk menentukan tanggung jawab tidak ditetapkan atau tidak jelas. 
+  Jalur eskalasi tidak memiliki pemilik utas tunggal untuk memastikan pemberian respons yang cepat. 
+  Peran, tanggung jawab, dan jalur eskalasi tidak dapat ditemukan, dan tidak tersedia saat diperlukan (misalnya, saat merespons insiden). 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Ketika Anda memahami siapa yang memegang tanggung jawab atau kepemilikan, Anda dapat menghubungi tim atau anggota tim yang tepat untuk melakukan permintaan atau pengalihann tugas. 
+  Untuk mengurangi risiko tidak adanya tindakan dan kebutuhan yang tidak tertangani, Anda telah mengidentifikasi seseorang yang memiliki wewenang untuk menetapkan tanggung jawab atau kepemilikan. 
+  Ketika Anda mendefinisikan cakupan suatu tanggung jawab dengan jelas, anggota tim Anda mendapatkan otonomi dan kepemilikan. 
+  Tanggung jawab Anda akan mendasari keputusan yang Anda ambil, tindakan yang akan Anda lakukan, dan penyerahan aktivitas Anda ke pemiliknya yang benar. 
+  Tanggung jawab yang ditinggalkan dapat dengan mudah diidentifikasi karena Anda memiliki pemahaman yang jelas tentang hal-hal yang berada di luar tanggung jawab tim Anda, sehingga membantu Anda dalam melakukan eskalasi untuk meminta klarifikasi. 
+  Tim menghindari kebingungan dan ketegangan, dan mereka dapat mengelola beban kerja serta sumber daya dengan lebih memadai. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Identifikasi peran dan tanggung jawab anggota tim, dan pastikan bahwa mereka memahami apa yang diharapkan dari peran mereka. Buat informasi ini dapat ditemukan sehingga anggota-anggota organisasi Anda dapat mengidentifikasi siapa yang perlu mereka hubungi saat ada kebutuhan khusus, baik berupa tim atau perorangan. Ketika organisasi berusaha memanfaatkan peluang untuk memigrasi dan memodernisasi AWS, peran dan tanggung jawab juga dapat berubah. Jaga agar tim Anda dan para anggotanya tetap menyadari tanggung jawab mereka, dan latih mereka dengan semestinya untuk melaksanakan tugas selama perubahan ini. 

 Tentukan peran atau tim yang harus menerima eskalasi untuk mengidentifikasi tanggung jawab dan kepemilikan. Tim ini dapat berinteraksi dengan berbagai pemangku kepentingan untuk mengambil suatu keputusan. Namun, mereka harus memiliki wewenang manajemen proses pengambilan keputusan. 

 Sediakan mekanisme yang dapat diakses bagi anggota organisasi untuk menemukan dan mengidentifikasi kepemilikan dan tanggung jawab. Mekanisme ini memberi tahu mereka siapa yang harus dihubungi saat ada kebutuhan khusus. 

 **Contoh pelanggan** 

 AnyCompany Retail baru-baru ini menyelesaikan migrasi beban kerja dari lingkungan on-premise ke zona landasan mereka di AWS dengan pendekatan angkat dan geser. Mereka melakukan peninjauan operasi untuk merenungkan cara mereka menyelesaikan tugas-tugas operasional umum dan memastikan bahwa matriks tanggung jawab mereka yang ada sekarang sudah sesuai dengan operasi yang ada di lingkungan baru. Ketika mereka bermigrasi dari on-premise ke AWS, mereka mengurangi tanggung jawab tim infrastruktur yang berkaitan dengan perangkat keras dan infrastruktur fisik. Langkah ini juga mengungkap adanya peluang baru untuk mengembangkan model operasi untuk beban kerja mereka. 

 Di saat mereka mengidentifikasi, menangani, dan mendokumentasikan sebagian besar tanggung jawab, mereka juga menetapkan rute eskalasi untuk tanggung jawab apa pun yang terlewatkan atau untuk tanggung jawab yang mungkin perlu diubah sesuai perkembangan praktik operasi. Untuk mengeksplorasi peluang-peluang baru untuk melakukan standardisasi dan meningkatkan efisiensi di seluruh beban kerja Anda, berikan akses ke alat-alat operasi seperti AWS Systems Manager dan alat-alat keamanan seperti AWS Security Hub CSPM dan Amazon GuardDuty. AnyCompany Retail menyusun sebuah tinjauan tanggung jawab dan strategi berdasarkan perbaikan yang ingin mereka tangani terlebih dahulu. Ketika perusahaan ini mengadopsi cara-cara kerja dan pola teknologi baru, mereka memperbarui matriks tanggung jawab mereka agar sesuai dengan itu semua. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  Mulailah dengan dokumentasi yang sudah ada. Beberapa dokumen sumber yang umum antara lain: 

   1.  Matriks pertanggungjawaban atau matriks bertanggung jawab, bisa dipertanggungjawabkan, dibuat dengan konsultasi, dan berdasarkan informasi (RACI) 

   1.  Definisi tim atau halaman wiki 

   1.  Definisi dan penawaran layanan 

   1.  Deskripsi peran atau pekerjaan 

1.  Tinjau dan lakukan diskusi tentang tanggung jawab yang didokumentasikan: 

   1.  Lakukan peninjauan bersama tim untuk mengidentifikasi ketidakselarasan yang terjadi antara tanggung jawab yang terdokumentasi dan tanggung jawab yang umumnya dijalankan oleh tim. 

   1.  Diskusikan layanan-layanan potensial yang ditawarkan oleh pelanggan internal untuk mengidentifikasi adanya perbedaan ekspektasi di antara tim. 

1.  Lakukan analisis dan atasi perbedaan. 

1.  Identifikasi peluang perbaikan. 

   1.  Identifikasi permintaan padat sumber daya yang sering kali mendapat permintaan, yang biasanya merupakan kandidat kuat untuk perbaikan. 

   1.  Cari praktik terbaik, pahami pola, dan ikuti panduan preskriptif, serta lakukan penyederhanaan dan standardisasi perbaikan. 

   1.  Dokumentasikan peluang-peluang perbaikan, dan lacak hingga perbaikan tersebut selesai. 

1.  Jika tim belum memiliki tanggung jawab untuk mengelola dan melacak penugasan tanggung jawab, identifikasi seseorang yang ada di dalam tim untuk memegang tanggung jawab ini. 

1.  Tentukan proses bagi tim untuk meminta klarifikasi tanggung jawab. 

   1.  Tinjau prosesnya, dan pastikan bahwa proses tersebut jelas dan mudah digunakan. 

   1.  Pastikan seseorang memiliki dan melacak proses eskalasi hingga selesai. 

   1.  Buat metrik operasional untuk mengukur efektivitas. 

   1.  Ciptakan sebuah mekanisme umpan balik untuk memastikan bahwa tim dapat menyoroti peluang-peluang perbaikan. 

   1.  Implementasikan sebuah mekanisme untuk peninjauan berkala. 

1.  Buatlah dokumentasi di sebuah lokasi yang dapat ditemukan dan dapat diakses. 

   1.  Wiki atau portal dokumentasi adalah pilihan umum. 

 **Tingkat upaya untuk rencana implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS01-BP06 Mengevaluasi kompromi](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_priorities_eval_tradeoffs.html) 
+  [OPS03-BP02 Anggota tim diberdayakan untuk bertindak ketika hasil dipertaruhkan](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_org_culture_team_emp_take_action.html) 
+  [OPS03-BP03 Tim didorong untuk membawa masalah ke tingkat yang lebih tinggi](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_org_culture_team_enc_escalation.html) 
+  [OPS03-BP07 Bekali tim dengan sumber daya dengan sesuai](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_org_culture_team_res_appro.html) 
+  [OPS09-BP01 Mengukur sasaran operasi dan KPI dengan metrik](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_operations_health_measure_ops_goals_kpis.html) 
+  [OPS09-BP03 Meninjau metrik-metrik operasi dan memprioritaskan perbaikan](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_operations_health_review_ops_metrics_prioritize_improvement.html) 
+  [OPS11-BP01 Buatlah suatu proses untuk peningkatan berkelanjutan](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_evolve_ops_process_cont_imp.html) 

 **Dokumen terkait:** 
+  [Laporan resmi AWS - Pengantar DevOps di AWS](https://docs.aws.amazon.com/whitepapers/latest/introduction-devops-aws/automation.html) 
+  [Laporan Resmi AWS - Kerangka Kerja Adopsi AWS Cloud: Perspektif Operasi](https://docs.aws.amazon.com/whitepapers/latest/aws-caf-operations-perspective/aws-caf-operations-perspective.html) 
+  [Keunggulan Operasional Kerangka Kerja AWS Well-Architected - Topologi model operasi Tingkat beban kerja](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/operating-model-2-by-2-representations.html) 
+  [Panduan Preskriptif AWS - Membangun Model Operasi Cloud Anda](https://docs.aws.amazon.com/prescriptive-guidance/latest/strategy-cloud-operating-model/welcome.html) 
+  [Panduan Preskriptif AWS - Membuat matriks RACI atau RASCI untuk model operasi cloud](https://docs.aws.amazon.com/prescriptive-guidance/latest/patterns/create-a-raci-or-rasci-matrix-for-a-cloud-operating-model.html) 
+  [Blog Operasi & Migrasi AWS Cloud - Memberikan Nilai Bisnis dengan Tim Platform Cloud](https://aws.amazon.com/blogs/mt/delivering-business-value-with-cloud-platform-teams/) 
+  [Blog Operasi & Migrasi AWS Cloud - Mengapa Model Operasi Cloud?](https://aws.amazon.com/blogs/mt/why-a-cloud-operating-model/) 
+  [DevOps Blog AWS - Bagaimana organisasi memodernisasi untuk operasi cloud](https://aws.amazon.com/blogs/devops/how-organizations-are-modernizing-for-cloud-operations/) 

 **Video terkait:** 
+  [Summit Online AWS - Model Operasi Cloud untuk Transformasi yang Dipercepat](https://www.youtube.com/watch?v=ksJ5_UdYIag) 
+  [ re:Invent 2023 AWS - Keamanan cloud yang tahan masa depan: Model operasi baru](https://www.youtube.com/watch?v=GFcKCz1VO2I) 

# OPS02-BP05 Mekanisme tersedia untuk meminta penambahan, perubahan, dan pengecualian
<a name="ops_ops_model_req_add_chg_exception"></a>

Anda dapat mengajukan permintaan kepada pemilik proses, prosedur, dan sumber daya. Permintaan tersebut mencakup penambahan, perubahan, dan pengecualian. Permintaan ini diajukan melalui sebuah proses manajemen perubahan. Buatlah keputusan-keputusan yang matang berdasarkan informasi untuk menyetujui permintaan apabila memungkinkan dan dianggap tepat setelah dilakukan evaluasi manfaat dan risiko. 

 **Hasil yang diinginkan:** 
+  Anda dapat mengajukan permintaan untuk mengubah proses, prosedur, dan sumber daya berdasarkan kepemilikan yang ditetapkan. 
+  Perubahan harus dibuat dengan penuh pertimbangan, dengan memikirkan manfaat dan risikonya. 

 **Anti-pola umum:** 
+  Anda harus memperbarui cara Anda melakukan deployment terhadap aplikasi Anda, tetapi perubahan proses deployment tidak dapat diminta dari tim operasi. 
+  Rencana pemulihan bencana harus diperbarui, tetapi tidak ada pemilik yang diidentifikasi untuk dapat dimintai perubahan. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Proses, prosedur, dan sumber daya dapat berubah seiring dengan terjadinya perubahan persyaratan. 
+  Pemilik dapat mengambil keputusan yang matang berdasarkan informasi ketika harus membuat perubahan. 
+  Perubahan harus dibuat dengan cara yang penuh pertimbangan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Untuk mengimplementasikan praktik terbaik ini, Anda harus dapat membuat permintaan perubahan proses, prosedur, dan sumber daya. Proses manajemen perubahan bisa jadi hal yang ringan. Buatlah dokumentasi proses manajemen perubahan. 

 **Contoh pelanggan** 

 AnyCompany Retail menggunakan sebuah matriks penetapan tanggung jawab (RACI) untuk mengidentifikasi siapa yang memiliki perubahan untuk proses, prosedur, dan sumber daya. Mereka memiliki proses manajemen perubahan terdokumentasi yang ringan dan mudah diikuti. Menggunakan matriks RACI dan proses, siapa pun dapat menyampaikan permintaan perubahan. 

 **Langkah-langkah implementasi** 

1.  Identifikasi proses, prosedur, dan sumber daya untuk beban kerja Anda dan pemilik untuk masing-masing. Buatlah dokumentasi tentang itu semua dalam sistem manajemen pengetahuan Anda. 

   1.  Jika Anda belum menerapkan [OPS02-BP01 Sumber daya telah mengidentifikasi pemilik](ops_ops_model_def_resource_owners.md), [OPS02-BP02 Proses dan Prosedur memiliki pemilik teridentifikasi](ops_ops_model_def_proc_owners.md), atau [OPS02-BP03 Aktivitas operasi memiliki pemilik teridentifikasi yang bertanggung jawab atas performanya](ops_ops_model_def_activity_owners.md), mulailah dengan yang pertama. 

1.  Bekerjasamalah dengan para pemangku kepentingan yang ada di organisasi Anda untuk mengembangkan sebuah proses manajemen perubahan. Proses tersebut harus meliputi penambahan, perubahan, dan pengecualian untuk sumber daya, proses, dan prosedur. 

   1.  Anda dapat menggunakan [Manajer Perubahan AWS Systems Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/change-manager.html) sebagai sebuah platform manajemen perubahan untuk sumber daya beban kerja. 

1.  Buatlah dokumentasi proses manajemen perubahan dalam sistem manajemen pengetahuan Anda. 

 **Tingkat upaya untuk rencana implementasi:** Sedang. Mengembangkan sebuah proses manajemen perubahan memerlukan penyelarasan dengan banyak pemangku kepentingan yang ada di seluruh organisasi Anda. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS02-BP01 Sumber daya telah mengidentifikasi pemilik](ops_ops_model_def_resource_owners.md) - Sumber daya membutuhkan pemilik yang teridentifikasi sebelum Anda membangun sebuah proses manajemen perubahan. 
+  [OPS02-BP02 Proses dan Prosedur memiliki pemilik teridentifikasi](ops_ops_model_def_proc_owners.md) - Proses membutuhkan pemilik yang teridentifikasi sebelum Anda membangun sebuah proses manajemen perubahan. 
+  [OPS02-BP03 Aktivitas operasi memiliki pemilik teridentifikasi yang bertanggung jawab atas performanya](ops_ops_model_def_activity_owners.md) - Kegiatan Operasi membutuhkan pemilik yang teridentifikasi sebelum Anda membangun sebuah proses manajemen perubahan. 

 **Dokumen terkait:** 
+ [ Panduan Preskriptif AWS - Playbook landasan dasar untuk migrasi besar AWS: Membuat matriks RACI](https://docs.aws.amazon.com/prescriptive-guidance/latest/large-migration-foundation-playbook/team-org.html#raci)
+ [ Manajemen Perubahan dalam Laporan Resmi Cloud](https://docs.aws.amazon.com/whitepapers/latest/change-management-in-the-cloud/change-management-in-the-cloud.html)

 **Layanan terkait:** 
+ [Manajer Perubahan AWS Systems Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/change-manager.html)

# OPS02-BP06 Tanggung jawab antara tim telah dinegosiasikan atau ditetapkan sebelumnya
<a name="ops_ops_model_def_neg_team_agreements"></a>

Miliki perjanjian yang telah ditetapkan atau dinegosiasikan antara tim yang menjelaskan bagaimana mereka akan bekerja sama dan saling mendukung satu sama lain (contohnya, waktu respons, tujuan tingkat layanan, atau perjanjian tingkat layanan). Saluran komunikasi antar-tim didokumentasikan. Memahami dampak dari pekerjaan tim terhadap hasil bisnis, dan hasil dari tim dan organisasi yang lain akan membuat Anda tahu tentang penentuan prioritas tugas mereka dan membantu mereka merespons dengan tepat. 

 Ketika ada tanggung jawab dan kepemilikan yang tidak ditetapkan atau tidak diketahui, maka Anda akan menanggung risiko tidak menangani aktivitas yang diperlukan secara tepat waktu serta risiko munculnya upaya yang berulang dan kemungkinan bertentangan untuk menangani kebutuhan-kebutuhan tersebut. 

 **Hasil yang diinginkan:** 
+  Perjanjian bekerja atau mendukung antar-tim sudah disetujui dan didokumentasikan. 
+  Tim-tim yang mendukung atau bekerja dengan satu sama lain memiliki ekspektasi respons dan saluran komunikasi yang telah ditetapkan sebelumnya. 

 **Anti-pola umum:** 
+  Ada sebuah masalah yang terjadi dalam produksi dan dua tim terpisah mulai menyelesaikan masalahnya sendiri-sendiri. Upaya terpisah mereka memperpanjang masa henti produksi. 
+  Tim operasi membutuhkan bantuan dari tim pengembangan, tetapi tidak ada waktu respons yang disepakati. Permintaannya tetap berada dalam timbunan yang belum dikerjakan (backlog). 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Tim mengetahui cara berinteraksi dan mendukung satu sama lain. 
+  Ekspektasi untuk tingkat responsivitas sudah diketahui. 
+  Saluran komunikasi sudah ditetapkan dengan jelas. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Rendah 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Dengan mengimplementasikan praktik terbaik ini, artinya bahwa sudah tidak ada lagi ambiguitas tentang bagaimana tim bekerja dengan satu sama lain. Perjanjian resmi mengatur tentang bagaimana tim bekerja sama atau mendukung satu sama lain. Saluran komunikasi antar-tim sudah didokumentasikan. 

 **Contoh pelanggan** 

 Tim SRE AnyCompany Retail memiliki perjanjian tingkat layanan dengan tim pengembangan mereka. Setiap kali tim pengembangan mengajukan sebuah permintaan dalam sistem tiket mereka, mereka dapat mengantisipasi bahwa respons akan diterima dalam waktu lima belas menit. Jika ada penghentian kerja di lokasi, tim SRE akan memimpin pelaksanaan investigasi dengan dukungan dari tim pengembangan. 

 **Langkah-langkah implementasi** 

1.  Melalui kerja sama dengan para pemangku kepentingan yang ada di seluruh organisasi Anda, buatlah perjanjian antara tim berdasarkan proses dan prosedur. 

   1.  Jika sebuah proses atau prosedur dimiliki bersama antara dua tim, kembangkan sebuah runbook tentang cara tim akan bekerja sama. 

   1.  Jika ada ketergantungan antara tim, buat dan sepakati SLA respons untuk permintaan. 

1.  Buatlah dokumentasi tanggung jawab dalam sistem manajemen pengetahuan Anda. 

 **Tingkat upaya untuk rencana implementasi:** Sedang. Jika belum ada perjanjian yang dibuat antara tim, mungkin akan diperlukan upaya agar para pemangku kepentingan di seluruh organisasi Anda bisa sepakat. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS02-BP02 Proses dan Prosedur memiliki pemilik teridentifikasi](ops_ops_model_def_proc_owners.md) - Kepemilikan proses harus diidentifikasi sebelum menetapkan perjanjian antar tim. 
+  [OPS02-BP03 Aktivitas operasi memiliki pemilik teridentifikasi yang bertanggung jawab atas performanya](ops_ops_model_def_activity_owners.md) - Kepemilikan kegiatan operasi harus diidentifikasi sebelum menetapkan perjanjian antar tim. 

 **Dokumen terkait:** 
+ [Wawasan Eksekutif AWS - Memberdayakan Inovasi dengan Tim Dua Pizza ](https://aws.amazon.com/executive-insights/content/amazon-two-pizza-team/)
+ [Pengantar DevOps di AWS - Tim Dua Pizza](https://docs.aws.amazon.com/whitepapers/latest/introduction-devops-aws/two-pizza-teams.html)

# OPS 3. Bagaimana budaya organisasi Anda mendukung hasil bisnis Anda?
<a name="ops-03"></a>

 Berikan dukungan kepada anggota tim Anda sehingga mereka dapat menjadi lebih efektif dalam mengambil tindakan dan mendukung hasil bisnis Anda. 

**Topics**
+ [OPS03-BP01 Memberikan sponsor eksekutif](ops_org_culture_executive_sponsor.md)
+ [OPS03-BP02 Anggota tim diberdayakan untuk bertindak ketika hasil dipertaruhkan](ops_org_culture_team_emp_take_action.md)
+ [OPS03-BP03 Eskalasi didorong](ops_org_culture_team_enc_escalation.md)
+ [OPS03-BP04 Komunikasi yang tepat waktu, jelas, dan dapat ditindaklanjuti](ops_org_culture_effective_comms.md)
+ [OPS03-BP05 Mendorong eksperimen](ops_org_culture_team_enc_experiment.md)
+ [OPS03-BP06 Mendorong dan mendukung para anggota tim untuk mempertahankan dan mengembangkan tingkat keterampilan mereka](ops_org_culture_team_enc_learn.md)
+ [OPS03-BP07 Tim sumber daya dengan tepat](ops_org_culture_team_res_appro.md)

# OPS03-BP01 Memberikan sponsor eksekutif
<a name="ops_org_culture_executive_sponsor"></a>

 Pada tingkat tertinggi, pimpinan senior bertindak sebagai sponsor eksekutif untuk menetapkan ekspektasi dan arah untuk hasil organisasi dengan jelas, termasuk mengevaluasi keberhasilannya. Sponsor mendukung dan mendorong penggunaan praktik-praktik terbaik serta perkembangan organisasi. 

 **Hasil yang diinginkan:** Organisasi-organisasi yang berusaha untuk mengadopsi, mentransformasi, dan mengoptimalkan operasi cloud mereka menetapkan garis kepemimpinan dan akuntabilitas yang jelas untuk hasil yang diinginkan. Organisasi memahami setiap kemampuan yang dibutuhkan oleh organisasi untuk mencapai hasil baru dan menetapkan kepemilikan kepada tim fungsional untuk pengembangan. Pimpinan secara aktif menetapkan arah ini, menetapkan kepemilikan, mengambil pertanggungjawaban, dan menentukan pekerjaan. Hasilnya, individu yang ada di seluruh organisasi dapat termobilisasi, merasa terinspirasi, dan secara aktif bekerja menuju tujuan yang diinginkan. 

 **Anti-pola umum:** 
+  Terdapat sebuah mandat bagi pemilik beban kerja untuk memigrasikan beban kerja AWS tanpa sponsor yang jelas dan membuat rencana untuk operasi cloud. Hal ini mengakibatkan tim berkolaborasi untuk melakukan peningkatan dan mematangkan kemampuan operasional tanpa ada kesadaran. Kurangnya standar praktik terbaik operasional membuat tim menjadi kewalahan (seperti kerja keras operator, kondisi selalu siaga, dan utang teknis), yang membatasi inovasi. 
+  Sasaran organisasi baru telah ditetapkan untuk mengadopsi sebuah teknologi baru tanpa memberikan sponsor dan strategi kepemimpinan. Tim menafsirkan tujuan-tujuan secara berbeda, yang menyebabkan kebingungan di antara mereka tentang ke mana upaya harus difokuskan, alasan mengapa tujuan-tujuan itu penting, dan bagaimana dampaknya harus diukur. Akibatnya, organisasi kehilangan momentum dalam mengadopsi teknologi. 

 **Manfaat menerapkan praktik terbaik ini:** Ketika sponsor eksekutif secara jelas mengomunikasikan dan berbagi visi, arah, dan tujuan yang hendak dicapainya, anggota tim akan tahu apa yang diharapkan dari mereka. Individu dan tim mulai memfokuskan upaya secara intens ke arah yang sama untuk mencapai tujuan-tujuan yang sudah ditentukan ketika para pemimpin terlibat secara aktif. Hasilnya, organisasi memaksimalkan kemampuan untuk mencapai keberhasilan. Ketika Anda melakukan evaluasi atas kesuksesan, Anda dapat mengidentifikasi hambatan dengan lebih baik sehingga hambatan tersebut dapat diatasi melalui campur tangan sponsor eksekutif. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Pada setiap fase perjalanan cloud (migrasi, adopsi, atau optimalisasi), kesuksesan membutuhkan keterlibatan aktif di tingkat kepemimpinan tertinggi dengan sponsor eksekutif yang ditunjuk. Sponsor eksekutif menyelaraskan pola pikir tim, serangkaian keahlian, dan cara bekerja dengan strategi yang ditentukan. 
  +  **Jelaskan *alasannya*:** Berikan kejelasan dan uraikan alasan-alasan di balik visi dan strategi. 
  +  **Tetapkan ekspektasi:** Tentukan dan publikasikan tujuan-tujuan yang ingin diraih organisasi Anda, termasuk cara mengukur keberhasilannya. 
  +  **Lacak pencapaian tujuan:** Ukur pencapaian tujuan bertahap secara teratur (bukan hanya penyelesaian tugasnya saja). Bagikan hasilnya sehingga tindakan yang tepat dapat dilakukan jika hasil sedang dalam risiko. 
  +  **Sediakan sumber daya yang diperlukan untuk mencapai tujuan Anda:** Satukan orang-orang dan tim untuk saling berkolaborasi dan membangun solusi yang tepat yang mewujudkan hasil yang ingin dicapai. Hal ini mengurangi atau menghilangkan gesekan organisasi. 
  +  **Dukung tim Anda:** Tetap berinteraksi dengan tim Anda sehingga Anda memahami bagaimana kondisi mereka dan mengetahui jika ada faktor eksternal yang memengaruhi mereka. Identifikasi rintangan yang memperlambat kemajuan tim Anda. Bertindaklah atas nama tim Anda untuk membantu mengatasi hambatan dan menghilangkan beban yang tidak perlu. Ketika ada faktor eksternal yang memengaruhi performa tim Anda, lakukan evaluasi kembali tujuan dan sesuaikan target sebagaimana mestinya. 
  +  **Dorong penerapan praktik terbaik:** Kenali praktik terbaik yang memberikan manfaat-manfaat yang dapat diukur, dan kenali para pembuat dan pengguna praktik tersebut. Dukung adopsi lebih lanjut untuk memperbesar manfaat yang dapat dicapai dengannya. 
  +  **Dorong evolusi tim Anda:** Ciptakan budaya peningkatan terus-menerus, dan secara proaktif belajarlah dari kemajuan yang dibuat, dan belajarlah pula dari kegagalan yang dialami. Dukung pertumbuhan dan perkembangan perorangan maupun organisasi. Gunakan data dan anekdot untuk mengembangkan visi dan strategi. 

 **Contoh pelanggan** 

 AnyCompany Retail sedang dalam proses transformasi bisnis melalui perombakan pengalaman pelanggan dengan cepat, peningkatan produktivitas, dan percepatan pertumbuhan dengan menggunakan AI generatif. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  Bangun kepemimpinan yang berutas tunggal (single-threaded), dan tunjuk sponsor eksekutif utama untuk memimpin dan mendorong transformasi. 

1.  Tentukan hasil bisnis yang jelas dari transformasi Anda, dan tetapkan kepemilikan serta pertanggunjawabannya. Berdayakan pejabat eksekutif utama dengan wewenang untuk memimpin dan mengambil keputusan-keputusan penting. 

1.  Pastikan bahwa strategi transformasional Anda sudah sangat jelas dan telah dikomunikasikan secara luas oleh sponsor eksekutif ke setiap tingkat organisasi. 

   1.  Tetapkan tujuan-tujuan bisnis yang jelas untuk inisiatif IT dan cloud. 

   1.  Buatlah dokumentasi metrik bisnis utama untuk mendorong transformasi IT dan cloud. 

   1.  Komunikasikan visi secara konsisten kepada semua tim dan individu perorangan yang bertanggung jawab atas bagian-bagian dari strategi tersebut. 

1.  Kembangkan matriks perencanaan komunikasi yang menentukan pesan apa yang perlu disampaikan kepada pemimpin, manajer, dan kontributor individu perorangan tertentu. Tentukan orang atau tim yang harus menyampaikan pesan ini. 

   1.  Jalankan rencana komunikasi secara konsisten dan andal. 

   1.  Tetapkan dan kelola ekspektasi melalui acara tatap muka yang diadakan secara rutin. 

   1.  Terima umpan balik mengenai efektivitas komunikasi, dan sesuaikan komunikasinya, dan buatlah rencana komunikasi sesuai dengan itu. 

   1.  Jadwalkan acara-acara komunikasi untuk memahami tantangan dari tim secara proaktif, dan buatlah sebuah loop umpan balik yang konsisten yang akan memungkinkan penyesuaian arah, jika diperlukan. 

1.  Libatkan secara aktif setiap inisiatif dari perspektif pimpinan untuk memastikan bahwa semua tim yang terkena dampak memahami hasil yang menjadi tanggung jawab mereka. 

1.  Pada setiap rapat status, sponsor eksekutif harus mencari penghalang, memeriksa metrik yang ditetapkan, anekdot, atau umpan balik dari tim, dan mengukur kemajuan pencapaian tujuan-tujuan yang ditetapkan. 

 **Tingkat upaya untuk rencana implementasi** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS03-BP04 Komunikasi yang tepat waktu, jelas, dan dapat ditindaklanjuti](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_org_culture_effective_comms.html) 
+  [OP11-BP01 Buatlah suatu proses untuk peningkatan berkelanjutan](wellarchitected/latest/operational-excellence-pillar/evolve/learn_share_and_improve/ops_evolve_ops_process_cont_imp.html) 
+  [OPS11-BP07 Melakukan peninjauan metrik operasi](wellarchitected/latest/operational-excellence-pillar/evolve/learn_share_and_improve/ops_evolve_ops_metrics_review.html) 

 **Dokumen terkait:** 
+  [Mengurai Kekusutan Organisasi Anda: Sangat Selaras](https://aws.amazon.com/blogs/enterprise-strategy/untangling-your-organisational-hairball-highly-aligned/) 
+  [Transformasi yang Hidup: Perubahan-perubahan dengan pendekatan pragmatis](https://aws.amazon.com/blogs/enterprise-strategy/the-living-transformation-pragmatically-approaching-changes/) 
+  [Menjadi Perusahaan yang Siap Menghadapi Masa Depan](https://aws.amazon.com/blogs/enterprise-strategy/becoming-a-future-ready-enterprise/) 
+  [7 Perangkap yang Perlu Dihindari Saat Membangun CCOE](https://aws.amazon.com/blogs/enterprise-strategy/7-pitfalls-to-avoid-when-building-a-ccoe/) 
+  [Menavigasi Cloud: Indikator Performa Utama untuk Mencapai Keberhasilan](https://aws.amazon.com/blogs/enterprise-strategy/navigating-the-cloud-key-performance-indicators-for-success/) 

 **Video terkait:** 
+  [AWS re: Invent 2023: Panduan pemimpin untuk AI generatif: Menggunakan sejarah untuk membentuk masa depan (SEG204)](https://youtu.be/e3snrDsct1o) 

 **Contoh terkait:** 
+  [Prosci: Peran & Pentingnya Sponsor Utama](https://www.prosci.com/blog/primary-sponsors-role-and-importance) 

# OPS03-BP02 Anggota tim diberdayakan untuk bertindak ketika hasil dipertaruhkan
<a name="ops_org_culture_team_emp_take_action"></a>

 Perilaku kepemilikan yang membudaya yang ditanamkan oleh pimpinan akan menimbulkan perasaan diberdayakan pada diri karyawan untuk bertindak atas nama seluruh perusahaan di luar cakupan peran dan pertanggungjawaban mereka. Karyawan dapat bertindak untuk mengidentifikasi risiko secara proaktif saat risiko-risiko itu muncul dan melakukan tindakan sebagaimana mestinya. Dengan budaya seperti ini, karyawan dapat mengambil keputusan bernilai tinggi dengan kesadaran terhadap situasi yang dihadapinya. 

 Misalnya, Amazon menggunakan [Prinsip Kepemimpinan](https://www.amazon.jobs/content/en/our-workplace/leadership-principles) sebagai pedoman untuk mendorong perilaku yang diinginkan bagi para karyawan untuk bergerak maju saat menghadapi kesulitan, memecahkan masalah, menangani konflik, dan mengambil tindakan. 

 **Hasil yang diinginkan:** Para pimpinan telah menyebarkan pengaruh budaya baru yang memungkinkan individu dan tim membuat keputusan-keputusan penting, bahkan pada tingkat organisasi yang lebih rendah (selama keputusan-keputusan itu ditentukan dengan izin yang dapat diaudit dan mekanisme keselamatan). Kegagalan tidak dianggap sebagai sesuatu yang buruk, dan tim secara berulang belajar untuk memperbaiki cara-cara mereka dalam mengambil keputusan dan dalam memberikan respons untuk mengatasi situasi-situasi serupa di kesempatan lain. Jika tindakan seseorang mengakibatkan terjadinya perbaikan yang dapat menguntungkan tim lain, mereka membagikan pengetahuan yang didapatkan dari tindakan tersebut secara proaktif. Pimpinan mengukur perbaikan operasional dan memberikan insentif kepada individu perseorangan dan organisasi yang mengadopsi pola-pola tersebut. 

 **Anti-pola umum:** 
+  Tidak ada panduan atau mekanisme yang jelas dalam organisasi terkait hal-hal yang harus dilakukan ketika ada risiko yang diidentifikasi. Misalnya, ketika seorang karyawan melihat adanya serangan phishing, lalu karyawan tersebut tidak melapor ke tim keamanan, dan mengakibatkan sebagian besar organisasi menjadi korban dari serangan tersebut. Hal ini mengakibatkan terjadinya pembobolan data. 
+  Pelanggan Anda mengeluhkan bahwa layanan tidak tersedia, yang terutama disebabkan oleh deployment yang gagal. Tim SRE Anda bertanggung jawab atas alat deployment, dan rollback otomatis untuk deployment tersedia di dalam peta strategi jangka panjang mereka. Dalam peluncuran (rollout) aplikasi baru-baru ini, salah satu rekayasawan menemukan solusi untuk mengotomatiskan rollback aplikasi ke versi sebelumnya. Meskipun solusi mereka dapat menjadi pola untuk tim SRE, namun tim lain tidak mengadopsinya, karena tidak ada proses untuk melacak perbaikan tersebut. Organisasi terus diganggu dengan deployment yang gagal dan berdampak pada para pelanggan dan menyebabkan sentimen negatif lebih lanjut. 
+  Untuk menjaga kepatuhan, tim infosec Anda mengawasi proses model lama untuk merotasi kunci SSH bersama secara rutin atas nama operator yang terhubung ke instans Linux Amazon EC2 mereka. Dibutuhkan beberapa hari bagi tim infosec untuk menyelesaikan proses rotasi kunci ini, dan Anda pun tidak dapat terkoneksi ke instans tersebut. Tidak ada seorang pun di dalam atau di luar infosec yang menyarankan penggunaan opsi lain yang ada di AWS untuk mencapai hasil yang sama. 

 **Manfaat menerapkan praktik terbaik ini: ** Dengan melakukan desentralisasi atas otoritas untuk membuat keputusan dan memberdayakan tim Anda untuk membuat keputusan kunci, Anda dapat mengatasi masalah dengan lebih cepat dan dengan tingkat keberhasilan yang meningkat. Selain itu, tim mulai menyadari adanya rasa kepemilikan, dan kegagalan dapat diterima. Eksperimen menjadi andalan yang membudaya. Manajer dan direktur tidak merasakan bahwa mereka seolah-olah dikontrol secara berlebihan di setiap aspek pekerjaan mereka. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

1.  Kembangkan budaya yang menganggap kegagalan sebagai sebuah hal lumrah. 

1.  Tetapkan kepemilikan dan pertanggungjawaban yang jelas untuk berbagai area fungsional di dalam organisasi. 

1.  Komunikasikan kepemilikan dan akuntabilitas kepada semua orang sehingga setiap individu tahu siapa yang dapat membantu mereka memfasilitasi keputusan yang terdesentralisasi. 

1.  Tentukan keputusan satu arah dan dua arah Anda untuk membantu individu perseorangan mengetahui kapan mereka perlu melakukan eskalasi ke tingkat kepemimpinan yang lebih tinggi. 

1.  Ciptakan kesadaran organisasi bahwa semua karyawan diberdayakan untuk melakukan tindakan di berbagai tingkatan ketika ada masalah yang membahayakan hasil. Bekali para anggota tim Anda dengan dokumentasi tata kelola, tingkat izin, alat, dan peluang untuk mempraktikkan keterampilan yang diperlukan untuk memberikan respons secara efektif. 

1.  Berikan kepada para anggota tim Anda peluang untuk melatih keterampilan yang diperlukan untuk memberikan respons atas berbagai keputusan. Setelah tingkat keputusan ditentukan, jalankan game day untuk memastikan bahwa semua kontributor perorangan memahami dan dapat mendemonstrasikan proses. 

   1.  Sediakan lingkungan alternatif yang aman di mana proses dan prosedur dapat diuji dan dilatih. 

   1.  Akui dan ciptakan kesadaran bahwa para anggota tim memiliki wewenang untuk melakukan tindakan ketika hasil mengandung risiko pada tingkat yang telah ditentukan. 

   1.  Tentukan otoritas yang dimiliki anggota tim Anda untuk mengambil tindakan dengan memberikan izin dan akses ke beban kerja dan komponen yang mereka dukung. 

1.  Berikan kemampuan kepada tim untuk berbagi pembelajaran mereka (baik keberhasilan maupun kegagalan yang berkaitan dengan operasi). 

1.  Berdayakan tim untuk menantang status quo, dan sediakan mekanisme untuk melacak dan mengukur perbaikan, serta mengukur dampaknya terhadap organisasi. 

 **Tingkat upaya untuk rencana implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS01-BP06 Mengevaluasi kompromi sambil mengelola manfaat dan risiko](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_priorities_eval_tradeoffs.html) 
+  [OPS02-BP05 Mekanisme tersedia untuk mengidentifikasi tanggung jawab dan kepemilikan](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_ops_model_req_add_chg_exception.html) 

 **Dokumen terkait:** 
+  [Posting Blog AWS \$1 Perusahaan yang tangkas](https://aws.amazon.com/blogs/enterprise-strategy/the-agile-enterprise/) 
+  [Posting Blog AWS \$1 Mengukur kesuksesan: Paradoks dan rencana](https://aws.amazon.com/blogs/enterprise-strategy/measuring-success-a-paradox-and-a-plan/) 
+  [Posting Blog AWS \$1 Melepaskan: Mengaktifkan otonomi dalam tim](https://aws.amazon.com/blogs/enterprise-strategy/letting-go-enabling-autonomy-in-teams/) 
+  [Sentralisasi atau Desentralisasi?](https://aws.amazon.com/blogs/enterprise-strategy/centralize-or-decentralize/) 

 **Video terkait:** 
+  [re:Invent 2023 \$1 Bagaimana agar Anda tidak menyabotase transformasi Anda (SEG201)](https://www.youtube.com/watch?v=heLvxK5N8Aw) 
+  [re:Invent 2021 \$1 Amazon Builders' Library: Keunggulan Operasional di Amazon](https://www.youtube.com/watch?v=7MrD4VSLC_w) 
+  [Sentralisasi vs Desentralisasi](https://youtu.be/jviFsd4hhfE?si=fjt8avVAYxA9jF01) 

 **Contoh terkait:** 
+  [Menggunakan catatan keputusan arsitektur untuk merampingkan proses pengambilan keputusan teknis untuk proyek pengembangan perangkat lunak](https://docs.aws.amazon.com/prescriptive-guidance/latest/architectural-decision-records/welcome.html) 

# OPS03-BP03 Eskalasi didorong
<a name="ops_org_culture_team_enc_escalation"></a>

 Anggota tim diimbau oleh para pimpinan untuk menyampaikan masalah dan kekhawatiran mereka kepada pengambil keputusan dan pemangku kepentingan pada level yang lebih tinggi, jika mereka meyakini bahwa hal itu menimbulkan risiko pada hasil dan standar yang diharapkan tidak terpenuhi. Ini adalah bagian dari budaya organisasi dan didorong pada semua level. Eskalasi (penyampaian) harus dilakukan sejak dini dan sering kali agar risiko-risiko semacam itu dapat diidentifikasi, dan dicegah sebelum menyebabkan insiden. Pimpinan tidak menegur individu perseorangan karena menyampaikan masalah ke level pimpinan yang lebih tinggi. 

 **Hasil yang diinginkan:** Individu perseorangan yang ada di seluruh organisasi merasa nyaman untuk menyampaikan masalah ke tingkat pimpinan langsung dan lebih tinggi. Pimpinan telah dengan sengaja dan sadar menetapkan ekspektasi bahwa tim mereka harus merasa aman untuk menyampaikan masalah apa pun ke pimpinan yang lebih tinggi. Terdapat mekanisme untuk menyampaikan masalah ke pimpinan yang lebih tinggi di setiap tingkat dalam organisasi. Ketika karyawan melakukan eskalasi ke manajer mereka, mereka bersama-sama memutuskan tingkat dampaknya dan apakah masalah tersebut harus disampaikan ke tingkat pimpinan yang lebih tinggi. Untuk memulai eskalasi, karyawan diharuskan untuk menyertakan rencana kerja yang direkomendasikan untuk mengatasi masalah tersebut. Jika manajemen langsung tidak melakukan tindakan dengan tepat waktu, maka karyawan diimbau untuk menyampaikan masalah tersebut ke tingkat pimpinan tertinggi jika mereka merasa sangat yakin bahwa risiko terhadap organisasi tersebut benar-benar perlu dieskalasi. 

 **Anti-pola umum:** 
+  Para pemimpin eksekutif tidak mengajukan pertanyaan yang cukup cermat selama pelaksanaan rapat status program transformasi cloud Anda untuk menemukan letak terjadinya masalah dan hambatan. Yang disajikan sebagai status hanyalah kabar baik. Mereka CIO telah menjelaskan bahwa dia hanya suka mendengar kabar baik, karena tantangan apa pun yang muncul membuat CEO orang berpikir bahwa program tersebut gagal. 
+  Anda adalah seorang rekayasawan operasi cloud dan Anda melihat bahwa sistem manajemen pengetahuan yang baru tidak diadopsi secara luas oleh tim aplikasi. Perusahaan menginvestasikan waktu satu tahun dan dana beberapa juta dolar untuk mengimplementasikan sistem manajemen pengetahuan baru tersebut, tetapi orang-orang masih menulis runbook mereka secara lokal dan membagikannya di layanan berbagi cloud organisasi, sehingga pengetahuan terkait beban kerja yang didukung itu menjadi sulit ditemukan. Anda mencoba menyampaikan hal ini kepada pimpinan, karena penggunaan sistem ini secara konsisten dapat meningkatkan efisiensi operasional. Ketika Anda menyampaikannya kepada direktur yang memimpin implementasi sistem manajemen pengetahuan tersebut, ia akan menegur Anda karena hal ini dianggap dapat menciptakan keraguan pada investasi. 
+  Tim infosec yang bertanggung jawab untuk mengeraskan sumber daya komputasi telah memutuskan untuk menerapkan proses yang mengharuskan melakukan pemindaian yang diperlukan untuk memastikan bahwa EC2 instance sepenuhnya diamankan sebelum tim komputasi merilis sumber daya untuk digunakan. Ini telah menciptakan penundaan waktu seminggu tambahan untuk sumber daya yang akan digunakan, yang merusak merekaSLA. Tim komputasi tidak berani menyampaikan masalah ini kepada VP melalui cloud karena hal ini merusak citra VP keamanan informasi. 

 **Manfaat menjalankan praktik terbaik ini:** 

 Masalah-masalah yang kompleks atau kritis ditangani sebelum berdampak pada bisnis. Lebih sedikit waktu yang terbuang. Risiko diminimalkan. Tim menjadi lebih proaktif dan fokus pada hasil ketika memecahkan masalah. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Kemauan dan kemampuan untuk melakukan eskalasi secara bebas di setiap tingkatan di dalam organisasi adalah sebuah landasan organisasi dan budaya yang harus dikembangkan secara sadar melalui pelatihan yang ditekankan, komunikasi kepemimpinan, penetapan ekspektasi, dan deployment mekanisme di seluruh organisasi pada setiap tingkat. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  Tentukan kebijakan, standar, dan ekspektasi untuk organisasi Anda. 

   1.  Pastikan adopsi dan pemahaman yang luas tentang kebijakan, ekspektasi, dan standar. 

1.  Dorong, latih, dan berdayakan pekerja untuk melakukan eskalasi waktu secara dini dan sering kali ketika standar tidak terpenuhi. 

1.  Akui pada tingkat organisasi bahwa eskalasi yang dilakukan sejak dini dan sering kali merupakan praktik terbaik. Akui bahwa eskalasi mungkin saja terbukti tidak berdasar, tetapi lebih baik mengambil kesempatan untuk mencegah terjadinya insiden daripada melewatkan kesempatan tersebut dengan tidak melakukan eskalasi. 

   1.  Bangun sebuah sebuah mekanisme untuk melakukan eskalasi (seperti sistem kabel Andon). 

   1.  Miliki prosedur terdokumentasi yang menetapkan kapan dan bagaimana eskalasi harus dilakukan. 

   1.  Tentukan sekelompok personel dengan otoritas berjenjang untuk melakukan atau menyetujui tindakan, beserta informasi kontak dari setiap pemangku kepentingan. 

1.  Ketika eskalasi terjadi, eskalasi tersebut harus berlanjut sampai anggota tim yakin bahwa risiko telah ditangani melalui tindakan yang didorong dari para pimpinan. 

   1.  Eskalasi harus mencakup: 

      1.  Deskripsi situasi, dan sifat risiko 

      1.  Tingkat kekritisan situasi 

      1.  Siapa atau apa yang terkena dampak 

      1.  Seberapa besar dampak tersebut 

      1.  Urgensi jika dampak terjadi 

      1.  Saran perbaikan dan rencana penanganan 

   1.  Lindungi karyawan yang melakukan eskalasi. Miliki kebijakan yang melindungi para anggota tim dari tindakan pembalasan jika mereka melakukan eskalasi di sekitar pengambil keputusan atau pemangku kepentingan yang tidak responsif. Terapkan mekanisme untuk mengidentifikasi apakah hal ini terjadi dan beri respons yang tepat. 

1.  Tumbuhkan budaya loop umpan balik perbaikan berkelanjutan dalam segala hal yang dihasilkan oleh organisasi. Loop umpan balik bertindak sebagai eskalasi kecil kepada individu yang bertanggung jawab, dan mereka mengidentifikasi peluang-peluang perbaikan, bahkan ketika eskalasi tidak diperlukan. Budaya perbaikan berkelanjutan mendorong setiap orang untuk menjadi lebih proaktif. 

1.  Pimpinan harus menekankan ulang secara berkala kebijakan, standar, mekanisme, dan keinginan untuk mewujudkan eskalasi yang terbuka dan loop umpan balik berkelanjutan tanpa tindakan pembalasan. 

 **Tingkat upaya untuk Rencana Implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS02-BP05 Mekanisme tersedia untuk meminta penambahan, perubahan, dan pengecualian](ops_ops_model_req_add_chg_exception.md) 

 **Dokumen terkait:** 
+  [Bagaimana Anda menumbuhkan budaya perbaikan berkelanjutan dan belajar dari Andon dan sistem eskalasi?](https://www.linkedin.com/advice/0/how-do-you-foster-culture-continuous-improvement-7054190310033145857) 
+  [Kabel Andon (Revolusi TI)](https://itrevolution.com/articles/kata/) 
+  [AWS DevOps Panduan \$1 Tetapkan jalur eskalasi yang jelas dan dorong ketidaksepakatan yang konstruktif](https://docs.aws.amazon.com/wellarchitected/latest/devops-guidance/oa.bcl.5-establish-clear-escalation-paths-and-encourage-constructive-disagreement.html) 

 **Video terkait:** 
+  [Jeff Bezos tentang cara membuat keputusan (& meningkatkan kecepatan)](https://www.youtube.com/watch?v=VFwCGECvq4I) 
+  [Sistem Produk Toyota: Menghentikan Produksi, sebuah Tombol, dan Papan Listrik Andon](https://youtu.be/TUKpxjAftnk?si=qohtCCX0q78GDzJu) 
+  [Kabel Andon di Manufaktur LEAN](https://youtu.be/HshopyQk720?si=1XJkpCSqJSpk_zE6) 

 **Contoh terkait:** 
+  [Bekerja dengan rencana eskalasi di Incident Manager](https://docs.aws.amazon.com/incident-manager/latest/userguide/escalation.html) 

# OPS03-BP04 Komunikasi yang tepat waktu, jelas, dan dapat ditindaklanjuti
<a name="ops_org_culture_effective_comms"></a>

 Pimpinan bertanggung jawab untuk menciptakan komunikasi yang kuat dan efektif, terutama ketika organisasi mengadopsi strategi, teknologi, atau cara kerja baru. Pemimpin harus menetapkan ekspektasi bagi semua staf untuk bekerja untuk mencapai tujuan-tujuan perusahaan. Rancang mekanisme komunikasi yang menciptakan dan memelihara kesadaran di antara tim yang bertanggung jawab untuk menjalankan rencana yang didanai dan disponsori oleh pimpinan. Manfaatkan keragaman lintas organisasi, dan dengarkan dengan penuh perhatian berbagai perspektif yang unik. Gunakan perspektif ini untuk meningkatkan inovasi, menantang asumsi Anda, dan mengurangi risiko bias konfirmasi. Tumbuhkan inklusi, keragaman, dan kemudahan akses dalam tim Anda untuk mendapatkan perspektif yang bermanfaat. 

 **Hasil yang diinginkan:** Organisasi Anda merancang strategi-strategi komunikasi untuk mengatasi dampak yang ditimbulkan oleh perubahan-perubahan terhadap organisasi. Tim tetap mendapatkan informasi terbaru dan termotivasi untuk terus bekerja sama satu sama lain, bukan saling melawan. Individu perseorangan memahami betapa pentingnya peran mereka untuk mencapai tujuan-tujuan yang telah ditetapkan. Email hanyalah mekanisme pasif untuk komunikasi dan digunakan sebagaimana mestinya. Manajemen meluangkan waktu dengan kontributor individual perorangan mereka untuk membantu mereka memahami tanggung jawab, tugas yang harus diselesaikan, dan bagaimana pekerjaan mereka berkontribusi pada keseluruhan misi. Jika perlu, para pemimpin melibatkan personel secara langsung di lokasi-lokasi yang lebih kecil untuk menyampaikan pesan dan memastikan bahwa pesan-pesan ini tersampaikan secara efektif. Sebagai hasil dari strategi komunikasi yang baik, organisasi menunjukkan kinerja sesuai atau melampaui harapan pimpinan. Pimpinan mendorong dan meminta pendapat yang beragam di dalam dan di seluruh tim. 

 **Anti-pola umum:** 
+  Organisasi Anda memiliki rencana lima tahun untuk memigrasi semua beban kerja ke AWS. Kasus bisnis untuk cloud mencakup modernisasi 25% dari semua beban kerja untuk memanfaatkan teknologi nirserver. CIO mengomunikasikan strategi ini untuk mengarahkan laporan dan mengharapkan setiap pemimpin untuk menyampaikan presentasi ini kepada manajer, direktur, dan kontributor perorangan tanpa melakukan komunikasi tatap muka. CIO memantau dari belakang dan mengharapkan organisasinya menjalankan strategi baru tersebut. 
+  Pimpinan tidak menyediakan atau menggunakan mekanisme untuk umpan balik, dan kesenjangan ekspektasi pun tumbuh, yang menyebabkan proyek terhenti. 
+  Anda diminta untuk membuat perubahan pada grup keamanan Anda, tetapi Anda tidak diberikan detail apa pun tentang perubahan yang perlu dilakukan, dampak perubahan yang dapat terjadi pada semua beban kerja, dan kapan hal tersebut seharusnya terjadi. Manajer meneruskan sebuah email dari VP InfoSec dan menambahkan pesan “Mari Wujudkan.” 
+  Perubahan dilakukan pada strategi migrasi Anda yang mengurangi jumlah modernisasi yang direncanakan dari 25% menjadi 10%. Perubahan ini memiliki efek hilir pada organisasi operasi. Mereka tidak diberi tahu tentang perubahan strategis ini sehingga mereka tidak siap dengan kapasitas personel terampil yang memadai untuk mendukung beban kerja yang diangkat dan digeser dalam jumlah yang lebih besar ke AWS. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Organisasi Anda selalu menerima informasi tentang strategi baru atau perubahan strategi, dan mereka bertindak sebagaimana mestinya dengan motivasi yang kuat untuk saling membantu guna mencapai keseluruhan tujuan dan metrik yang telah ditetapkan oleh pimpinan. 
+  Mekanisme tersedia dan digunakan untuk memberikan pengingat secara tepat waktu kepada anggota tim tentang risiko-risiko yang diketahui dan peristiwa-peristiwa yang direncanakan. 
+  Cara kerja baru (termasuk perubahan pada personel atau organisasi, proses, atau teknologi), beserta keterampilan yang dibutuhkan, diadopsi dengan lebih efektif oleh organisasi, dan organisasi Anda menyadari manfaat-manfaat bisnis dengan lebih cepat. 
+  Anggota tim memiliki konteks yang diperlukan tentang komunikasi-komunikasi yang diterima, dan mereka dapat bekerja dengan lebih efektif. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Untuk mengimplementasikan praktik terbaik ini, Anda harus bekerja sama dengan para pemangku kepentingan di seluruh organisasi untuk menyepakati standar komunikasi. Publikasikan standar tersebut ke organisasi Anda. Untuk transisi IT yang signifikan, tim perencanaan yang telah sudah dibentuk dan mapan mempunyai kecenderungan lebih untuk berhasil mengelola dampak perubahan terhadap personelnya daripada organisasi yang mengabaikan praktik ini. Manajemen perubahan bisa lebih menantang untuk organisasi yang lebih besar, karena dukungan yang kuat untuk strategi baru sangat diperlukan dari semua kontributor individual perorangan. Dengan tidak adanya tim perencanaan transisi seperti ini, pimpinan memegang 100% tanggung jawab untuk melakukan komunikasi yang efektif. Saat membentuk tim perencanaan transisi, tugaskan para anggota tim untuk bekerja dengan semua pimpinan organisasi untuk menentukan dan mengelola komunikasi yang efektif di setiap tingkat. 

 **Contoh pelanggan** 

 AnyCompany Retail mendaftar untuk Dukungan Perusahaan AWS dan mengandalkan penyedia layanan pihak ketiga lain untuk operasi cloud-nya. Perusahaan menggunakan obrolan dan chatops sebagai media komunikasi utama mereka untuk aktivitas-aktivitas operasional. Peringatan dan informasi lainnya memenuhi saluran tertentu. Ketika seseorang harus bertindak, mereka menyatakan hasil yang diinginkan dengan jelas, dan dalam banyak kasus, mereka menerima runbook atau playbook yang bisa digunakan. Mereka menjadwalkan perubahan besar pada sistem produksi yang memiliki sebuah kalender perubahan. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  Bangunlah sebuah tim inti di dalam organisasi yang memiliki pertanggungjawaban untuk membangun dan memulai rencana komunikasi untuk perubahan yang terjadi di berbagai tingkatan di dalam organisasi. 

1.  Tetapkan kepemilikan utas tunggal untuk mencapai pengawasan. Bekali masing-masing tim dengan kemampuan untuk melakukan inovasi secara mandiri, dan seimbangkan penggunaan mekanisme yang konsisten, yang memungkinkan inspeksi dan visi direksional pada level yang tepat. 

1.  Bekerjalah dengan para pemangku kepentingan di seluruh organisasi Anda untuk menyepakati standar komunikasi, praktik, dan rencana. 

1.  Pastikan bahwa tim komunikasi inti melakukan kolaborasi dengan para pimpinan organisasi dan program untuk menyusun pesan kepada staf yang sesuai atas nama para pemimpin. 

1.  Bangunlah mekanisme komunikasi strategis untuk mengelola perubahan melalui pengumuman, kalender bersama, rapat umum, dan metode tatap muka atau empat mata sehingga anggota tim memiliki ekspektasi yang sesuai tentang tindakan-tindakan yang harus mereka lakukan. 

1.  Sediakan konteks, detail, dan waktu yang diperlukan (apabila memungkinkan) untuk menentukan apakah tindakan perlu dilakukan. Ketika tindakan diperlukan, beritahukan tindakan apa yang diperlukan beserta dampaknya. 

1.  Implementasikan alat-alat yang memudahkan komunikasi taktis, seperti obrolan internal, email, dan manajemen pengetahuan. 

1.  Implementasikan mekanisme untuk mengukur dan memastikan bahwa semua komunikasi memberikan hasil yang diinginkan. 

1.  Buatlah sebuah loop umpan balik yang mengukur efektivitas semua komunikasi, terutama ketika komunikasi berkaitan dengan resistensi terhadap perubahan di seluruh organisasi. 

1.  Untuk semua Akun AWS, tetapkan [kontak alternatif](https://docs.aws.amazon.com/accounts/latest/reference/manage-acct-update-contact-alternate.html) untuk penagihan, keamanan, dan operasi. Idealnya, setiap kontak harus berupa distribusi email, bukan kontak individu perseorangan tertentu. 

1.  Buatlah sebuah rencana eskalasi dan komunikasi eskalasi balik untuk berinteraksi dengan tim internal dan eksternal Anda, termasuk dukungan AWS dan penyedia layanan pihak ketiga lainnya. 

1.  Mulai dan jalankan strategi komunikasi secara konsisten selama berlangsungnya setiap program transformasi. 

1.  Prioritaskan tindakan yang dapat diulang, jika memungkinkan, untuk mengaktifkan otomatisasi yang aman dalam skala besar. 

1.  Ketika komunikasi perlu dilakukan dengan melibatkan tindakan-tindakan otomatis, tujuan komunikasi seharusnya adalah untuk memberikan informasi kepada tim, untuk melakukan audit, atau sebagai bagian dari proses manajemen perubahan. 

1.  Analisis komunikasi dari sistem peringatan Anda untuk mendeteksi hasil positif palsu atau peringatan yang terus-menerus dibuat. Hapus atau ubah peringatan-peringatan tersebut sehingga peringatan tersebut dimulai ketika diperlukan intervensi manusia. Jika ada sebuah peringatan muncul, berikan runbook atau playbook. 

   1.  Anda dapat menggunakan [AWS Systems Manager Documents](https://docs.aws.amazon.com/systems-manager/latest/userguide/sysman-ssm-docs.html) untuk membuat playbook dan runbook untuk peringatan. 

1.  Mekanisme diterapkan untuk memberikan pemberitahuan risiko atau acara-acara yang direncanakan dengan cara yang jelas dan dapat ditindaklanjuti, melalui peringatan yang memadai untuk memberi respons yang sesuai. Gunakan daftar email atau saluran obrolan untuk mengirimkan pemberitahuan sebelum acara yang sudah direncanakan. 

   1.  [AWS Chatbot](https://docs.aws.amazon.com/chatbot/latest/adminguide/what-is.html) dapat Anda gunakan untuk mengirim peringatan dan menanggapi peristiwa dalam platform pesan organisasi Anda. 

1.  Berikan sumber informasi yang dapat diakses di mana acara yang sudah direncanakan dapat ditemukan. Beri pemberitahuan tentang acara-acara yang direncanakan dari sistem yang sama. 

   1.  [AWS Systems Manager Change Calendar](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-change-calendar.html) dapat Anda gunakan untuk membuat jendela perubahan ketika perubahan dapat terjadi. Hal ini memberikan para anggota tim pemberitahuan mengenai kapan mereka dapat membuat perubahan dengan aman. 

1.  Pantau pemberitahuan kerentanan dan informasi patch untuk memahami kerentanan yang memiliki risiko tinggi dan risiko potensial yang berkaitan dengan komponen beban kerja Anda. Berikan pemberitahuan kepada para anggota tim agar mereka dapat bertindak. 

   1.  Anda dapat berlangganan [Buletin Keamanan AWS untuk menerima pemberitahuan kerentanan](https://aws.amazon.com/security/security-bulletins/) pada AWS. 

1.  **Cari pendapat dan perspektif yang beragam:** Dorong kontribusi dari semua orang. Berikan kesempatan komunikasi kepada kelompok yang kurang terwakili. Lakukan rotasi peran dan tanggung jawab dalam rapat. 

   1.  **Perluas peran dan tanggung jawab:** Sediakan kesempatan bagi anggota tim untuk mengambil peran yang mungkin jarang bisa mereka ambil. Mereka bisa mendapatkan pengalaman dan perspektif dari peran tersebut serta dari interaksi dengan para anggota tim baru yang mungkin tidak akan berinteraksi dengan mereka di luar peran tersebut. Mereka juga dapat membawa pengalaman dan perspektif mereka ke peran baru tersebut serta untuk para anggota tim yang berinteraksi dengan mereka. Begitu perspektif meningkat, lakukan identifikasi terhadap kesempatan bisnis yang muncul atau peluang perbaikan baru. Lakukan rotasi tugas-tugas umum di antara para anggota di dalam tim agar mereka dapat memahami tuntutan dan dampak yang ditimbulkan dari pelaksanaan tugas-tugas yang biasanya dijalankan oleh anggota yang lain. 

   1.  **Sediakan lingkungan yang aman dan ramah:** Miliki kebijakan dan kontrol yang melindungi mental dan keselamatan fisik anggota tim dalam organisasi Anda. Para anggota tim harus bisa berinteraksi tanpa rasa takut akan pembalasan. Ketika para anggota tim merasa aman dan diterima, mereka mungkin menjadi lebih terlibat dan produktif. Makin beragam organisasi Anda, maka akan makin baik pemahaman Anda tentang orang-orang yang Anda dukung termasuk para pelanggan Anda. Ketika anggota tim Anda merasa nyaman, merasa bebas untuk berbicara, dan meyakini bahwa suara mereka akan didengar, mereka lebih berpeluang untuk membagikan wawasan berharga (misalnya, peluang pemasaran, kebutuhan aksesibilitas, segmen pasar yang belum terlayani, dan risiko-risiko yang tidak diketahui di lingkungan Anda). 

   1.  **Dukung anggota tim untuk berpartisipasi penuh:** Sediakan sumber daya yang diperlukan bagi karyawan Anda untuk berpartisipasi penuh pada semua aktivitas yang berkaitan dengan pekerjaan. Para anggota tim yang sehari-hari berhadapan dengan tantangan akan mengembangkan keterampilan untuk pekerjaan-pekerjaan di sekitar mereka. Keterampilan yang dikembangkan secara khusus ini bisa memberi keuntungan yang signifikan bagi organisasi Anda. Dukung para anggota tim dengan akomodasi yang diperlukan untuk meningkatkan keuntungan yang bisa Anda terima dari kontribusi mereka. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS03-BP01 Memberikan sponsor eksekutif](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_org_culture_executive_sponsor.html) 
+  [OPS07-BP03 Menggunakan runbook untuk menjalankan prosedur](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_ready_to_support_use_runbooks.html) 
+  [OPS07-BP04 Menggunakan playbook untuk menyelidiki masalah](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_ready_to_support_use_playbooks.html) 

 **Dokumen terkait:** 
+  [Posting blog AWS \$1 Akuntabilitas dan pemberdayaan adalah kunci bagi organisasi tangkas yang berkinerja tinggi](https://aws.amazon.com/blogs/enterprise-strategy/two-pizza-teams-are-just-the-start-accountability-and-empowerment-are-key-to-high-performing-agile-organizations-part-2/) 
+  [AWS Executive Insights \$1 Belajar untuk meningkatkan (menskalakan) inovasi, bukan kompleksitas \$1 Single-threaded Leaders](https://aws.amazon.com/executive-insights/content/amazon-two-pizza-team/#Single-Threaded_Leaders) 
+  [Buletin Keamanan AWS](https://aws.amazon.com/security/security-bulletins) 
+  [Buka CVE](https://www.opencve.io/welcome) 
+  [Aplikasi Dukungan di Slack untuk Mengelola Kasus Dukungan](https://aws.amazon.com/blogs/aws/new-aws-support-app-in-slack-to-manage-support-cases/) 
+  [Kelola sumber daya AWS di saluran Slack Anda dengan Amazon Q Developer dalam aplikasi obrolan](https://aws.amazon.com/blogs/mt/manage-aws-resources-in-your-slack-channels-with-aws-chatbot/) 

 **Layanan terkait:** 
+  [Amazon Q Developer dalam aplikasi obrolan](https://docs.aws.amazon.com/chatbot/latest/adminguide/what-is.html) 
+  [AWS Kalender Perubahan Systems Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-change-calendar.html) 
+  [AWS Dokumen Systems Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/sysman-ssm-docs.html) 

# OPS03-BP05 Mendorong eksperimen
<a name="ops_org_culture_team_enc_experiment"></a>

Eksperimen adalah katalis untuk mengubah ide baru menjadi produk dan fitur. Eksperimen mempercepat proses pembelajaran dan membuat anggota tim terus tertarik dan terlibat. Anggota tim didorong untuk sering bereksperimen guna mendorong inovasi. Meskipun hasil yang tidak diinginkan terjadi, ada nilai dalam memiliki pengetahuan tentang apa yang sebaiknya tidak dilakukan. Anggota tim tidak dihukum untuk eksperimen yang berhasil dengan hasil yang tidak diinginkan. 

 **Hasil yang diinginkan:** 
+  Organisasi Anda mendorong eksperimen untuk mendukung inovasi. 
+  Eksperimen digunakan sebagai peluang untuk belajar. 

 **Anti-pola umum:** 
+  Anda ingin menjalankan pengujian A/B tetapi tidak ada mekanisme untuk menjalankan eksperimen tersebut. Anda melakukan deployment perubahan UI tanpa memiliki kemampuan untuk mengujinya. Tindakan tersebut mengakibatkan pengalaman pelanggan yang negatif. 
+  Perusahaan Anda hanya memiliki lingkungan produksi dan lingkungan pentahapan. Tidak ada lingkungan sandbox untuk melakukan eksperimen dengan fitur atau produk baru sehingga Anda harus melakukan eksperimen di dalam lingkungan produksi. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Eksperimen mendorong inovasi. 
+  Anda dapat bereaksi lebih cepat terhadap umpan balik yang diberikan oleh pengguna melalui eksperimen. 
+  Organisasi Anda mengembangkan budaya belajar. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Eksperimen harus dijalankan dengan cara yang aman. Manfaatkan beberapa lingkungan untuk melakukan eksperimen tanpa membahayakan sumber daya produksi. Gunakan pengujian A/B dan bendera fitur untuk menguji eksperimen. Berikan kepada para anggota tim kemampuan untuk melakukan eksperimen di dalam sebuah lingkungan sandbox. 

 **Contoh pelanggan** 

 AnyCompany Retail mendorong eksperimen. Anggota tim dapat menggunakan 20% dari hari-hari kerja mereka untuk melakukan eksperimen atau mempelajari teknologi baru. Mereka memiliki sebuah lingkungan sandbox di mana mereka dapat berinovasi. Pengujian A/B digunakan untuk fitur-fitur baru guna memvalidasinya dengan umpan balik nyata dari pengguna. 

 **Langkah-langkah implementasi** 

1.  Bekerjasamalah dengan para pimpinan di seluruh organisasi Anda untuk mendukung eksperimen. Para anggota tim harus didorong untuk melakukan eksperimen dengan cara yang aman. 

1.  Berikan kepada para anggota tim Anda sebuah lingkungan di mana mereka dapat melakukan eksperimen dengan aman. Mereka harus memiliki akses ke sebuah lingkungan yang mirip dengan lingkungan produksi. 

   1.  Anda dapat menggunakan Akun AWS terpisah untuk membuat lingkungan sebuah sandbox untuk eksperimen. [AWS Control Tower](https://docs.aws.amazon.com/controltower/latest/userguide/what-is-control-tower.html) dapat digunakan untuk menyediakan akun ini. 

1.  Gunakan bendera fitur dan pengujian A/B untuk melakukan eksperimen dengan aman dan mengumpulkan umpan balik pengguna. 

   1.  [AWS AppConfig Feature Flags](https://docs.aws.amazon.com/appconfig/latest/userguide/what-is-appconfig.html) menyediakan kemampuan untuk membuat fitur bendera. 

   1.  Anda dapat menggunakan [versi AWS Lambda](https://docs.aws.amazon.com/lambda/latest/dg/configuration-versions.html) untuk menerapkan versi baru dari fungsi untuk uji beta. 

 **Tingkat upaya untuk rencana implementasi:** Tinggi. Memberikan kepada para anggota tim sebuah lingkungan untuk melakukan eksperimen dan cara yang aman untuk melakukan eksperimen dapat mengharuskan Anda menanamkan investasi besar. Anda juga mungkin harus melakukan modifikasi terhadap kode aplikasi untuk menggunakan bendera fitur atau mendukung pengujian A/B. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS11-BP02 Lakukan analisis pasca-insiden](ops_evolve_ops_perform_rca_process.md) - Belajar dari insiden adalah pendorong penting untuk inovasi bersama dengan eksperimen. 
+  [OPS11-BP03 Menerapkan loop umpan balik](ops_evolve_ops_feedback_loops.md) - Loop umpan balik adalah bagian penting dari eksperimen. 

 **Dokumen terkait:** 
+ [ Pandangan Bagian Dalam Budaya Amazon: Eksperimen, Kegagalan, dan Obsesi Pelanggan ](https://aws.amazon.com/blogs/industries/an-inside-look-at-the-amazon-culture-experimentation-failure-and-customer-obsession/)
+ [ Praktik terbaik untuk membuat dan mengelola akun sandbox di AWS](https://aws.amazon.com/blogs/mt/best-practices-creating-managing-sandbox-accounts-aws/)
+ [ Buat Budaya Eksperimen yang Diaktifkan oleh Cloud ](https://aws.amazon.com/blogs/enterprise-strategy/create-a-culture-of-experimentation-enabled-by-the-cloud/)
+ [ Mengaktifkan eksperimen dan inovasi di cloud di Sulamérica Seguros ](https://aws.amazon.com/blogs/mt/enabling-experimentation-and-innovation-in-the-cloud-at-sulamerica-seguros/)
+ [ Eksperimen Lebih Banyak, Lebih Sedikit Gagal ](https://aws.amazon.com/blogs/enterprise-strategy/experiment-more-fail-less/)
+ [ Mengatur Lingkungan AWS Anda dengan Menggunakan Beberapa Akun - Sandbox OU ](https://docs.aws.amazon.com/whitepapers/latest/organizing-your-aws-environment/sandbox-ou.html)
+ [ Menggunakan AWS AppConfig Feature Flag ](https://aws.amazon.com/blogs/mt/using-aws-appconfig-feature-flags/)

 **Video terkait:** 
+ [AWS on Air ft. Amazon CloudWatch Evidently \$1 Peristiwa AWS](https://www.youtube.com/watch?v=ydX7lRNKAOo)
+ [AWS on Air San Fran Summit 2022 ft. Integrasi AWS AppConfig Feature Flags dengan Jira ](https://www.youtube.com/watch?v=miAkZPtjqHg)
+ [AWS re:Invent 2022 - Deployment bukan perilisan: Kontrol peluncuran Anda dengan bendera fitur (BOA305-R) ](https://www.youtube.com/watch?v=uouw9QxVrE8)
+ [ Buat Akun AWS Secara Pemrograman dengan AWS Control Tower](https://www.youtube.com/watch?v=LxxQTPdSFgw)
+ [ Menyiapkan Lingkungan Multi-Akun AWS yang Menggunakan Praktik Terbaik untuk AWS Organizations](https://www.youtube.com/watch?v=uOrq8ZUuaAQ)

 **Contoh terkait:** 
+ [ Sandbox Inovasi AWS](https://aws.amazon.com/solutions/implementations/aws-innovation-sandbox/)
+ [ Personalisasi End-to-End 101 untuk E-Commerce ](https://catalog.workshops.aws/personalize-101-ecommerce/en-US/labs/ab-testing)

 **Layanan terkait:** 
+  [Amazon CloudWatch Evidently](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-Evidently.html) 
+  [AWS AppConfig](https://docs.aws.amazon.com/appconfig/latest/userguide/what-is-appconfig.html) 
+  [AWS Control Tower](https://docs.aws.amazon.com/controltower/latest/userguide/what-is-control-tower.html) 

# OPS03-BP06 Mendorong dan mendukung para anggota tim untuk mempertahankan dan mengembangkan tingkat keterampilan mereka
<a name="ops_org_culture_team_enc_learn"></a>

 Tim harus mengembangkan tingkat keterampilan mereka untuk mengadopsi perkembangan teknologi, serta untuk mengimbangi perubahan permintaan dan tanggung jawab dalam mendukung beban kerja Anda. Perkembangan keterampilan menggunakan teknologi dapat menjadi sumber kepuasan tim dan mendorong inovasi. Dukung anggota tim Anda untuk mendapatkan dan mempertahankan sertifikasi industri yang memvalidasi dan mengakui perkembangan keterampilan mereka. Terapkan pelatihan silang untuk mendorong transfer pengetahuan dan meminimalkan dampak signifikan yang terjadi karena kehilangan anggota tim berpengalaman yang memiliki keterampilan dan pengetahuan terkait lembaga. Berikan waktu khusus yang terstruktur untuk pembelajaran. 

 AWS menyediakan sumber daya, termasuk [Memulai Pusat Sumber Daya AWS](https://aws.amazon.com/getting-started/), [Blog AWS](https://aws.amazon.com/blogs/), [Bincang Teknologi Online AWS](https://aws.amazon.com/getting-started/), [Acara dan Webinar AWS](https://aws.amazon.com/events/), dan [Lab AWS Well-Architected](https://wellarchitectedlabs.com/), yang memberikan panduan, contoh, dan panduan terperinci untuk mendidik tim Anda. 

 Sumber daya seperti [Dukungan](https://aws.amazon.com/premiumsupport/programs/), ([AWS re:Post](https://repost.aws/), [Pusat Dukungan](https://console.aws.amazon.com/support/home/)), dan [Dokumentasi AWS](https://docs.aws.amazon.com/whitepapers/latest/aws-security-incident-response-guide/welcome.html) akan membantu menghilangkan hambatan teknis dan memperbaiki operasi. Hubungi Dukungan melalui Pusat Dukungan jika Anda memiliki pertanyaan. 

 AWS juga membagikan praktik dan pola-pola terbaik yang telah kami pelajari melalui pengoperasian AWS di [Amazon Builders' Library](https://aws.amazon.com/builders-library/) dan berbagai macam materi pendidikan lainnya yang bermanfaat melalui [Blog AWS](https://aws.amazon.com/blogs/) dan [Siniar Resmi AWS](https://aws.amazon.com/podcasts/aws-podcast/). 

 [AWS Training dan Sertifikasi](https://aws.amazon.com/training/) mencakup pelatihan gratis melalui kursus digital mandiri, bersama dengan rencana pembelajaran berdasarkan peran atau domain. Anda juga dapat mengikuti pelatihan yang dibimbing oleh instruktur untuk mendukung perkembangan keterampilan AWS tim Anda. 

 **Hasil yang diinginkan:** Organisasi Anda terus-menerus melakukan evaluasi terhadap kesenjangan keterampilan yang terjadi dan mengatasinya dengan membuat anggaran dan menanamkan investasi yang terstruktur. Tim mendorong dan mendukung para anggota mereka dengan aktivitas-aktivitas peningkatan keterampilan, misalnya dengan memperoleh sertifikasi industri terkemuka. Tim memanfaatkan program berbagi pengetahuan khusus seperti sesi makan siang sambil belajar, hari imersi, hackathon, dan game day. Organisasi Anda menjaga sistem pengetahuannya agar tetap mutakhir dan relevan untuk melatih silang para anggota tim, termasuk pelatihan orientasi karyawan baru. 

 **Anti-pola umum:** 
+  Dengan tidak adanya program pelatihan dan anggaran yang terstruktur, tim akan mengalami ketidakpastian saat mereka mencoba mengimbangi perkembangan teknologi, dan hal ini akan mengakibatkan meningkatnya gesekan. 
+  Sebagai bagian dari migrasi ke AWS, organisasi Anda menunjukkan adanya kesenjangan keterampilan dan beragamnya tingkat penguasaan keterampilan di antara tim. Tanpa upaya untuk meningkatkan keterampilan, tim akan mendapati diri mereka terbebani dengan manajemen warisan dan tidak efisien dari lingkungan cloud yang akan menyebabkan meningkatnya kerja keras yang harus dilakukan operator. Kelelahan fisik dan mental ini akan meningkatkan tingkat ketidakpuasan karyawan. 

 **Manfaat menerapkan praktik terbaik ini:** Ketika organisasi Anda secara sadar berinvestasi dalam meningkatkan keterampilan timnya, hal itu juga akan membantu mempercepat dan meningkatkan skala adopsi dan pengoptimalan cloud. Program pembelajaran yang tertarget dapat mendorong inovasi dan membangun kemampuan operasional bagi tim agar mereka siap menangani peristiwa-peristiwa yang terjadi. Tim secara sadar berinvestasi untuk mengimplementasikan dan mengembangkan praktik terbaik. Tim memiliki semangat yang tinggi, dan anggota tim menghargai kontribusi mereka terhadap bisnis. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Untuk mengadopsi teknologi baru, mendorong inovasi, dan mengimbangi laju perubahan-perubahan yang terjadi pada permintaan dan tanggung jawab untuk mendukung beban kerja Anda, teruslah berinvestasi dalam pertumbuhan profesional tim Anda. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  **Gunakan program advokasi cloud terstruktur:** [AWS Skills Guild](https://aws.amazon.com/training/teams/aws-skills-guild/) menyediakan pelatihan konsultatif untuk meningkatkan kepercayaan keterampilan cloud dan memicu budaya pembelajaran yang berkelanjutan. 

1.  **Sediakan sumber daya untuk kepentingan edukasi:** Sediakan waktu khusus yang terstruktur, akses ke materi pelatihan, sumber daya lab, dan dukung partisipasi untuk mengikuti konferensi dan akses ke organisasi profesional yang memberikan kesempatan untuk belajar dari pendidik dan rekan. Berikan akses kepada anggota tim junior Anda agar dia bisa belajar dari anggota tim senior, atau biarkan anggota tim junior mengamati pekerjaan anggota tim senior serta melihat metode dan keterampilan mereka. Dorong pembelajaran tentang konten yang tidak terkait langsung dengan pekerjaan agar tim junior tersebut memiliki pandangan yang lebih luas. 

1.  **Dorong penggunaan sumber daya teknis ahli:** Manfaatkan sumber daya seperti [AWS Re:Post](https://repost.aws/) untuk mendapatkan akses ke pengetahuan-pengetahuan pilihan dan komunitas yang dinamis. 

1.  **Membangun dan memelihara repositori pengetahuan terkini:** Gunakan platform berbagi pengetahuan, misalnya wiki dan runbook. Buat sumber pengetahuan pakar Anda sendiri yang dapat digunakan kembali dengan [AWS re:Post Private](https://aws.amazon.com/repost-private/) untuk merampingkan kolaborasi dan meningkatkan produktivitas serta mempercepat proses onboarding karyawan. 

1.  **Edukasi tim dan interaksi antar-tim:** Buat rencana untuk kebutuhan anggota tim terkait pembelajaran berkelanjutan. Berikan kesempatan kepada para anggota tim untuk bergabung dengan tim-tim yang lain (baik sementara atau pun seterusnya) agar mereka bisa berbagi keterampilan dan praktik terbaik yang bermanfaat bagi organisasi Anda. 

1.  **Dukung untuk mendapatkan dan mempertahankan sertifikasi industri:** Dukung para anggota tim Anda dalam melakukan proses akuisisi dan pemeliharaan atas sertifikasi industri yang memberikan validasi atas kemampuan yang telah mereka pelajari, serta berikan pengakuan atas pencapaian-pencapaian yang mereka raih. 

 **Tingkat upaya untuk rencana implementasi:** Tinggi 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS03-BP01 Memberikan sponsor eksekutif](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_org_culture_executive_sponsor.html) 
+  [OPS11-BP04 Menjalankan manajemen pengetahuan](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_evolve_ops_knowledge_management.html) 

 **Dokumen terkait:** 
+  [Laporan Resmi AWS \$1 Kerangka Kerja Adopsi Cloud: Perspektif Orang-orang](https://docs.aws.amazon.com/whitepapers/latest/aws-caf-people-perspective/aws-caf-people-perspective.html) 
+  [Berinvestasi dalam pembelajaran berkelanjutan untuk mengembangkan masa depan organisasi Anda](https://aws.amazon.com/blogs/publicsector/investing-continuous-learning-grow-organizations-future/) 
+  [AWS Skills Guild](https://aws.amazon.com/training/teams/aws-skills-guild/) 
+  [AWS Training dan Sertifikasi](https://aws.amazon.com/training/) 
+  [Dukungan](https://aws.amazon.com/premiumsupport/programs/) 
+  [AWS re:Post](https://repost.aws/) 
+  [Pusat Sumber Daya untuk Memulai AWS](https://aws.amazon.com/getting-started/) 
+  [Blog AWS](https://aws.amazon.com/blogs/) 
+  [Kepatuhan AWS Cloud](https://aws.amazon.com/compliance/) 
+  [AWS Dokumentasi](https://docs.aws.amazon.com/whitepapers/latest/aws-security-incident-response-guide/welcome.html) 
+  [Siniar Resmi AWS](https://aws.amazon.com/podcasts/aws-podcast/). 
+  [Bincang Teknologi Online AWS](https://aws.amazon.com/getting-started/) 
+  [Acara dan Webinar AWS](https://aws.amazon.com/events/) 
+  [Lab AWS Well-Architected](https://wellarchitectedlabs.com/) 
+  [Amazon Builders' Library](https://aws.amazon.com/builders-library/) 

 **Video terkait:** 
+  [AWS re:Invent 2023 \$1 Menyempurnakan keterampilan dengan kecepatan cloud: Mengubah karyawan menjadi wirausahawan](https://www.youtube.com/watch?v=Ax7JqIDIXEY) 
+  [WS re:Invent 2023 \$1 Membangun budaya keingintahuan melalui gamifikasi](https://www.youtube.com/watch?v=EqWvSBAmD3w) 

# OPS03-BP07 Tim sumber daya dengan tepat
<a name="ops_org_culture_team_res_appro"></a>

 Sediakan anggota tim mahir dalam jumlah yang tepat, serta sediakan alat dan sumber daya untuk mendukung kebutuhan beban kerja Anda. Anggota tim yang terlalu terbebani dapat meningkatkan risiko terjadinya kesalahan manusia. Berinvestasi dalam alat dan sumber daya, seperti otomatisasi, dapat meningkatkan (menskalakan) efektivitas tim Anda dan akan membantu mereka dalam mendukung lebih banyak beban kerja tanpa memerlukan kapasitas tambahan. 

 **Hasil yang diinginkan:** 
+  Anda telah mengatur tim Anda dengan tepat untuk mendapatkan keahlian yang dibutuhkan bagi mereka untuk mengoperasikan beban kerja sesuai dengan rencana migrasi Anda. AWS Karena tim Anda telah meningkatkan dirinya sendiri selama proyek migrasi Anda, mereka telah memperoleh kemahiran dalam AWS teknologi inti yang direncanakan bisnis untuk digunakan saat memigrasi atau memodernisasi aplikasi mereka. 
+  Anda telah menyelaraskan rencana jumlah personel Anda dengan hati-hati untuk memanfaatkan sumber daya secara efisien dengan memanfaatkan otomatisasi dan alur kerja. Tim yang lebih kecil sekarang dapat mengelola lebih banyak infrastruktur atas nama tim pengembangan aplikasi. 
+  Dengan perubahan prioritas operasional, kendala-kendala yang dihadapi personel sumber daya diidentifikasi secara proaktif untuk melindungi keberhasilan inisiatif bisnis. 
+  Metrik-metrik operasional yang melaporkan kerja keras operasional (seperti kelelahan akibat kondisi siaga atau pemanggilan yang berlebihan) ditinjau untuk memastikan bahwa personel tidak kewalahan. 

 **Anti-pola umum:** 
+  Staf Anda belum meningkatkan AWS keterampilan saat Anda mendekati rencana migrasi cloud multi-tahun Anda, yang berisiko mendukung beban kerja dan menurunkan moral karyawan. 
+  Seluruh organisasi IT Anda sedang beralih ke cara-cara kerja tangkas. Bisnis memprioritaskan portofolio produk dan menetapkan metrik-metrik untuk fitur apa saja yang perlu dikembangkan terlebih dahulu. Proses tangkas Anda tidak mengharuskan tim untuk menetapkan story point ke rencana kerja mereka. Akibatnya, mustahil bagi Anda untuk mengetahui tingkat kapasitas yang dibutuhkan untuk jumlah pekerjaan berikutnya, atau apakah Anda memiliki keterampilan yang tepat yang ditugaskan untuk pekerjaan tersebut. 
+  Anda meminta AWS mitra memigrasi beban kerja Anda, dan Anda tidak memiliki rencana transisi dukungan untuk tim Anda setelah mitra menyelesaikan proyek migrasi. Tim Anda mengalami kesulitan untuk mendukung beban kerja secara efisien dan efektif. 

 **Manfaat menerapkan praktik terbaik ini:** Anda memiliki anggota tim yang terampil yang tersedia di dalam organisasi Anda untuk mendukung beban kerja. Alokasi sumber daya dapat beradaptasi dengan perubahan prioritas tanpa memengaruhi kinerja. Hasilnya adalah tim yang mahir dalam mendukung beban kerja sambil memaksimalkan waktu untuk berkonsentrasi pada inovasi bagi pelanggan, yang pada gilirannya meningkatkan kepuasan karyawan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Perencanaan sumber daya untuk migrasi cloud Anda harus dilakukan pada level organisasi yang selaras dengan rencana migrasi Anda, dan model operasi yang diinginkan yang sedang diimplementasikan untuk mendukung lingkungan cloud baru Anda. Ini harus mencakup pemahaman tentang teknologi-teknologi cloud mana yang di-deploy untuk tim pengembangan aplikasi dan bisnis. Pimpinan infrastruktur dan operasi harus merencanakan analisis kesenjangan keterampilan, pelatihan, dan penetapan peran untuk para rekayasawan yang memimpin adopsi cloud. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  Tentukan kriteria keberhasilan untuk keberhasilan tim dengan metrik-metrik operasional yang relevan seperti produktivitas personel (misalnya, biaya untuk mendukung beban kerja tertentu atau jam operator yang dihabiskan selama insiden). 

1.  Tetapkan perencanaan kapasitas sumber daya dan mekanisme inspeksi untuk memastikan bahwa keseimbangan yang tepat dari kapasitas yang memenuhi syarat benar-benar tersedia saat diperlukan dan dapat disesuaikan dari waktu ke waktu. 

1.  Ciptakan mekanisme (misalnya, mengirimkan survei bulanan kepada tim) untuk memahami tantangan-tantangan terkait pekerjaan yang memengaruhi tim (seperti meningkatnya tanggung jawab, perubahan teknologi, kehilangan personel, atau peningkatan pelanggan yang didukung). 

1.  Gunakan mekanisme-mekanisme tersebut untuk berinteraksi dengan tim dan menemukan tren yang mungkin menjadi faktor tantangan produktivitas karyawan. Ketika ada faktor eksternal yang memengaruhi kinerja tim Anda, lakukan evaluasi kembali tujuan dan sesuaikan target sebagaimana mestinya. Identifikasi rintangan yang menghambat kemajuan tim Anda. 

1.  Lakukan peninjauan secara rutin mengenai apakah sumber daya yang saat ini disediakan masih memadai, atau apakah diperlukan sumber daya tambahan, dan lakukan penyesuaian yang tepat untuk mendukung tim. 

 **Tingkat upaya untuk rencana implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS03-BP06 Anggota tim didorong untuk mempertahankan dan mengembangkan keahlian mereka](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_org_culture_team_enc_learn.html) 
+  [OPS09-BP03 Meninjau metrik operasi dan memprioritaskan peningkatan](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_operations_health_review_ops_metrics_prioritize_improvement.html) 
+  [OPS10-BP01 Gunakan proses untuk manajemen peristiwa, insiden, dan masalah](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_event_response_event_incident_problem_process.html) 
+  [OPS10-BP07 Otomatiskan tanggapan terhadap acara](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_event_response_auto_event_response.html) 

 **Dokumen terkait:** 
+  [AWS Cloud Kerangka Adopsi: Perspektif Orang](https://docs.aws.amazon.com/whitepapers/latest/aws-caf-people-perspective/aws-caf-people-perspective.html) 
+  [Menjadi Perusahaan yang Siap Menghadapi Masa Depan](https://aws.amazon.com/blogs/enterprise-strategy/becoming-a-future-ready-enterprise/) 
+  [Prioritaskan Keterampilan Karyawan Anda untuk Mendorong Pertumbuhan Bisnis](https://aws.amazon.com/executive-insights/content/prioritize-your-employees-skills-to-drive-business-growth/) 
+  [Organisasi berkinerja tinggi - Tim Dua-Pizza Amazon](https://aws.amazon.com/executive-insights/content/amazon-two-pizza-team/) 
+  [Bagaimana Perusahaan dengan Pemanfaatan Cloud yang Matang Meraih Kesuksesannya](https://aws.amazon.com/blogs/mt/how-cloud-mature-enterprises-succeed/) 

# Persiapkan
<a name="a-prepare"></a>

**Topics**
+ [OPS 4. Bagaimana Anda mengimplementasikan observabilitas dalam beban kerja Anda?](ops-04.md)
+ [OPS 5. Bagaimana cara mengurangi kecacatan, mempermudah perbaikan, dan meningkatkan aliran ke dalam produksi?](ops-05.md)
+ [OPS 6. Bagaimana cara memitigasi risiko deployment?](ops-06.md)
+ [OPS 7. Bagaimana cara mengetahui bahwa Anda siap untuk mendukung beban kerja?](ops-07.md)

# OPS 4. Bagaimana Anda mengimplementasikan observabilitas dalam beban kerja Anda?
<a name="ops-04"></a>

Terapkan observabilitas dalam beban kerja Anda sehingga Anda dapat memahami statusnya dan membuat keputusan berbasis data berdasarkan persyaratan bisnis.

**Topics**
+ [OPS04-BP01 Identifikasi indikator kinerja utama](ops_observability_identify_kpis.md)
+ [OPS04-BP02 Melaksanakan telemetri aplikasi](ops_observability_application_telemetry.md)
+ [OPS04-BP03 Menerapkan telemetri pengalaman pengguna](ops_observability_customer_telemetry.md)
+ [OPS04-BP04 Mengimplementasikan telemetri dependensi](ops_observability_dependency_telemetry.md)
+ [OPS04-BP05 Melaksanakan penelusuran terdistribusi](ops_observability_dist_trace.md)

# OPS04-BP01 Identifikasi indikator kinerja utama
<a name="ops_observability_identify_kpis"></a>

 Untuk mengimplementasikan observabilitas dalam beban kerja, Anda memulainya dengan memahami statusnya dan mengambil keputusan berbasis data berdasarkan persyaratan bisnis. Salah satu cara paling efektif untuk memastikan keselarasan antara kegiatan pemantauan dan tujuan bisnis adalah dengan mendefinisikan dan memantau indikator kinerja utama ()KPIs. 

 **Hasil yang diinginkan:** Praktik-praktik observabilitas yang efisien yang sangat selaras dengan tujuan bisnis, sehingga memastikan upaya pemantauan selalu memenuhi hasil bisnis yang nyata. 

 **Anti-pola umum:** 
+  Tidak terdefinisiKPIs: Bekerja tanpa jelas KPIs dapat menyebabkan pemantauan terlalu banyak atau terlalu sedikit, kehilangan sinyal vital. 
+  StatisKPIs: Tidak meninjau kembali atau menyempurnakan KPIs karena beban kerja atau tujuan bisnis berkembang. 
+  Ketidakselarasan: Berfokus pada metrik-metrik teknis yang tidak berkorelasi langsung dengan hasil bisnis atau yang lebih sulit untuk berkorelasi dengan masalah-masalah dunia nyata. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Kemudahan identifikasi masalah: Bisnis KPIs sering memunculkan masalah lebih jelas daripada metrik teknis. Penurunan dalam bisnis KPI dapat menunjukkan masalah dengan lebih efektif daripada memilah-milah berbagai metrik teknis. 
+  Keselarasan bisnis: Memastikan bahwa kegiatan pemantauan secara langsung adalah aktivitas yang mendukung tujuan bisnis. 
+  Efisiensi: Prioritaskan untuk melakukan pemantauan sumber daya dan memberikan perhatian pada metrik-metrik yang penting. 
+  Proaktif: Kenali dan atasi masalah sebelum masalah itu memunculkan dampak bisnis yang lebih luas. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Untuk secara efektif mendefinisikan beban kerjaKPIs: 

1.  **Mulai dengan hasil bisnis:** Sebelum menyelami metrik, pahami dahulu hasil bisnis yang diinginkan. Apakah peningkatan penjualan, keterlibatan pengguna yang lebih tinggi, atau waktu respons yang lebih cepat? 

1.  **Korelasikan metrik teknis dengan tujuan bisnis:** Tidak semua metrik teknis memiliki dampak langsung pada hasil bisnis Anda. Identifikasi mereka yang melakukannya, tetapi seringkali lebih mudah untuk mengidentifikasi masalah menggunakan bisnis. KPI 

1.  **Gunakan [Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html):** Gunakan CloudWatch untuk menentukan dan memantau metrik yang mewakili Anda. KPIs 

1.  **Tinjau dan perbarui secara teraturKPIs:** Saat beban kerja dan bisnis Anda berkembang, jaga agar tetap relevan. KPIs 

1.  **Libatkan pemangku kepentingan:** Libatkan tim teknis dan bisnis dalam mendefinisikan dan meninjau. KPIs 

 **Tingkat upaya untuk rencana implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+ [OPS04-BP02 Melaksanakan telemetri aplikasi](ops_observability_application_telemetry.md)
+ [OPS04-BP03 Menerapkan telemetri pengalaman pengguna](ops_observability_customer_telemetry.md)
+ [OPS04-BP04 Mengimplementasikan telemetri dependensi](ops_observability_dependency_telemetry.md)
+ [OPS04-BP05 Melaksanakan penelusuran terdistribusi](ops_observability_dist_trace.md)

 **Dokumen terkait:** 
+ [AWS Praktik Terbaik Observabilitas](https://aws-observability.github.io/observability-best-practices/)
+ [ CloudWatch Panduan Pengguna](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html)
+ [AWS Kursus Pembuat Keterampilan Observabilitas](https://explore.skillbuilder.aws/learn/course/external/view/elearning/14688/aws-observability)

 **Video terkait:** 
+ [ Mengembangkan strategi observabilitas ](https://www.youtube.com/watch?v=Ub3ATriFapQ)

 **Contoh terkait:** 
+  [Lokakarya Satu Observabilitas](https://catalog.workshops.aws/observability/en-US) 

# OPS04-BP02 Melaksanakan telemetri aplikasi
<a name="ops_observability_application_telemetry"></a>

 Telemetri aplikasi berfungsi sebagai fondasi observabilitas beban kerja Anda. Sangat penting bagi Anda untuk menghadirkan telemetri yang menawarkan wawasan yang dapat ditindaklanjuti tentang keadaan aplikasi Anda serta pencapaian hasil teknis dan bisnis. Dari pemecahan masalah hingga mengukur dampak fitur baru atau memastikan keselarasan dengan indikator kinerja kunci bisnis (KPIs), telemetri aplikasi menginformasikan cara Anda membangun, mengoperasikan, dan mengembangkan beban kerja Anda. 

 Metrik, log, dan jejak merupakan tiga pilar observabilitas utama. Ketiganya berfungsi sebagai alat diagnostik yang mampu menggambarkan keadaan aplikasi Anda. Seiring waktu, tiga hal ini akan membantu menciptakan garis acuan dan mengidentifikasi setiap anomali. Namun, untuk memastikan keselarasan antara kegiatan pemantauan dan tujuan bisnis, penting untuk menentukan dan memantau. KPIs Bisnis KPIs sering membuatnya lebih mudah untuk mengidentifikasi masalah dibandingkan dengan metrik teknis saja. 

 Jenis telemetri lainnya, seperti pemantauan pengguna nyata (RUM) dan transaksi sintetis, melengkapi sumber data primer ini. RUMmenawarkan wawasan tentang interaksi pengguna waktu nyata, sedangkan transaksi sintetis mensimulasikan perilaku pengguna potensial, membantu mendeteksi kemacetan sebelum pengguna nyata menghadapinya. 

 **Hasil yang diinginkan:** Dapatkan wawasan yang dapat ditindaklanjuti mengenai performa beban kerja Anda. Wawasan ini akan memungkinkan Anda untuk mengambil keputusan yang proaktif tentang optimalisasi performa, mencapai peningkatan stabilitas beban kerja, merampingkan proses CI/CD, dan memanfaatkan sumber daya secara efektif. 

 **Anti-pola umum:** 
+  **Observabilitas yang tidak lengkap:** Mengabaikan penggunaan observabilitas di setiap lapisan beban kerja, sehingga mengakibatkan titik buta yang dapat membuat performa sistem vital dan wawasan perilaku menjadi tidak jelas. 
+  **Tampilan data terfragmentasi:** Ketika data tersebar di beberapa alat dan sistem, mempertahankan pandangan yang menyeluruh tentang kondisi dan performa beban kerja Anda akan menjadi sesuatu yang sulit dilakukan. 
+  **Masalah yang dilaporkan pengguna:** Tanda bahwa deteksi masalah proaktif melalui telemetri dan pemantauan bisnis kurang. KPI 

 **Manfaat menjalankan praktik terbaik ini:** 
+  **Pengambilan keputusan berdasarkan informasi:** Dengan wawasan dari telemetri dan bisnisKPIs, Anda dapat membuat keputusan berbasis data. 
+  **Peningkatan efisiensi operasional:** Pemanfaatan sumber daya berbasis data akan menghasilkan efektivitas biaya. 
+  **Penyempurnaan stabilitas beban kerja:** Deteksi dan penyelesaian masalah yang lebih cepat akan menghasilkan peningkatan waktu aktif. 
+  **Perampingan proses CI/CD:** Wawasan dari data telemetri dapat memfasilitasi penyempurnaan proses dan pengiriman kode yang andal. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 [Untuk menerapkan telemetri aplikasi untuk beban kerja Anda, gunakan layanan AWS seperti Amazon dan. CloudWatch [AWS X-Ray](https://aws.amazon.com/xray/)](https://aws.amazon.com/cloudwatch/) Amazon CloudWatch menyediakan rangkaian alat pemantauan yang komprehensif, memungkinkan Anda mengamati sumber daya dan aplikasi di dalam AWS dan lingkungan lokal. Layanan ini mengumpulkan, melacak, dan menganalisis metrik, menggabungkan dan memantau data log, dan memberikan respons terhadap perubahan yang terjadi dalam sumber daya Anda, menyempurnakan pemahaman Anda tentang bagaimana beban kerja Anda beroperasi. Secara bersamaan, AWS X-Ray memungkinkan Anda melacak, menganalisis, dan men-debug aplikasi Anda, memberi Anda pemahaman mendalam tentang perilaku beban kerja Anda. Dengan fitur seperti peta layanan, distribusi latensi, dan jadwal penelusuran, AWS X-Ray memberikan wawasan tentang kinerja beban kerja Anda dan hambatan yang mempengaruhinya. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  **Identifikasi data apa yang akan dikumpulkan:** Pastikan metrik, log, dan jejak penting yang akan menawarkan wawasan substansial tentang kondisi, performa, dan perilaku beban kerja Anda. 

1.  **Menyebarkan [CloudWatchagen: Agen](https://aws.amazon.com/cloudwatch/)** berperan penting dalam pengadaan metrik dan log sistem dan aplikasi dari beban kerja Anda dan infrastruktur dasarnya. CloudWatch CloudWatch Agen juga dapat digunakan untuk mengumpulkan OpenTelemetry atau jejak X-Ray dan mengirimkannya ke X-Ray. 

1.  **Menerapkan deteksi anomali untuk log dan metrik:** Gunakan deteksi [anomali CloudWatch Log dan deteksi anomali CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/LogsAnomalyDetection.html) [Metrik untuk secara otomatis mengidentifikasi aktivitas yang tidak biasa](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) dalam operasi aplikasi Anda. Alat-alat ini menggunakan algoritma machine learning untuk mendeteksi dan memberikan peringatan tentang anomali yang ditemukan, yang dapat meningkatkan kemampuan pemantauan Anda dan mempercepat waktu respons terhadap adanya potensi gangguan atau ancaman keamanan. Siapkan fitur-fitur ini untuk mengelola kesehatan dan keamanan aplikasi secara proaktif. 

1.  **Mengamankan data log sensitif:** Gunakan [perlindungan data Amazon CloudWatch Logs](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/mask-sensitive-log-data.html) untuk menutupi informasi sensitif di dalam log Anda. Fitur ini akan membantu Anda menjaga privasi dan kepatuhan dengan melakukan deteksi otomatis dan pengaburan data sensitif sebelum diakses. Menerapkan penyembunyian data untuk menangani dan melindungi detail sensitif dengan aman seperti informasi yang dapat diidentifikasi secara pribadi (). PII 

1.  **Tentukan dan pantau bisnisKPIs:** Tetapkan [metrik khusus](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/publishingMetrics.html) yang selaras dengan hasil [bisnis](https://aws-observability.github.io/observability-best-practices/guides/operational/business/monitoring-for-business-outcomes/) Anda. 

1.  **Instrumentasikan aplikasi Anda dengan AWS X-Ray:** Selain menggunakan CloudWatch agen, penting untuk [menginstruksikan aplikasi Anda](https://docs.aws.amazon.com/xray/latest/devguide/xray-instrumenting-your-app.html) untuk memancarkan data jejak. Proses ini dapat memberikan wawasan lebih lanjut tentang perilaku dan performa beban kerja Anda. 

1.  **Standardisasi pengumpulan data di seluruh aplikasi Anda:** Lakukan standardisasi terhadap praktik-praktik pengumpulan data di seluruh aplikasi Anda. Keseragaman bermanfaat dalam mengorelasikan dan menganalisis data, sehingga itu akan memberikan pandangan yang komprehensif tentang perilaku aplikasi Anda. 

1.  **Menerapkan observabilitas lintas akun:** Tingkatkan efisiensi pemantauan di beberapa akun dengan observabilitas [ CloudWatch lintas akun Akun AWS Amazon](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-Unified-Cross-Account.html). Dengan fitur ini, Anda dapat menggabungkan metrik, log, dan alarm dari akun yang berbeda ke dalam satu tampilan, yang menyederhanakan manajemen dan meningkatkan waktu respons untuk masalah yang diidentifikasi di seluruh lingkungan organisasi Anda. AWS 

1.  **Menganalisis dan bertindak berdasarkan data:** Setelah pengumpulan dan normalisasi data dilakukan, gunakan [Amazon CloudWatch](https://aws.amazon.com/cloudwatch/features/) untuk analisis metrik dan log, dan [AWS X-Ray](https://aws.amazon.com/xray/features/)untuk analisis jejak. Analisis tersebut dapat menghasilkan wawasan penting tentang kondisi, performa, dan perilaku beban kerja Anda, sehingga dapat memandu Anda dalam proses pengambilan keputusan. 

 **Tingkat upaya untuk rencana implementasi:** Tinggi 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS04-BP01 Tentukan beban kerja KPIs](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_identify_kpis.html) 
+  [OPS04-BP03 Melaksanakan telemetri aktivitas pengguna](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_customer_telemetry.html) 
+  [OPS04-BP04 Menerapkan telemetri ketergantungan](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_dependency_telemetry.html) 
+  [OPS04-BP05 Menerapkan ketertelusuran transaksi](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_dist_trace.html) 

 **Dokumen terkait:** 
+  [Praktik Terbaik Observabilitas AWS](https://aws-observability.github.io/observability-best-practices/) 
+  [Panduan Pengguna CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) 
+  [AWS X-Ray Panduan Pengembang](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html) 
+  [Menginstrumentasikan sistem terdistribusi untuk visibilitas operasional](https://aws.amazon.com/builders-library/instrumenting-distributed-systems-for-operational-visibility) 
+  [Kursus Skill Builder Observabilitas AWS](https://explore.skillbuilder.aws/learn/course/external/view/elearning/14688/aws-observability) 
+  [Apa yang Baru dengan Amazon CloudWatch](https://aws.amazon.com/about-aws/whats-new/management-and-governance/?whats-new-content.sort-by=item.additionalFields.postDateTime&whats-new-content.sort-order=desc&awsf.whats-new-products=general-products%23amazon-cloudwatch) 
+  [Apa yang baru dengan AWS X-Ray](https://aws.amazon.com/about-aws/whats-new/developer-tools/?whats-new-content.sort-by=item.additionalFields.postDateTime&whats-new-content.sort-order=desc&awsf.whats-new-products=general-products%23aws-x-ray) 

 **Video terkait:** 
+  [AWS re:invent 2022 - Praktik terbaik observabilitas di Amazon](https://youtu.be/zZPzXEBW4P8) 
+  [AWS re:invent 2022 - Mengembangkan strategi observabilitas](https://youtu.be/Ub3ATriFapQ) 

 **Contoh terkait:** 
+  [Lokakarya Satu Observabilitas](https://catalog.workshops.aws/observability) 
+  [AWS Perpustakaan Solusi: Pemantauan Aplikasi dengan Amazon CloudWatch](https://aws.amazon.com/solutions/implementations/application-monitoring-with-cloudwatch) 

# OPS04-BP03 Menerapkan telemetri pengalaman pengguna
<a name="ops_observability_customer_telemetry"></a>

 Memperoleh wawasan yang mendalam tentang pengalaman dan interaksi pelanggan dengan aplikasi Anda adalah hal yang krusial. Pemantauan pengguna nyata (RUM) dan transaksi sintetis berfungsi sebagai alat yang ampuh untuk tujuan ini. RUMmenyediakan data tentang interaksi pengguna nyata yang memberikan perspektif kepuasan pengguna tanpa filter, sementara transaksi sintetis mensimulasikan interaksi pengguna, membantu mendeteksi potensi masalah bahkan sebelum berdampak pada pengguna nyata. 

 **Hasil yang diinginkan:** Pandangan yang menyeluruh tentang pengalaman pelanggan, deteksi masalah yang proaktif, dan optimalisasi interaksi pengguna untuk memberikan pengalaman digital yang mulus (seamless). 

 **Anti-pola umum:** 
+  Aplikasi tanpa pemantauan pengguna nyata (RUM): 
  +  Deteksi masalah yang tertunda: TanpaRUM, Anda mungkin tidak menyadari kemacetan atau masalah kinerja hingga pengguna mengeluh. Pendekatan reaktif ini dapat menyebabkan pelanggan menjadi tidak puas. 
  +  Kurangnya wawasan pengalaman pengguna: Tidak menggunakan RUM berarti Anda kehilangan data penting yang menunjukkan bagaimana pengguna nyata berinteraksi dengan aplikasi Anda, sehingga membatasi kemampuan Anda untuk mengoptimalkan pengalaman pengguna. 
+  Aplikasi tanpa transaksi sintetis: 
  +  Kasus edge yang terlewatkan: Transaksi-transaksi sintetis akan membantu Anda untuk menguji jalur dan fungsi yang mungkin jarang digunakan oleh pengguna biasa, tetapi sangat penting untuk fungsi bisnis tertentu. Tanpanya, jalur-jalur tersebut bisa mengalami kesalahan fungsi dan luput dari perhatian. 
  +  Memeriksa masalah saat aplikasi tidak digunakan: Pengujian sintetis yang dilakukan secara rutin dapat memberikan simulasi saat-saat ketika pengguna nyata tidak berinteraksi secara aktif dengan aplikasi Anda, sehingga hal itu akan memastikan sistem selalu berfungsi dengan benar. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Deteksi masalah proaktif: Identifikasi dan atasi potensi masalah sebelum berdampak pada pengguna nyata. 
+  Pengalaman pengguna yang dioptimalkan: Umpan balik berkelanjutan dari RUM bantuan dalam menyempurnakan dan meningkatkan pengalaman pengguna secara keseluruhan. 
+  Wawasan tentang performa perangkat dan browser: Memahami performa aplikasi Anda di berbagai perangkat dan browser, sehingga memungkinkan optimalisasi lebih lanjut. 
+  Alur kerja bisnis yang divalidasi: Transaksi-transaksi sintetis rutin akan memastikan fungsionalitas inti dan jalur-jalur penting tetap berjalan dan efisien. 
+  Performa aplikasi yang ditingkatkan: Manfaatkan wawasan yang dikumpulkan dari data pengguna nyata untuk meningkatkan responsivitas dan keandalan aplikasi. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Untuk memanfaatkan RUM dan transaksi sintetis untuk telemetri aktivitas pengguna, AWS menawarkan layanan seperti Amazon dan [ CloudWatch RUMAmazon CloudWatch ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-RUM.html) [Synthetics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html). Metrik, log, dan jejak, ditambah dengan data aktivitas pengguna, memberikan sebuah pandangan yang komprehensif tentang status operasional aplikasi dan pengalaman pengguna. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  **Menerapkan Amazon CloudWatch RUM:** Integrasikan aplikasi Anda CloudWatch RUM untuk mengumpulkan, menganalisis, dan menyajikan data pengguna nyata. 

   1.  Gunakan [CloudWatch RUM JavaScript perpustakaan](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-RUM.html) untuk berintegrasi RUM dengan aplikasi Anda. 

   1.  Siapkan dasbor untuk memvisualisasikan dan memantau data pengguna nyata. 

1.  **Configure CloudWatch Synthetics:** Buat kenari, atau rutinitas skrip, yang mensimulasikan interaksi pengguna dengan aplikasi Anda. 

   1.  Tentukan alur kerja dan jalur aplikasi kritis. 

   1.  Desain kenari menggunakan skrip [CloudWatch Synthetics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html) untuk mensimulasikan interaksi pengguna untuk jalur ini. 

   1.  Jadwalkan dan pantau canary agar berjalan pada interval-interval tertentu, sehingga memastikan pemeriksaan performa yang konsisten. 

1.  **Menganalisis dan bertindak berdasarkan data:** Memanfaatkan data dari RUM dan transaksi sintetis untuk mendapatkan wawasan dan mengambil tindakan korektif ketika anomali terdeteksi. Gunakan CloudWatch dasbor dan alarm untuk tetap mendapat informasi. 

 **Tingkat upaya untuk rencana implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS04-BP01 Identifikasi indikator kinerja utama](ops_observability_identify_kpis.md) 
+  [OPS04-BP02 Melaksanakan telemetri aplikasi](ops_observability_application_telemetry.md) 
+  [OPS04-BP04 Mengimplementasikan telemetri dependensi](ops_observability_dependency_telemetry.md) 
+  [OPS04-BP05 Melaksanakan penelusuran terdistribusi](ops_observability_dist_trace.md) 

 **Dokumen terkait:** 
+ [ CloudWatch RUMPanduan Amazon](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-RUM.html)
+ [Panduan Amazon CloudWatch Synthetics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html)

 **Video terkait:** 
+ [Optimalkan aplikasi melalui wawasan pengguna akhir dengan Amazon CloudWatch RUM](https://www.youtube.com/watch?v=NMaeujY9A9Y)
+ [AWS di Air ft. Pemantauan Pengguna Nyata untuk Amazon CloudWatch](https://www.youtube.com/watch?v=r6wFtozsiVE)

 **Contoh terkait:** 
+ [ Lokakarya Satu Observabilitas ](https://catalog.workshops.aws/observability/en-US/intro)
+ [Git Repository untuk Amazon CloudWatch RUM Web Client](https://github.com/aws-observability/aws-rum-web)
+ [Menggunakan Amazon CloudWatch Synthetics untuk mengukur waktu buka halaman](https://github.com/aws-samples/amazon-cloudwatch-synthetics-page-performance)

# OPS04-BP04 Mengimplementasikan telemetri dependensi
<a name="ops_observability_dependency_telemetry"></a>

 Telemetri dependensi sangat penting untuk memantau kondisi dan performa layanan dan komponen eksternal yang diandalkan oleh beban kerja Anda. Hal ini memberikan wawasan berharga tentang keterjangkauan, batas waktu, dan peristiwa penting lainnya yang terkait dengan dependensi seperti DNS, basis data, atau API pihak ketiga. Ketika Anda menginstrumentasi aplikasi Anda agar menghasilkan metrik, log, dan jejak tentang dependensi ini, Anda mendapatkan pemahaman yang lebih jelas tentang potensi kemacetan, masalah performa, atau kegagalan yang dapat memengaruhi beban kerja Anda. 

 **Hasil yang diinginkan:** Pastikan bahwa dependensi yang diandalkan beban kerja Anda menunjukkan performa yang sesuai harapan, sehingga Anda dapat secara proaktif mengatasi masalah-masalah dan memastikan performa beban kerja yang optimal. 

 **Anti-pola umum:** 
+  **Mengabaikan dependensi eksternal:** Hanya berfokus pada metrik aplikasi internal sambil mengabaikan metrik yang berkaitan dengan dependensi eksternal. 
+  **Kurangnya pemantauan proaktif:** Menunggu masalah muncul alih-alih terus memantau kondisi dan performa dependensi. 
+  **Pemantauan model silo:** Menggunakan beberapa alat pemantauan yang berbeda-beda sehingga wawasan tentang kondisi dependensi menjadi terfragmentasi dan tidak konsisten. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  **Peningkatan keandalan beban kerja:** Dengan memastikan bahwa dependensi eksternal terus-menerus tersedia dan berkinerja optimal. 
+  **Deteksi dan penyelesaian masalah yang lebih cepat:** Secara proaktif mengidentifikasi dan menangani masalah pada dependensi sebelum berdampak pada beban kerja. 
+  **Pandangan menyeluruh:** Mendapatkan pandangan yang menyeluruh tentang komponen internal dan eksternal yang memengaruhi kondisi beban kerja. 
+  **Peningkatan skalabilitas beban kerja:** Dengan memahami batas skalabilitas dan karakteristik performa dependensi eksternal. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Implementasikan telemetri dependensi dengan memulai melakukan identifikasi layanan, infrastruktur, dan proses yang digunakan oleh beban kerja Anda. Ukur seperti apa kondisi yang baik ketika dependensi berfungsi sesuai harapan, kemudian tentukan data apa yang akan diperlukan untuk mengukur kondisi-kondisi itu. Dengan informasi tersebut, Anda dapat membuat dasbor dan peringatan yang memberikan wawasan kepada tim operasi Anda tentang status dependensi tersebut. Gunakan alat-alat AWS untuk menemukan dan mengukur dampak yang ditimbulkan ketika dependensi tidak dapat menunjukkan hasil yang sesuai kebutuhan. Selalu tinjau ulang strategi Anda agar memperhitungkan perubahan-perubahan dalam prioritas, sasaran, dan wawasan yang diperoleh. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

 Cara mengimplementasikan telemetri dependensi secara efektif: 

1.  **Identifikasi dependensi eksternal:** Lakukan kolaborasi dengan pemangku kepentingan untuk menentukan dependensi eksternal yang diandalkan oleh beban kerja Anda. Dependensi eksternal dapat mencakup layanan-layanan seperti basis data eksternal, API pihak ketiga, rute konektivitas jaringan ke lingkungan lain, dan layanan DNS. Langkah pertama menuju telemetri dependensi yang efektif adalah memiliki pemahaman yang menyeluruh tentang apa saja dependensi tersebut. 

1.  **Kembangkan strategi pemantauan:** Setelah Anda memiliki gambaran yang jelas tentang dependensi eksternal Anda, rancanglah strategi pemantauan yang disesuaikan dengan dependensi tersebut. Hal ini melibatkan pemahaman terhadap tingkat kekritisan setiap dependensi, perilaku yang diharapkan, dan perjanjian atau target tingkat layanan (SLA atau SLT) terkait. Siapkan peringatan proaktif untuk memberi tahu Anda tentang perubahan status atau penyimpangan-penyimpangan performa. 

1.  **Gunakan [pemantauan jaringan](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-Network-Monitoring-Sections.html):** Gunakan [Monitor Internet](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-InternetMonitor.html) dan [Monitor Jaringan](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/what-is-network-monitor.html), yang memberikan wawasan komprehensif mengenai kondisi internet dan jaringan global. Alat-alat ini akan membantu Anda untuk memahami dan merespons pemadaman, gangguan, atau penurunan kinerja yang memengaruhi dependensi eksternal Anda. 

1.  **Terus dapatkan informasi dengan [AWS Health](https://aws.amazon.com/premiumsupport/technology/aws-health/).** AWS Health adalah sumber informasi otoritatif tentang kondisi sumber daya AWS Cloud Anda. Gunakan AWS Health untuk memvisualisasikan dan menerima notifikasi tentang peristiwa layanan terkini dan perubahan yang akan datang, seperti peristiwa siklus hidup yang direncanakan, sehingga Anda dapat mengambil langkah-langkah untuk mengurangi dampaknya. 

   1.  [Buat notifikasi peristiwa AWS Health sesuai keperluan](https://docs.aws.amazon.com/health/latest/ug/user-notifications.html) yang dikirim ke saluran email dan obrolan melalui [Notifikasi Pengguna AWS](https://docs.aws.amazon.com/notifications/latest/userguide/what-is-service.html) serta integrasikan secara programatis dengan [alat pemantauan dan peringatan Anda melalui Amazon EventBridge](https://docs.aws.amazon.com/health/latest/ug/cloudwatch-events-health.html) atau [API AWS Health](https://docs.aws.amazon.com/health/latest/APIReference/Welcome.html). 

   1.  Rencanakan dan lacak progres pada peristiwa kesehatan yang memerlukan tindakan dengan mengintegrasikan dengan manajemen perubahan atau alat ITSM (seperti [Jira atau](https://docs.aws.amazon.com/smc/latest/ag/cloud-sys-health.html) [ServiceNow](https://docs.aws.amazon.com/smc/latest/ag/sn-aws-health.html)) yang mungkin sudah Anda gunakan melalui Amazon EventBridge atau API AWS Health. 

   1.  Jika Anda menggunakan AWS Organizations, aktifkan [tampilan organisasi untuk AWS Health](https://docs.aws.amazon.com/health/latest/ug/aggregate-events.html) guna menggabungkan peristiwa AWS Health di seluruh akun. 

1.  **Lakukan instrumentasi pada aplikasi Anda dengan [AWS X-Ray](https://aws.amazon.com/xray/):** AWS X-Ray memberikan wawasan tentang bagaimana performa aplikasi dan dependensi yang mendasarinya. Dengan melacak permintaan dari awal hingga akhir, Anda dapat mengidentifikasi kemacetan atau kegagalan yang terjadi dalam layanan eksternal atau komponen yang diandalkan oleh aplikasi Anda. 

1.  **Gunakan [Amazon DevOps Guru](https://aws.amazon.com/devops-guru/):** Layanan berbasis machine learning ini mengidentifikasi masalah operasional, memprediksi kapan masalah kritis mungkin terjadi, dan merekomendasikan tindakan spesifik yang harus diambil. Layanan ini sangat bermanfaat untuk mendapatkan wawasan tentang dependensi dan memastikan bahwa dependensi bukan merupakan sumber masalah operasional. 

1.  **Pantau secara rutin:** Terus pantau metrik dan log yang berkaitan dengan dependensi eksternal. Siapkan peringatan untuk perilaku tak terduga atau performa yang menurun. 

1.  **Lakukan validasi setelah perubahan:** Setiap kali ada pembaruan atau perubahan yang dilakukan pada salah satu dependensi eksternal, Anda harus melakukan validasi terhadap performa dan memeriksa keselarasannya dengan persyaratan-persyaratan aplikasi Anda. 

 **Tingkat upaya untuk rencana implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS04-BP01 Menentukan KPI beban kerja](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_identify_kpis.html) 
+  [OPS04-BP02 Mengimplementasikan telemetri aplikasi](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_application_telemetry.html) 
+  [OPS04-BP03 Mengimplementasikan telemetri aktivitas pengguna](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_customer_telemetry.html) 
+  [OPS04-BP05 Mengimplementasikan keterlacakan transaksi](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_dist_trace.html) 
+  [OPS08-BP04 Membuat peringatan yang dapat ditindaklanjuti](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_workload_observability_create_alerts.html) 

 **Dokumen terkait:** 
+  [Panduan Pengguna Dasbor Health Pribadi Amazon](https://docs.aws.amazon.com/health/latest/ug/what-is-aws-health.html) 
+  [Panduan Pengguna Monitor Internet AWS](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-InternetMonitor.html) 
+  [Panduan Developer AWS X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html) 
+  [Panduan Pengguna DevOps Guru AWS](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html) 

 **Video terkait:** 
+  [Visibilitas tentang bagaimana masalah internet memengaruhi performa aplikasi](https://www.youtube.com/watch?v=Kuc_SG_aBgQ) 
+  [Pengantar tentang Amazon DevOps Guru](https://www.youtube.com/watch?v=2uA8q-8mTZY) 
+  [Mengelola peristiwa siklus hidup sumber daya dalam skala besar dengan AWS Health](https://www.youtube.com/watch?v=VoLLNL5j9NA) 

 **Contoh terkait:** 
+  [AWS Health Aware](https://github.com/aws-samples/aws-health-aware/) 
+  [Menggunakan Penyaringan Berbasis Tag untuk Mengelola Pemantauan dan Peringatan AWS Health dengan Skala Besar](https://aws.amazon.com/blogs/mt/using-tag-based-filtering-to-manage-health-monitoring-and-alerting-at-scale/) 

# OPS04-BP05 Melaksanakan penelusuran terdistribusi
<a name="ops_observability_dist_trace"></a>

 Penelusuran terdistribusi menawarkan cara untuk memantau dan memvisualisasikan permintaan yang melintasi berbagai komponen sistem terdistribusi. Dengan menangkap data jejak dari berbagai sumber dan menganalisisnya dalam tampilan terpadu, tim dapat lebih memahami bagaimana permintaan mengalir, di mana kemacetan terjadi, dan di mana upaya pengoptimalan harus difokuskan. 

 **Hasil yang diinginkan:** Dapatkan tampilan menyeluruh permintaan-permintaan yang mengalir melewati sistem terdistribusi Anda, sehingga akan memungkinkan Anda untuk melakukan debugging yang presisi, performa yang dioptimalkan, dan pengalaman pengguna yang lebih baik. 

 **Anti-pola umum:** 
+  Instrumentasi yang tidak konsisten: Tidak semua layanan yang ada dalam sebuah sistem terdistribusi diinstrumentasi untuk penelusuran. 
+  Mengabaikan latensi: Hanya berfokus pada kesalahan dan tidak mempertimbangkan latensi atau penurunan performa yang terjadi secara bertahap. 

 **Manfaat menjalankan praktik terbaik ini:** 
+ Gambaran umum sistem yang komprehensif: Memberikan visualisasi dari seluruh jalur permintaan, dari masuk hingga keluar.
+  Debugging yang disempurnakan: Mengidentifikasi dengan cepat di mana kegagalan atau masalah performa terjadi. 
+  Pengalaman pengguna yang ditingkatkan: Melakukan pemantauan dan optimalisasi berdasarkan data pengguna aktual, yang akan memastikan bahwa sistem memenuhi tuntutan dunia nyata. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Mulailah dengan mengidentifikasi semua elemen beban kerja Anda yang memerlukan instrumentasi. Setelah semua komponen diperhitungkan, manfaatkan alat seperti AWS X-Ray dan OpenTelemetry untuk mengumpulkan data jejak untuk analisis dengan alat seperti X-Ray dan Amazon CloudWatch ServiceLens Map. Terlibat dalam ulasan reguler dengan pengembang, dan lengkapi diskusi ini dengan alat seperti Amazon DevOps Guru, X-Ray Analytics, dan X-Ray Insights untuk membantu mengungkap temuan yang lebih dalam. Buatlah peringatan dari data jejak untuk memberikan notifikasi kapan hasil, sebagaimana didefinisikan dalam rencana pemantauan beban kerja, mengandung risiko. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

 Cara mengimplementasikan penelusuran terdistribusi secara efektif: 

1.  **Adopsi [AWS X-Ray](https://aws.amazon.com/xray/):** Integrasikan X-Ray ke dalam aplikasi Anda untuk mendapatkan wawasan tentang perilakunya, memahami performanya, dan mengenali kemacetan. Manfaatkan Wawasan X-Ray untuk analisis jejak otomatis. 

1.  **Instrumen layanan Anda:** Verifikasi bahwa setiap layanan, dari [AWS Lambda](https://aws.amazon.com/lambda/)fungsi hingga [EC2instance](https://aws.amazon.com/ec2/), mengirimkan data jejak. Semakin banyak layanan yang Anda instrumen, semakin jelas end-to-end tampilan. 

1.  **Menggabungkan [Pemantauan Pengguna CloudWatch Nyata](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-RUM.html) dan [pemantauan sintetis](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html):** Integrasikan Pemantauan Pengguna Nyata (RUM) dan pemantauan sintetis dengan X-Ray. Hal ini akan memungkinkan perekaman pengalaman pengguna dunia nyata dan simulasi interaksi pengguna untuk mengidentifikasi masalah-masalah potensial yang mungkin terjadi. 

1.  **Gunakan [CloudWatch agen: Agen](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html)** dapat mengirim jejak dari X-Ray atau OpenTelemetry, meningkatkan kedalaman wawasan yang diperoleh. 

1.  **Gunakan [Amazon DevOps Guru: DevOps Guru](https://aws.amazon.com/devops-guru/)** menggunakan data dari X-Ray,, CloudWatch AWS Config, dan AWS CloudTrail untuk memberikan rekomendasi yang dapat ditindaklanjuti. 

1.  **Lakukan analisis jejak:** Tinjau data jejak secara rutin untuk membedakan pola, anomali, atau kemacetan yang dapat memengaruhi performa aplikasi Anda. 

1.  **Siapkan peringatan:** Konfigurasikan alarm [CloudWatch](https://aws.amazon.com/cloudwatch/)untuk pola yang tidak biasa atau latensi yang diperpanjang, memungkinkan pengalamatan masalah proaktif. 

1.  **Peningkatan terus-menerus:** Tinjau ulang strategi penelusuran Anda saat layanan ditambahkan atau dimodifikasi untuk menangkap semua titik data yang relevan. 

 **Tingkat upaya untuk rencana implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS04-BP01 Identifikasi indikator kinerja utama](ops_observability_identify_kpis.md) 
+  [OPS04-BP02 Melaksanakan telemetri aplikasi](ops_observability_application_telemetry.md) 
+  [OPS04-BP03 Menerapkan telemetri pengalaman pengguna](ops_observability_customer_telemetry.md) 
+  [OPS04-BP04 Mengimplementasikan telemetri dependensi](ops_observability_dependency_telemetry.md) 

 **Dokumen terkait:** 
+ [AWS X-Ray Panduan Pengembang](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html)
+ [Panduan Pengguna CloudWatch agen Amazon](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html)
+ [Panduan Pengguna Amazon DevOps Guru](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html)

 **Video terkait:** 
+ [Gunakan AWS X-Ray Wawasan](https://www.youtube.com/watch?v=tl8OWHl6jxw)
+ [AWS di Air ft. Observabilitas: Amazon CloudWatch ](https://www.youtube.com/watch?v=qBDBnPkZ-KI) dan AWS X-Ray

 **Contoh terkait:** 
+ [Instrumentasi aplikasi Anda untuk AWS X-Ray](https://aws.amazon.com/xray/latest/devguide/xray-instrumenting-your-app.html)

# OPS 5. Bagaimana cara mengurangi kecacatan, mempermudah perbaikan, dan meningkatkan aliran ke dalam produksi?
<a name="ops-05"></a>

 Adopsi pendekatan yang meningkatkan aliran perubahan ke dalam produksi, sehingga memungkinkan pemfaktoran ulang, umpan balik cepat atas kualitas, dan perbaikan bug. Ini mempercepat perubahan yang bermanfaat memasuki produksi, membatasi masalah yang di-deploy, dan mencapai identifikasi cepat serta perbaikan masalah akibat aktivitas deployment. 

**Topics**
+ [OPS05-BP01 Menggunakan kontrol versi](ops_dev_integ_version_control.md)
+ [OPS05-BP02 Menguji dan memvalidasi perubahan](ops_dev_integ_test_val_chg.md)
+ [OPS05-BP03 Menggunakan sistem manajemen konfigurasi](ops_dev_integ_conf_mgmt_sys.md)
+ [OPS05-BP04 Menggunakan sistem manajemen build dan deployment](ops_dev_integ_build_mgmt_sys.md)
+ [OPS05-BP05 Melakukan manajemen patch](ops_dev_integ_patch_mgmt.md)
+ [OPS05-BP06 Bagikan standar desain](ops_dev_integ_share_design_stds.md)
+ [OPS05-BP07 Mengimplementasikan praktik untuk meningkatkan kualitas kode](ops_dev_integ_code_quality.md)
+ [OPS05-BP08 Menggunakan beberapa lingkungan](ops_dev_integ_multi_env.md)
+ [OPS05-BP09 Lakukan perubahan yang sering, kecil, dan reversibel](ops_dev_integ_freq_sm_rev_chg.md)
+ [OPS05-BP10 Mengotomatiskan integrasi dan deployment sepenuhnya](ops_dev_integ_auto_integ_deploy.md)

# OPS05-BP01 Menggunakan kontrol versi
<a name="ops_dev_integ_version_control"></a>

 Gunakan kontrol versi untuk memungkinkan pelacakan perubahan dan rilis. 

 Banyak layanan AWS yang menawarkan kemampuan kontrol versi. Gunakan revisi atau sistem [kontrol sumber](https://aws.amazon.com/devops/source-control/) seperti [Git](https://aws.amazon.com/devops/source-control/git/) untuk mengelola kode dan artefak lainnya, seperti templat [AWS CloudFormation](https://aws.amazon.com/cloudformation/) yang dikendalikan versi untuk infrastruktur Anda. 

 **Hasil yang diinginkan:** Tim Anda berkolaborasi dalam kode. Saat digabungkan, kode tersebut konsisten dan tidak ada perubahan yang hilang. Kesalahan mudah dibatalkan melalui penentuan versi yang benar. 

 **Anti-pola umum:** 
+  Anda telah mengembangkan dan menyimpan kode di stasiun kerja Anda. Anda mengalami kegagalan penyimpanan yang tidak dapat dipulihkan di stasiun kerja dan kemudian kode Anda hilang. 
+  Setelah menimpa kode yang ada dengan perubahan Anda, Anda dapat memulai ulang aplikasi namun aplikasi sudah tidak dapat beroperasi lagi. Anda tidak bisa membatalkan perubahan. 
+  Anda memiliki write lock pada file laporan yang perlu diedit orang lain. Mereka meminta Anda untuk berhenti mengerjakannya agar mereka bisa menyelesaikan tugas-tugas mereka. 
+  Tim penelitian Anda telah mengerjakan sebuah analisis mendetail yang membentuk pekerjaan mendatang Anda. Seseorang secara tidak sengaja menyimpan daftar belanjanya dan menimpa laporan akhir. Anda tidak bisa membatalkan perubahan dan harus membuat ulang laporan tersebut. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan menggunakan kemampuan kontrol versi, Anda dapat dengan mudah kembali ke versi sebelumnya dengan status yang baik, dan membatasi risiko kehilangan aset. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Pelihara aset di repositori dengan kontrol versi. Tindakan ini mendukung pelacakan perubahan, deployment versi baru, deteksi perubahan pada versi yang ada, dan pengembalian ke versi sebelumnya (misalnya, kembali ke versi dengan status yang baik apabila terjadi kegagalan). Integrasikan kemampuan kontrol versi dari sistem manajemen konfigurasi Anda ke dalam prosedur Anda. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS05-BP04 Menggunakan sistem manajemen build dan deployment](ops_dev_integ_build_mgmt_sys.md) 

 **Video terkait:** 
+ [AWS re:Invent 2023 - Bagaimana Lockheed Martin membangun perangkat lunak lebih cepat, didukung oleh DevSecOps ](https://www.youtube.com/watch?v=Q1OSyxYkl5w)
+ [AWS re:Invent 2023 - Bagaimana GitHub mengoperasionalkan AI untuk kolaborasi dan produktivitas tim ](https://www.youtube.com/watch?v=cOVvGaiusOI)

# OPS05-BP02 Menguji dan memvalidasi perubahan
<a name="ops_dev_integ_test_val_chg"></a>

 Setiap perubahan yang di-deploy harus diuji untuk menghindari kesalahan dalam lingkungan produksi. Praktik terbaik ini difokuskan untuk menguji perubahan-perubahan dari kontrol versi hingga build artefak. Di samping perubahan kode aplikasi, pengujian juga harus menyertakan infrastruktur, konfigurasi, kontrol keamanan, dan prosedur-prosedur operasi. Ada banyak bentuk pengujian, dari uji unit hingga analisis komponen perangkat lunak (SCA). Makin ke kiri pengujian dalam proses integrasi dan pengiriman perangkat lunak akan menghasilkan tingkat kepastian kualitas artefak yang lebih tinggi. 

 Organisasi Anda harus mengembangkan standar-standar pengujian untuk semua artefak perangkat lunak. Pengujian otomatis dapat mengurangi kerja yang melelahkan dan mencegah terjadinya kesalahan dalam pengujian manual. Uji manual mungkin diperlukan dalam beberapa kasus. Pengembang harus memiliki akses ke hasil uji otomatis untuk menciptakan loop umpan balik yang meningkatkan kualitas perangkat lunak. 

 **Hasil yang diinginkan:** Perubahan perangkat lunak Anda diuji sebelum dikirim. Pengembang memiliki akses ke hasil pengujian dan validasi. Organisasi Anda memiliki standar pengujian yang berlaku untuk semua perubahan perangkat lunak. 

 **Anti-pola umum:** 
+  Anda men-deploy perubahan perangkat lunak baru tanpa melakukan pengujian apa pun. Perangkat lunak gagal berjalan dalam lingkungan produksi, dan mengakibatkan matinya sistem. 
+  Grup keamanan baru di-deploy dengan AWS CloudFormation tanpa diuji di dalam sebuah lingkungan pra-produksi. Grup keamanan tersebut menjadikan aplikasi Anda tidak terjangkau oleh para pelanggan Anda. 
+  Sebuah metode diubah tanpa pengujian unit. Perangkat lunak gagal saat di-deploy ke lingkungan produksi. 

 **Manfaat menerapkan praktik terbaik ini:** Perubahan tingkat kegagalan deployment perangkat lunak berkurang. Kualitas perangkat lunak meningkat. Pengembang memiliki kesadaran yang lebih tinggi tentang kelayakan kode mereka. Kebijakan keamanan dapat diluncurkan dengan penuh keyakinan untuk mendukung kepatuhan organisasi. Perubahan infrastruktur, misalnya pembaruan kebijakan penskalaan otomatis, diuji di awal untuk memenuhi kebutuhan lalu lintas. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Pengujian dilakukan pada semua perubahan, dari kode aplikasi hingga infrastruktur, sebagai bagian dari praktik integrasi berkelanjutan yang Anda lakukan. Hasil-hasil pengujian dipublikasikan sehingga pengembang memiliki umpan balik dengan cepat. Organisasi memiliki standar pengujian bahwa semua perubahan harus lulus. 

 Gunakan kekuatan AI generatif dengan Amazon Q Developer untuk meningkatkan produktivitas pengembang dan kualitas kode Anda. Amazon Q Developer menyertakan pembuatan saran kode (berdasarkan model bahasa besar), produksi pengujian unit (termasuk kondisi batas), dan peningkatan keamanan kode melalui deteksi dan perbaikan kerentanan keamanan. 

 **Contoh pelanggan** 

 Sebagai bagian dari pipeline integrasi berkelanjutan mereka, AnyCompany Retail melakukan beberapa jenis pengujian pada semua artefak perangkat lunak. Mereka mempraktikkan pengembangan yang didorong pengujian sehingga semua perangkat lunak memiliki pengujian-pengujian unit. Begitu artefak dibangun, mereka kemudian menjalankan pengujian secara menyeluruh. Setelah pengujian putaran pertama selesai, mereka menjalankan pemindaian keamanan aplikasi statis, yang mencari kerentanan yang dikenali. Pengembang menerima pesan setelah setiap gerbang pengujian dilalui. Setelah semua pengujian selesai, artefak perangkat lunak kemudian disimpan di dalam sebuah repositori artefak. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  Bekerjalah dengan para pemangku kepentingan yang ada di organisasi Anda untuk mengembangkan sebuah standar pengujian untuk artefak perangkat lunak. Pengujian standar apa yang harus dilalui oleh semua artefak? Apakah ada persyaratan kepatuhan atau tata kelola yang harus disertakan di dalam cakupan pengujian? Apakah Anda perlu melakukan pengujian kualitas kode? Setelah pengujian selesai dilakukan, siapa yang perlu mengetahuinya? 

   1.  [Arsitektur Referensi Pipeline Deployment AWS](https://pipelines.devops.aws.dev/) berisi daftar tepercaya untuk jenis-jenis pengujian yang dapat dilakukan pada artefak perangkat lunak sebagai bagian dari pipeline integrasi. 

1.  Instrumentasikan aplikasi Anda dengan pengujian-pengujian yang diperlukan berdasarkan standar pengujian perangkat lunak Anda. Setiap set pengujian harus diselesaikan dalam waktu kurang dari sepuluh menit. Pengujian harus berjalan sebagai bagian dari pipeline integrasi. 

   1.  Gunakan [Amazon Q Developer](https://docs.aws.amazon.com/amazonq/latest/qdeveloper-ug/what-is.html), sebuah alat AI generatif yang dapat membantu Anda membuat kasus pengujian unit (termasuk ketentuan batas), yang dapat menghasilkan fungsi dengan menggunakan kode dan komentar, dan menerapkan algoritme terkenal. 

   1.  Gunakan [Amazon CodeGuru](https://docs.aws.amazon.com/codeguru/latest/reviewer-ug/welcome.html) Reviewer untuk melakukan pengujian kode aplikasi Anda apakah ada cacat. 

   1.  Anda dapat menggunakan [AWS CodeBuild](https://docs.aws.amazon.com/codebuild/latest/userguide/welcome.html) untuk melakukan pengujian pada artefak perangkat lunak. 

   1.  [AWS CodePipeline](https://docs.aws.amazon.com/codepipeline/latest/userguide/welcome.html) dapat mengorkestrasi pengujian perangkat lunak Anda ke dalam pipeline. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS05-BP01 Menggunakan kontrol versi](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_dev_integ_version_control.html) 
+  [OPS05-BP06 Membagikan standar desain](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_dev_integ_share_design_stds.html) 
+  [OPS05-BP07 Mengimplementasikan praktik untuk meningkatkan kualitas kode](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_dev_integ_code_quality.html) 
+  [OPS05-BP10 Mengotomatiskan integrasi dan deployment sepenuhnya](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_dev_integ_auto_integ_deploy.html) 

 **Dokumen terkait:** 
+  [Adopsi pendekatan pengembangan berbasis pengujian](https://docs.aws.amazon.com/prescriptive-guidance/latest/best-practices-cdk-typescript-iac/development-best-practices.html) 
+  [Mengakselerasi Siklus Hidup Pengembangan Perangkat Lunak Anda dengan Amazon Q](https://aws.amazon.com/blogs/devops/accelerate-your-software-development-lifecycle-with-amazon-q/) 
+  [Amazon Q Developer, sekarang tersedia secara umum, menyertakan pratinjau kemampuan-kemampuan baru untuk menata kembali pengalaman pengembang](https://aws.amazon.com/blogs/aws/amazon-q-developer-now-generally-available-includes-new-capabilities-to-reimagine-developer-experience/) 
+  [Lembar Cheat Utama untuk Menggunakan Amazon Q Developer di IDE Anda](https://community.aws/content/2eYoqeFRqaVnk900emsknDfzhfW/the-ultimate-cheat-sheet-for-using-amazon-q-developer-in-your-ide) 
+  [Beban kerja Shift-Left, memanfaatkan AI untuk Pembuatan Uji](https://community.aws/content/2gBZtC94gPzaCQRnt4P0rIYWuBx/shift-left-workload-leveraging-ai-for-test-creation) 
+  [Pusat Amazon Q Developer](https://aws.amazon.com/developer/generative-ai/amazon-q/) 
+  [10 cara untuk membangun aplikasi lebih cepat dengan menggunakan Amazon CodeWhisperer](https://aws.amazon.com/blogs/devops/10-ways-to-build-applications-faster-with-amazon-codewhisperer/) 
+  [Melihat melampaui cakupan kode dengan Amazon CodeWhisperer](https://aws.amazon.com/blogs/devops/looking-beyond-code-coverage-with-amazon-codewhisperer/) 
+  [Praktik Terbaik untuk Rekayasa Perintah dengan Amazon CodeWhisperer](https://aws.amazon.com/blogs/devops/best-practices-for-prompt-engineering-with-amazon-codewhisperer/) 
+  [Pipeline Pengujian AWS CloudFormation Otomatis dengan TaskCat dan CodePipeline](https://aws.amazon.com/blogs/devops/automated-cloudformation-testing-pipeline-with-taskcat-and-codepipeline/) 
+  [Membangun pipeline CI/CD DevSecOps AWS yang menyeluruh dengan alat-alat SCA, SAST, dan DAST sumber terbuka](https://aws.amazon.com/blogs/devops/building-end-to-end-aws-devsecops-ci-cd-pipeline-with-open-source-sca-sast-and-dast-tools/) 
+  [Memulai pengujian aplikasi nirserver](https://aws.amazon.com/blogs/compute/getting-started-with-testing-serverless-applications/) 
+  [Pipeline CI/CD adalah pemandu utama rilisan saya](https://aws.amazon.com/builders-library/cicd-pipeline/) 
+  [Laporan Resmi tentang Mempraktikkan Integrasi Berkelanjutan dan Pengiriman Berkelanjutan di AWS](https://docs.aws.amazon.com/whitepapers/latest/practicing-continuous-integration-continuous-delivery/welcome.html) 

 **Video terkait:** 
+  [Menerapkan API dengan Amazon Q Developer Agent untuk Pengembangan Perangkat Lunak](https://www.youtube.com/watch?v=U4XEvJUvff4) 
+  [Menginstal, Mengonfigurasi, & Menggunakan Amazon Q Developer dengan JetBrains IDE (Cara)](https://www.youtube.com/watch?v=-iQfIhTA4J0) 
+  [Menguasai seni Amazon CodeWhisperer - Daftar putar YouTube](https://www.youtube.com/playlist?list=PLDqi6CuDzubxzL-yIqgQb9UbbceYdKhpK) 
+  [AWS re:Invent 2020: Infrastruktur yang dapat diuji: Pengujian integrasi di AWS](https://www.youtube.com/watch?v=KJC380Juo2w) 
+  [AWS Summit ANZ 2021 - Mendorong strategi yang mengutamakan pengujian dengan CDK dan pengembangan yang didorong pengujian](https://www.youtube.com/watch?v=1R7G_wcyd3s) 
+  [Menguji Infrastruktur Anda sebagai Kode dengan AWS CDK](https://www.youtube.com/watch?v=fWtuwGSoSOU) 

 **Sumber daya terkait:** 
+  [Arsitektur Referensi Pipeline Deployment AWS - Aplikasi](https://pipelines.devops.aws.dev/application-pipeline/index.html) 
+  [Pipeline DevSecOps Kubernetes AWS](https://github.com/aws-samples/devsecops-cicd-containers) 
+  [Menjalankan pengujian unit untuk aplikasi Node.js dari GitHub dengan menggunakan AWS CodeBuild](https://docs.aws.amazon.com/prescriptive-guidance/latest/patterns/run-unit-tests-for-a-node-js-application-from-github-by-using-aws-codebuild.html) 
+  [Menggunakan Serverspec untuk pengembangan kode infrastruktur yang didorong pengujian](https://docs.aws.amazon.com/prescriptive-guidance/latest/patterns/use-serverspec-for-test-driven-development-of-infrastructure-code.html) 

 **Layanan terkait:** 
+  [Amazon Q Developer](https://aws.amazon.com/q/developer/) 
+  [Amazon CodeGuru Reviewer](https://docs.aws.amazon.com/codeguru/latest/reviewer-ug/welcome.html) 
+  [AWS CodeBuild](https://docs.aws.amazon.com/codebuild/latest/userguide/welcome.html) 
+  [AWS CodePipeline](https://docs.aws.amazon.com/codepipeline/latest/userguide/welcome.html) 

# OPS05-BP03 Menggunakan sistem manajemen konfigurasi
<a name="ops_dev_integ_conf_mgmt_sys"></a>

 Gunakan sistem manajemen konfigurasi untuk membuat dan melacak perubahan konfigurasi. Sistem ini mengurangi kesalahan yang disebabkan oleh proses manual dan meminimalkan tingkat upaya untuk melakukan deployment perubahan. 

Manajemen konfigurasi statis menetapkan nilai saat melakukan inisialisasi atas sebuah sumber daya yang diharapkan tetap konsisten selama masa pakai sumber daya tersebut. Manajemen konfigurasi dinamis menetapkan nilai saat inisialisasi. Nilai ini dapat atau diharapkan berubah selama masa pakai sumber daya. Misalnya, Anda dapat mengatur sebuah pengalih fitur untuk mengaktifkan fungsionalitas dalam kode Anda melalui sebuah perubahan konfigurasi, atau mengubah tingkat kerincian log selama insiden.

Konfigurasi harus di-deploy dalam status yang diketahui dan konsisten. Anda harus menggunakan inspeksi otomatis untuk selalu memantau konfigurasi sumber daya di seluruh lingkungan dan wilayah. Kontrol ini harus didefinisikan sebagai kode dan manajemen otomatis untuk memastikan aturan diterapkan secara konsisten di seluruh lingkungan. Perubahan konfigurasi harus diperbarui melalui prosedur kontrol perubahan yang disepakati dan diterapkan secara konsisten, dengan tetap memperhatikan kontrol versi. Konfigurasi aplikasi harus dikelola secara independen dan tidak bergantung pada kode aplikasi dan infrastruktur. Hal ini memungkinkan deployment yang konsisten di banyak lingkungan. Perubahan konfigurasi tidak akan mengakibatkan pembangunan kembali atau pemindahan aplikasi. 

 **Hasil yang diinginkan:** Anda mengonfigurasi, memvalidasi, dan melakukan deployment sebagai bagian dari pipeline integrasi berkelanjutan, pengiriman berkelanjutan (CI/CD) Anda. Anda memantau untuk memvalidasi bahwa konfigurasi sudah benar. Hal ini akan meminimalkan dampak apa pun yang terjadi terhadap pelanggan dan pengguna akhir. 

 **Anti-pola umum:** 
+  Anda memperbarui konfigurasi server web secara manual di seluruh armada dan beberapa server menjadi tidak responsif karena terjadinya kesalahan pembaruan. 
+  Anda secara manual memperbarui armada server aplikasi Anda selama berjam-jam. Ketidaksesuaian dalam konfigurasi selama terjadi perubahan dapat menyebabkan perilaku yang tak terduga. 
+  Seseorang telah memperbarui grup keamanan Anda dan server web Anda tidak dapat diakses lagi. Tanpa mengetahui apa yang telah diubah, Anda menghabiskan banyak waktu untuk menyelidiki masalah tersebut sehingga waktu pemulihan akan semakin panjang. 
+  Anda mendorong konfigurasi pra-produksi ke dalam lingkungan produksi melalui CI/CD tanpa melakukan validasi. Anda mengekspos pengguna dan pelanggan ke data dan layanan yang salah. 

 **Manfaat menerapkan praktik terbaik ini:** Mengadopsi sistem manajemen konfigurasi akan meminimalkan tingkat upaya untuk membuat dan melacak perubahan, serta akan mengurangi frekuensi kesalahan yang disebabkan oleh penggunaan prosedur manual. Sistem manajemen konfigurasi dapat memberikan jaminan sehubungan dengan persyaratan tata kelola, kepatuhan, dan peraturan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Sistem manajemen konfigurasi digunakan untuk melacak dan mengimplementasikan perubahan-perubahan yang dibuat pada konfigurasi aplikasi dan lingkungan. Sistem manajemen konfigurasi juga digunakan untuk mengurangi terjadinya kesalahan yang disebabkan oleh proses-proses yang diselesaikan secara manual, membuat perubahan konfigurasi menjadi dapat diulang dan dapat diaudit, serta mengurangi tingkat upaya. 

 Pada AWS, Anda dapat menggunakan [AWS Config](https://docs.aws.amazon.com/config/latest/developerguide/WhatIsConfig.html) untuk terus memantau konfigurasi sumber daya AWS Anda [di seluruh akun dan Wilayah](https://docs.aws.amazon.com/config/latest/developerguide/aggregate-data.html). Dengan demikian, Anda dapat melacak riwayat konfigurasi mereka, memahami bagaimana perubahan konfigurasi akan memengaruhi sumber daya lainnya, dan mengauditnya terhadap konfigurasi yang diharapkan atau diinginkan dengan menggunakan [Aturan AWS Config](https://docs.aws.amazon.com/config/latest/developerguide/evaluate-config.html) dan [AWS Config Conformance Packs](https://docs.aws.amazon.com/config/latest/developerguide/conformance-packs.html). 

 Untuk konfigurasi dinamis dalam aplikasi yang berjalan di instans Amazon EC2, AWS Lambda, kontainer, aplikasi seluler, atau perangkat IoT, Anda dapat menggunakan [AWS AppConfig](https://docs.aws.amazon.com/appconfig/latest/userguide/what-is-appconfig.html) untuk mengonfigurasi, memvalidasi, men-deploy, dan memantaunya di seluruh lingkungan. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  Lakukan identifikasi pemilik konfigurasi. 

   1.  Buat agar para pemilik konfigurasi menyadari tentang kepatuhan, tata kelola, atau peraturan apa pun. 

1.  Lakukan identifikasi terhadap item-item konfigurasi dan hasil kerja. 

   1.  Item-item konfigurasi adalah semua konfigurasi aplikasi dan lingkungan yang dipengaruhi oleh sebuah deployment yang dilakukan di dalam pipeline CI/CD Anda. 

   1.  Hasil kerja antara lain kriteria keberhasilan, validasi, dan hal-hal yang harus dipantau. 

1.  Pilihlah alat-alat yang bisa digunakan untuk melakukan manajemen konfigurasi berdasarkan kebutuhan bisnis dan pipeline pengiriman Anda. 

1.  Pertimbangkan deployment tertimbang seperti deployment canary untuk perubahan-perubahan konfigurasi yang signifikan guna meminimalkan dampak konfigurasi yang salah. 

1.  Integrasikan manajemen konfigurasi Anda ke dalam pipeline CI/CD Anda. 

1.  Validasikan semua perubahan yang didorong. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS06-BP01 Rencana untuk perubahan yang gagal](ops_mit_deploy_risks_plan_for_unsucessful_changes.md) 
+  [OPS06-BP02 Uji penerapan](ops_mit_deploy_risks_test_val_chg.md) 
+  [OPS06-BP03 Menggunakan strategi deployment yang aman](ops_mit_deploy_risks_deploy_mgmt_sys.md) 
+  [OPS06-BP04 Mengotomatiskan pengujian dan rollback](ops_mit_deploy_risks_auto_testing_and_rollback.md) 

 **Dokumen terkait:** 
+ [AWS Control Tower](https://docs.aws.amazon.com/controltower/latest/userguide/what-is-control-tower.html)
+ [Akselerator Zona Landasan AWS](https://aws.amazon.com/solutions/implementations/landing-zone-accelerator-on-aws/)
+ [AWS Config](https://aws.amazon.com/config/)
+ [ Apa itu AWS Config? ](https://docs.aws.amazon.com/config/latest/developerguide/WhatIsConfig.html)
+  [AWS AppConfig](https://docs.aws.amazon.com/appconfig/latest/userguide/what-is-appconfig.html) 
+ [ Apa itu AWS CloudFormation? ](https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/Welcome.html)
+  [Alat Pengembang AWS](https://aws.amazon.com/products/developer-tools/) 
+ [AWS CodeBuild](https://aws.amazon.com/codebuild/)
+ [AWS CodePipeline](https://aws.amazon.com/codepipeline/)
+ [AWS CodeDeploy](https://aws.amazon.com/codedeploy/)

 **Video terkait:** 
+ [AWS re:Invent 2022 - Tata kelola dan kepatuhan proaktif untuk beban kerja AWS](https://youtu.be/PpUnH9Y52X0?si=82wff87KHXcc6nbT)
+ [AWS re:Invent 2020: Capai kepatuhan sebagai kode dengan menggunakan AWS Config](https://youtu.be/m8vTwvbzOfw?si=my4DP0FLq1zwKjho)
+ [ Kelola dan Deploy Konfigurasi Aplikasi dengan AWS AppConfig](https://youtu.be/ztIxMY3IIu0?si=ovYGsxWOBysyQrg0)

# OPS05-BP04 Menggunakan sistem manajemen build dan deployment
<a name="ops_dev_integ_build_mgmt_sys"></a>

 Gunakan sistem manajemen build dan deployment. Sistem ini mengurangi kesalahan yang disebabkan oleh proses manual dan meminimalkan tingkat upaya untuk melakukan deployment perubahan. 

 Di AWS, Anda dapat membangun pipeline integrasi berkelanjutan dan deployment berkelanjutan (CI/CD) dengan menggunakan layanan-layanan seperti [Alat Developer AWS](https://aws.amazon.com/products/developer-tools/) (misalnya [AWS CodeBuild](https://aws.amazon.com/codebuild/), [AWS CodePipeline](https://aws.amazon.com/codepipeline/), dan [AWS CodeDeploy](https://aws.amazon.com/codedeploy/)). 

 **Hasil yang diinginkan:** Sistem manajemen build dan deployment Anda mendukung sistem integrasi berkelanjutan dan pengiriman berkelanjutan (CI/CD) yang ada di organisasi Anda yang menyediakan kemampuan-kemampuan untuk mengotomatisasi peluncuran yang aman dengan konfigurasi yang benar. 

 **Anti-pola umum:** 
+  Setelah menyusun kode Anda pada sistem pengembangan, Anda menyalin file yang dapat dieksekusi ke sistem produksi namun file tersebut gagal memulai. File log lokal mengindikasikan bahwa kegagalan tersebut dikarenakan terjadinya kehilangan dependensi. 
+  Anda berhasil membangun aplikasi Anda dengan fitur-fitur baru pada lingkungan pengembangan Anda dan memberikan kodenya ke tim jaminan kualitas (QA). Kode tersebut gagal dalam pengujian QA karena ada aset statis yang hilang. 
+  Pada hari Jumat, setelah melakukan upaya keras, Anda berhasil membangun aplikasi Anda secara manual di lingkungan pengembangan Anda termasuk fitur-fitur yang baru Anda kodekan. Pada hari Senin, Anda tidak dapat mengulangi langkah-langkah yang membuat Anda berhasil membangun aplikasi tersebut. 
+  Anda melakukan pengujian yang telah Anda siapkan untuk rilisan baru Anda. Kemudian Anda menghabiskan minggu selanjutnya untuk mempersiapkan lingkungan pengujian dan melakukan seluruh pengujian integrasi yang ada sekarang disusul dengan pengujian kinerja. Kode baru tersebut ternyata memiliki dampak kinerja yang tidak dapat diterima dan harus dikembangkan ulang dan kemudian diuji ulang. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan menyediakan mekanisme untuk mengatasi aktivitas build dan deployment, Anda mengurangi upaya yang diperlukan untuk melakukan tugas-tugas berulang, membebaskan anggota tim Anda untuk fokus pada tugas-tugas kreatif mereka yang berharga, serta mengurangi terjadinya kesalahan akibat pelaksanaan prosedur yang dilakukan secara manual. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Sistem manajemen build dan deployment digunakan untuk melacak dan mengimplementasikan perubahan, mengurangi kesalahan yang disebabkan oleh proses yang dilakukan secara manual, dan mengurangi upaya yang diperlukan untuk melakukan deployment dengan aman. Lakukan otomatisasi sepenuhnya terhadap pipeline integrasi dan deployment dari check-in kode hingga build, pengujian, deployment, dan validasi. Hal ini akan mempersingkat waktu tunggu (lead time), mengurangi biaya, mendorong peningkatan frekuensi perubahan, mengurangi tingkat upaya, dan meningkatkan kolaborasi. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

![\[Diagram yang menunjukkan pipeline CI/CD menggunakan AWS CodePipeline dan layanan terkait\]](http://docs.aws.amazon.com/id_id/wellarchitected/latest/framework/images/deployment-pipeline-tooling.png)


1.  Gunakan sistem kontrol versi untuk menyimpan dan mengelola aset (seperti dokumen, kode sumber, dan file biner). 

1.  Gunakan CodeBuild untuk mengompilasikan kode sumber Anda, menjalankan pengujian unit, dan menghasilkan artefak yang siap untuk di-deploy. 

1.  Gunakan CodeDeploy sebagai sebuah layanan deployment yang mengotomatiskan deployment aplikasi ke instans [Amazon EC2](https://aws.amazon.com/ec2/), instans on-premise, [fungsi AWS Lambda nirserver](https://docs.aws.amazon.com/lambda/latest/dg/welcome.html), atau [Amazon ECS](https://aws.amazon.com/ecs/). 

1.  Pantau deployment Anda. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS06-BP04 Mengotomatiskan pengujian dan rollback](ops_mit_deploy_risks_auto_testing_and_rollback.md) 

 **Dokumen terkait:** 
+  [Alat Pengembang AWS](https://aws.amazon.com/products/developer-tools/) 
+  [Apa itu AWS CodeBuild?](https://docs.aws.amazon.com/codebuild/latest/userguide/welcome.html) 
+ [AWS CodeBuild](https://aws.amazon.com/codebuild/)
+  [Apa itu AWS CodeDeploy?](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html) 

 **Video terkait:** 
+ [AWS re:Invent 2022 - Praktik terbaik AWS Well-Architected untuk DevOps di AWS](https://youtu.be/hfXokRAyorA)

# OPS05-BP05 Melakukan manajemen patch
<a name="ops_dev_integ_patch_mgmt"></a>

 Lakukan manajemen patch untuk mendapatkan fitur, menangani permasalahan, dan menjaga kepatuhan terhadap tata kelola. Otomatiskan manajemen patch untuk mengurangi kesalahan yang disebabkan oleh proses manual, menskalakan, dan mengurangi upaya untuk melakukan patch. 

 Manajemen patch dan kerentanan adalah bagian dari aktivitas manajemen manfaat dan risiko Anda. Lebih baik Anda memiliki infrastruktur tetap dan melakukan deployment beban kerja pada status yang diketahui baik dan terverifikasi. Jika tidak memungkinkan, opsi yang tersisa ialah menerapkan patching. 

 [AWS Health](https://aws.amazon.com/premiumsupport/technology/aws-health/) adalah sumber informasi otoritatif tentang peristiwa siklus hidup yang direncanakan dan peristiwa lain yang memerlukan tindakan yang memengaruhi kesehatan sumber daya AWS Cloud Anda. Anda harus mengetahui perubahan dan pembaruan yang akan datang yang harus dilakukan. Peristiwa siklus hidup utama yang direncanakan dikirim setidaknya enam bulan sebelumnya. 

 [Amazon EC2 Image Builder](https://aws.amazon.com/image-builder/) menyediakan pipeline untuk memperbarui image mesin. Sebagai bagian dari manajemen patch, pertimbangkan [Amazon Machine Image (AMI)](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/AMIs.html       ) menggunakan [pipeline image AMI](https://docs.aws.amazon.com/imagebuilder/latest/userguide/start-build-image-pipeline.html) atau image kontainer dengan [pipeline citra Docker](https://docs.aws.amazon.com/imagebuilder/latest/userguide/start-build-container-pipeline.html), sedangkan AWS Lambda menyediakan pola untuk [runtime kustom dan pustaka patch](https://docs.aws.amazon.com/lambda/latest/dg/runtimes-custom.html) untuk menghilangkan kerentanan. 

 Anda harus mengelola pembaruan untuk [Amazon Machine Images](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/AMIs.html) untuk citra Linux atau Windows Server menggunakan [Amazon EC2 Image Builder](https://aws.amazon.com/image-builder/). Anda dapat menggunakan [Amazon Elastic Container Registry (Amazon ECR](https://docs.aws.amazon.com/AmazonECR/latest/userguide/what-is-ecr.html)) dengan pipeline yang ada sekarang untuk mengelola citra Amazon ECS dan mengelola citra Amazon EKS. Lambda menyertakan [fitur manajemen versi](https://docs.aws.amazon.com/lambda/latest/dg/configuration-versions.html). 

 Patching tidak boleh dilakukan pada sistem produksi tanpa mengujinya terlebih dahulu di sebuah lingkungan yang aman. Patch hanya bisa diterapkan jika mendukung hasil operasi atau bisnis. Pada AWS, Anda dapat menggunakan [AWS Systems Manager Patch Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-patch.html) untuk mengotomatiskan proses patching sistem terkelola dan menjadwalkan aktivitas menggunakan [Systems Manager Maintenance Windows](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-maintenance.html). 

 **Hasil yang diinginkan:** Citra AMI dan kontainer Anda diberikan patch, diperbarui, dan siap diluncurkan. Anda dapat melacak status dari semua citra yang di-deploy dan mengetahui kepatuhan patch. Anda dapat melaporkan status saat ini dan memiliki proses untuk memenuhi kebutuhan-kebutuhan kepatuhan Anda. 

 **Anti-pola umum:** 
+  Anda diberi tugas untuk menerapkan semua patch keamanan baru dalam waktu dua jam yang menyebabkan terjadinya beberapa kali pemadaman akibat ketidaksesuaian aplikasi dengan patch. 
+  Pustaka yang tidak di-patch dapat menimbulkan konsekuensi yang tidak dinginkan karena pihak yang tidak diketahui memanfaatkan kerentanan di dalamnya untuk mengakses beban kerja Anda. 
+  Anda melakukan patching pada lingkungan pengembangan secara otomatis tanpa memberikan notifikasi kepada developer. Anda menerima beberapa keluhan dari pengembang bahwa lingkungan mereka tidak lagi beroperasi sesuai dengan yang diharapkan. 
+  Anda belum menerapkan patch pada perangkat lunak komersial siap pakai di sebuah instans tetap. Ketika Anda mengalami masalah pada perangkat lunak dan menghubungi vendornya, Anda diberi tahu bahwa versi tersebut tidak didukung dan Anda harus melakukan patching pada tingkat tertentu untuk menerima bantuan. 
+  Patch yang baru-baru ini dirilis untuk perangkat lunak enkripsi yang Anda gunakan memiliki peningkatan performa yang signifikan. Sistem Anda yang tidak di-patching tetap memiliki masalah performa akibat tidak dilakukannya patching. 
+  Anda mendapatkan notifikasi tentang kerentanan zero-day yang memerlukan perbaikan darurat dan Anda harus menerapkan patching pada semua lingkungan Anda secara manual. 
+  Anda tidak mengetahui tindakan krusial yang diperlukan untuk memelihara sumber daya Anda, seperti pembaruan versi wajib, karena Anda tidak meninjau peristiwa siklus hidup terencana mendatang dan informasi lainnya. Anda kehilangan waktu krusial untuk perencanaan dan pelaksanaan, sehingga mengakibatkan perubahan darurat untuk tim Anda dan potensi dampak atau waktu henti yang tidak terduga. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan menjalankan proses manajemen patching, termasuk kriteria Anda untuk patching dan metodologi untuk distribusi ke seluruh lingkungan Anda, Anda dapat menskalakan dan melaporkan tingkat patching Anda. Ini memberikan jaminan seputar patching keamanan dan memastikan visibilitas yang jelas tentang status perbaikan yang diketahui yang sekarang sedang dilakukan. Hal ini mendorong adopsi fitur dan kemampuan yang diinginkan, penyingkiran masalah secara cepat, dan kepatuhan yang berkelanjutan terhadap tata kelola. Implementasikan sistem manajemen dan otomatisasi patching untuk mengurangi tingkat upaya untuk men-deploy patch dan mengurangi kesalahan yang disebabkan oleh proses yang dilakukan secara manual. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Lakukan patching pada sistem untuk menyelesaikan masalah, untuk mendapatkan fitur atau kemampuan yang diinginkan, dan untuk tetap patuh terhadap kebijakan tata kelola serta persyaratan dukungan vendor. Pada sistem tetap, lakukan deployment dengan rangkaian patching yang sesuai untuk mencapai hasil yang diinginkan. Lakukan otomatisasi mekanisme manajemen patching untuk mengurangi waktu yang telah berlalu untuk melakukan patching, untuk mencegah kesalahan yang disebabkan oleh proses manual, dan mengurangi upaya dalam melakukan patching. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

 Untuk Amazon EC2 Image Builder: 

1.  Dengan menggunakan Amazon EC2 Image Builder, tentukan detail pipeline: 

   1.  Buatlah sebuah pipeline citra dan beri nama 

   1.  Tentukan jadwal pipeline dan zona waktu 

   1.  Konfigurasikan dependensi apa pun 

1.  Pilih resep: 

   1.  Pilih resep yang sudah ada atau buat resep baru 

   1.  Pilih jenis citra 

   1.  Beri nama dan versi resep Anda 

   1.  Pilih citra dasar Anda 

   1.  Tambahkan komponen build dan tambahkan ke registri target 

1.  Opsional - tentukan konfigurasi infrastruktur Anda. 

1.  Opsional - tentukan pengaturan konfigurasi. 

1.  Tinjau pengaturan. 

1.  Pertahankan kebersihan resep secara teratur. 

 Untuk Systems Manager Patch Manager: 

1.  Buat acuan dasar patch. 

1.  Pilih metode operasi patching. 

1.  Aktifkan pelaporan dan pemindaian kepatuhan. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS06-BP04 Mengotomatiskan pengujian dan rollback](ops_mit_deploy_risks_auto_testing_and_rollback.md) 

 **Dokumen terkait:** 
+ [ Apa itu Amazon EC2 Image Builder ](https://docs.aws.amazon.com/imagebuilder/latest/userguide/what-is-image-builder.html)
+ [ Buat pipeline citra dengan menggunakan Amazon EC2 Image Builder ](https://docs.aws.amazon.com/imagebuilder/latest/userguide/start-build-image-pipeline.html)
+ [ Buat pipeline citra kontainer ](https://docs.aws.amazon.com/imagebuilder/latest/userguide/start-build-container-pipeline.html)
+  [AWS Systems Manager Patch Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-patch.html) 
+ [ Menggunakan Patch Manager ](https://docs.aws.amazon.com/systems-manager/latest/userguide/patch-manager-console.html)
+ [ Menggunakan laporan kepatuhan patch ](https://docs.aws.amazon.com/systems-manager/latest/userguide/patch-manager-compliance-reports.html)
+ [Alat Developer AWS](https://aws.amazon.com/products/developer-tools)

 **Video terkait:** 
+  [CI/CD untuk Aplikasi Nirserver di AWS](https://www.youtube.com/watch?v=tEpx5VaW4WE) 
+  [Mendesain dengan Mempertimbangkan Operasional](https://youtu.be/uh19jfW7hw4) 

   **Contoh terkait:** 
+ [Tutorial AWS Systems Manager Patch Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/patch-manager-tutorials.html)

# OPS05-BP06 Bagikan standar desain
<a name="ops_dev_integ_share_design_stds"></a>

 Bagikan praktik terbaik kepada seluruh tim untuk meningkatkan kesadaran dan memaksimalkan manfaat dari upaya-upaya pengembangan. Dokumentasikan dan jaga agar hal ini selalu mutakhir seiring perkembangan yang terjadi pada arsitektur Anda. Jika standar bersama telah diterapkan di dalam organisasi Anda, tersedianya mekanisme merupakan hal yang sangat penting untuk meminta penambahan, perubahan, dan pengecualian terhadap standar. Tanpa opsi ini, standar akan menjadi penghambat inovasi. 

 **Hasil yang diinginkan:** Standar desain dibagikan ke semua tim yang ada dalam organisasi Anda. Mereka didokumentasikan dan disimpan up-to-date sebagai praktik terbaik berkembang. 

 **Anti-pola umum:** 
+ Dua tim pengembangan masing-masing telah membuat sebuah layanan autentikasi pengguna. Pengguna Anda harus mempertahankan rangkaian kredensial terpisah untuk masing-masing bagian sistem yang ingin diakses. 
+ Setiap tim mengelola infrastruktur mereka sendiri. Persyaratan kepatuhan baru memaksakan penerapan sebuah perubahan pada infrastruktur Anda dan setiap tim mengimplementasikannya dengan cara yang berbeda.

 **Manfaat menerapkan praktik terbaik ini:** Penggunaan standar bersama akan mendukung adopsi praktik terbaik dan memaksimalkan manfaat dari upaya-upaya pengembangan yang dilakukan. Mendokumentasikan dan memperbarui standar desain membuat organisasi Anda tetap up-to-date dengan praktik terbaik serta persyaratan keamanan dan kepatuhan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Berbagi praktik terbaik, standar desain, daftar periksa, prosedur operasi, panduan, dan persyaratan tata kelola yang ada sekarang dengan semua tim. Buatlah prosedur-prosedur untuk meminta perubahan, penambahan, dan pengecualian standar desain untuk mendukung peningkatan dan inovasi. Buat tim mengetahui tentang konten yang dipublikasikan. Memiliki mekanisme untuk menjaga standar desain up-to-date saat praktik terbaik baru muncul. 

 **Contoh pelanggan** 

 AnyCompany Retail memiliki tim arsitektur lintas fungsi yang menciptakan pola arsitektur perangkat lunak. Tim ini membangun arsitektur dengan kepatuhan dan tata kelola bawaan. Tim yang mengadopsi standar bersama ini mendapatkan manfaat dari memiliki kepatuhan dan tata kelola bawaan. Mereka dapat membangun di atas standar desain dengan cepat. Tim arsitektur mengadakan pertemuan setiap tiga bulan untuk mengevaluasi pola-pola arsitektur dan melakukan pembaruan, jika perlu. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  Identifikasikan sebuah tim lintas fungsi yang memegang kepemilikan atas pengembangan dan pembaruan standar desain. Tim ini harus bekerja sama dengan para pemangku kepentingan yang ada di seluruh organisasi Anda untuk mengembangkan standar desain, standar operasi, daftar periksa, panduan, dan persyaratan tata kelola. Dokumentasikan standar desain dan bagikan dalam organisasi Anda. 

   1.  [AWS Service Catalog](https://docs.aws.amazon.com/servicecatalog/latest/adminguide/introduction.html) dapat digunakan untuk membuat portofolio yang mewakili standar desain dengan menggunakan infrastruktur sebagai kode. Anda dapat berbagi portofolio dengan semua akun. 

1.  Miliki mekanisme untuk menjaga standar desain up-to-date karena praktik terbaik baru diidentifikasi. 

1.  Jika standar desain diterapkan secara terpusat, Anda harus memiliki proses untuk meminta perubahan, pembaruan, dan pengecualian. 

 **Tingkat upaya untuk rencana implementasi:** Sedang. Untuk mengembangkan sebuah proses untuk membuat dan berbagi standar desain mungkin diperlukan kerja sama dan koordinasi dengan para pemangku kepentingan yang ada di seluruh organisasi Anda. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS01-BP03 Mengevaluasi persyaratan tata kelola](ops_priorities_governance_reqs.md) - Persyaratan tata kelola memengaruhi standar desain. 
+  [OPS01-BP04 Evaluasi persyaratan kepatuhan](ops_priorities_compliance_reqs.md) - Kepatuhan adalah input penting dalam membuat standar desain. 
+  [OPS07-BP02 Memastikan peninjauan yang konsisten terkait kesiapan operasional](ops_ready_to_support_const_orr.md) - Daftar periksa kesiapan operasional merupakan sebuah mekanisme untuk mengimplementasikan standar desain ketika Anda merancang desain beban kerja Anda. 
+  [OPS11-BP01 Buatlah suatu proses untuk peningkatan berkelanjutan](ops_evolve_ops_process_cont_imp.md) - Memperbarui standar desain merupakan bagian dari peningkatan berkelanjutan. 
+  [OPS11-BP04 Melakukan manajemen pengetahuan](ops_evolve_ops_knowledge_management.md) - Sebagai bagian dari praktik manajemen pengetahuan Anda, dokumentasikan dan bagikan standar desain. 

 **Dokumen terkait:** 
+ [Otomatiskan AWS Backup s dengan AWS Service Catalog](https://aws.amazon.com/blogs/mt/automate-aws-backups-with-aws-service-catalog/)
+ [AWS Service Catalog Akun Factory-Enhanced](https://aws.amazon.com/blogs/mt/aws-service-catalog-account-factory-enhanced/)
+ [Bagaimana Expedia Group membangun Database as a Service (DBaaS) menawarkan menggunakan AWS Service Catalog](https://aws.amazon.com/blogs/mt/how-expedia-group-built-database-as-a-service-dbaas-offering-using-aws-service-catalog/)
+ [ Mempertahankan visibilitas tentang penggunaan pola-pola arsitektur cloud ](https://aws.amazon.com/blogs/architecture/maintain-visibility-over-the-use-of-cloud-architecture-patterns/)
+ [Sederhanakan berbagi AWS Service Catalog portofolio Anda dalam pengaturan AWS Organizations](https://aws.amazon.com/blogs/mt/simplify-sharing-your-aws-service-catalog-portfolios-in-an-aws-organizations-setup/)

 **Video terkait:** 
+ [AWS Service Catalog — Memulai](https://www.youtube.com/watch?v=A9kKy6WhqVA)
+ [AWS re:invent 2020: Kelola AWS Service Catalog portofolio Anda seperti seorang ahli](https://www.youtube.com/watch?v=lVfXkWHAtR8)

 **Contoh terkait:** 
+ [AWS Service Catalog Arsitektur Referensi](https://github.com/aws-samples/aws-service-catalog-reference-architectures)
+ [AWS Service Catalog Lokakarya](https://catalog.us-east-1.prod.workshops.aws/workshops/d40750d7-a330-49be-9945-cde864610de9/en-US)

 **Layanan terkait:** 
+  [AWS Service Catalog](https://docs.aws.amazon.com/servicecatalog/latest/adminguide/introduction.html) 

# OPS05-BP07 Mengimplementasikan praktik untuk meningkatkan kualitas kode
<a name="ops_dev_integ_code_quality"></a>

 Implementasikan praktik untuk meningkatkan kualitas kode dan meminimalkan kecacatan. Beberapa contohnya termasuk, pengembangan yang didorong pengujian, peninjauan kode, pengadopsian standar, dan pemrograman berpasangan. Sertakan praktik-praktik ini ke dalam integrasi berkelanjutan dan proses penyampaian hasil Anda. 

 **Hasil yang diinginkan:** Organisasi Anda menggunakan praktik-praktik terbaik seperti peninjauan kode atau pemrograman berpasangan untuk meningkatkan kualitas kode. Pengembang dan operator mengadopsi praktik-praktik terbaik dalam kualitas kode sebagai bagian dari siklus hidup pengembangan perangkat lunak. 

 **Anti-pola umum:** 
+  Anda mempercayakan kode ke cabang utama aplikasi tanpa peninjauan kode. Perubahan otomatis melakukan deployment ke lingkungan produksi dan menyebabkan penghentian produksi. 
+  Aplikasi baru dikembangkan tanpa melakukan pengujian integrasi, unit, atau pengujian menyeluruh. Tidak ada cara untuk menguji aplikasi sebelum deployment. 
+  Tim Anda membuat perubahan-perubahan manual pada lingkungan produksi untuk mengatasi kecacatan. Perubahan tidak melalui proses pengujian atau peninjauan kode dan tidak direkam atau dicatat log-nya melalui proses penyampaian hasil dan integrasi berkelanjutan. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan mengadopsi praktik-praktik untuk meningkatkan kualitas kode, Anda dapat membantu meminimalkan masalah-masalah yang terjadi di lingkungan produksi. Praktik-praktik terbaik kualitas kode mencakup pemrograman berpasangan, tinjauan kode, dan implementasi alat-alat produktivitas AI. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Implementasikan praktik-praktik untuk meningkatkan kualitas kode guna meminimalkan terjadinya kecacatan sebelum dilakukan deployment terhadapnya. Gunakan praktik-praktik, misalnya pengembangan berbasis pengujian, peninjauan kode, dan pemrograman berpasangan, untuk meningkatkan kualitas pengembangan Anda. 

 Gunakan kekuatan AI generatif dengan Amazon Q Developer untuk meningkatkan produktivitas pengembang dan kualitas kode Anda. Amazon Q Developer menyertakan pembuatan saran kode (berdasarkan model bahasa besar), produksi pengujian unit (termasuk kondisi batas), dan peningkatan keamanan kode melalui deteksi dan perbaikan kerentanan keamanan. 

 **Contoh pelanggan** 

 AnyCompany Retail mengadopsi beberapa praktik untuk meningkatkan kualitas kode. Mereka telah mengadopsi pengembangan berbasis pengujian sebagai standar untuk menulis aplikasi. Untuk beberapa fitur baru, pengembang mereka akan memasangkan program menjadi satu saat proses sprint. Setiap permintaan penarikan (pull request) akan melewati peninjauan kode oleh pengembang senior sebelum diintegrasikan dan dilakukan deployment. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  Adopsi praktik-praktik kualitas kode, misalnya praktik pengembangan berbasis pengujian, peninjauan kode, dan pemrograman berpasangan, ke dalam proses penyampaian hasil dan integrasi berkelanjutan Anda. Gunakan teknik-teknik ini untuk meningkatkan kualitas perangkat lunak. 

   1.  Gunakan [Amazon Q Developer](https://docs.aws.amazon.com/amazonq/latest/qdeveloper-ug/what-is.html), sebuah alat AI generatif yang dapat membantu Anda membuat kasus pengujian unit (termasuk ketentuan batas), yang dapat menghasilkan fungsi menggunakan kode dan komentar, menerapkan algoritme terkenal, mendeteksi pelanggaran kebijakan keamanan dan kerentanan dalam kode Anda, mendeteksi rahasia, memindai infrastruktur sebagai kode (IaC), kode dokumen, dan mempelajari pustaka kode pihak ketiga dengan lebih cepat. 

   1.  [Amazon CodeGuru Reviewer](https://docs.aws.amazon.com/codeguru/latest/reviewer-ug/welcome.html) dapat memberikan rekomendasi pemrograman untuk kode Python dan Java menggunakan machine learning. 

 **Tingkat upaya untuk rencana implementasi:** Sedang. Ada banyak cara untuk mengimplementasikan praktik-praktik terbaik ini, tetapi membuat organisasi mau mengadopsinya mungkin akan menjadi hal yang sulit. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS05-BP02 Menguji dan memvalidasi perubahan](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_dev_integ_test_val_chg.html) 
+  [OPS05-BP06 Membagikan standar desain](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_dev_integ_share_design_stds.html) 

 **Dokumen terkait:** 
+  [Adopsi pendekatan pengembangan berbasis pengujian](https://docs.aws.amazon.com/prescriptive-guidance/latest/best-practices-cdk-typescript-iac/development-best-practices.html) 
+  [Mengakselerasi Siklus Hidup Pengembangan Perangkat Lunak Anda dengan Amazon Q](https://aws.amazon.com/blogs/devops/accelerate-your-software-development-lifecycle-with-amazon-q/) 
+  [Amazon Q Developer, sekarang tersedia secara umum, menyertakan pratinjau kemampuan-kemampuan baru untuk menata kembali pengalaman pengembang](https://aws.amazon.com/blogs/aws/amazon-q-developer-now-generally-available-includes-new-capabilities-to-reimagine-developer-experience/) 
+  [Lembar Cheat Utama untuk Menggunakan Amazon Q Developer di IDE Anda](https://community.aws/content/2eYoqeFRqaVnk900emsknDfzhfW/the-ultimate-cheat-sheet-for-using-amazon-q-developer-in-your-ide) 
+  [Beban kerja Shift-Left, memanfaatkan AI untuk Pembuatan Uji](https://community.aws/content/2gBZtC94gPzaCQRnt4P0rIYWuBx/shift-left-workload-leveraging-ai-for-test-creation) 
+  [Pusat Amazon Q Developer](https://aws.amazon.com/developer/generative-ai/amazon-q/) 
+  [10 cara untuk membangun aplikasi lebih cepat dengan menggunakan Amazon CodeWhisperer](https://aws.amazon.com/blogs/devops/10-ways-to-build-applications-faster-with-amazon-codewhisperer/) 
+  [Melihat melampaui cakupan kode dengan Amazon CodeWhisperer](https://aws.amazon.com/blogs/devops/looking-beyond-code-coverage-with-amazon-codewhisperer/) 
+  [Praktik Terbaik untuk Rekayasa Perintah dengan Amazon CodeWhisperer](https://aws.amazon.com/blogs/devops/best-practices-for-prompt-engineering-with-amazon-codewhisperer/) 
+  [Panduan Perangkat Lunak Tangkas](https://martinfowler.com/agile.html) 
+  [Pipeline CI/CD adalah pemandu utama rilisan saya](https://aws.amazon.com/builders-library/cicd-pipeline/) 
+  [Lakukan otomatisasi peninjauan kode dengan Amazon CodeGuru Reviewer](https://aws.amazon.com/blogs/devops/automate-code-reviews-with-amazon-codeguru-reviewer/) 
+  [Adopsi pendekatan pengembangan berbasis pengujian](https://docs.aws.amazon.com/prescriptive-guidance/latest/best-practices-cdk-typescript-iac/development-best-practices.html) 
+  [Bagaimana DevFactory membangun aplikasi yang lebih baik dengan Amazon CodeGuru](https://aws.amazon.com/blogs/machine-learning/how-devfactory-builds-better-applications-with-amazon-codeguru/) 
+  [Tentang Pemrograman Berpasangan](https://martinfowler.com/articles/on-pair-programming.html) 
+  [RENGA Inc. mengotomatiskan peninjauan kode dengan Amazon CodeGuru](https://aws.amazon.com/blogs/machine-learning/renga-inc-automates-code-reviews-with-amazon-codeguru/) 
+  [Seni Pengembangan Tangkas: Pengembangan yang Didorong Pengujian](http://www.jamesshore.com/v2/books/aoad1/test_driven_development) 
+  [Mengapa peninjauan kode itu penting (dan sesungguhnya menghemat waktu\$1)](https://www.atlassian.com/agile/software-development/code-reviews) 

 **Video terkait:** 
+  [Menerapkan API dengan Amazon Q Developer Agent untuk Pengembangan Perangkat Lunak](https://www.youtube.com/watch?v=U4XEvJUvff4) 
+  [Menginstal, Mengonfigurasi, & Menggunakan Amazon Q Developer dengan JetBrains IDE (Cara)](https://www.youtube.com/watch?v=-iQfIhTA4J0) 
+  [Menguasai seni Amazon CodeWhisperer - Daftar putar YouTube](https://www.youtube.com/playlist?list=PLDqi6CuDzubxzL-yIqgQb9UbbceYdKhpK) 
+  [AWS re:Invent 2020: Peningkatan berkelanjutan kualitas kode dengan Amazon CodeGuru](https://www.youtube.com/watch?v=iX1i35H1OVw) 
+  [AWS Summit ANZ 2021 - Mendorong strategi yang mengutamakan pengujian dengan CDK dan pengembangan yang didorong pengujian](https://www.youtube.com/watch?v=1R7G_wcyd3s) 

 **Layanan terkait:** 
+  [Amazon Q Developer](https://aws.amazon.com/q/developer/) 
+  [Amazon CodeGuru Reviewer](https://docs.aws.amazon.com/codeguru/latest/reviewer-ug/welcome.html) 
+  [Amazon CodeGuru Profiler](https://docs.aws.amazon.com/codeguru/latest/profiler-ug/what-is-codeguru-profiler.html) 

# OPS05-BP08 Menggunakan beberapa lingkungan
<a name="ops_dev_integ_multi_env"></a>

 Gunakan beberapa lingkungan untuk bereksperimen, mengembangkan, dan menguji beban kerja Anda. Gunakan tingkat kontrol berjenjang seiring lingkungan mendekati tahap produksi untuk mendapatkan keyakinan bahwa beban kerja Anda beroperasi sesuai keinginan ketika di-deploy. 

 **Hasil yang diinginkan:** Anda memiliki beberapa lingkungan yang mencerminkan kebutuhan-kebutuhan kepatuhan dan tata kelola Anda. Anda menguji dan mempromosikan kode melalui lingkungan-lingkungan yang ada di jalur Anda menuju produksi. 

1.  Organisasi Anda melakukan hal ini melalui pembentukan zona landasan, yang menyediakan tata kelola, kontrol, otomatisasi akun, jaringan, keamanan, dan observabilitas operasional. Kelola kemampuan zona landasan ini menggunakan beberapa lingkungan. Contoh umumnya adalah organisasi sandbox untuk mengembangkan dan menguji perubahan pada zona landasan berbasis [AWS Control Tower](https://aws.amazon.com/controltower/), yang mencakup [AWS IAM Identity Center](https://aws.amazon.com/iam/identity-center/) dan kebijakan seperti [kebijakan kontrol layanan (SCP](https://docs.aws.amazon.com/organizations/latest/userguide/orgs_manage_policies_scps.html)). Semua elemen ini dapat secara signifikan memengaruhi akses dan pengoperasian Akun AWS di dalam zona landasan. 

1.  Selain layanan ini, tim Anda memperluas kemampuan zona landasan dengan solusi yang diterbitkan oleh AWS dan partner AWS atau sebagai solusi kustom yang dikembangkan dalam organisasi Anda. Contoh solusi yang diterbitkan oleh AWS termasuk [Customizations for AWS Control Tower (CfCT)](https://aws.amazon.com/solutions/implementations/customizations-for-aws-control-tower/) dan [AWS Control Tower Account Factory for Terraform](https://docs.aws.amazon.com/controltower/latest/userguide/aft-overview.html) (AFT). 

1.  Organisasi Anda menerapkan prinsip pengujian, promosi kode, dan perubahan kebijakan yang sama untuk zona landasan di semua lingkungan dalam jalur Anda menuju produksi. Strategi ini menyediakan lingkungan zona landasan yang stabil dan aman untuk tim aplikasi dan beban kerja Anda. 

 **Anti-pola umum:** 
+  Anda sedang melakukan pengembangan di sebuah lingkungan pengembangan bersama dan pengembang lain menimpa perubahan kode Anda. 
+  Kontrol keamanan terbatas di lingkungan pengembangan bersama Anda melarang Anda untuk melakukan eksperimen dengan layanan dan fitur baru. 
+  Anda melakukan pengujian beban pada sistem produksi Anda dan menyebabkan terjadinya pemadaman (outage) terhadap pengguna Anda. 
+  Kesalahan fatal yang menyebabkan hilangnya data terjadi di lingkungan produksi. Di lingkungan produksi, Anda mencoba membuat ulang kondisi yang menyebabkan data hilang tersebut sehingga Anda dapat mengidentifikasi bagaimana hal tersebut bisa terjadi dan mencegahnya agar tidak terjadi kembali. Untuk mencegah kejadian hilang data lainnya selama proses pengujian, Anda terpaksa menjadikan aplikasi tidak tersedia untuk pengguna. 
+  Anda mengoperasikan layanan multi-tenant dan tidak dapat mendukung permintaan lingkungan khusus yang diajukan oleh pelanggan. 
+  Anda mungkin tidak selalu melakukan pengujian, tetapi ketika Anda melakukannya, Anda melakukan pengujian tersebut di lingkungan produksi. 
+  Anda percaya bahwa dengan satu lingkungan tunggal, cakupan dampak perubahannya hanya terjadi di dalam lingkungan tersebut. 
+  Anda meningkatkan kemampuan zona landasan penting, tetapi perubahan tersebut mengganggu kemampuan tim Anda untuk menyediakan akun bagi proyek baru atau beban kerja yang sudah ada. 
+  Anda menerapkan kontrol baru pada Akun AWS Anda, tetapi perubahan tersebut memengaruhi kemampuan tim beban kerja Anda untuk menerapkan perubahan di dalam Akun AWS mereka. 

 **Manfaat menjalankan praktik terbaik ini:** Saat Anda melakukan deployment beberapa lingkungan, Anda dapat mendukung beberapa lingkungan pengembangan, pengujian, dan produksi secara serentak tanpa menimbulkan konflik di antara developer atau komunitas pengguna. Untuk kemampuan kompleks seperti zona landasan, hal ini secara signifikan mengurangi risiko perubahan, menyederhanakan proses perbaikan, dan mengurangi risiko pembaruan penting terhadap lingkungan. Organisasi yang menggunakan zona landasan secara otomatis mendapatkan manfaat dari penggunaan strategi multi-akun di lingkungan AWS mereka, dengan struktur akun, tata kelola, jaringan, dan konfigurasi keamanan. Seiring organisasi Anda berkembang dari waktu ke waktu, zona landasan dapat berevolusi untuk mengamankan serta mengatur beban kerja dan sumber daya Anda. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Gunakan beberapa lingkungan dan sediakan lingkungan sandbox pengembang yang memiliki kontrol minimum untuk membantu eksperimen. Sediakan lingkungan pengembangan individu untuk membantu melakukan pekerjaan secara paralel, sehingga ketangkasan pengembangan akan meningkat. Implementasikan kontrol yang lebih kuat di lingkungan tersebut ketika mendekati produksi agar pengembang dapat membuat inovasi. Gunakan infrastruktur sebagai kode dan sistem manajemen konfigurasi untuk men-deploy lingkungan yang dikonfigurasi sesuai dengan kontrol yang ada di dalam lingkungan produksi guna memastikan sistem beroperasi sesuai keinginan saat di-deploy. Saat lingkungan tidak digunakan, nonaktifkan lingkungan tersebut untuk menghindari timbulnya biaya-biaya terkait sumber daya tidak terpakai (misalnya sistem pengembangan di malam hari dan di akhir pekan). Deploy lingkungan setara produksi saat melakukan pengujian beban untuk meningkatkan hasil yang valid. 

 Tim seperti rekayasa platform, jaringan, dan operasi keamanan sering mengelola kemampuan di tingkat organisasi dengan persyaratan yang berbeda. Pemisahan akun saja tidak cukup untuk menyediakan dan memelihara lingkungan terpisah untuk eksperimen, pengembangan, dan pengujian. Dalam kasus seperti itu, buat instans AWS Organizations terpisah. 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+ [ Penjadwal Instans di AWS](https://aws.amazon.com/solutions/implementations/instance-scheduler-on-aws/)
+  [Apa itu AWS CloudFormation?](https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/Welcome.html) 
+ [ Mengatur Lingkungan AWS Anda Menggunakan Beberapa Akun - Beberapa organisasi - Uji perubahan pada lingkungan AWS Anda secara keseluruhan ](https://docs.aws.amazon.com/whitepapers/latest/organizing-your-aws-environment/multiple-organizations.html#test-changes-to-your-overall-aws-environment)
+ [Panduan AWS Control Tower](https://catalog.workshops.aws/control-tower)

# OPS05-BP09 Lakukan perubahan yang sering, kecil, dan reversibel
<a name="ops_dev_integ_freq_sm_rev_chg"></a>

 Gunakan perubahan yang sering, kecil, dan dapat dikembalikan untuk mengurangi cakupan perubahan. Ketika digunakan bersamaan dengan sistem manajemen perubahan, sistem manajemen konfigurasi, dan sistem build serta pengiriman, perubahan yang sering, kecil, dan dapat dikembalikan dapat mengurangi cakupan dan dampak perubahan. Hal ini menghasilkan pemecahan masalah yang lebih efektif dan remediasi yang lebih cepat dengan opsi untuk membatalkan perubahan. 

 **Anti-pola umum:** 
+  Anda melakukan deployment versi baru aplikasi Anda setiap tiga bulan sekali dengan periode perubahan yang mengharuskan layanan inti dinonaktifkan. 
+  Anda sering kali membuat perubahan pada skema basis data Anda tanpa melacak perubahan dalam sistem manajemen Anda terlebih dahulu. 
+  Anda melakukan pembaruan secara manual di tempat, menimpa instalasi dan konfigurasi yang ada, dan tidak memiliki rencana roll-back yang jelas. 

 **Manfaat menerapkan praktik terbaik ini:** Upaya pengembangan akan menjadi lebih cepat dengan menerapkan perubahan kecil dalam frekuensi yang rapat. Ketika perubahan itu berukuran kecil, perubahan tersebut akan jauh lebih mudah diidentifikasi jika terdapat konsekuensi yang tidak diinginkan, serta lebih mudah untuk dikembalikan. Ketika perubahan dapat dikembalikan, risiko implementasi perubahan menjadi lebih kecil karena pemulihannya lebih mudah diterapkan. Proses perubahan memiliki risiko yang lebih kecil dan dampak kegagalan perubahan menjadi berkurang. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Rendah 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Gunakan perubahan yang sering, kecil, dan dapat dikembalikan untuk mengurangi cakupan dan dampak yang ditimbulkan perubahan tersebut. Hal ini akan memudahkan Anda dalam melakukan pemecahan masalah, membantu proses remediasi yang lebih cepat, dan menyediakan opsi untuk membatalkan perubahan. Hal ini juga akan meningkatkan rasio nilai yang dapat Anda berikan ke bisnis. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS05-BP03 Menggunakan sistem manajemen konfigurasi](ops_dev_integ_conf_mgmt_sys.md) 
+  [OPS05-BP04 Menggunakan sistem manajemen build dan deployment](ops_dev_integ_build_mgmt_sys.md) 
+  [OPS06-BP04 Mengotomatiskan pengujian dan rollback](ops_mit_deploy_risks_auto_testing_and_rollback.md) 

 **Dokumen terkait:** 
+ [Menerapkan Layanan Mikro pada AWS](https://docs.aws.amazon.com/whitepapers/latest/microservices-on-aws/microservices-on-aws.html)
+ [ Layanan Mikro - Observabilitas ](https://docs.aws.amazon.com/whitepapers/latest/microservices-on-aws/observability.html)

# OPS05-BP10 Mengotomatiskan integrasi dan deployment sepenuhnya
<a name="ops_dev_integ_auto_integ_deploy"></a>

 Otomatiskan build, deployment, dan pengujian beban kerja. Hal ini mengurangi kesalahan yang disebabkan oleh proses manual, dan mengurangi upaya untuk melakukan deployment perubahan. 

 Terapkan metadata menggunakan [Tag Sumber Daya](https://docs.aws.amazon.com/general/latest/gr/aws_tagging.html) dan [AWS Resource Groups](https://docs.aws.amazon.com/ARG/latest/APIReference/Welcome.html) sesuai [strategi penandaan](https://aws.amazon.com/answers/account-management/aws-tagging-strategies/) yang konsisten untuk mencapai identifikasi sumber daya Anda. Berikan tag pada sumber daya Anda untuk organisasi, akuntansi biaya, kontrol akses, dan penargetan pelaksanaan aktivitas operasi yang diotomatiskan. 

 **Hasil yang diinginkan:** Pengembang menggunakan alat untuk mengirimkan kode dan mencapai produksi. Pengembang tidak harus masuk log in ke dalam Konsol Manajemen AWS untuk memberikan pembaruan. Terdapat jejak audit penuh untuk perubahan dan konfigurasi, sehingga hal itu cukup untuk memenuhi kebutuhan tata kelola dan kepatuhan. Proses dapat diulang dan distandardisasi di seluruh tim. Pengembang bebas untuk memusatkan perhatian pada pengembangan dan pendorongan kode, sehingga akan meningkatkan produktivitas. 

 **Anti-pola umum:** 
+  Pada hari Jumat, Anda selesai menulis kode baru untuk cabang fitur Anda. Pada hari Senin, setelah menjalankan skrip pengujian kualitas kode dan setiap skrip pengujian unit, Anda mendaftarkan kode tersebut untuk rilisan terjadwal berikutnya. 
+  Anda ditugaskan untuk membuat kode perbaikan untuk sebuah masalah besar yang dapat memengaruhi banyak pelanggan di lingkungan produksi. Setelah menguji perbaikan tersebut, Anda melakukan commit terhadap kode Anda dan mengirimkan manajemen perubahan melalui email untuk meminta persetujuan deployment ke lingkungan produksi. 
+  Sebagai pengembang, Anda masuk log in ke Konsol Manajemen AWS untuk membuat sebuah lingkungan pengembangan baru dengan menggunakan metode dan sistem yang tidak standar. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan mengimplementasikan sistem manajemen build dan deployment otomatis, Anda dapat mengurangi kesalahan yang disebabkan proses yang diselesaikan secara manual dan mengurangi upaya yang diperlukan untuk melakukan deployment perubahan, sehingga akan membantu anggota tim Anda berkonsentrasi untuk menghadirkan nilai bisnis. Anda meningkatkan kecepatan pengiriman selama proses menuju lingkungan produksi. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Rendah 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Anda menggunakan sistem manajemen build dan deployment untuk melacak dan mengimplementasikan perubahan, mengurangi kesalahan yang disebabkan oleh proses yang diselesaikan secara manual, dan mengurangi upaya yang diperlukan. Lakukan otomatisasi sepenuhnya terhadap pipeline integrasi dan deployment dari check-in kode hingga build, pengujian, deployment, dan validasi. Hal ini dapat mengurangi waktu tunggu, mendorong peningkatan frekuensi perubahan, mengurangi tingkat upaya, meningkatkan kecepatan masuk pasar, menghasilkan peningkatan produktivitas, dan meningkatkan keamanan kode Anda selama proses Anda menuju lingkungan produksi. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS05-BP03 Menggunakan sistem manajemen konfigurasi](ops_dev_integ_conf_mgmt_sys.md) 
+  [OPS05-BP04 Menggunakan sistem manajemen build dan deployment](ops_dev_integ_build_mgmt_sys.md) 

 **Dokumen terkait:** 
+  [Apa itu AWS CodeBuild?](https://docs.aws.amazon.com/codebuild/latest/userguide/welcome.html) 
+  [Apa itu AWS CodeDeploy?](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html) 

 **Video terkait:** 
+ [AWS re:Invent 2022 - Praktik terbaik AWS Well-Architected untuk DevOps di AWS](https://youtu.be/hfXokRAyorA)

# OPS 6. Bagaimana cara memitigasi risiko deployment?
<a name="ops-06"></a>

 Adopsi pendekatan yang memberikan umpan balik cepat atas kualitas dan mencapai pemulihan cepat dari perubahan yang tidak memiliki hasil yang tidak diinginkan. Menggunakan praktik tersebut akan memitigasi dampak masalah akibat deployment perubahan. 

**Topics**
+ [OPS06-BP01 Rencana untuk perubahan yang gagal](ops_mit_deploy_risks_plan_for_unsucessful_changes.md)
+ [OPS06-BP02 Uji penerapan](ops_mit_deploy_risks_test_val_chg.md)
+ [OPS06-BP03 Menggunakan strategi deployment yang aman](ops_mit_deploy_risks_deploy_mgmt_sys.md)
+ [OPS06-BP04 Mengotomatiskan pengujian dan rollback](ops_mit_deploy_risks_auto_testing_and_rollback.md)

# OPS06-BP01 Rencana untuk perubahan yang gagal
<a name="ops_mit_deploy_risks_plan_for_unsucessful_changes"></a>

Rencanakan untuk kembali ke keadaan yang diketahui pasti baik, atau perbaiki di lingkungan produksi jika deployment menyebabkan hasil yang tidak diinginkan. Adanya kebijakan untuk menetapkan rencana semacam ini bermanfaat bagi semua tim dalam mengembangkan strategi untuk pulih dari perubahan yang gagal. Beberapa contoh strategi adalah langkah deployment dan rollback, kebijakan perubahan, penanda fitur, pemisahan lalu lintas, dan pergeseran lalu lintas. Rilis tunggal dapat mencakup beberapa perubahan komponen yang terkait. Strategi harus memberikan kemampuan untuk bertahan atau pulih dari kegagalan perubahan komponen apa pun.

 **Hasil yang diinginkan:** Anda telah menyiapkan sebuah rencana pemulihan yang mendetail untuk perubahan Anda apabila perubahan tersebut tidak berhasil. Selain itu, Anda juga telah mengurangi ukuran rilis untuk meminimalkan dampak-dampak potensial yang mungkin ditimbulkan terhadap komponen beban kerja lainnya. Hasilnya, Anda telah mengurangi dampak bisnis Anda dengan mempersingkat potensi waktu henti yang mungkin diakibatkan oleh kegagalan perubahan dan meningkatkan fleksibilitas serta efisiensi waktu pemulihan. 

 **Anti-pola umum:** 
+  Anda melakukan deployment dan aplikasi Anda menjadi tidak stabil, namun sepertinya masih ada pengguna yang aktif di sistem. Anda harus memutuskan apakah akan melakukan roll back terhadap perubahan yang akan berdampak pada pengguna aktif atau menunggu untuk melakukan roll back perubahan tersebut karena tahu bagaimana pun juga pengguna dapat terkena dampaknya. 
+  Setelah Anda membuat perubahan rutin, lingkungan baru Anda dapat diakses tetapi salah satu subnet Anda menjadi tidak dapat dijangkau. Anda harus memutuskan apakah akan melakukan roll back terhadap semuanya atau mencoba memperbaiki subnet yang tidak dapat diakses tersebut. Sementara Anda sedang memutuskan hal ini, subnet tersebut tetap tidak dapat dijangkau. 
+  Sistem Anda tidak dirancang dapat diperbarui dengan rilis-rilis yang lebih kecil. Akibatnya, Anda mengalami kesulitan dalam membatalkan perubahan massal tersebut selama deployment yang gagal. 
+  Anda tidak menggunakan infrastruktur sebagai kode (IaC) dan Anda melakukan pembaruan secara manual pada infrastruktur Anda sehingga mengakibatkan terjadinya konfigurasi yang tidak diinginkan. Anda tidak dapat melacak dan membatalkan perubahan manual secara efektif. 
+  Karena Anda belum mengukur peningkatan frekuensi deployment Anda, tim Anda kemudian mengalami kesulitan untuk mengurangi ukuran perubahan mereka dan meningkatkan rencana rollback mereka untuk setiap perubahan, yang berimbas pada risiko yang lebih besar dan tingkat kegagalan yang meningkat. 
+  Anda tidak mengukur total durasi pemadaman (outage) yang disebabkan oleh perubahan yang tidak berhasil. Tim Anda tidak dapat memprioritaskan dan meningkatkan proses deployment serta efektivitas rencana pemulihannya. 

 **Manfaat membangun praktik terbaik ini:** Memiliki rencana untuk pulih dari perubahan yang gagal meminimalkan waktu rata-rata untuk memulihkan (MTTR) dan mengurangi dampak bisnis Anda. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Kebijakan dan praktik yang konsisten serta terdokumentasi yang diadopsi oleh tim rilis akan memungkinkan organisasi untuk merencanakan apa yang seharusnya terjadi apabila terjadi kegagalan perubahan. Kebijakan tersebut harus memungkinkan perbaikan ke depan (fixing forward) dalam keadaan tertentu. Dalam situasi apa pun, rencana perbaikan ke depan atau rollback harus didokumentasikan dan diuji dengan baik sebelum melakukan deployment ke lingkungan produksi langsung sehingga waktu yang diperlukan untuk mengembalikan perubahan dapat diminimalkan. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  Buatlah dokumentasi kebijakan yang mengharuskan tim memiliki rencana efektif untuk mengembalikan perubahan dalam periode tertentu. 

   1.  Kebijakan harus menentukan kapan situasi perbaikan ke depan diperbolehkan. 

   1.  Rencana rollback yang terdokumentasi harus dapat diakses oleh semua pihak yang terlibat. 

   1.  Tentukan persyaratan-persyaratan untuk rollback (misalnya, ketika ternyata ada deployment perubahan tidak sah). 

1.  Lakukan analisis terhadap tingkat dampak yang ditimbulkan oleh semua perubahan yang berkaitan dengan setiap komponen dari sebuah beban kerja. 

   1.  Buatlah perubahan-perubahan berulang memungkinkan untuk distandardisasi, dijadikan templat, dan diotorisasi di awal jika perubahan-perubahan tersebut mengikuti alur kerja yang konsisten yang memberlakukan kebijakan perubahan. 

   1.  Kurangi potensi dampak yang mungkin ditimbulkan oleh setiap perubahan dengan menjadikan ukuran perubahan lebih kecil sehingga waktu pemulihan yang dibutuhkan menjadi lebih singkat dan menyebabkan lebih sedikit dampak bisnis. 

   1.  Pastikan prosedur rollback akan mengembalikan kode ke keadaan yang pasti baik untuk menghindari terjadinya insiden, jika memungkinkan. 

1.  Integrasikan alat-alat dan alur kerja untuk menegakkan kebijakan Anda secara terprogram. 

1.  Buat agar data tentang perubahan dapat dilihat oleh para pemilik beban kerja lain untuk meningkatkan kecepatan diagnosis perubahan yang gagal yang tidak dapat dibatalkan. 

   1.  Ukur keberhasilan praktik ini dengan menggunakan data perubahan yang terlihat dan identifikasi setiap peningkatan iteratif yang mungkin dilakukan. 

1.  Gunakan alat-alat pemantauan untuk memverifikasi keberhasilan atau kegagalan sebuah deployment untuk mempercepat pengambilan keputusan saat melakukan rollback. 

1.  Ukur durasi pemadaman (outage) Anda selama terjadi kegagalan perubahan untuk terus meningkatkan kualitas rencana pemulihan Anda. 

 **Tingkat upaya untuk rencana implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS06-BP04 Mengotomatiskan pengujian dan rollback](ops_mit_deploy_risks_auto_testing_and_rollback.md) 

 **Dokumen terkait:** 
+ [AWS Builders Library \$1 Memastikan Keamanan Rollback Selama Penerapan](https://aws.amazon.com/builders-library/ensuring-rollback-safety-during-deployments/)
+ [AWS Whitepaper \$1 Ubah Manajemen di Cloud](https://docs.aws.amazon.com/whitepapers/latest/change-management-in-the-cloud/change-management-in-the-cloud.html)

 **Video terkait:** 
+ [ re:Invent 2019 \$1 Pendekatan Amazon untuk deployment ketersediaan tinggi ](https://aws.amazon.com/builders-library/amazon-approach-to-high-availability-deployment/)

# OPS06-BP02 Uji penerapan
<a name="ops_mit_deploy_risks_test_val_chg"></a>

 Uji prosedur rilis dalam tahap praproduksi dengan menggunakan konfigurasi deployment, kontrol keamanan, langkah, dan prosedur yang sama seperti dalam tahap produksi. Lakukan validasi bahwa semua langkah yang di-deploy selesai sesuai harapan, seperti dengan memeriksa file, konfigurasi, dan layanan. Uji lebih lanjut semua perubahan dengan pengujian fungsional, integrasi, dan beban, beserta pemantauan apa pun seperti pemeriksaan kondisi. Dengan melakukan pengujian ini, Anda dapat mengidentifikasi masalah deployment lebih awal dengan peluang untuk merencanakan dan menanggulanginya sebelum produksi. 

 Anda dapat membuat lingkungan paralel sementara untuk menguji setiap perubahan. Lakukan otomatisasi deployment lingkungan pengujian dengan menggunakan infrastruktur sebagai kode (IaC) untuk membantu mengurangi jumlah pekerjaan yang terlibat dan memastikan stabilitas, konsistensi, dan pengiriman fitur yang lebih cepat. 

 **Hasil yang diinginkan:** Organisasi Anda mengadopsi budaya pengembangan berbasis pengujian yang mencakup pengujian deployment. Ini akan memastikan bahwa tim akan berkonsentrasi untuk menghadirkan nilai bisnis, bukan mengelola rilis. Tim terlibat sejak dini setelah identifikasi risiko deployment untuk menentukan arah mitigasi yang sesuai. 

 **Anti-pola umum:** 
+  Selama rilis produksi, deployment yang belum teruji sering kali akan menyebabkan masalah-masalah yang memerlukan penyelesaian dan eskalasi. 
+  Rilis Anda berisi infrastruktur sebagai kode (IaC) yang memperbarui sumber daya yang ada sekarang. Anda tidak yakin apakah IaC berjalan dengan sukses atau akan menyebabkan dampak pada sumber daya. 
+  Anda men-deploy sebuah fitur baru ke aplikasi Anda. Fitur tersebut tidak berfungsi sesuai keinginan dan masalah ini baru dapat diketahui setelah dilaporkan oleh para pengguna yang terdampak. 
+  Anda memperbarui sertifikat Anda. Anda secara tidak sengaja menginstal sertifikat ke komponen-komponen yang salah, yang akhirnya tidak terdeteksi dan berdampak pada pengunjung situs web karena koneksi yang aman ke situs web tidak dapat dibuat. 

 **Manfaat menerapkan praktik terbaik ini:** Pengujian ekstensif selama tahap pra-produksi dalam prosedur deployment serta perubahan-perubahan yang dimunculkannya dapat meminimalkan potensi dampak yang mungkin dapat ditimbulkan terhadap lingkungan produksi yang disebabkan oleh langkah-langkah deployment. Hal ini akan meningkatkan kepercayaan diri selama rilis produksi dan meminimalkan dukungan operasional tanpa memperlambat kecepatan penyampaian perubahan yang hendak dilakukan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Menguji proses deployment Anda sama pentingnya dengan menguji perubahan yang dihasilkan dari deployment Anda. Hal ini dapat dicapai dengan menguji langkah-langkah deployment Anda di lingkungan pra-produksi yang semaksimal mungkin mencerminkan produksi. Masalah-masalah umum, seperti langkah-langkah deployment yang tidak lengkap atau salah, atau kesalahan konfigurasi, dapat terdeteksi sebelum masuk ke lingkungan produksi. Selain itu, Anda dapat menguji langkah-langkah pemulihan Anda. 

 **Contoh pelanggan** 

 Sebagai bagian dari pipeline continuous integration and continuous delivery (CI/CD), AnyCompany Retail melakukan langkah-langkah yang ditentukan yang diperlukan untuk merilis pembaruan infrastruktur dan perangkat lunak bagi pelanggannya dalam lingkungan seperti produksi. Pipeline tersebut terdiri dari langkah pra-pemeriksaan untuk mendeteksi penyimpangan (mendeteksi perubahan pada sumber daya yang dilakukan di luar IaC Anda) di dalam sumber daya sebelum deployment, serta melakukan validasi terhadap tindakan-tindakan yang dilakukan IaC setelah inisiasi. Tahap ini memvalidasi langkah-langkah deployment, seperti memverifikasi bahwa file dan konfigurasi tertentu sudah siap dan layanan-layanan sudah berada dalam status berjalan serta merespons dengan benar pemeriksaan kondisi pada host lokal sebelum didaftarkan ulang dengan penyeimbang beban. Selain itu, semua perubahan menandai sejumlah pengujian otomatis, misalnya pengujian fungsional, keamanan, regresi, integrasi, dan beban. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  Lakukan pemeriksaan pra-instalasi untuk mencerminkan lingkungan pra-produksi ke lingkungan produksi. 

   1.  Gunakan [deteksi drift](https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/using-cfn-stack-drift.html) untuk mendeteksi kapan sumber daya telah diubah di luar. CloudFormation

   1.  Gunakan [set perubahan](https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/using-cfn-updating-stacks-changesets.html) untuk memvalidasi bahwa maksud pembaruan tumpukan cocok dengan tindakan yang CloudFormation dilakukan saat set perubahan dimulai. 

1.  Ini akan memicu langkah persetujuan manual di [AWS CodePipeline](https://docs.aws.amazon.com/codepipeline/latest/userguide/approvals.html) untuk mengotorisasi deployment ke lingkungan pra-produksi. 

1.  Gunakan konfigurasi penerapan seperti [AWS CodeDeploy AppSpec](https://docs.aws.amazon.com/codedeploy/latest/userguide/application-specification-files.html)file untuk menentukan langkah penerapan dan validasi. 

1.  Jika berlaku, [berintegrasi AWS CodeDeploy dengan AWS layanan lain](https://docs.aws.amazon.com/codedeploy/latest/userguide/integrations-aws.html) atau [berintegrasi AWS CodeDeploy dengan produk dan layanan mitra](https://docs.aws.amazon.com/codedeploy/latest/userguide/integrations-partners.html). 

1.  [Pantau penerapan menggunakan](https://docs.aws.amazon.com/codedeploy/latest/userguide/monitoring.html) Amazon CloudWatch, AWS CloudTrail, dan pemberitahuan SNS acara Amazon. 

1.  Lakukan pengujian otomatis pasca-deployment, termasuk pengujian fungsional, keamanan, regresi, integrasi, dan beban. 

1.  [Memecahkan](https://docs.aws.amazon.com/codedeploy/latest/userguide/troubleshooting.html) masalah deployment. 

1.  Validasi yang berhasil terhadap langkah-langkah sebelumnya seharusnya menginisiasi alur kerja persetujuan manual untuk memberikan otorisasi deployment ke produksi. 

 **Tingkat upaya untuk rencana implementasi:** Tinggi 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS05-BP02 Menguji dan memvalidasi perubahan](ops_dev_integ_test_val_chg.md) 

 **Dokumen terkait:** 
+ [AWS Perpustakaan Pembangun \$1 Mengotomatiskan penerapan yang aman dan lepas tangan \$1 Uji Penerapan](https://aws.amazon.com/builders-library/automating-safe-hands-off-deployments/#Test_deployments_in_pre-production_environments)
+ [AWS Whitepaper \$1 Mempraktikkan Integrasi Berkelanjutan dan Pengiriman Berkelanjutan AWS](https://docs.aws.amazon.com/whitepapers/latest/practicing-continuous-integration-continuous-delivery/testing-stages-in-continuous-integration-and-continuous-delivery.html)
+ [ Kisah Apollo - Mesin Deployment Amazon ](https://www.allthingsdistributed.com/2014/11/apollo-amazon-deployment-engine.html)
+  [Cara menguji dan men-debug AWS CodeDeploy secara lokal sebelum Anda mengirimkan kode Anda](https://aws.amazon.com/blogs/devops/how-to-test-and-debug-aws-codedeploy-locally-before-you-ship-your-code/) 
+ [ Mengintegrasikan Pengujian Konektivitas Jaringan dengan Deployment Infrastruktur ](https://aws.amazon.com/blogs/networking-and-content-delivery/integrating-network-connectivity-testing-with-infrastructure-deployment/)

 **Video terkait:** 
+ [ re:Invent 2020 \$1 Menguji perangkat lunak dan sistem di Amazon ](https://www.youtube.com/watch?v=o1sc3cK9bMU)

 **Contoh terkait:** 
+ [Tutorial \$1 Menyebarkan dan ECS layanan Amazon dengan tes validasi](https://docs.aws.amazon.com/codedeploy/latest/userguide/tutorial-ecs-deployment-with-hooks.html)

# OPS06-BP03 Menggunakan strategi deployment yang aman
<a name="ops_mit_deploy_risks_deploy_mgmt_sys"></a>

 Peluncuran produksi yang aman mengontrol aliran perubahan yang bermanfaat dengan tujuan untuk meminimalkan dampak yang dirasakan oleh pelanggan dari perubahan tersebut. Kontrol keselamatan menyediakan mekanisme-mekanisme inspeksi untuk memvalidasi hasil yang diinginkan dan membatasi ruang lingkup dampak yang ditimbulkan oleh cacat apa pun yang disebabkan oleh perubahan atau kegagalan deployment. Peluncuran yang aman dapat mencakup strategi seperti feature-flag, one-box, rolling (rilis canary), immutable, pemisahan lalu lintas, dan deployment blue/green. 

 **Hasil yang diinginkan:** Organisasi Anda menggunakan sebuah sistem integrasi berkelanjutan pengiriman berkelanjutan (CI/CD) yang menyediakan kemampuan-kemampuan untuk mengotomatiskan peluncuran (rollout) dengan aman. Tim diharuskan menggunakan strategi peluncuran aman yang sesuai. 

 **Anti-pola umum:** 
+  Anda melakukan deployment perubahan yang tidak berhasil ke seluruh lingkungan produksi secara sekaligus. Akibatnya, semua pelanggan merasakan dampaknya secara bersamaan. 
+  Cacat akibat deployment serentak yang dilakukan ke semua sistem memerlukan rilis darurat. Diperlukan waktu beberapa hari untuk memperbaikinya untuk semua pelanggan. 
+  Untuk mengelola rilis produksi diperlukan perencanaan dan partisipasi dari beberapa tim. Hal ini akan menghambat kemampuan Anda untuk melakukan pembaruan fitur bagi pelanggan Anda dalam rentang waktu yang berdekatan (frequent). 
+  Anda melakukan deployment yang dapat diubah dengan melakukan modifikasi terhadap sistem yang sudah ada. Setelah mengetahui bahwa perubahan yang di-deploy tidak berhasil, Anda terpaksa melakukan modifikasi terhadap sistem sekali lagi untuk memulihkan versi yang sebelumnya, dan hal ini memperpanjang waktu pemulihan Anda. 

 **Manfaat menerapkan praktik terbaik ini:** Deployment otomatis menyeimbangkan kecepatan peluncuran (roll-out) dengan menghadirkan perubahan yang bermanfaat secara konsisten kepada para pelanggan. Pembatasan dampak dapat mencegah kegagalan deployment yang mahal dan memaksimalkan kemampuan tim untuk merespons kegagalan tersebut dengan efisien. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Kegagalan pengiriman yang terjadi secara berkelanjutan dapat menyebabkan berkurangnya ketersediaan layanan dan buruknya pengalaman pelanggan. Untuk memaksimalkan tingkat keberhasilan deployment, terapkan kontrol keamanan dalam proses rilis menyeluruh (end-to-end) untuk meminimalkan kesalahan-kesalahan deployment, dengan tujuan untuk mencapai nol kegagalan deployment. 

 **Contoh pelanggan** 

 AnyCompany Retail memiliki misi untuk mencapai deployment dengan waktu henti yang minim hingga nol, yang berarti pengguna sama sekali tidak ada merasakan dampak selama deployment. Untuk mencapai tujuan tersebut, perusahaan telah membuat pola-pola deployment (lihat diagram alur kerja berikut), seperti deployment blue/green dan deployment bergulir (rolling). Semua tim mengadopsi satu atau beberapa pola tersebut di dalam pipeline CI/CD mereka. 


| Alur kerja CodeDeploy untuk Amazon EC2 | Alur kerja CodeDeploy untuk Amazon ECS | Alur kerja CodeDeploy untuk Lambda | 
| --- | --- | --- | 
|  ![\[Alur proses deployment untuk Amazon EC2\]](http://docs.aws.amazon.com/id_id/wellarchitected/latest/framework/images/deployment-process-ec2.png)  |  ![\[Alur proses deployment untuk Amazon ECS\]](http://docs.aws.amazon.com/id_id/wellarchitected/latest/framework/images/deployment-process-ecs.png)  |  ![\[Alur proses deployment untuk Amazon Lambda\]](http://docs.aws.amazon.com/id_id/wellarchitected/latest/framework/images/deployment-process-lambda.png)  | 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  Gunakan alur kerja persetujuan untuk memulai urutan langkah-langkah peluncuran (roll-out) produksi setelah promosi ke produksi. 

1.  Gunakan sistem deployment otomatis seperti [AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html). AWS CodeDeploy [Opsi deployment](https://docs.aws.amazon.com/codedeploy/latest/userguide/deployment-steps.html) mencakup deployment pengganti untuk EC2/On-Premise dan deployment blue/green untuk EC2/On-Premise, AWS Lambdadan Amazon ECS (lihat diagram alur kerja sebelumnya). 

   1.  Jika berlaku, [integrasikan AWS CodeDeploy dengan layanan-layanan AWS lain](https://docs.aws.amazon.com/codedeploy/latest/userguide/integrations-aws.html) atau [integrasikan AWS CodeDeploy dengan produk dan layanan mitra](https://docs.aws.amazon.com/codedeploy/latest/userguide/integrations-partners.html). 

1.  Gunakan deployment blue/gree untuk basis data seperti [Amazon Aurora](https://docs.aws.amazon.com/AmazonRDS/latest/AuroraUserGuide/blue-green-deployments.html) dan [Amazon RDS](https://docs.aws.amazon.com/AmazonRDS/latest/UserGuide/blue-green-deployments.html). 

1.  [Pantau deployment](https://docs.aws.amazon.com/codedeploy/latest/userguide/monitoring.html) dengan menggunakan Amazon CloudWatch, AWS CloudTrail dan pemberitahuan acara Amazon Simple Notiﬁcation Service (Amazon SNS). 

1.  Lakukan pengujian otomatis pasca-deployment, antara lain pengujian fungsional, keamanan, regresi, integrasi, dan uji beban. 

1.  [Memecahkan](https://docs.aws.amazon.com/codedeploy/latest/userguide/troubleshooting.html) masalah deployment. 

 **Tingkat upaya untuk rencana implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS05-BP02 Menguji dan memvalidasi perubahan](ops_dev_integ_test_val_chg.md) 
+  [OPS05-BP09 Lakukan perubahan yang sering, kecil, dan reversibel](ops_dev_integ_freq_sm_rev_chg.md) 
+  [OPS05-BP10 Mengotomatiskan integrasi dan deployment sepenuhnya](ops_dev_integ_auto_integ_deploy.md) 

 **Dokumen terkait:** 
+ [Pustaka Builder AWS \$1 Melakukan otomatisasi deployment secara aman dan otonom \$1 Deployment produksi ](https://aws.amazon.com/builders-library/automating-safe-hands-off-deployments/?did=ba_card&trk=ba_card#Production_deployments)
+ [AWS Pustaka Builder \$1 Pipeline CI/CD saya adalah pemandu utama rilis saya \$1 Rilis produksi otomatis yang aman](https://aws.amazon.com//builders-library/cicd-pipeline/#Safe.2C_automatic_production_releases)
+ [Laporan Resmi AWS \$1 Mempraktikkan Integrasi Berkelanjutan dan Pengiriman Berkelanjutan di AWS \$1 Metode deployment](https://docs.aws.amazon.com/whitepapers/latest/practicing-continuous-integration-continuous-delivery/deployment-methods.html)
+ [AWS CodeDeploy Panduan Pengguna](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html)
+ [Bekerja dengan konfigurasi deployment di AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/deployment-configurations.html)
+ [Siapkan deployment rilis canary API Gateway ](https://docs.aws.amazon.com/apigateway/latest/developerguide/canary-release.html)
+ [Tipe Deployment Amazon ECS](https://docs.aws.amazon.com/)
+ [Deployment Blue/Green yang Dikelola Sepenuhnya di Amazon Aurora dan Amazon RDS](https://aws.amazon.com/blogs/aws/new-fully-managed-blue-green-deployments-in-amazon-aurora-and-amazon-rds/)
+ [Deployment Blue/Green dengan AWS Elastic Beanstalk](https://docs.aws.amazon.com/elasticbeanstalk/latest/dg/using-features.CNAMESwap.html)

 **Video terkait:** 
+ [re:Invent 2020 \$1 Hands-off: Mengotomatiskan pipeline pengiriman berkelanjutan di Amazon](https://www.youtube.com/watch?v=ngnMj1zbMPY)
+ [re:Invent 2019 \$1 Pendekatan deployment ketersediaan tinggi Amazon](https://www.youtube.com/watch?v=bCgD2bX1LI4)

 **Contoh terkait:** 
+ [Coba Sampel Deployment Blue/Green di AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/applications-create-blue-green.html)
+ [ Lokakarya \$1 Membangun pipeline CI/CD untuk deployment canary Lambda menggunakan AWS CDK](https://catalog.workshops.aws/cdk-cicd-for-lambda-canary-deployment/en-US) 
+ [ Lokakarya \$1 Membangun pipeline Biru/Hijau DevOps pertama Anda dengan Amazon ECS ](https://catalog.us-east-1.prod.workshops.aws/workshops/4b59b9fb-48b6-461c-9377-907b2e33c9df/en-US)
+ [ Lokakarya \$1 Membangun pipeline Biru/Hijau DevOps pertama Anda dengan Amazon EKS ](https://catalog.us-east-1.prod.workshops.aws/workshops/4eab6682-09b2-43e5-93d4-1f58fd6cff6e/en-US)
+ [ Lokakarya \$1 EKS GitOps dengan ArgoCD ](https://catalog.workshops.aws/eksgitops-argocd-githubactions)
+ [ Lokakarya \$1 CI/CD di Lokakarya AWS](https://catalog.workshops.aws/cicdonaws/en-US)
+ [ Mengimplementasikan CI/CD lintas akun dengan AWS SAM untuk fungsi Lambda berbasis kontainer](https://aws.amazon.com/blogs/compute/implementing-cross-account-cicd-with-aws-sam-for-container-based-lambda/)

# OPS06-BP04 Mengotomatiskan pengujian dan rollback
<a name="ops_mit_deploy_risks_auto_testing_and_rollback"></a>

 Untuk meningkatkan kecepatan, keandalan, dan keyakinan pada proses deployment Anda, miliki strategi untuk kemampuan pengujian dan rollback otomatis di lingkungan praproduksi dan produksi. Otomatiskan pengujian saat melakukan deployment ke produksi untuk menyimulasikan interaksi manusia dan sistem yang memverifikasi perubahan yang sedang di-deploy. Otomatiskan rollback untuk kembali ke keadaan pasti baik sebelumnya dengan cepat. Rollback harus dimulai secara otomatis pada kondisi yang telah ditentukan di awal seperti ketika hasil perubahan yang Anda inginkan tidak tercapai atau ketika pengujian otomatis mengalami kegagalan. Mengotomatiskan kedua aktivitas ini dapat memperbaiki tingkat keberhasilan untuk deployment Anda, meminimalkan waktu pemulihan, dan mengurangi potensi dampak terhadap bisnis. 

 **Hasil yang diinginkan:** Strategi-strategi pengujian dan rollback otomatis Anda diintegrasikan ke dalam pipeline integrasi berkelanjutan dan pengiriman berkelanjutan (CI/CD) Anda. Pemantauan Anda dapat melakukan validasi berdasarkan kriteria keberhasilan Anda dan memulai rollback otomatis setelah terjadi kegagalan. Hal ini akan meminimalkan dampak apa pun yang terjadi terhadap pelanggan dan pengguna akhir. Misalnya, ketika semua hasil pengujian telah terpenuhi, Anda meneruskan kode Anda ke lingkungan produksi tempat pengujian regresi otomatis dimulai, dengan memanfaatkan kasus-kasus pengujian yang sama. Jika hasil pengujian regresi yang didapatkan tidak sesuai dengan harapan, maka rollback otomatis akan dimulai dalam alur kerja pipeline. 

 **Anti-pola umum:** 
+  Sistem Anda tidak dirancang dapat diperbarui dengan rilis-rilis yang lebih kecil. Akibatnya, Anda mengalami kesulitan dalam membatalkan perubahan massal tersebut selama deployment yang gagal. 
+  Proses deployment Anda terdiri dari serangkaian langkah-langkah manual. Setelah melakukan deployment perubahan ke beban kerja, Anda mulai melakukan pengujian pasca-deployment. Setelah pengujian selesai, Anda menyadari bahwa beban kerja Anda tidak dapat dioperasikan dan koneksi pelanggan terputus. Kemudian Anda mulai melakukan rollback ke versi sebelumnya. Semua langkah manual ini dapat menghambat pemulihan sistem secara keseluruhan dan akan menyebabkan dampak yang berkepanjangan terhadap pelanggan Anda. 
+  Anda menghabiskan waktu mengembangkan kasus-kasus pengujian otomatis untuk fungsionalitas yang jarang digunakan dalam aplikasi Anda, sehingga memperkecil laba atas investasi (roi) dalam kemampuan pengujian otomatis Anda. 
+  Rilis Anda terdiri dari aplikasi, infrastruktur, patch, dan pembaruan konfigurasi yang tidak bergantung satu sama lain. Namun demikian, Anda memiliki satu pipeline CI/CD yang mengirimkan semua perubahan dalam satu waktu sekaligus. Kegagalan yang terjadi pada satu komponen memaksa Anda untuk mengembalikan semua perubahan, dan membuat rollback Anda menjadi kompleks dan tidak efisien. 
+  Tim Anda menyelesaikan tugas-tugas coding dalam sprint one dan memulai tugas sprint two, tetapi rencana Anda tidak menyertakan pengujian sampai sprint three. Akibatnya, pengujian-pengujian otomatis mengungkap cacat dari sprint one yang harus diselesaikan sebelum pengujian hasil kerja sprint two dapat dimulai dan seluruh rilis menjadi tertunda, sehingga menurunkan nilai pengujian otomatis Anda. 
+  Kasus pengujian regresi otomatis Anda untuk rilis produksi sudah selesai, tetapi Anda tidak memantau kondisi beban kerja. Karena Anda tidak memiliki visibilitas mengenai apakah layanan telah dimulai ulang atau belum, Anda menjadi tidak yakin apakah rollback diperlukan atau rollback sudah terjadi. 

 **Manfaat menerapkan praktik terbaik ini:** Pengujian otomatis meningkatkan transparansi proses pengujian Anda dan kemampuan Anda untuk mencakup lebih banyak fitur dalam satu periode waktu yang lebih singkat. Dengan melakukan pengujian dan validasi terhadap perubahan-perubahan dalam produksi, Anda dapat mengidentifikasi masalah dengan cepat. Peningkatan konsistensi dengan alat-alat pengujian otomatis memungkinkan deteksi kecacatan yang lebih baik. Dengan melakukan rollback otomatis ke versi sebelumnya, dampak-dampak yang ditimbulkan terhadap para pelanggan diminimalkan. Rollback otomatis pada akhirnya akan memunculkan keyakinan yang lebih tinggi pada kemampuan deployment Anda dengan mengurangi dampak bisnis. Secara keseluruhan, kemampuan ini berkurang time-to-delivery sambil memastikan kualitas. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Lakukan otomatisasi terhadap pengujian lingkungan yang di-deploy untuk mengonfirmasi hasil-hasil yang diinginkan dengan lebih cepat. Lakukan otomatisasi terhadap rollback ke keadaan yang diketahui baik sebelumnya ketika hasil yang ditetapkan di awal tidak tercapai, untuk mempersingkat waktu pemulihan dan mengurangi kesalahan yang disebabkan oleh proses-proses yang dilakukan secara manual. Integrasikan alat-alat pengujian dengan alur kerja pipeline Anda untuk menguji dan meminimalkan input manual secara konsisten. Prioritaskan otomatisasi kasus pengujian, seperti kasus pengujian yang memitigasi risiko terbesar dan kasus pengujian yang harus sering diuji dengan setiap perubahan. Selain itu, otomatiskan rollback berdasarkan kondisi tertentu yang telah ditentukan sebelumnya di awal dalam rencana pengujian Anda. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  Bangun sebuah siklus hidup pengujian untuk siklus hidup pengembangan Anda yang menentukan setiap tahap proses pengujian mulai dari perencanaan persyaratan hingga pengembangan kasus pengujian, konfigurasi alat, pengujian otomatis, dan penutupan kasus pengujian. 

   1.  Buatlah sebuah pendekatan pengujian khusus beban kerja dari strategi pengujian Anda secara keseluruhan. 

   1.  Pertimbangkan strategi pengujian berkelanjutan jika diperlukan di seluruh siklus hidup pengembangan. 

1.  Pilih alat-alat otomatis untuk pengujian dan rollback berdasarkan kebutuhan bisnis dan investasi pipeline Anda. 

1.  Tentukan kasus pengujian mana yang ingin Anda otomatisasi dan mana yang harus dilakukan secara manual. Anda dapat menentukannya berdasarkan prioritas nilai bisnis dari fitur yang sedang diuji. Selaraskan semua anggota tim dengan rencana ini dan pastikan pertanggungjawabannya untuk melakukan pengujian manual. 

   1.  Terapkan kemampuan-kemampuan pengujian otomatis ke kasus pengujian tertentu yang cocok untuk otomatisasi, seperti kasus berulang atau yang sering dijalankan, kasus yang memerlukan tugas berulang, atau kasus yang diperlukan di beberapa konfigurasi. 

   1.  Tentukan skrip otomatisasi pengujian serta kriteria keberhasilan di dalam alat otomatisasi sehingga otomatisasi alur kerja yang berkelanjutan dapat dimulai ketika ada kasus tertentu yang mengalami kegagalan. 

   1.  Tentukan kriteria kegagalan khusus untuk melakukan rollback otomatis. 

1.  Prioritaskan otomatisasi pengujian untuk mendorong hasil yang konsisten dengan pengembangan kasus pengujian menyeluruh di mana kompleksitas dan interaksi manusia memiliki risiko kegagalan yang lebih tinggi. 

1.  Integrasikan alat-alat pengujian otomatis dan rollback Anda ke dalam pipeline CI/CD Anda. 

   1.  Kembangkan kriteria keberhasilan yang jelas untuk perubahan Anda. 

   1.  Lakukan pemantauan dan pengamatan untuk mendeteksi kriteria-kriteria ini dan secara otomatis membatalkan perubahan ketika kriteria rollback tertentu terpenuhi. 

1.  Lakukan berbagai jenis pengujian produksi otomatis, seperti: 

   1.  Pengujian A/B untuk menunjukkan hasil yang dibandingkan dengan versi saat ini antara dua kelompok pengujian pengguna. 

   1.  Pengujian canary yang memungkinkan Anda untuk meluncurkan perubahan Anda pada subset pengguna sebelum merilisnya ke semua pengguna. 

   1.  Pengujian penandaan fitur (feature-flag testing) yang memungkinkan satu per satu fitur dari versi baru untuk ditandai atau dihapus tandanya dari luar aplikasi sehingga setiap fitur baru dapat divalidasi satu per satu. 

   1.  Pengujian regresi untuk memverifikasi fungsionalitas baru dengan komponen-komponen yang saling terkait. 

1.  Lakukan pemantauan pada aspek operasional aplikasi, transaksi, dan interaksi dengan aplikasi dan komponen lain. Kembangkan laporan untuk menunjukkan keberhasilan perubahan berdasarkan beban kerja sehingga Anda dapat mengidentifikasi bagian otomatisasi dan alur kerja apa yang dapat dioptimalkan lebih lanjut. 

   1.  Kembangkan laporan hasil pengujian yang membantu Anda mengambil keputusan cepat terkait apakah prosedur rollback perlu diinvokasi. 

   1.  Terapkan sebuah strategi yang dapat memungkinkan rollback otomatis berdasarkan kondisi kegagalan yang telah ditentukan di awal yang dihasilkan dari satu atau beberapa metode pengujian Anda. 

1.  Kembangkan kasus pengujian otomatis untuk memungkinkan penggunaan ulang di seluruh perubahan berulang di masa mendatang. 

 **Tingkat upaya untuk rencana implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS06-BP01 Rencana untuk perubahan yang gagal](ops_mit_deploy_risks_plan_for_unsucessful_changes.md) 
+  [OPS06-BP02 Uji penerapan](ops_mit_deploy_risks_test_val_chg.md) 

 **Dokumen terkait:** 
+ [AWS Builders Library \$1 Memastikan keamanan rollback selama penerapan](https://aws.amazon.com/builders-library/ensuring-rollback-safety-during-deployments/)
+  [Menerapkan ulang dan mengembalikan penerapan dengan AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/deployments-rollback-and-redeploy.html) 
+ [8 praktik terbaik saat mengotomatiskan penerapan Anda dengan AWS CloudFormation](https://aws.amazon.com/blogs/infrastructure-and-automation/best-practices-automating-deployments-with-aws-cloudformation/)

 **Contoh terkait:** 
+ [Pengujian UI tanpa server menggunakan Selenium,, AWS Lambda, dan Alat AWS Fargate Pengembang AWS](https://aws.amazon.com/blogs/devops/using-aws-codepipeline-aws-codebuild-and-aws-lambda-for-serverless-automated-ui-testing/)

 **Video terkait:** 
+ [ re:Invent 2020 \$1 Hands-off: Mengotomatiskan pipeline pengiriman berkelanjutan di Amazon ](https://www.youtube.com/watch?v=ngnMj1zbMPY)
+ [ re:Invent 2019 \$1 Pendekatan deployment ketersediaan tinggi Amazon ](https://www.youtube.com/watch?v=bCgD2bX1LI4)

# OPS 7. Bagaimana cara mengetahui bahwa Anda siap untuk mendukung beban kerja?
<a name="ops-07"></a>

 Evaluasi kesiapan operasional beban kerja, proses, dan prosedur, serta personel Anda untuk memahami risiko operasional terkait beban kerja Anda. 

**Topics**
+ [OPS07-BP01 Memastikan kemampuan personel](ops_ready_to_support_personnel_capability.md)
+ [OPS07-BP02 Memastikan peninjauan yang konsisten terkait kesiapan operasional](ops_ready_to_support_const_orr.md)
+ [OPS07-BP03 Menggunakan runbook untuk menjalankan prosedur](ops_ready_to_support_use_runbooks.md)
+ [OPS07-BP04 Menggunakan playbook untuk menyelidiki masalah](ops_ready_to_support_use_playbooks.md)
+ [OPS07-BP05 Membuat keputusan yang tepat untuk melakukan deployment sistem dan perubahan](ops_ready_to_support_informed_deploy_decisions.md)
+ [OPS07-BP06 Membuat rencana dukungan untuk beban kerja produksi](ops_ready_to_support_enable_support_plans.md)

# OPS07-BP01 Memastikan kemampuan personel
<a name="ops_ready_to_support_personnel_capability"></a>

Miliki mekanisme untuk memvalidasi bahwa Anda memiliki jumlah personel terlatih yang sesuai untuk mendukung beban kerja. Mereka harus diberi pelatihan tentang platform dan layanan yang membentuk beban kerja Anda. Berikan kepada mereka pengetahuan yang diperlukan untuk mengoperasikan beban kerja. Anda harus memiliki cukup banyak personel terlatih untuk mendukung pengoperasian normal beban kerja dan menyelesaikan masalah-masalah terkait insiden yang terjadi. Anda harus memiliki cukup banyak personel sehingga Anda dapat melakukan rotasi untuk personel yang siap tugas mendadak dan personel yang liburan guna menghindari lelah ekstrim pada personel. 

 **Hasil yang diinginkan:** 
+  Ada cukup banyak personel terlatih untuk mendukung beban kerja pada saat beban kerja tersedia. 
+  Anda memberikan pelatihan tentang perangkat lunak dan layanan yang membentuk beban kerja Anda kepada personel. 

 **Anti-pola umum:** 
+ Melakukan deployment beban kerja tanpa anggota tim yang terlatih untuk mengoperasikan platform dan layanan yang digunakan. 
+  Tidak memiliki cukup banyak personel untuk mendukung pelaksanaan rotasi personel yang siap tugas mendadak atau personel yang sedang libur. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Memiliki anggota tim yang terampil membantu dukungan yang efektif untuk beban kerja. 
+  Dengan cukup banyak anggota tim, Anda dapat mendukung beban kerja dan pelaksanaan rotasi personel yang siap tugas mendadak sekaligus mengurangi risiko personel yang terlalu lelah. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Pastikan bahwa terdapat personel yang terlatih dengan memadai untuk mendukung beban kerja. Pastikan Anda memiliki jumlah anggota tim yang cukup untuk menangani aktivitas-aktivitas operasional dalam kondisi normal, termasuk pelaksanaan rotasi personel yang siap bertugas mendadak. 

 **Contoh pelanggan** 

 AnyCompany Retail memastikan tim yang mendukung beban kerja memiliki staf yang terlatih dalam jumlah yang sesuai. Mereka memiliki cukup banyak rekayasawan untuk mendukung pelaksanaan rotasi personel yang siap tugas mendadak. Personel mendapatkan pelatihan tentang perangkat lunak dan platform yang merupakan dasar pembangunan beban kerja dan mereka didorong untuk mendapatkan sertifikasi. Ada cukup banyak personel sehingga orang dapat mengambil cuti sambil tetap ada dukungan untuk beban kerja dan rotasi personel yang siap tugas mendadak. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  Tetapkan jumlah personel yang memadai untuk mengoperasikan dan mendukung beban kerja Anda, termasuk tugas siap sedia, masalah keamanan, dan peristiwa siklus hidup, seperti tugas akhir dukungan dan rotasi sertifikat. 

1.  Latih personel Anda tentang perangkat lunak dan platform yang membentuk beban kerja Anda. 

   1.  [Pelatihan dan Sertifikasi AWS](https://aws.amazon.com/training/) memiliki pustaka kursus tentang AWS. Kursus-kursus ini disediakan gratis dan berbayar, baik secara online maupun tatap muka. 

   1.  [AWS menyelenggarakan acara dan webinar](https://aws.amazon.com/events/) tempat Anda belajar AWS dari para ahli. 

1. Lakukan tindakan berikut secara rutin. 
   +  Lakukan evaluasi terhadap ukuran dan keterampilan tim seiring perubahan kondisi pengoperasian dan beban kerja. 
   +  Sesuaikan ukuran dan keterampilan tim agar memenuhi persyaratan-persyaratan operasional. 
   +  Periksa kemampuan dan kapasitas untuk [mengatasi peristiwa siklus hidup yang direncanakan](https://docs.aws.amazon.com/health/latest/ug/aws-health-planned-lifecycle-events.html), peristiwa keamanan yang tidak direncanakan, dan notifikasi operasional melalui AWS Health. 

 **Tingkat upaya untuk rencana implementasi:** Tinggi. Mempekerjakan dan melatih tim untuk mendukung beban kerja mengharuskan Anda melakukan upaya yang cukup besar, tetapi hal itu akan memberikan manfaat besar dalam jangka panjang. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS11-BP04 Melakukan manajemen pengetahuan](ops_evolve_ops_knowledge_management.md) - Anggota tim harus memiliki informasi yang diperlukan untuk mengoperasikan dan mendukung beban kerja. Manajemen pengetahuan merupakan kunci untuk menyediakan informasi tersebut. 

 **Dokumen terkait:** 
+  [Acara dan Webinar AWS](https://aws.amazon.com/events/) 
+  [Pelatihan dan Sertifikasi AWS](https://aws.amazon.com/training/) 

# OPS07-BP02 Memastikan peninjauan yang konsisten terkait kesiapan operasional
<a name="ops_ready_to_support_const_orr"></a>

Gunakan Peninjauan Kesiapan Operasional (ORR) untuk memvalidasi bahwa Anda dapat mengoperasikan beban kerja Anda. ORR adalah sebuah mekanisme yang dikembangkan di Amazon untuk memvalidasi bahwa tim dapat mengoperasikan beban kerja mereka dengan aman. ORR adalah sebuah proses peninjauan dan inspeksi menggunakan daftar periksa persyaratan. ORR adalah sebuah pengalaman layanan mandiri yang digunakan tim untuk memastikan beban kerja mereka. ORR mencakup praktik-praktik terbaik dari pelajaran yang kami dapatkan selama bertahun-tahun membangun perangkat lunak. 

 Daftar periksa ORR terdiri dari rekomendasi berkaitan dengan arsitektur, proses operasional, manajemen peristiwa, dan kualitas rilis. Proses Koreksi Kesalahan (CoE) kami merupakan pendorong utama item-item ini. Analisis pasca-insiden Anda sendiri harus mendorong pengembangan ORR Anda. ORR tidak hanya tentang mengikuti praktik terbaik tapi juga mencegah berulangnya peristiwa yang telah Anda lihat sebelumnya. Terakhir, keamanan, pengelolaan, dan kepatuhan terhadap persyaratan juga dapat disertakan di dalam sebuah ORR. 

 Jalankan ORR sebelum beban kerja meluncur ke ketersediaan umum dan kemudian ke seluruh siklus pengembangan perangkat lunak. Menjalankan ORR sebelum peluncuran dapat meningkatkan kemampuan Anda untuk mengoperasikan beban kerja dengan aman. Jalankan kembali ORR Anda secara berkala pada beban kerja untuk mengetahui penyimpangan dari praktik terbaik. Anda dapat memiliki daftar periksa ORR untuk peluncuran layanan baru dan ORR untuk peninjauan secara berkala. Ini membantu Anda untuk tetap up to date dengan praktik terbaik yang muncul dan menggabungkan pelajaran yang didapatkan dari analisis pasca-insiden. Saat penggunaan cloud Anda sudah matang, Anda dapat membangun persyaratan ORR ke dalam arsitektur Anda secara default. 

 **Hasil yang Diinginkan:** Anda memiliki daftar periksa ORR dengan praktik terbaik untuk organisasi Anda. ORR dilakukan sebelum peluncuran beban kerja. ORR dijalankan secara berkala selama berlangsungnya siklus beban kerja. 

 **Anti-pola umum:** 
+ Anda meluncurkan beban kerja tanpa mengetahui apakah Anda dapat mengoperasikannya atau tidak. 
+ Persyaratan pengelolaan dan keamanan tidak diikutsertakan ketika menjamin peluncuran beban kerja. 
+ Beban kerja tidak dievaluasi kembali secara berkala. 
+ Beban kerja diluncurkan tanpa menerapkan prosedur-prosedur yang diperlukan. 
+ Anda melihat berulangnya kegagalan yang disebabkan akar masalah yang sama di beberapa beban kerja. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Beban kerja Anda mencakup praktik terbaik dalam hal arsitektur, proses, dan manajemen. 
+  Pelajaran yang didapatkan digabungkan dalam proses ORR. 
+  Prosedur yang diperlukan tersedia ketika beban kerja diluncurkan. 
+  ORR dijalankan di seluruh siklus perangkat lunak beban kerja Anda. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 ORR adalah dua hal: proses dan daftar periksa. Proses ORR Anda harus diadopsi oleh organisasi Anda dan didukung oleh seorang sponsor eksekutif. Minimal, ORR harus dilakukan sebelum beban kerja meluncur ke ketersediaan umum. Jalankan ORR di seluruh siklus pengembangan perangkat lunak untuk tetap up to date dengan praktik-praktik terbaik atau persyaratan baru. Daftar periksa ORR harus mencakup item-item konfigurasi, persyaratan keamanan dan pengelolaan, serta praktik terbaik dari organisasi Anda. Seiring waktu, Anda dapat menggunakan layanan-layanan, seperti [AWS Config](https://docs.aws.amazon.com/config/latest/developerguide/WhatIsConfig.html), [AWS Security Hub CSPM](https://docs.aws.amazon.com/securityhub/latest/userguide/what-is-securityhub.html), dan [AWS Control TowerGuardrails](https://docs.aws.amazon.com/controltower/latest/userguide/guardrails.html), untuk membangun praktik terbaik dari ORR ke pagar pembatas untuk deteksi otomatis atas praktik terbaik. 

 **Contoh pelanggan** 

 Setelah terjadi beberapa insiden produksi, AnyCompany Retail memutuskan untuk menerapkan proses ORR. Mereka membangun daftar periksa yang terdiri dari praktik terbaik, persyaratan pengelolaan dan kepatuhan, serta pelajaran yang didapatkan dari pemadaman (outage). Beban kerja baru melakukan ORR sebelum diluncurkan. Setiap beban kerja melakukan ORR setiap tahun dengan subset praktik terbaik untuk menggabungkan praktik-praktik terbaik dan persyaratan baru yang ditambahkan ke daftar periksa ORR. Seiring waktu, AnyCompany Retail digunakan [AWS Config](https://docs.aws.amazon.com/config/latest/developerguide/WhatIsConfig.html) untuk mendeteksi beberapa praktik terbaik, mempercepat proses ORR. 

 **Langkah-langkah implementasi** 

 Untuk mempelajari lebih lanjut tentang ORR, baca [laporan resmi Ulasan Kesiapan Operasional (ORR](https://docs.aws.amazon.com/wellarchitected/latest/operational-readiness-reviews/wa-operational-readiness-reviews.html)). Laporan resmi ini menyediakan detail informasi tentang riwayat proses ORR, cara membangun praktik ORR Anda sendiri, dan cara mengembangkan daftar periksa ORR Anda. Langkah-langkah berikut ini merupakan versi singkat dari dokumen tersebut. Untuk pemahaman yang mendalam tentang apa itu ORR dan cara membangunnya, sebaiknya baca laporan resmi tersebut. 

1. Kumpulkan para pemangku kepentingan utama, termasuk para perwakilan dari bagian keamanan, operasi, dan pengembangan. 

1. Minta setiap pemangku kepentingan untuk menyediakan setidaknya satu persyaratan. Untuk iterasi pertama, coba batasi jumlah item menjadi tiga puluh atau kurang. 
   +  [Lampiran B: Contoh pertanyaan ORR](https://docs.aws.amazon.com/wellarchitected/latest/operational-readiness-reviews/appendix-b-example-orr-questions.html) dari laporan resmi Peninjauan Kesiapan Operasional (ORR) yang berisi sampel pertanyaan yang dapat Anda gunakan untuk memulai. 

1. Kumpulkan persyaratan Anda ke dalam lembar kerja. 
   + Anda dapat menggunakan [lensa khusus](https://docs.aws.amazon.com/wellarchitected/latest/userguide/lenses-custom.html) di [AWS Well-Architected Tool](https://console.aws.amazon.com/wellarchiected/) untuk mengembangkan ORR Anda dan membagikannya di seluruh akun dan Organisasi AWS Anda. 

1. Identifikasi satu beban kerja untuk diberikan ORR. Idealnya adalah beban kerja sebelum peluncuran atau beban kerja internal. 

1. Pelajari daftar periksa ORR dan catat semua penemuan yang dibuat. Penemuannya mungkin akan dapat diterima jika terdapat mitigasi. Untuk penemuan yang tidak memiliki mitigasi, tambahkan beban kerja ke backlog item Anda dan implementasikan sebelum peluncuran. 

1. Seiring waktu, lanjutkan penambahan praktik terbaik dan persyaratan ke daftar periksa ORR Anda. 

 Pelanggan Dukungan dengan Dukungan Perusahaan dapat meminta [Lokakarya Tinjauan Kesiapan Operasional](https://aws.amazon.com/premiumsupport/technology-and-programs/proactive-services/) dari Manajer Akun Teknis mereka. Lokakarya ini adalah sesi *kerja mundur* interaktif untuk membuat daftar periksa ORR Anda sendiri. 

 **Tingkat upaya untuk rencana implementasi:** Tinggi. Untuk mengadopsi praktik ORR pada organisasi Anda diperlukan sponsor eksekutif dan dukungan pemangku kepentingan. Buat dan perbarui daftar periksa dengan masukan dari seluruh organisasi Anda. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+ [OPS01-BP03 Mengevaluasi persyaratan tata kelola](ops_priorities_governance_reqs.md) – Persyaratan tata kelola sangat sesuai untuk daftar periksa ORR. 
+ [OPS01-BP04 Evaluasi persyaratan kepatuhan](ops_priorities_compliance_reqs.md) – Terkadang persyaratan kepatuhan tercantum di daftar periksa ORR. Terkadang persyaratan kepatuhan adalah proses yang terpisah. 
+ [OPS03-BP07 Tim sumber daya dengan tepat](ops_org_culture_team_res_appro.md) – Kemampuan tim merupakan kandidat yang bagus untuk persyaratan ORR. 
+ [OPS06-BP01 Rencana untuk perubahan yang gagal](ops_mit_deploy_risks_plan_for_unsucessful_changes.md) – Rencana rollback atau rollforward harus dibuat sebelum Anda meluncurkan beban kerja Anda. 
+ [OPS07-BP01 Memastikan kemampuan personel](ops_ready_to_support_personnel_capability.md) – Untuk mendukung beban kerja, Anda harus memiliki personel yang diperlukan. 
+ [SEC01-BP03 Mengidentifikasi dan memvalidasi tujuan kontrol](https://docs.aws.amazon.com/wellarchitected/latest/framework/sec_securely_operate_control_objectives.html) – Tujuan kontrol keamanan membuat persyaratan ORR yang sangat baik. 
+ [REL13-BP01 Tentukan tujuan pemulihan untuk waktu henti dan kehilangan data](https://docs.aws.amazon.com/wellarchitected/latest/framework/rel_planning_for_recovery_objective_defined_recovery.html) – Rencana pemulihan bencana adalah persyaratan ORR yang baik. 
+ [COST02-BP01 Kembangkan kebijakan berdasarkan persyaratan organisasi Anda](https://docs.aws.amazon.com/wellarchitected/latest/framework/cost_govern_usage_policies.html) – Kebijakan manajemen biaya baik untuk dimasukkan dalam daftar periksa ORR Anda. 

 **Dokumen terkait:** 
+  [AWS Control Tower - Pagar Pembatas di AWS Control Tower](https://docs.aws.amazon.com/controltower/latest/userguide/guardrails.html) 
+  [AWS Well-Architected Tool - Lensa Kustom](https://docs.aws.amazon.com/wellarchitected/latest/userguide/lenses-custom.html) 
+  [Templat Peninjauan Kesiapan Operasional oleh Adrian Hornsby](https://medium.com/the-cloud-architect/operational-readiness-review-template-e23a4bfd8d79) 
+  [Laporan Resmi Peninjauan Kesiapan Operasional (ORR)](https://docs.aws.amazon.com/wellarchitected/latest/operational-readiness-reviews/wa-operational-readiness-reviews.html) 

 **Video terkait:** 
+  [AWS Dukungan Anda \$1 Membangun Peninjauan Kesiapan Operasional (ORR) yang Efektif](https://www.youtube.com/watch?v=Keo6zWMQqS8) 

 **Contoh terkait:** 
+  [Sampel Lensa Peninjauan Kesiapan Operasional (ORR)](https://github.com/aws-samples/custom-lens-wa-sample/tree/main/ORR-Lens) 

 **Layanan terkait:** 
+  [AWS Config](https://docs.aws.amazon.com/config/latest/developerguide/WhatIsConfig.html) 
+  [AWS Control Tower](https://docs.aws.amazon.com/controltower/latest/userguide/what-is-control-tower.html) 
+  [AWS Security Hub CSPM](https://docs.aws.amazon.com/securityhub/latest/userguide/what-is-securityhub.html) 
+  [AWS Well-Architected Tool](https://docs.aws.amazon.com/wellarchitected/latest/userguide/intro.html) 

# OPS07-BP03 Menggunakan runbook untuk menjalankan prosedur
<a name="ops_ready_to_support_use_runbooks"></a>

 *Runbook* adalah sebuah proses terdokumentasi untuk meraih hasil tertentu. Runbook terdiri dari serangkaian langkah yang diikuti seseorang untuk menyelesaikan sesuatu. Runbook telah digunakan dalam operasi sejak masa-masa awal industri penerbangan. Dalam operasi cloud, kita menggunakan runbook untuk mengurangi risiko dan meraih hasil-hasil yang diinginkan. Dalam bentuk paling sederhananya, runbook adalah daftar periksa untuk menyelesaikan tugas. 

 Runbook adalah bagian penting dari operasi beban kerja Anda. Mulai dari pelaksanaan orientasi untuk anggota tim baru hingga melakukan deployment rilis besar, runbook adalah proses terkodifikasi yang dapat memberikan hasil-hasil yang konsisten, siapa pun yang menggunakannya. Runbook harus dipublikasikan di lokasi sentral dan diperbarui seiring berkembangnya proses karena memperbarui runbook adalah komponen utama dari proses manajemen perubahan. Runbook juga harus menyertakan panduan tentang cara menangani kesalahan, alat, izin, pengecualian, dan eskalasi jika terjadi masalah. 

 Saat organisasi Anda matang, mulailah mengotomatiskan runbook. Mulailah dengan runbook yang singkat dan sering kali digunakan. Gunakan bahasa skrip untuk mengotomatiskan langkah-langkah atau mempermudah pelaksanaan langkah-langkah. Seiring Anda mengotomatiskan beberapa runbook pertama, Anda harus mendedikasikan waktu untuk mengotomatiskan runbook yang lebih kompleks. Seiring waktu, sebagian besar runbook Anda harus diotomatiskan dalam cara tertentu. 

 **Hasil yang diinginkan:** Tim Anda memiliki kumpulan panduan langkah demi langkah untuk melakukan tugas-tugas beban kerja. Runbook berisi hasil yang diinginkan, alat dan izin yang diperlukan, serta petunjuk untuk penanganan kesalahan. Runbook disimpan di sebuah lokasi sentral (sistem kontrol versi) dan sering diperbarui. Misalnya, runbook Anda menyediakan kemampuan bagi tim Anda untuk memantau, mengomunikasikan, dan merespons peristiwa AWS Health untuk akun-akun penting selama terjadi alarm aplikasi, masalah operasional, dan peristiwa siklus hidup yang sudah direncanakan. 

 **Anti-pola umum:** 
+  Mengandalkan ingatan untuk menyelesaikan setiap langkah dari suatu proses. 
+  Menerapkan perubahan secara manual tanpa menggunakan daftar periksa. 
+  Anggota tim yang berbeda-beda melakukan proses yang sama, tetapi dengan langkah atau hasil yang berbeda. 
+  Membiarkan runbook tidak selaras dengan perubahan sistem dan otomatisasi. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Mengurangi tingkat kesalahan untuk tugas-tugas yang dilakukan manual. 
+  Operasi dilakukan secara konsisten. 
+  Anggota tim baru dapat mulai melakukan tugas dengan lebih cepat. 
+  Runbook dapat diotomatiskan untuk mengurangi upaya yang diperlukan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Runbook dapat memiliki beberapa bentuk, bergantung pada tingkat kematangan organisasi Anda. Minimal, runbook harus terdiri dari dokumen teks langkah demi langkah. Hasil yang diinginkan harus ditunjukkan dengan jelas. Buatlah dokumentasi yang jelas mengenai izin atau alat khusus yang diperlukan. Berikan panduan mendetail tentang cara menangani kesalahan dan cara melakukan eskalasi jika terjadi kesalahan. Cantumkan pemilik runbook dan publikasikan di sebuah lokasi sentral. Setelah runbook Anda didokumentasikan, kemudian validasi dengan meminta orang lain di tim Anda untuk menjalankannya. Seiring berkembangnya prosedur, perbarui runbook Anda sesuai dengan proses manajemen perubahan Anda. 

 Runbook teks Anda harus diotomatiskan seiring semakin matangnya organisasi Anda. Dengan menggunakan layanan-layanan seperti [AWS Systems Manager Automation](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-automation.html), Anda dapat mentransformasikan teks biasa menjadi otomatisasi yang dapat dijalankan dengan beban kerja Anda. Otomatisasi ini dapat dijalankan sebagai respons terhadap peristiwa, sehingga mengurangi beban operasional untuk memelihara beban kerja Anda. AWS Systems Manager Automation juga menyediakan [pengalaman desain visual](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-visual-designer.html) kode rendah untuk membuat runbook otomatisasi dengan lebih mudah. 

 **Contoh pelanggan** 

 AnyCompany Retail harus melakukan pembaruan skema basis data selama deployment perangkat lunak. Tim Operasi Cloud bekerja sama dengan Tim Administrasi Basis Data untuk membuat sebuah runbook guna menerapkan perubahan ini secara manual. Runbook ini mencantumkan setiap langkah yang ada dalam prosesnya dalam bentuk daftar periksa. Runbook ini berisi sebuah bagian yang menjelaskan cara menangani kesalahan saat terjadi kesalahan. Mereka memublikasikan runbook di wiki internal mereka bersama dengan runbook mereka yang lain. Tim Operasi Cloud berencana untuk mengotomatiskan runbook dalam sprint mendatang. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

 Jika Anda belum memiliki repositori dokumen, repositori kontrol versi bisa menjadi tempat yang tepat untuk mulai membangun pustaka runbook Anda. Anda dapat membangun runbook Anda dengan menggunakan Markdown. Kami telah menyediakan contoh templat runbook yang dapat Anda gunakan untuk mulai membangun runbook. 

```
# Runbook Title
## Runbook Info
| Runbook ID | Description | Tools Used | Special Permissions | Runbook Author | Last Updated | Escalation POC | 
|-------|-------|-------|-------|-------|-------|-------|
| RUN001 | What is this runbook for? What is the desired outcome? | Tools | Permissions | Your Name | 2022-09-21 | Escalation Name |
## Steps
1. Step one
2. Step two
```

1.  Jika Anda belum memiliki repositori atau wiki dokumentasi, buatlah repositori kontrol versi baru di sistem kontrol versi Anda. 

1.  Identifikasi proses yang tidak memiliki runbook. Proses yang ideal adalah proses yang dilakukan secara semi-reguler, sedikit jumlah langkahnya, dan memiliki kegagalan yang dampaknya rendah. 

1.  Di repositori dokumen Anda, buat draf dokumen Markdown baru dengan menggunakan templat tersebut. Isi Judul Runbook dan bidang-bidang yang wajib diisi di bawah Info Runbook. 

1.  Dimulai dengan langkah pertama, isi bagian Langkah-langkah dalam runbook. 

1.  Berikan runbook kepada anggota tim. Minta mereka menggunakan runbook ini untuk memvalidasi langkah-langkahnya. Jika ada sesuatu yang belum dimasukkan atau memerlukan kejelasan, perbarui runbook ini. 

1.  Publikasikan runbook ini ke bagian penyimpanan dokumentasi internal Anda. Setelah dipublikasikan, beri tahu tim Anda dan para pemangku kepentingan lainnya. 

1.  Seiring waktu, Anda akan membangun sebuah pustaka runbook. Saat pustaka tersebut bertambah besar, mulailah bekerja untuk mengotomatiskan runbook. 

 **Tingkat upaya untuk rencana implementasi:** Rendah. Standar minimum untuk runbook adalah panduan teks langkah demi langkah. Mengotomatiskan runbook dapat meningkatkan upaya penerapan. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS02-BP02 Proses dan Prosedur memiliki pemilik teridentifikasi](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_ops_model_def_proc_owners.html) 
+  [OPS07-BP04 Menggunakan playbook untuk menyelidiki masalah](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_ready_to_support_use_playbooks.html) 
+  [OPS10-BP01 Menggunakan proses untuk manajemen peristiwa, insiden, dan masalah](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_event_response_event_incident_problem_process.html) 
+  [OPS10-BP02 Menjalankan proses untuk setiap peringatan](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_event_response_process_per_alert.html) 
+  [OPS11-BP04 Menjalankan manajemen pengetahuan](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_evolve_ops_knowledge_management.html) 

 **Dokumen terkait:** 
+  [Mencapai Keunggulan Operasional menggunakan playbook dan runbook otomatis](https://aws.amazon.com/blogs/mt/achieving-operational-excellence-using-automated-playbook-and-runbook/) 
+  [AWS Systems Manager: Bekerja dengan runbook](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-documents.html) 
+  [Playbook migrasi untuk migrasi besar AWS - Tugas 4: Meningkatkan runbook migrasi Anda](https://docs.aws.amazon.com/prescriptive-guidance/latest/large-migration-migration-playbook/task-four-migration-runbooks.html) 
+  [Gunakan runbook AWS System Manager Automation untuk menyelesaikan tugas-tugas operasional](https://aws.amazon.com/blogs/mt/use-aws-systems-manager-automation-runbooks-to-resolve-operational-tasks/) 

 **Video terkait:** 
+  [AWS re:Invent 2019: Panduan mandiri untuk runbook, laporan insiden, dan respons insiden](https://www.youtube.com/watch?v=E1NaYN_fJUo) 
+  [Cara melakukan otomatisasi Operasi IT di AWS \$1 Amazon Web Services](https://www.youtube.com/watch?v=GuWj_mlyTug) 
+  [Integrasikan Skrip ke dalam AWS Systems Manager](https://www.youtube.com/watch?v=Seh1RbnF-uE) 

 **Contoh terkait:** 
+  [Lab Well-Architected: Melakukan otomatisasi operasi dengan Playbook dan Runbook](https://wellarchitectedlabs.com/operational-excellence/200_labs/200_automating_operations_with_playbooks_and_runbooks/) 
+  [AWS Postingan Blog : Membangun Praktik Otomatisasi Cloud untuk Keunggulan Operasional: Praktik Terbaik dari AWS Managed Services](https://aws.amazon.com/blogs/mt/build-a-cloud-automation-practice-for-operational-excellence-best-practices-from-aws-managed-services/) 
+  [AWS Systems Manager: Panduan otomatisasi](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-walk.html) 
+  [AWS Systems Manager: Pulihkan volume root dari snapshot runbook terbaru](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-document-sample-restore.html) 
+  [Membangun runbook respons insiden AWS dengan menggunakan notebook Jupyter dan CloudTrail Lake](https://catalog.us-east-1.prod.workshops.aws/workshops/a5801f0c-7bd6-4282-91ae-4dfeb926a035/en-US) 
+  [Gitlab - Runbook](https://gitlab.com/gitlab-com/runbooks) 
+  [Rubix – Pustaka Python untuk membuat runbook di Notebook Jupyter](https://github.com/Nurtch/rubix) 
+  [Menggunakan Document Builder untuk membuat runbook kustom](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-walk-document-builder.html) 

 **Layanan terkait:** 
+  [AWS Systems Manager Automation](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-automation.html) 

# OPS07-BP04 Menggunakan playbook untuk menyelidiki masalah
<a name="ops_ready_to_support_use_playbooks"></a>

 *Playbook* adalah panduan mendetail yang digunakan untuk menyelidiki insiden. Ketika terjadi sebuah insiden, playbook digunakan untuk menyelidiki, membuat cakupan dampak, dan mengidentifikasi akar masalah penyebabnya. Playbook digunakan untuk berbagai skenario, dari deployment yang gagal hingga insiden keamanan. Dalam banyak kasus, playbook mengidentifikasi akar masalah yang dimitigasi dengan menggunakan runbook. Playbook adalah komponen pokok dalam rencana respons insiden organisasi Anda. 

 Playbook yang baik memiliki sejumlah fitur utama. Playbook memberikan panduan secara mendetail bagi pengguna, dalam proses penemuan. Dengan berpikir secara menyeluruh, langkah apa saja yang sebaiknya diikuti seseorang untuk mendiagnosis sebuah insiden? Tetapkan secara jelas di dalam playbook apakah alat-alat khusus atau izin yang lebih tinggi diperlukan di dalam playbook. Membuat sebuah rencana komunikasi untuk memberikan informasi terbaru kepada para pemangku kepentingan mengenai status penyelidikan adalah komponen utama. Dalam situasi ketika akar penyebab masalah tidak dapat diidentifikasi, playbook harus memiliki rencana eskalasi. Jika akar penyebab masalah sudah diidentifikasi, playbook harus mengarah ke sebuah runbook yang menjelaskan cara menyelesaikannya. Playbook harus disimpan secara terpusat dan dipelihara secara rutin. Jika playbook digunakan untuk pemberitahuan khusus, bekali tim Anda dengan penunjuk ke playbook yang ada di dalam pemberitahuan tersebut. 

 Otomatisasi playbook Anda seiring dengan kematangan organisasi. Mulailah dengan playbook yang mencakup insiden-insiden berisiko rendah. Gunakan penulisan skrip untuk mengotomatiskan langkah-langkah penemuan. Pastikan Anda memiliki runbook pendamping untuk memitigasi akar masalah umum. 

 **Hasil yang diinginkan:** Organisasi Anda memiliki playbook untuk insiden umum. Playbook disimpan di lokasi terpusat dan tersedia untuk anggota tim Anda. Playbook harus sering diperbarui. Runbook pendamping dibuat untuk akar masalah apa pun yang diketahui. 

 **Anti-pola umum:** 
+  Tidak ada cara standar untuk menyelidiki sebuah insiden. 
+  Anggota tim mengandalkan memori otot atau pengetahuan kelembagaan untuk memecahkan masalah kegagalan deployment. 
+  Anggota tim baru mempelajari cara menyelidiki permasalahan melalui coba-coba (trial and error). 
+  Praktik terbaik untuk menyelidiki permasalahan tidak dibagikan ke seluruh tim. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Playbook meningkatkan upaya Anda untuk memitigasi insiden. 
+  Anggota tim yang berbeda-beda dapat menggunakan playbook yang sama untuk mengidentifikasi akar penyebab masalah secara konsisten. 
+  Setelah akar penyebab masalah diketahui, kemudian bisa dikembangkan runbook untuk masalah tersebut, sehingga dapat mempercepat waktu pemulihan. 
+  Playbook akan membantu anggota tim untuk mulai berkontribusi lebih cepat. 
+  Tim dapat menskalakan proses mereka dengan playbook yang dapat diulangi langkah-langkahnya. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Cara Anda membangun dan menggunakan playbook bergantung pada kematangan organisasi Anda. Jika Anda baru mengenal cloud, buatlah playbook dalam bentuk teks di dalam repositori dokumen pusat. Seiring dengan kematangan organisasi, playbook bisa dibuat menjadi semi-otomatis dengan bahasa skrip seperti Python. Skrip-skrip ini dapat dijalankan di dalam notebook Jupyter untuk mempercepat penemuan. Organisasi tingkat lanjut memiliki playbook yang sepenuhnya otomatis untuk permasalahan-permasalahan umum yang diperbaiki secara otomatis dengan runbook. 

 Mulailah membangun playbook Anda dengan mengidentifikasi insiden-insiden umum yang terjadi pada beban kerja Anda. Untuk mengawali, pilihlah playbook untuk insiden-insiden dengan risiko rendah dan dengan akar penyebab masalah yang telah dipersempit menjadi beberapa permasalahan. Setelah Anda memiliki playbook untuk skenario yang lebih sederhana, beralihlah ke skenario yang memiliki risiko lebih tinggi atau skenario dengan akar penyebab masalah yang tidak diketahui dengan baik. 

 Playbook teks Anda harus diotomatiskan seiring dengan kematangan organisasi Anda. Menggunakan layanan seperti [AWS Systems Manager Automation](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-automation.html), teks datar dapat ditransformasi menjadi otomatisasi. Otomatisasi ini dapat dijalankan terhadap beban kerja untuk mempercepat penyelidikan. Otomatisasi ini dapat diaktifkan untuk merespons peristiwa, sehingga akan mengurangi rata-rata waktu untuk menemukan dan menyelesaikan insiden. 

 Pelanggan dapat menggunakan [AWS Systems Manager Incident Manager](https://docs.aws.amazon.com/incident-manager/latest/userguide/what-is-incident-manager.html) untuk menanggapi insiden. Layanan ini menyediakan satu antarmuka untuk memeriksa insiden, memberikan informasi kepada para pemangku kepentingan saat proses penemuan dan mitigasi, dan berkolaborasi selama berlangsungnya insiden. Layanan ini menggunakan AWS System Manager Automation untuk mempercepat deteksi dan pemulihan. 

 **Contoh pelanggan** 

 Insiden produksi memberikan dampak pada AnyCompany Retail. Rekayasawan yang siap dipanggil kapan saja (on-call) menggunakan playbook untuk menyelidiki permasalahan. Seiring mereka mengikuti langkah-langkahnya, mereka terus memutakhirkan para pemangku kepentingan utama yang diidentifikasi di dalam playbook. Rekayasawan mengidentifikasi akar penyebab masalah sebagai kondisi pacu di dalam layanan backend. Dengan menggunakan runbook, rekayasawan meluncurkan ulang layanan, sehingga AnyCompany Retail dapat kembali online. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

 Jika Anda belum memiliki repositori dokumen, kami menyarankan Anda untuk membuat repositori kontrol versi untuk pustaka playbook Anda. Anda dapat membangun playbook Anda dengan menggunakan Markdown, yang kompatibel dengan sebagian besar sistem otomatisasi playbook. Jika Anda memulai dari nol, gunakan contoh templat playbook berikut ini. 

```
# Playbook Title
## Playbook Info
| Playbook ID | Description | Tools Used | Special Permissions | Playbook Author | Last Updated | Escalation POC | Stakeholders | Communication Plan |
|-------|-------|-------|-------|-------|-------|-------|-------|-------|
| RUN001 | What is this playbook for? What incident is it used for? | Tools | Permissions | Your Name | 2022-09-21 | Escalation Name | Stakeholder Name | How will updates be communicated during the investigation? |
## Steps
1. Step one
2. Step two
```

1.  Jika Anda belum memiliki repositori dokumen atau wiki, buatlah repositori kontrol versi baru untuk playbook Anda di sistem kontrol versi Anda. 

1.  Identifikasi permasalahan umum yang memerlukan penyelidikan. Ini sebaiknya adalah skenario dengan akar penyebab masalah yang dibatasi ke beberapa permasalahan dan penyelesaian yang memiliki risiko rendah. 

1.  Menggunakan templat Markdown, isilah bagian Nama Playbook dan bidang di bawah Info Playbook. 

1.  Lengkapi langkah-langkah pemecahan masalah. Sampaikan dengan sejelas mungkin tindakan-tindakan yang akan dilakukan atau area apa saja yang harus Anda selidiki. 

1.  Berikan playbook tersebut kepada anggota tim dan minta mereka mempelajari dan memvalidasinya. Jika terdapat hal yang terlewatkan atau tidak jelas, lakukan pembaruan playbook. 

1.  Terbitkan playbook di dalam repositori dokumen Anda dan informasikan kepada tim dan pemangku kepentingan. 

1.  Pustaka playbook ini akan tumbuh seiring dengan semakin banyaknya playbook yang Anda tambahkan. Setelah Anda memiliki beberapa playbook, mulailah mengotomatiskannya menggunakan alat seperti AWS Systems Manager Automation untuk terus menyinkronkan otomatisasi dan playbook. 

 **Tingkat upaya untuk rencana implementasi:** Rendah. Playbook Anda harus berupa dokumen teks yang disimpan di sebuah lokasi terpusat. Organisasi yang lebih matang akan beralih ke playbook otomatis. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS02-BP02 Proses dan Prosedur memiliki pemilik teridentifikasi](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_ops_model_def_proc_owners.html) 
+  [OPS07-BP03 Menggunakan runbook untuk menjalankan prosedur](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_ready_to_support_use_runbooks.html) 
+  [OPS10-BP01 Menggunakan proses untuk manajemen peristiwa, insiden, dan masalah](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_event_response_event_incident_problem_process.html) 
+  [OPS10-BP02 Menjalankan proses untuk setiap peringatan](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_event_response_process_per_alert.html) 
+  [OPS11-BP04 Menjalankan manajemen pengetahuan](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_evolve_ops_knowledge_management.html) 

 **Dokumen terkait:** 
+  [Mencapai Keunggulan Operasional menggunakan playbook dan runbook otomatis](https://aws.amazon.com/blogs/mt/achieving-operational-excellence-using-automated-playbook-and-runbook/) 
+  [AWS Systems Manager: Bekerja dengan runbook](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-documents.html) 
+  [Gunakan runbook AWS System Manager Automation untuk menyelesaikan tugas-tugas operasional](https://aws.amazon.com/blogs/mt/use-aws-systems-manager-automation-runbooks-to-resolve-operational-tasks/) 

 **Video terkait:** 
+  [AWS re:Invent 2019: Panduan mandiri untuk runbook, laporan insiden, dan respons insiden (SEC318-R1)](https://www.youtube.com/watch?v=E1NaYN_fJUo) 
+  [Incident Manager AWS Systems Manager - Lokakarya AWS Virtual](https://www.youtube.com/watch?v=KNOc0DxuBSY) 
+  [Integrasikan Skrip ke dalam AWS Systems Manager](https://www.youtube.com/watch?v=Seh1RbnF-uE) 

 **Contoh terkait:** 
+  [AWS Kerangka Kerja Playbook Pelanggan](https://github.com/aws-samples/aws-customer-playbook-framework) 
+  [AWS Systems Manager: Panduan otomatisasi](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-walk.html) 
+  [Membangun runbook respons insiden AWS dengan menggunakan notebook Jupyter dan CloudTrail Lake](https://catalog.workshops.aws/workshops/a5801f0c-7bd6-4282-91ae-4dfeb926a035/en-US) 
+  [Rubix – Pustaka Python untuk membuat runbook di Notebook Jupyter](https://github.com/Nurtch/rubix) 
+  [Menggunakan Document Builder untuk membuat runbook kustom](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-walk-document-builder.html) 

 **Layanan terkait:** 
+  [AWS Systems Manager Automation](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-automation.html) 
+  [AWS Peluncuran Systems Manager Incident Manager](https://docs.aws.amazon.com/incident-manager/latest/userguide/what-is-incident-manager.html) 

# OPS07-BP05 Membuat keputusan yang tepat untuk melakukan deployment sistem dan perubahan
<a name="ops_ready_to_support_informed_deploy_decisions"></a>

Miliki proses untuk perubahan yang sukses dan tidak sukses pada beban kerja Anda. Pre-mortem adalah latihan simulasi tim terhadap terjadinya kegagalan untuk mengembangkan strategi mitigasi. Gunakan pre-mortem untuk mengantisipasi kegagalan dan menciptakan prosedur ketika diperlukan. Evaluasi manfaat dan risiko dari deployment perubahan ke beban kerja Anda. Pastikan apakah semua perubahan sudah mematuhi tata kelola atau tidak. 

 **Hasil yang diinginkan:** 
+  Anda mengambil keputusan yang tepat ketika melakukan deployment perubahan ke beban kerja Anda. 
+  Perubahan mematuhi tata kelola. 

 **Anti-pola umum:** 
+ Melakukan deployment perubahan ke beban kerja tanpa proses untuk menangani deployment yang gagal.
+ Membuat perubahan pada lingkungan produksi Anda yang tidak mematuhi persyaratan-persyaratan tata kelola.
+ Melakukan deployment versi beban kerja baru Anda tanpa menetapkan garis dasar untuk pemanfaatan sumber daya.

 **Manfaat menjalankan praktik terbaik ini:** 
+  Anda siap untuk menangani perubahan-perubahan yang tidak berhasil dilakukan pada beban kerja Anda. 
+  Perubahan pada beban kerja Anda mematuhi kebijakan-kebijakan tata kelola. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Rendah 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Gunakan pre-mortem untuk mengembangkan proses untuk perubahan yang tidak berhasil. Buatlah dokumentasi dari proses-proses Anda untuk perubahan yang tidak berhasil. Pastikan semua perubahan mematuhi tata kelola. Evaluasi manfaat dan risiko melakukan deployment perubahan ke beban kerja Anda. 

 **Contoh pelanggan** 

 AnyCompany Retail melakukan pre-mortem secara teratur untuk melakukan validasi terhadap proses-proses mereka untuk perubahan yang tidak berhasil. Mereka mendokumentasikan proses mereka di Wiki bersama dan sering kali memperbaruinya. Semua perubahan mematuhi persyaratan-persyaratan tata kelola. 

 **Langkah-langkah implementasi** 

1.  Ambil keputusan yang tepat ketika melakukan deployment perubahan ke beban kerja Anda. Tetapkan dan tinjau kriteria untuk deployment yang berhasil. Kembangkan skenario atau kriteria yang akan menginisiasi pengembalian perubahan ke versi sebelumnya. Pikirkan manfaat dari deployment perubahan dibandingkan dengan risiko perubahan yang tidak berhasil. 

1.  Pastikan bahwa semua perubahan mematuhi kebijakan tata kelola. 

1.  Gunakan pre-mortem guna membuat rencana untuk perubahan-perubahan yang tidak berhasil dan mendokumentasikan strategi mitigasi. Jalankan sesi latihan table-top untuk memperagakan perubahan yang tidak berhasil dan melakukan validasi terhadap prosedur pengembalian ke versi sebelumnya (roll-back). 

 **Tingkat upaya untuk rencana implementasi:** Sedang. Mengimplementasikan praktik pre-mortem memerlukan koordinasi dan upaya dari para pemangku kepentingan dalam seluruh organisasi Anda 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS01-BP03 Mengevaluasi persyaratan tata kelola](ops_priorities_governance_reqs.md) - Persyaratan tata kelola merupakan faktor kunci dalam menentukan apakah akan melakukan deployment perubahan. 
+  [OPS06-BP01 Rencana untuk perubahan yang gagal](ops_mit_deploy_risks_plan_for_unsucessful_changes.md) - Buat rencana untuk memitigasi deployment yang gagal dan gunakan pre-mortem untuk memvalidasinya. 
+  [OPS06-BP02 Uji penerapan](ops_mit_deploy_risks_test_val_chg.md) - Setiap perubahan perangkat lunak harus diuji dengan tepat sebelum deployment untuk mengurangi kecacatan dalam produksi. 
+  [OPS07-BP01 Memastikan kemampuan personel](ops_ready_to_support_personnel_capability.md) - Memiliki cukup banyak personel yang terlatih untuk mendukung beban kerja sangat penting dalam mengambil keputusan yang tepat dalam hal deployment perubahan sistem. 

 **Dokumen terkait:** 
+ [ Amazon Web Services: Risiko dan Kepatuhan ](https://docs.aws.amazon.com/whitepapers/latest/aws-risk-and-compliance/welcome.html)
+ [Model Tanggung Jawab Bersama AWS](https://aws.amazon.com/compliance/shared-responsibility-model/)
+ [ Tata Kelola dalam AWS Cloud: Keseimbangan yang Tepat Antara Kelincahan dan Keamanan ](https://aws.amazon.com/blogs/apn/governance-in-the-aws-cloud-the-right-balance-between-agility-and-safety/)

# OPS07-BP06 Membuat rencana dukungan untuk beban kerja produksi
<a name="ops_ready_to_support_enable_support_plans"></a>

 Aktifkan dukungan untuk perangkat lunak dan layanan yang diandalkan beban kerja produksi Anda. Pilih tingkat dukungan yang sesuai untuk memenuhi kebutuhan tingkat layanan produksi Anda. Rencana dukungan untuk dependensi ini diperlukan untuk berjaga-jaga jika ada gangguan layanan atau masalah perangkat lunak yang terjadi. Buatlah dokumentasi dari rencana-rencana dukungan dan cara meminta dukungan untuk semua vendor perangkat lunak dan layanan. Implementasikan mekanisme yang memastikan bahwa titik kontak dukungan selalu yang terbaru. 

 **Hasil yang diinginkan:** 
+  Implementasikan rencana dukungan untuk perangkat lunak dan layanan yang diandalkan oleh beban kerja produksi. 
+  Pilih rencana dukungan yang sesuai berdasarkan kebutuhan tingkat layanan. 
+  Buatlah dokumentasi dari rencana dukungan, tingkat dukungan, dan cara meminta dukungan. 

 **Anti-pola umum:** 
+  Anda tidak memiliki rencana dukungan untuk vendor perangkat lunak yang penting. Beban kerja Anda terkena dampaknya dan Anda tidak dapat melakukan apa-apa untuk mempercepat perbaikan atau mendapatkan informasi terbaru dari vendor secara tepat waktu. 
+  Seorang pengembang yang merupakan titik utama kontak untuk vendor perangkat lunak tidak lagi bekerja di perusahaan. Anda tidak dapat menghubungi dukungan vendor secara langsung. Anda harus meluangkan waktu menelusuri dan mencari-cari dalam sistem kontak generik, sehingga menambah waktu yang diperlukan untuk memberikan respons ketika diperlukan. 
+  Penghentian (outage) produksi terjadi pada vendor perangkat lunak. Tidak ada dokumentasi tentang cara mengajukan kasus dukungan. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Dengan tingkat dukungan yang sesuai, Anda dapat memperoleh respons dalam kerangka waktu yang diperlukan untuk memenuhi kebutuhan-kebutuhan tingkat layanan. 
+  Sebagai pelanggan yang didukung, Anda dapat menyampaikan masalah, jika terjadi masalah produksi. 
+  Vendor layanan dan perangkat lunak dapat membantu menyelesaikan masalah saat terjadi insiden. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Rendah 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Aktifkan rencana dukungan untuk vendor perangkat lunak dan layanan yang diandalkan oleh beban kerja produksi Anda. Atur rencana dukungan yang sesuai untuk memenuhi kebutuhan-kebutuhan tingkat layanan Anda. Untuk pelanggan AWS, ini artinya Anda mengaktifkan Business Support AWS atau yang lebih tinggi pada setiap akun yang memiliki beban kerja produksi. Temui para vendor dukungan secara teratur untuk mendapatkan informasi terbaru mengenai penawaran dukungan, proses, dan kontak. Buatlah dokumentasi tentang cara meminta dukungan dari para vendor perangkat lunak dan layanan, termasuk cara menyampaikan masalah jika ada penghentian (outage). Implementasikan mekanisme-mekanisme untuk menjaga agar kontak selalu yang terbaru. 

 **Contoh pelanggan** 

 Di AnyCompany Retail, semua dependensi layanan dan perangkat lunak komersial memiliki rencana dukungan. Contohnya, mereka mengaktifkan Dukungan Perusahaan AWS di semua akun yang memiliki beban kerja produksi. Semua pengembang dapat membuka kasus dukungan bila ada masalah yang terjadi. Ada satu halaman wiki yang memuat informasi tentang cara meminta dukungan, siapa yang harus diberi tahu, dan praktik-praktik terbaik untuk mempercepat penanganan kasus. 

 **Langkah-langkah implementasi** 

1.  Bekerjasamalah dengan para pemangku kepentingan yang ada di organisasi Anda untuk mengidentifikasi para vendor perangkat lunak dan layanan yang diandalkan oleh beban kerja Anda. Buatlah dokumentasi mengenai dependensi ini. 

1.  Tentukan kebutuhan tingkat layanan untuk beban kerja Anda. Pilih rencana dukungan yang selaras dengannya. 

1.  Untuk layanan-layanan dan perangkat lunak komersial, tetapkan rencana dukungan dengan para vendornya. 

   1.  Dengan berlangganan AWS Business Support atau yang lebih tinggi untuk semua akun produksi, waktu respons AWS Dukungan akan lebih cepat dan hal ini sangat disarankan. Jika Anda tidak memiliki dukungan premium, Anda harus memiliki rencana tindakan untuk menangani masalah, yang memerlukan bantuan dari AWS Dukungan. AWS Dukungan memberikan kombinasi alat dan teknologi, orang, dan program yang dirancang untuk secara proaktif membantu Anda mengoptimalkan performa, menurunkan biaya, dan berinovasi dengan lebih cepat. Selain itu, AWS Business Support memberikan manfaat tambahan, termasuk akses API ke AWS Trusted Advisor dan AWS Health untuk integrasi programatis dengan sistem Anda, bersama metode akses lainnya seperti Konsol Manajemen AWS dan saluran Amazon EventBridge. 

1.  Buatlah dokumentasi tentang rencana dukungan di alat manajemen pengetahuan Anda. Sertakan cara untuk meminta dukungan, siapa yang harus diberi tahu jika ada kasus dukungan diajukan, dan cara untuk menyampaikan masalah saat terjadi insiden. Wiki bisa menjadi sebuah mekanisme yang bagus untuk memungkinkan semua orang membuat pembaruan yang diperlukan pada dokumentasi ketika mereka mengetahui tentang adanya perubahan yang dilakukan untuk mendukung proses atau perubahan kontak. 

 **Tingkat upaya untuk rencana implementasi:** Rendah. Sebagian besar vendor perangkat lunak dan layanan menawarkan pilihan penyertaan rencana dukungan. Mendokumentasikan dan berbagi praktik terbaik terkait dukungan di sistem manajemen pengetahuan Anda akan memastikan tim Anda mengetahui tindakan-tindakan yang harus dilakukan jika ada masalah produksi. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS02-BP02 Proses dan Prosedur memiliki pemilik teridentifikasi](ops_ops_model_def_proc_owners.md) 

 **Dokumen terkait:** 
+ [Rencana AWS Dukungan](https://docs.aws.amazon.com/awssupport/latest/user/aws-support-plans.html)

 **Layanan terkait:** 
+ [AWS Business Support](https://aws.amazon.com/premiumsupport/plans/business/)
+ [Dukungan Perusahaan AWS](https://aws.amazon.com/premiumsupport/plans/enterprise/)

# Jalankan
<a name="a-operate"></a>

**Topics**
+ [OPS 8. Bagaimana cara memanfaatkan observabilitas beban kerja di organisasi Anda?](ops-08.md)
+ [OPS 9. Bagaimana cara memahami kondisi operasi Anda?](ops-09.md)
+ [OPS 10. Bagaimana cara mengelola peristiwa operasi dan beban kerja?](ops-10.md)

# OPS 8. Bagaimana cara memanfaatkan observabilitas beban kerja di organisasi Anda?
<a name="ops-08"></a>

Memastikan kondisi beban kerja yang optimal dengan memanfaatkan observabilitas. Memanfaatkan metrik, log, dan jejak yang relevan untuk mendapatkan pandangan komprehensif tentang kinerja beban kerja Anda dan mengatasi masalah secara efisien.

**Topics**
+ [OPS08-BP01 Menganalisis metrik beban kerja](ops_workload_observability_analyze_workload_metrics.md)
+ [OPS08-BP02 Menganalisis log beban kerja](ops_workload_observability_analyze_workload_logs.md)
+ [OPS08-BP03 Menganalisis jejak beban kerja](ops_workload_observability_analyze_workload_traces.md)
+ [OPS08-BP04 Membuat peringatan yang dapat ditindaklanjuti](ops_workload_observability_create_alerts.md)
+ [OPS08-BP05 Membuat dasbor](ops_workload_observability_create_dashboards.md)

# OPS08-BP01 Menganalisis metrik beban kerja
<a name="ops_workload_observability_analyze_workload_metrics"></a>

 Setelah mengimplementasikan telemetri aplikasi, lakukan analisis terhadap metrik yang dikumpulkan secara rutin. Latensi, permintaan, kesalahan, dan kapasitas (atau kuota) memang memberikan wawasan tentang performa sistem, tetapi memprioritaskan peninjauan terhadap metrik hasil bisnis adalah hal yang sangat penting. Ini akan memastikan Anda mengambil keputusan berbasis data yang selaras dengan tujuan-tujuan bisnis Anda. 

 **Hasil yang diharapkan:** Wawasan akurat tentang performa beban kerja yang mendorong keputusan berdasarkan informasi data, sehingga memastikan keselarasan dengan tujuan bisnis. 

 **Anti-pola umum:** 
+  Menganalisis metrik secara terpisah tanpa mempertimbangkan dampak-dampak yang ditimbulkannya terhadap hasil bisnis. 
+  Ketergantungan berlebihan pada metrik teknis sekaligus mengesampingkan metrik bisnis. 
+  Peninjauan metrik jarang dilakukan, sehingga peluang pengambilan keputusan waktu nyata terlewatkan. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Peningkatan pemahaman tentang korelasi antara performa teknis dan hasil bisnis. 
+  Perbaikan proses pengambilan keputusan yang berlandaskan data waktu nyata. 
+  Melakukan identifikasi dan mitigasi masalah secara proaktif sebelum hasil bisnis terkena dampaknya. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Manfaatkan alat seperti Amazon CloudWatch untuk melakukan analisis metrik. AWS layanan seperti deteksi CloudWatch anomali dan Amazon DevOps Guru dapat digunakan untuk mendeteksi anomali, terutama ketika ambang batas statis tidak diketahui atau ketika pola perilaku lebih cocok untuk deteksi anomali. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  **Lakukan analisis dan peninjauan:** Tinjau dan tafsirkan metrik beban kerja Anda secara rutin. 

   1.  Memprioritaskan metrik hasil bisnis daripada metrik teknis murni. 

   1.  Memahami arti penting dari lonjakan, penurunan, atau pola dalam data Anda. 

1.  **Manfaatkan Amazon CloudWatch:** Gunakan Amazon CloudWatch untuk tampilan terpusat dan analisis mendalam. 

   1.  Konfigurasikan CloudWatch dasbor untuk memvisualisasikan metrik Anda dan membandingkannya dari waktu ke waktu. 

   1.  Gunakan [persentil CloudWatch](https://aws-observability.github.io/observability-best-practices/guides/operational/business/sla-percentile/) untuk mendapatkan pandangan yang jelas tentang distribusi metrik, yang dapat membantu dalam mendefinisikan SLAs dan memahami outlier. 

   1.  Siapkan [deteksi CloudWatch anomali](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) untuk mengidentifikasi pola yang tidak biasa tanpa bergantung pada ambang batas statis. 

   1.  Menerapkan [observabilitas CloudWatch lintas akun](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-Unified-Cross-Account.html) untuk memantau dan memecahkan masalah aplikasi yang menjangkau beberapa akun dalam suatu Wilayah. 

   1.  Gunakan [Wawasan CloudWatch Metrik](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/query_with_cloudwatch-metrics-insights.html) untuk menanyakan dan menganalisis data metrik di seluruh akun dan Wilayah, mengidentifikasi tren dan anomali. 

   1.  Terapkan [CloudWatch Metric Math](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/using-metric-math.html) untuk mengubah, menggabungkan, atau melakukan perhitungan pada metrik Anda untuk wawasan yang lebih dalam. 

1.  **Mempekerjakan Amazon DevOps Guru:** Gabungkan [Amazon DevOps Guru](https://aws.amazon.com/devops-guru/) untuk deteksi anomali yang ditingkatkan pembelajaran mesin untuk mengidentifikasi tanda-tanda awal masalah operasional untuk aplikasi tanpa server Anda dan memperbaikinya sebelum berdampak pada pelanggan Anda. 

1.  **Lakukan optimalisasi berdasarkan wawasan:** Ambil keputusan cerdas berdasarkan analisis metrik Anda untuk menyesuaikan dan meningkatkan beban kerja Anda. 

 **Tingkat upaya untuk Rencana Implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS04-BP01 Identifikasi indikator kinerja utama](ops_observability_identify_kpis.md) 
+  [OPS04-BP02 Melaksanakan telemetri aplikasi](ops_observability_application_telemetry.md) 

 **Dokumen terkait:** 
+ [ The Wheel Blog - Menekankan pentingnya peninjauan metrik secara terus-menerus ](https://aws.amazon.com/blogs/opensource/the-wheel/)
+ [ Persentil itu penting ](https://aws-observability.github.io/observability-best-practices/guides/operational/business/sla-percentile/)
+ [Menggunakan AWS Cost Anomaly Detection](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html)
+ [ CloudWatch observabilitas lintas akun](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-Unified-Cross-Account.html)
+ [Kueri metrik Anda dengan Wawasan CloudWatch Metrik](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/query_with_cloudwatch-metrics-insights.html)

 **Video terkait:** 
+ [Aktifkan Observabilitas Lintas Akun di Amazon CloudWatch](https://www.youtube.com/watch?v=lUaDO9dqISc)
+ [Pengantar Amazon DevOps Guru](https://www.youtube.com/watch?v=2uA8q-8mTZY)
+ [Terus Menganalisis Metrik menggunakan AWS Cost Anomaly Detection](https://www.youtube.com/watch?v=IpQYBuay5OE)

 **Contoh terkait:** 
+ [ Lokakarya Satu Observabilitas ](https://catalog.workshops.aws/observability/en-US/intro)
+ [Mendapatkan wawasan operasi dengan AIOps menggunakan Amazon Guru DevOps](https://catalog.us-east-1.prod.workshops.aws/workshops/f92df379-6add-4101-8b4b-38b788e1222b/en-US)

# OPS08-BP02 Menganalisis log beban kerja
<a name="ops_workload_observability_analyze_workload_logs"></a>

 Melakukan analisis log beban kerja secara rutin merupakan hal yang sangatlah penting untuk mendapatkan pemahaman yang lebih mendalam tentang aspek-aspek operasional aplikasi Anda. Dengan memilah-milah, memvisualisasikan, dan menafsirkan data log secara efisien, Anda akan dapat terus mengoptimalkan performa dan keamanan aplikasi. 

 **Hasil yang diinginkan:** Wawasan yang kaya tentang perilaku dan operasi aplikasi yang berasal dari analisis log yang dilakukan secara menyeluruh, sehingga akan memastikan deteksi dan mitigasi masalah yang proaktif. 

 **Anti-pola umum:** 
+  Mengabaikan analisis log sampai ada masalah kritis yang muncul. 
+  Tidak menggunakan rangkaian alat lengkap yang tersedia untuk melakukan analisis log, sehingga ada wawasan kritis yang terlewatkan. 
+  Hanya mengandalkan tinjauan log manual tanpa memanfaatkan kemampuan-kemampuan otomatisasi dan kueri. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Lakukan identifikasi kemacetan operasional, ancaman keamanan, dan masalah-masalah potensial lain secara proaktif. 
+  Pemanfaatan data log yang efisien untuk optimalisasi aplikasi yang berkelanjutan. 
+  Peningkatan pemahaman tentang perilaku aplikasi, sehingga itu akan membantu Anda dalam melakukan upaya debugging dan pemecahan masalah. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 [Amazon CloudWatch Logs](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/WhatIsCloudWatchLogs.html) adalah alat yang ampuh untuk analisis log. Fitur terintegrasi seperti Wawasan CloudWatch Log dan Wawasan Kontributor membuat proses memperoleh informasi yang bermakna dari log menjadi intuitif dan efisien. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  **Siapkan CloudWatch Log**: Konfigurasikan aplikasi dan layanan untuk mengirim CloudWatch log ke Log. 

1.  **Gunakan deteksi anomali log: Manfaatkan deteksi** [anomali CloudWatch Amazon Logs](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/LogsAnomalyDetection.html) untuk secara otomatis mengidentifikasi dan memperingatkan pola log yang tidak biasa. Alat ini akan membantu Anda secara proaktif mengelola anomali-anomali yang terjadi dalam log Anda dan mendeteksi setiap potensi masalah sejak dini. 

1.  **Siapkan Wawasan CloudWatch Log**: Gunakan [Wawasan CloudWatch Log](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/AnalyzingLogData.html) untuk mencari dan menganalisis data log Anda secara interaktif. 

   1.  Buat kueri untuk mengekstrak pola, memvisualisasikan data log, dan memperoleh wawasan yang dapat Anda tindaklanjuti. 

   1.  Gunakan [analisis pola Wawasan CloudWatch Log](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CWL_AnalyzeLogData_Patterns.html) untuk menganalisis dan memvisualisasikan pola log yang sering. Fitur ini akan membantu Anda memahami tren operasional umum dan setiap potensi penyimpangan yang ada dalam data log Anda. 

   1.  Gunakan [perbandingan CloudWatch Log (diff)](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CWL_AnalyzeLogData_Compare.html) untuk melakukan analisis diferensial antara periode waktu yang berbeda atau di seluruh grup log yang berbeda. Gunakan kemampuan ini untuk mendeteksi perubahan-perubahan yang terjadi dan menilai dampaknya terhadap kinerja atau perilaku sistem Anda. 

1.  **Pantau log secara real-time dengan Live Tail:** Gunakan [Amazon CloudWatch Logs Live Tail](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CloudWatchLogs_LiveTail.html) untuk melihat data log secara real-time. Anda dapat secara aktif memantau aktivitas operasional aplikasi Anda saat sedang berlangsung, yang memberikan visibilitas langsung kepada Anda mengenai kinerja sistem dan potensi masalah. 

1.  **Manfaatkan Wawasan Kontributor: Gunakan Wawasan CloudWatch** [Kontributor](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/ContributorInsights.html) untuk mengidentifikasi pembicara teratas dalam dimensi kardinalitas tinggi seperti alamat IP atau agen pengguna. 

1.  **Menerapkan filter metrik CloudWatch Log**: Konfigurasikan [filter metrik CloudWatch Log](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/MonitoringLogData.html) untuk mengonversi data log menjadi metrik yang dapat ditindaklanjuti. Ini memungkinkan Anda untuk mengatur alarm atau melakukan analisis pola lebih lanjut. 

1.  **Menerapkan [observabilitas CloudWatch lintas akun](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-Unified-Cross-Account.html):** Pantau dan pecahkan masalah aplikasi yang menjangkau beberapa akun dalam suatu Wilayah. 

1.  **Lakukan peninjauan dan penyempurnaan secara rutin**: Tinjau strategi analisis log Anda secara berkala untuk menangkap semua informasi yang relevan dan terus mengoptimalkan performa aplikasi. 

 **Tingkat upaya untuk rencana implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS04-BP01 Identifikasi indikator kinerja utama](ops_observability_identify_kpis.md) 
+  [OPS04-BP02 Melaksanakan telemetri aplikasi](ops_observability_application_telemetry.md) 
+  [OPS08-BP01 Menganalisis metrik beban kerja](ops_workload_observability_analyze_workload_metrics.md) 

 **Dokumen terkait:** 
+  [Menganalisis Data Log dengan Wawasan CloudWatch Log](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/AnalyzingLogData.html) 
+  [Menggunakan CloudWatch Wawasan Kontributor](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/ContributorInsights.html) 
+  [Membuat dan Mengelola Filter Metrik CloudWatch Log](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/MonitoringLogData.html) 

 **Video terkait:** 
+  [Menganalisis Data Log dengan Wawasan CloudWatch Log](https://www.youtube.com/watch?v=2s2xcwm8QrM) 
+  [Gunakan Wawasan CloudWatch Kontributor untuk Menganalisis Data Kardinalitas Tinggi](https://www.youtube.com/watch?v=ErWRBLFkjGI) 

 **Contoh terkait:** 
+  [CloudWatch Pertanyaan Contoh Log](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CWL_QuerySyntax-examples.html) 
+  [Lokakarya Satu Observabilitas](https://catalog.workshops.aws/observability/en-US/intro) 

# OPS08-BP03 Menganalisis jejak beban kerja
<a name="ops_workload_observability_analyze_workload_traces"></a>

 Menganalisis data jejak sangatlah penting untuk mencapai pandangan yang komprehensif tentang perjalanan operasional aplikasi. Dengan memvisualisasikan dan memahami interaksi antara berbagai komponen, performa dapat disesuaikan, kemacetan dapat diidentifikasi, dan pengalaman pengguna dapat ditingkatkan. 

 **Hasil yang dinginkan:** Dapatkan visibilitas yang jelas tentang operasi terdistribusi yang dimiliki aplikasi Anda, sehingga memungkinkan penyelesaian masalah yang lebih cepat dan pengalaman pengguna yang disempurnakan. 

 **Anti-pola umum:** 
+  Mengabaikan data jejak, dan hanya mengandalkan log serta metrik. 
+  Tidak melakukan korelasi antara data jejak dengan log terkait. 
+  Mengabaikan metrik-metrik yang berasal dari jejak, seperti latensi dan tingkat kesalahan. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Tingkatkan pemecahan masalah dan kurangi waktu rata-rata ke resolusi ()MTTR. 
+  Mendapatkan wawasan tentang dependensi dan dampaknya. 
+  Identifikasi dan perbaikan masalah performa secara cepat. 
+  Memanfaatkan metrik-metrik yang berasal dari jejak untuk pengambilan keputusan yang tepat berdasarkan informasi. 
+  Pengalaman pengguna yang ditingkatkan melalui interaksi komponen yang dioptimalkan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 [AWS X-Ray](https://www.docs.aws.com/xray/latest/devguide/aws-xray.html) menawarkan serangkaian fitur komprehensif untuk melakukan analisis data jejak, yang dapat menyediakan pandangan yang menyeluruh tentang interaksi layanan, memantau aktivitas pengguna, dan mendeteksi masalah-masalah performa. Fitur seperti ServiceLens, X-Ray Insights, X-Ray Analytics, dan Amazon DevOps Guru meningkatkan kedalaman wawasan yang dapat ditindaklanjuti yang berasal dari data jejak. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

 Langkah-langkah berikut menawarkan pendekatan terstruktur untuk menerapkan analisis data jejak secara efektif menggunakan AWS layanan: 

1.  **Integrasikan AWS X-Ray**: Pastikan X-Ray terintegrasi dengan aplikasi Anda untuk menangkap data jejak. 

1.  **Analisis metrik X-Ray**: Selidiki metrik yang berasal dari jejak X-Ray, seperti latensi, tingkat permintaan, tingkat kesalahan, dan distribusi waktu respons, dengan menggunakan [peta layanan](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-servicemap.html#xray-console-servicemap-view) untuk memantau kesehatan aplikasi. 

1.  **Gunakan ServiceLens**: Manfaatkan [ServiceLenspeta](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/servicelens_service_map.html) untuk meningkatkan observabilitas layanan dan aplikasi Anda. Fitur ini memungkinkan Anda untuk menampilkan jejak, metrik, log, alarm, dan informasi kondisi lainnya secara terpadu. 

1.  **Aktifkan Wawasan X-Ray**: 

   1.  Aktifkan [Wawasan X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-insights.html) untuk deteksi anomali otomatis dalam jejak. 

   1.  Periksa wawasan untuk menentukan pola dan memastikan akar masalah, misalnya peningkatan tingkat kesalahan atau latensi. 

   1.  Pelajari lini waktu wawasan untuk mendapatkan analisis kronologis dari masalah-masalah yang terdeteksi. 

1.  **Gunakan Analitik X-Ray**: [Analitik X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-analytics.html) akan memungkinkan Anda menjelajahi data jejak secara menyeluruh, menentukan pola, dan mengekstrak wawasan. 

1.  **Gunakan grup di X-Ray**: Buat grup di X-Ray untuk memfilter jejak berdasarkan kriteria seperti latensi tinggi, sehingga memungkinkan analisis yang lebih tertarget. 

1.  **Menggabungkan Amazon DevOps Guru**: Libatkan [Amazon DevOps Guru](https://aws.amazon.com/devops-guru/) untuk mendapatkan manfaat dari model pembelajaran mesin yang menunjukkan dengan tepat anomali operasional dalam jejak. 

1.  **Gunakan CloudWatch Synthetics**: Gunakan [CloudWatchSynthetics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries_tracing.html) untuk membuat kenari untuk terus memantau titik akhir dan alur kerja Anda. Canary ini dapat terintegrasi dengan X-Ray untuk menyediakan data jejak untuk analisis aplikasi yang sedang diuji secara mendalam. 

1.  **Gunakan Real User Monitoring (RUM)**: Dengan [AWS X-Ray dan CloudWatch RUM](https://docs.aws.amazon.com/xray/latest/devguide/xray-services-RUM.html), Anda dapat menganalisis dan men-debug jalur permintaan mulai dari pengguna akhir aplikasi Anda melalui layanan AWS terkelola hilir. Ini akan membantu Anda untuk mengidentifikasi tren latensi dan kesalahan yang berdampak pada pengguna akhir Anda. 

1.  **Berkorelasi dengan log**: Korelasikan [data jejak dengan log terkait](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/servicelens_troubleshooting.html#servicelens_troubleshooting_Nologs) dalam tampilan jejak X-Ray untuk perspektif mendetail tentang perilaku aplikasi. Ini memungkinkan Anda untuk melihat peristiwa log yang terkait langsung dengan transaksi-transaksi yang dilacak. 

1.  **Menerapkan [observabilitas CloudWatch lintas akun](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-Unified-Cross-Account.html):** Pantau dan pecahkan masalah aplikasi yang menjangkau beberapa akun dalam suatu Wilayah. 

 **Tingkat upaya untuk rencana implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS08-BP01 Menganalisis metrik beban kerja](ops_workload_observability_analyze_workload_metrics.md) 
+  [OPS08-BP02 Menganalisis log beban kerja](ops_workload_observability_analyze_workload_logs.md) 

 **Dokumen terkait:** 
+  [Menggunakan ServiceLens untuk Memantau Kesehatan Aplikasi](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/ServiceLens.html) 
+  [Menjelajahi Data Jejak dengan Analitik X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-analytics.html) 
+  [Mendeteksi Anomali di dalam Jejak dengan Wawasan X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/xray-insights.html) 
+  [Pemantauan Berkelanjutan dengan CloudWatch Synthetics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html) 

 **Video terkait:** 
+  [Analisis dan Debug Aplikasi Menggunakan Amazon CloudWatch Synthetics & AWS X-Ray](https://www.youtube.com/watch?v=s2WvaV2eDO4) 
+  [Gunakan Wawasan AWS X-Ray](https://www.youtube.com/watch?v=tl8OWHl6jxw) 

 **Contoh terkait:** 
+  [Lokakarya Satu Observabilitas](https://catalog.workshops.aws/observability/en-US/intro) 
+  [Menerapkan X-Ray dengan AWS Lambda](https://docs.aws.amazon.com/lambda/latest/dg/services-xray.html) 
+  [CloudWatchTemplat Canary Synthetics](https://github.com/aws-samples/cloudwatch-synthetics-canary-terraform) 

# OPS08-BP04 Membuat peringatan yang dapat ditindaklanjuti
<a name="ops_workload_observability_create_alerts"></a>

 Sangat penting untuk mendeteksi dan merespons penyimpangan dalam perilaku aplikasi Anda segera. Lebih penting lagi adalah mengenali ketika hasil yang didasarkan pada indikator kinerja utama (KPI) berisiko atau ketika muncul anomali yang tak terduga. Mendasarkan peringatan pada KPI akan memastikan bahwa sinyal yang Anda terima berkaitan langsung dengan dampak bisnis atau operasional. Pendekatan terhadap peringatan yang dapat ditindaklanjuti ini mempromosikan respons proaktif dan akan membantu Anda untuk mempertahankan performa dan keandalan sistem. 

 **Hasil yang diinginkan:** Menerima peringatan yang tepat waktu, relevan, dan dapat ditindaklanjuti untuk identifikasi dan mitigasi potensi masalah dengan cepat, terutama ketika hasil KPI berisiko. 

 **Anti-pola umum:** 
+  Menyiapkan terlalu banyak peringatan non-kritis, yang mengakibatkan kewalahan. 
+  Tidak memprioritaskan peringatan berdasarkan KPI, sehingga dampak masalah terhadap bisnis menjadi sulit dipahami. 
+  Mengabaikan penanganan akar masalah, yang berimbas pada munculnya peringatan berulang untuk masalah yang sama. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Berkurangnya kewalahan akibat peringatan dengan memusatkan perhatian pada peringatan-peringatan yang dapat ditindaklanjuti dan relevan. 
+  Waktu aktif dan keandalan sistem yang lebih baik melalui deteksi dan mitigasi masalah yang proaktif. 
+  Kolaborasi tim yang disempurnakan dan penyelesaian masalah yang lebih cepat dengan melakukan integrasi alat-alat peringatan dan komunikasi populer. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Untuk membuat sebuah mekanisme peringatan yang efektif, Anda harus menggunakan metrik, log, dan data jejak yang menandai kapan hasil yang didasarkan pada KPI berisiko atau terdapat anomali yang terdeteksi. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  **Tentukan indikator kinerja utama (KPI)**: Identifikasi KPI yang dimiliki aplikasi Anda. Peringatan harus dikaitkan dengan KPI ini agar mencerminkan dampak bisnis secara akurat. 

1.  **Implementasikan deteksi anomali**: 
   +  **Gunakan deteksi anomali Amazon CloudWatch**: Siapkan [deteksi anomali Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) untuk mendeteksi pola yang tidak biasa secara otomatis, yang membantu Anda hanya menghasilkan peringatan untuk anomali yang asli. 
   +  **Gunakan Wawasan AWS X-Ray**: 

     1.  Siapkan [Wawasan X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-insights.html) untuk mendeteksi anomali dalam data jejak. 

     1.  Konfigurasikan [notifikasi untuk Wawasan X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-insights.html#xray-console-insight-notifications) agar Anda mendapat notifikasi tentang masalah yang terdeteksi. 
   +  **Integrasikan dengan Amazon DevOps Guru**: 

     1.  Manfaatkan [Amazon DevOps Guru](https://aws.amazon.com/devops-guru/) untuk kemampuan machine learning-nya dalam mendeteksi anomali operasional pada data yang ada. 

     1.  Arahkan ke [pengaturan notifikasi](https://docs.aws.amazon.com/devops-guru/latest/userguide/update-notifications.html#navigate-to-notification-settings) di DevOps Guru untuk menyiapkan peringatan anomali. 

1.  **Implementasikan peringatan yang dapat ditindaklanjuti**: Rancang peringatan yang menyediakan informasi yang memadai untuk tindakan cepat. 

   1.  Pantau [peristiwa AWS Health dengan aturan Amazon EventBridge](https://docs.aws.amazon.com/health/latest/ug/cloudwatch-events-health.html), atau integrasikan secara terprogram dengan API AWS Health untuk mengotomatiskan tindakan saat Anda menerima peristiwa AWS Health. Ini bisa berupa tindakan-tindakan umum, seperti mengirimkan semua pesan peristiwa siklus hidup yang direncanakan ke antarmuka obrolan, atau tindakan tertentu, seperti inisiasi alur kerja di alat manajemen layanan IT. 

1.  **Kurangi kelelahan karena peringatan**: Minimalkan peringatan non-kritis. Ketika tim kewalahan dengan banyaknya peringatan yang tidak penting, mereka bisa jadi melewatkan masalah-masalah kritis, sehingga mengurangi efektivitas mekanisme peringatan secara keseluruhan. 

1.  **Siapkan alarm komposit**: Gunakan [alarm komposit Amazon CloudWatch](https://aws.amazon.com/bloprove-monitoring-efficiency-using-amazon-cloudwatch-composite-alarms-2/) untuk mengkonsolidasikan beberapa alarm. 

1.  **Integrasikan dengan alat peringatan**: Gabungkan alat seperti [Ops Genie](https://www.atlassian.com/software/opsgenie) dan [PagerDuty](https://www.pagerduty.com/). 

1.  **Gunakan kemampuan Amazon Q Developer dalam aplikasi obrolan**: Integrasikan [Amazon Q Developer dalam aplikasi obrolan](https://aws.amazon.com/chatbot/) untuk menyampaikan peringatan ke Amazon Chime, Microsoft Teams, dan Slack. 

1.  **Peringatan berdasarkan log**: Gunakan [filter metrik log](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/MonitoringLogData.html) di CloudWatch untuk membuat alarm berdasarkan peristiwa log tertentu. 

1.  **Tinjau dan ulangi**: Tinjau ulang dan sempurnakan konfigurasi peringatan secara rutin. 

 **Tingkat upaya untuk rencana implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS04-BP01 Identifikasi indikator kinerja utama](ops_observability_identify_kpis.md) 
+  [OPS04-BP02 Melaksanakan telemetri aplikasi](ops_observability_application_telemetry.md) 
+  [OPS04-BP03 Menerapkan telemetri pengalaman pengguna](ops_observability_customer_telemetry.md) 
+  [OPS04-BP04 Mengimplementasikan telemetri dependensi](ops_observability_dependency_telemetry.md) 
+  [OPS04-BP05 Melaksanakan penelusuran terdistribusi](ops_observability_dist_trace.md) 
+  [OPS08-BP01 Menganalisis metrik beban kerja](ops_workload_observability_analyze_workload_metrics.md) 
+  [OPS08-BP02 Menganalisis log beban kerja](ops_workload_observability_analyze_workload_logs.md) 
+  [OPS08-BP03 Menganalisis jejak beban kerja](ops_workload_observability_analyze_workload_traces.md) 

 **Dokumen terkait:** 
+  [Menggunakan alarm Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 
+  [Membuat sebuah alarm gabungan](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Create_Composite_Alarm.html) 
+  [Membuat sebuah alarm CloudWatch berdasarkan pada deteksi anomali](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Create_Anomaly_Detection_Alarm.html) 
+  [Notifikasi DevOps Guru](https://docs.aws.amazon.com/devops-guru/latest/userguide/update-notifications.html) 
+  [Notifikasi wawasan X-ray](https://docs.aws.amazon.com/xray/latest/devguide/xray-console-insights.html#xray-console-insight-notifications) 
+  [Pantau, operasikan, dan pecahkan masalah sumber daya AWS Anda dengan ChatOps interaktif](https://aws.amazon.com/chatbot/) 
+  [Panduan Integrasi Amazon CloudWatch \$1 PagerDuty](https://support.pagerduty.com/docs/amazon-cloudwatch-integration-guide) 
+  [Integrasikan Opsgenie dengan Amazon CloudWatch](https://support.atlassian.com/opsgenie/docs/integrate-opsgenie-with-amazon-cloudwatch/) 

 **Video terkait:** 
+  [Membuat Alarm Gabungan di Amazon CloudWatch](https://www.youtube.com/watch?v=0LMQ-Mu-ZCY) 
+  [Ikhtisar Amazon Q Developer dalam aplikasi obrolan](https://www.youtube.com/watch?v=0jUSEfHbTYk) 
+  [AWS On Air dengan Perintah Mutatif di Amazon Q Developer dalam aplikasi obrolan](https://www.youtube.com/watch?v=u2pkw2vxrtk) 

 **Contoh terkait:** 
+  [Alarm, manajemen insiden, dan remediasi di cloud dengan Amazon CloudWatch](https://aws.amazon.com/bloarms-incident-management-and-remediation-in-the-cloud-with-amazon-cloudwatch/) 
+  [Tutorial: Membuat aturan Amazon EventBridge yang mengirimkan notifikasi ke Amazon Q Developer dalam aplikasi obrolan](https://docs.aws.amazon.com/chatbot/latest/adminguide/create-eventbridge-rule.html) 
+  [Lokakarya Satu Observabilitas](https://catalog.workshops.aws/observability/en-US/intro) 

# OPS08-BP05 Membuat dasbor
<a name="ops_workload_observability_create_dashboards"></a>

 Dasbor adalah tampilan yang berpusat pada manusia tentang data telemetri beban kerja Anda. Meskipun menyediakan antarmuka visual yang vital, dasbor tidak boleh menggantikan mekanisme peringatan, melainkan hanya melengkapinya. Ketika dibuat dengan cermat, dasbor tidak hanya dapat menawarkan wawasan yang disajikan dengan cepat tentang kondisi dan kinerja sistem, tetapi juga dapat menyajikan informasi waktu nyata kepada para pemangku kepentingan tentang hasil bisnis dan dampak dari masalah yang ditimbulkannya. 

 **Hasil yang diinginkan:** 

 Wawasan yang jelas dan dapat ditindaklanjuti tentang kondisi sistem dan bisnis menggunakan representasi visual. 

 **Anti-pola umum:** 
+  Dasbor yang terlalu rumit yang mempunyai terlalu banyak metrik. 
+  Mengandalkan dasbor tanpa peringatan untuk deteksi anomali. 
+  Tidak memperbarui dasbor seiring perkembangan beban kerja. 

 **Manfaat praktik terbaik ini:** 
+  Visibilitas langsung tentang metrik sistem penting dan KPI. 
+  Komunikasi dan pemahaman para pemangku kepentingan yang ditingkatkan. 
+  Wawasan yang disajikan dengan cepat tentang dampak masalah operasional. 

 **Tingkat risiko yang dihadapi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 **Dasbor yang berpusat pada bisnis** 

 Dasbor yang disesuaikan dengan KPI bisnis melibatkan lebih banyak pemangku kepentingan. Meskipun orang-orang ini mungkin tidak tertarik pada metrik sistem, namun mereka tertarik untuk memahami implikasi bisnis dari angka-angka ini. Dasbor yang berpusat pada bisnis memastikan semua metrik teknis dan operasional yang dipantau dan dianalisis selaras dengan tujuan-tujuan bisnis secara keseluruhan. Penyelarasan ini memberikan kejelasan, memastikan semua orang memiliki pemahaman yang sama mengenai hal-hal yang penting dan hal-hal yang tidak penting. Selain itu, dasbor yang menyoroti KPI bisnis cenderung lebih mudah untuk ditindaklanjuti. Para pemangku kepentingan dapat dengan cepat memahami kondisi operasi, area yang perlu diperhatikan, dan dampak yang mungkin ditimbulkan terhadap hasil bisnis. 

 Dengan mempertimbangkan hal ini, saat membuat dasbor Anda, pastikan ada keseimbangan antara metrik-metrik teknis dan KPI bisnis. Keduanya penting, tetapi melayani audiens yang berbeda. Idealnya, Anda harus memiliki dasbor yang memberikan pandangan menyeluruh tentang kondisi dan performa sistem sekaligus menekankan hasil bisnis utama serta implikasinya. 

 Dasbor Amazon CloudWatch adalah halaman beranda yang dapat disesuaikan di konsol CloudWatch yang dapat digunakan untuk memantau sumber daya Anda dalam satu tampilan, bahkan sumber daya yang tersebar di berbagai Wilayah AWS dan akun yang berbeda. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  **Buat dasbor dasar:** [Buatlah sebuah dasbor baru di CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/create_dashboard.html), berikan nama yang deskriptif. 

1.  **Gunakan widget Markdown:** Sebelum menggunakan metrik, [gunakan widget Markdown](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/add_remove_text_dashboard.html) untuk menambahkan konteks tekstual di bagian atas dasbor Anda. Widget ini akan menjelaskan cakupan dasbor, tingkat pentingnya metrik yang ditampilkan, dan juga dapat diisi dengan tautan-tautan ke dasbor serta alat-alat pemecahan masalah lainnya. 

1.  **Buat variabel dasbor:** [Gabungkan variabel dasbor](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/cloudwatch_dashboard_variables.html) jika sesuai agar dasbor mempunyai tampilan yang dinamis dan fleksibel. 

1.  **Buat widget metrik:** [Tambahkan widget metrik](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/create-and-work-with-widgets.html) untuk memberikan visualisasi dari berbagai metrik yang dihasilkan oleh aplikasi Anda, lalu sesuaikan semua widget agar efektif menampilkan kondisi sistem dan hasil bisnis. 

1.  **Kueri Wawasan Log:** Manfaatkan [Wawasan Log CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CWL_ExportQueryResults.html) untuk mendapatkan metrik yang dapat ditindaklanjuti dari log Anda dan menampilkan wawasan ini di dasbor Anda. 

1.  **Siapkan alarm:** Integrasikan [Alarm CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/add_remove_alarm_dashboard.html) ke dasbor Anda untuk melihat sekilas metrik apa pun yang melanggar ambang batas mereka. 

1.  **Gunakan Wawasan Kontributor:** Gabungkan [Wawasan Kontributor CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/ContributorInsights-ViewReports.html) untuk menganalisis bidang kardinalitas tinggi dan mendapatkan pemahaman yang lebih jelas tentang kontributor utama sumber daya Anda. 

1.  **Desain widget kustom:** Untuk kebutuhan spesifik yang tidak dipenuhi oleh widget standar, sebaiknya Anda membuat [widget kustom](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/add_custom_widget_dashboard.html). Widget kustom ini dapat menarik dari berbagai sumber data atau menyajikan data dengan cara yang unik. 

1.  **Gunakan AWS Health:** AWS Health adalah sumber informasi otoritatif tentang kondisi sumber daya AWS Cloud Anda. Gunakan [Dasbor AWS Health](https://health.aws.amazon.com/health/status) langsung, atau gunakan data AWS Health di dasbor dan alat Anda sendiri sehingga Anda memiliki informasi tepat yang tersedia untuk membuat keputusan yang tepat. 

1.  **Ulangi dan sempurnakan:** Saat aplikasi Anda berkembang, tinjau kembali dasbor Anda secara teratur untuk memastikan relevansinya. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS04-BP01 Identifikasi indikator kinerja utama](ops_observability_identify_kpis.md) 
+  [OPS08-BP01 Menganalisis metrik beban kerja](ops_workload_observability_analyze_workload_metrics.md) 
+  [OPS08-BP02 Menganalisis log beban kerja](ops_workload_observability_analyze_workload_logs.md) 
+  [OPS08-BP03 Menganalisis jejak beban kerja](ops_workload_observability_analyze_workload_traces.md) 
+  [OPS08-BP04 Membuat peringatan yang dapat ditindaklanjuti](ops_workload_observability_create_alerts.md) 

 **Dokumen terkait:** 
+  [Membangun Dasbor untuk Visibilitas Operasional](https://aws.amazon.com/builders-library/building-dashboards-for-operational-visibility/) 
+  [Menggunakan Dasbor Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html) 

 **Video terkait:** 
+  [Membuat Dasbor CloudWatch Lintas Akun & Lintas Wilayah](https://www.youtube.com/watch?v=eIUZdaqColg) 
+  [AWS re:Invent 2021 - Mendapatkan visibilitas korporasi dengan dasbor operasional AWS Cloud)](https://www.youtube.com/watch?v=NfMpYiGwPGo) 

 **Contoh terkait:** 
+  [Lokakarya Satu Observabilitas](https://catalog.workshops.aws/observability/en-US/intro) 
+  [Pemantauan Aplikasi dengan Amazon CloudWatch](https://aws.amazon.com/solutions/implementations/application-monitoring-with-cloudwatch/) 
+  [Dasbor dan Wawasan Intelijen Peristiwa AWS Health](https://aws.amazon.com/blogs/mt/aws-health-events-intelligence-dashboards-insights/) 
+  [Visualisasikan peristiwa AWS Health menggunakan Amazon Managed Grafana](https://aws.amazon.com/blogs/mt/visualize-aws-health-events-using-amazon-managed-grafana/) 

# OPS 9. Bagaimana cara memahami kondisi operasi Anda?
<a name="ops-09"></a>

 Tetapkan, catat, dan analisis metrik operasi untuk mendapatkan visibilitas peristiwa operasi sehingga Anda dapat mengambil tindakan yang tepat. 

**Topics**
+ [OPS09-BP01 Mengukur sasaran operasi dan KPI dengan metrik](ops_operations_health_measure_ops_goals_kpis.md)
+ [OPS09-BP02 Mengomunikasikan status dan tren untuk memastikan visibilitas beroperasi](ops_operations_health_communicate_status_trends.md)
+ [OPS09-BP03 Meninjau metrik-metrik operasi dan memprioritaskan perbaikan](ops_operations_health_review_ops_metrics_prioritize_improvement.md)

# OPS09-BP01 Mengukur sasaran operasi dan KPI dengan metrik
<a name="ops_operations_health_measure_ops_goals_kpis"></a>

 Dapatkan sasaran dan KPI yang menentukan keberhasilan operasi dari organisasi Anda dan pastikan metrik-metrik tersebut mencerminkan hal ini. Tetapkan garis acuan sebagai titik referensi dan lakukan evaluasi ulang secara rutin. Kembangkan mekanisme untuk mengumpulkan metrik-metrik tersebut dari tim untuk dievaluasi. Metrik [DevOps Research and Assessment (DORA)](https://dora.dev/guides/dora-metrics-four-keys/) menyediakan metode populer untuk mengukur progres penerapan praktik DevOps dalam pengiriman perangkat lunak. 

 **Hasil yang diinginkan:** 
+ Organisasi menerbitkan dan membagikan sasaran dan KPI untuk tim operasi.
+ Anda menetapkan metrik-metrik yang mencerminkan KPI ini. Di antara contohnya adalah:
  +  Kedalaman antrean tiket atau rata-rata umur tiket 
  +  Jumlah tiket yang dikelompokkan berdasarkan jenis masalah 
  +  Waktu yang dihabiskan untuk mengurusi masalah dengan atau tanpa prosedur operasi standar (SOP) 
  +  Jumlah waktu yang dihabiskan untuk pulih dari push kode yang gagal 
  +  Volume panggilan 

 **Anti-pola umum:** 
+  Tenggat waktu deployment tidak terpenuhi karena developer disibukkan dengan tugas-tugas pemecahan masalah. Tim pengembangan menuntut lebih banyak personel, tetapi tidak dapat mengukur berapa orang yang mereka butuhkan karena waktu yang tersita tidak dapat diukur. 
+  Meja Tingkat 1 disiapkan untuk menangani panggilan pengguna. Seiring waktu, makin banyak beban kerja yang ditambahkan, tetapi tidak ada personel yang dialokasikan ke meja Tingkat 1 tersebut. Kepuasan pelanggan sangat rendah karena waktu panggilan semakin meningkat dan masalah berlarut-larut tanpa penyelesaian, tetapi manajemen tidak melihat indikator permasalahan ini, sehingga tidak ada tindakan yang dilakukan. 
+  Beban kerja yang bermasalah diserahkan kepada tim operasi terpisah untuk dilakukan pemeliharaan. Tidak seperti beban kerja lainnya, beban kerja tersebut tidak dilengkapi dengan dokumentasi dan runbook yang baik. Akibatnya, tim menghabiskan waktu lebih lama untuk memecahkan masalah dan mengurusi kegagalan. Namun demikian, tidak ada metrik yang mendokumentasikan hal ini, sehingga akuntabilitas menjadi sulit. 

 **Manfaat menjalankan praktik terbaik ini:** Ketika pemantauan beban kerja menunjukkan status aplikasi dan layanan kita, tim operasi pemantauan memberi pemilik wawasan tentang perubahan yang terjadi di antara para pemakai beban kerja tersebut, misalnya perubahan-perubahan kebutuhan bisnis. Ukur efektivitas tim-tim tersebut dan evaluasi mereka berdasarkan sasaran bisnis dengan membuat metrik-metrik yang dapat mencerminkan status operasi. Metrik dapat menyoroti masalah dukungan atau mengidentifikasi penyimpangan ketika terjadi pergeseran dari target tingkat layanan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

Jadwalkan waktu dengan para pemimpin bisnis dan pemangku kepentingan untuk menentukan apa sasaran layanan secara keseluruhan. Tentukan tugas apa saja yang seharusnya dijalankan oleh berbagai tim operasi dan tantangan apa yang dapat mereka tangani. Dengan menggunakan hal ini, lakukan curah pendapat tentang indikator kinerja utama (KPI) yang mungkin mencerminkan semua sasaran operasi ini. Indikator tersebut mungkin berupa kepuasan pelanggan, waktu dari konsepsi fitur hingga deployment, waktu penyelesaian masalah rata-rata, atau efisiensi biaya.

 Berpatokan pada KPI, identifikasi metrik dan sumber data yang mungkin paling mencerminkan semua sasaran ini. Kepuasan pelanggan dapat berupa kombinasi dari berbagai metrik seperti waktu tunggu atau respons panggilan, skor kepuasan, dan jenis-jenis masalah yang disampaikan. Waktu deployment mungkin merupakan jumlah waktu yang diperlukan untuk pengujian dan deployment, serta perbaikan pasca-deployment yang perlu ditambahkan. Statistik yang menunjukkan waktu yang dihabiskan untuk berbagai jenis masalah (atau jumlah masalah tersebut) dapat memberikan wawasan tentang bagian-bagian yang memerlukan upaya tertarget. 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+ [ Quick - Menggunakan KPI ](https://docs.aws.amazon.com/quicksight/latest/user/kpi.html)
+ [ Amazon CloudWatch - Menggunakan Metrik ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/working_with_metrics.html)
+ [ Membangun Dasbor ](https://aws.amazon.com/builders-library/building-dashboards-for-operational-visibility/)
+ [ Cara melacak KPI pengoptimalan biaya Anda dengan Dasbor KPI ](https://aws.amazon.com/blogs/aws-cloud-financial-management/how-to-track-your-cost-optimization-kpis-with-the-kpi-dashboard/)
+ [Panduan DevOps AWS](https://docs.aws.amazon.com/wellarchitected/latest/devops-guidance/devops-guidance.html)

 **Contoh terkait:** 
+ [ Memantau kinerja pengiriman perangkat lunak Anda menggunakan alat pemantauan dan observabilitas bawaan AWS](https://catalog.us-east-1.prod.workshops.aws/workshops/3b7f3d77-c6ef-44b2-aa29-d2719b8be897/en-US)
+ [ Menyeimbangkan kecepatan dan stabilitas deployment dengan metrik DORA ](https://aws.amazon.com/blogs/devops/balance-deployment-speed-and-stability-with-dora-metrics/)
+ [ Contoh metrik operasional MLOps dalam industri jasa keuangan ](https://docs.aws.amazon.com/prescriptive-guidance/latest/strategy-unlock-value-data-financial-services/operational-metrics.html)
+ [ Cara melacak KPI optimalisasi biaya Anda dengan Dasbor KPI ](https://aws.amazon.com/blogs/aws-cloud-financial-management/how-to-track-your-cost-optimization-kpis-with-the-kpi-dashboard/)

# OPS09-BP02 Mengomunikasikan status dan tren untuk memastikan visibilitas beroperasi
<a name="ops_operations_health_communicate_status_trends"></a>

 Anda perlu mengetahui keadaan operasi Anda dan arah trennya untuk mengidentifikasi kapan hasil mungkin berisiko, apakah pekerjaan tambahan dapat didukung, atau mengidentifikasi efek perubahan terhadap tim Anda. Selama peristiwa operasi, halaman status yang dapat dijadikan acuan oleh para pengguna dan tim operasi untuk mendapatkan informasi dapat mengurangi tekanan pada saluran komunikasi dan menyebarkan informasi secara proaktif. 

 **Hasil yang diinginkan:** 
+  Pimpinan operasi memiliki wawasan sekilas untuk melihat volume panggilan seperti apa yang sedang dioperasikan oleh tim mereka dan upaya apa yang mungkin sedang dilakukan, seperti deployment. 
+  Peringatan disebarkan kepada para pemangku kepentingan dan komunitas pengguna ketika terjadi dampak terhadap operasi normal. 
+  Pimpinan dan pemangku kepentingan organisasi dapat memeriksa halaman status sebagai respons terhadap peringatan atau dampak, dan memperoleh informasi seputar peristiwa operasional yang terjadi, seperti titik kontak, informasi tiket, dan perkiraan waktu pemulihan. 
+  Laporan tersedia bagi para pimpinan dan pemangku kepentingan lainnya untuk menunjukkan statistik operasi seperti volume panggilan selama periode waktu tertentu, skor kepuasan pengguna, jumlah tiket tertunda, dan usia mereka. 

 **Anti-pola umum:** 
+  Terdapat beban kerja yang tidak aktif, sehingga sebuah layanan menjadi tidak tersedia. Volume panggilan melonjak karena para pengguna ingin mengetahui apa yang terjadi. Manajer menambah volume tersebut dengan permintaan informasinya tentang siapa yang mengurusi masalah. Berbagai tim operasi melipatgandakan upaya untuk melakukan penyelidikan. 
+  Keinginan untuk kemampuan baru menyebabkan beberapa personel dialihkan ke upaya rekayasa. Tidak ada pengisian ulang (backfill) yang disediakan, dan waktu penyelesaian masalah semakin lama. Informasi ini tidak direkam, dan pimpinan baru menyadari hal ini setelah beberapa minggu dan pengguna menyampaikan ketidakpuasan. 

 **Manfaat menjalankan praktik terbaik ini:** Selama peristiwa operasional yang berdampak pada bisnis, banyak waktu dan tenaga yang bisa terbuang untuk meminta informasi dari berbagai tim yang sedang berusaha memahami situasinya. Dengan membuat halaman status dan dasbor yang disebarluaskan, para pemangku kepentingan dapat dengan cepat memperoleh informasi mengenai hal-hal seperti apakah ada masalah yang sudah terdeteksi, siapa yang memimpin penanganan masalah tersebut, atau kapan operasi diperkirakan akan kembali normal. Dengan begitu, anggota tim terhindar dari membuang-buang waktu untuk mengomunikasikan status kepada orang lain dan lebih bisa berkonsentrasi untuk menangani masalah. 

 Selain itu, dasbor dan laporan dapat memberikan wawasan kepada para pembuat keputusan dan pemangku kepentingan untuk melihat bagaimana tim operasi dapat menanggapi kebutuhan bisnis dan bagaimana sumber daya mereka dialokasikan. Hal ini sangat penting untuk menentukan apakah sumber daya yang memadai tersedia untuk mendukung bisnis. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Buatlah dasbor yang menunjukkan metrik-metrik utama saat ini untuk tim operasi Anda, dan buat dasbor tersebut mudah diakses oleh para pemimpin operasi serta manajemen. 

 Buat halaman status yang dapat diperbarui dengan cepat untuk menunjukkan apabila insiden atau peristiwa sedang berlangsung, yang mencantumkan siapa yang bertanggung jawab, dan siapa yang mengoordinasikan respons. Bagikan langkah atau solusi apa pun yang harus dipertimbangkan oleh para pengguna di halaman ini, dan sebarkan luaskan lokasinya. Imbau para pengguna untuk memeriksa lokasi ini terlebih dahulu ketika mereka dihadapkan dengan masalah yang tidak diketahui. 

 Kumpulkan dan sediakan laporan yang menunjukkan kondisi operasi dari waktu ke waktu, dan distribusikan hal ini kepada para pimpinan dan pengambil keputusan untuk menggambarkan pekerjaan operasi beserta tantangan dan kebutuhan. 

 Bagikan kepada tim metrik dan laporan yang paling mencerminkan sasaran dan KPI dan bagian yang paling menerima pengaruhnya dalam mendorong perubahan. Luangkan waktu khusus untuk aktivitas ini untuk meningkatkan pentingnya operasi di dalam tim dan antar-tim. 

 Gunakan [AWS Health](https://docs.aws.amazon.com/health/latest/ug/what-is-aws-health.html) bersama dasbor Anda sendiri, atau integrasikan peristiwa AWS Health ke dalamnya, sehingga tim Anda dapat mengorelasikan masalah aplikasi dengan status layanan AWS. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+ [ OPS09-BP01 Mengukur sasaran operasi dan KPI dengan metrik ](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_operations_health_measure_ops_goals_kpis.html)

 **Dokumen terkait:** 
+ [ Mengukur Kemajuan ](https://docs.aws.amazon.com/prescriptive-guidance/latest/strategy-cloud-operating-model/measure-progress.html)
+ [ Membangun dasbor untuk visibilitas operasi ](https://aws.amazon.com/builders-library/building-dashboards-for-operational-visibility/)

 **Contoh terkait:** 
+ [ Operasi Data ](https://aws.amazon.com/solutions/app-development/data-operations)
+ [ Cara melacak KPI pengoptimalan biaya Anda dengan Dasbor KPI ](https://aws.amazon.com/blogs/aws-cloud-financial-management/how-to-track-your-cost-optimization-kpis-with-the-kpi-dashboard/)
+ [ Pentingnya Indikator Kinerja Utama (KPI) untuk Migrasi Cloud Skala Besar ](https://aws.amazon.com/blogs/mt/the-importance-of-key-performance-indicators-kpis-for-large-scale-cloud-migrations/)

# OPS09-BP03 Meninjau metrik-metrik operasi dan memprioritaskan perbaikan
<a name="ops_operations_health_review_ops_metrics_prioritize_improvement"></a>

 Menyisihkan waktu dan sumber daya khusus untuk meninjau keadaan operasi memastikan bahwa pelayanan lini bisnis sehari-hari tetap menjadi prioritas. Kumpulkan para pemimpin operasi dan pemangku kepentingan untuk secara rutin meninjau metrik, menegaskan kembali atau memodifikasi sasaran dan tujuan, dan memprioritaskan perbaikan. 

 **Hasil yang diinginkan:** 
+  Para pemimpin operasi dan staf secara rutin bertemu untuk meninjau metrik selama periode pelaporan tertentu. Tantangan dikomunikasikan, keberhasilan dirayakan, dan pelajaran yang dipetik dibagikan. 
+  Para pemangku kepentingan dan pemimpin bisnis secara rutin diberi pengarahan tentang keadaan operasi dan diminta untuk memberikan masukan mengenai sasaran, KPI, dan inisiatif masa depan. Kompromi antara pemberian layanan, operasi, dan pemeliharaan dibahas dan dimasukkan ke dalam konteks. 

 **Anti-pola umum:** 
+  Sebuah produk baru diluncurkan, tetapi tim operasi Tingkat 1 dan Tingkat 2 tidak mendapatkan pelatihan yang memadai untuk mendukung atau tidak mendapatkan staf tambahan. Metrik-metrik yang menunjukkan penurunan waktu resolusi tiket dan peningkatan volume insiden tidak terlihat oleh para pimpinan. Tindakan diambil beberapa minggu kemudian ketika jumlah langganan mulai turun karena para pengguna yang tidak puas dan beralih ke platform lain. 
+  Proses manual untuk melakukan pemeliharaan pada beban kerja telah berlangsung sejak lama. Meskipun sudah ada keinginan untuk melakukan otomatisasi, prioritas yang diberikan rendah mengingat rendahnya nilai penting sistem. Namun seiring waktu, sistem menjadi semakin penting dan sekarang proses manual ini menyita sebagian besar waktu operasional. Tidak ada sumber daya yang dijadwalkan untuk menyediakan peningkatan peralatan untuk operasi, sehingga menyebabkan kelelahan pada staf saat terjadi peningkatan beban kerja. Para pimpinan menyadari hal ini setelah ada laporan bahwa para staf beralih ke kompetitor. 

 **Manfaat menerapkan praktik terbaik ini:** Beberapa organisasi mengalami kesulitan untuk mengalokasikan waktu dan perhatian yang sama untuk pemberian layanan dan produk atau penawaran baru. Ketika masalah ini terjadi, lini bisnis dapat mengalami hal buruk karena tingkat layanan yang diharapkan perlahan-lahan memburuk. Alasannya adalah karena operasi tidak berubah dan berkembang sesuai dengan perkembangan bisnis, dan bisa segera tertinggal. Tanpa melakukan peninjauan rutin terhadap wawasan yang dikumpulkan oleh operasi, risiko terhadap bisnis mungkin baru terlihat ketika semua sudah terlambat. Dengan pengalokasian waktu untuk meninjau metrik dan prosedur, baik di antara staf operasi maupun dengan pimpinan, peran penting yang dimiliki oleh operasi akan terus dapat dilihat, dan risiko dapat diidentifikasi jauh sebelum mencapai tingkat kritis. Tim operasi mendapatkan wawasan yang lebih baik tentang perubahan dan inisiatif bisnis yang akan datang, sehingga upaya-upaya proaktif dapat dilakukan. Visibilitas para pimpinan ke dalam metrik-metrik operasi menunjukkan peran penting yang dimiliki oleh tim operasional dalam hal kepuasan pelanggan, baik internal maupun eksternal, dan memungkinkan mereka mempertimbangkan pilihan prioritas dengan lebih baik, atau memastikan bahwa operasional memiliki waktu dan sumber daya untuk berubah dan berkembang seiring munculnya inisiatif bisnis dan beban kerja baru. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Luangkan waktu khusus untuk meninjau metrik-metrik operasi antara para pemangku kepentingan dan tim operasional dan meninjau data laporan. Pertimbangkan laporan-laporan berdasarkan tujuan dan sasaran organisasi untuk menentukan apakah semuanya terpenuhi. Identifikasi sumber-sumber ambiguitas yang membuat sasaran menjadi tidak jelas, atau di mana mungkin ada ketidaksesuaian antara apa yang diminta dan apa yang diberikan. 

 Identifikasi di mana waktu, personel, dan alat dapat membantu mencapai hasil operasi yang diharapkan. Tentukan KPI mana yang akan menerima dampaknya dan target kesuksesan apa yang harus dimiliki. Lakukan peninjauan ulang secara rutin untuk memastikan operasi memiliki sumber daya yang memadai untuk mendukung lini bisnis. 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+ [ Amazon Athena ](https://aws.amazon.com/athena/)
+ [ Referensi metrik dan dimensi Amazon CloudWatch ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html)
+ [ Amazon Quick ](https://aws.amazon.com/quicksight/)
+ [AWS Glue](https://aws.amazon.com/glue/)
+ [AWS Glue Data Catalog](https://docs.aws.amazon.com/glue/latest/dg/populate-data-catalog.html)
+ [ Mengumpulkan metrik dan log dari server instans Amazon EC2 dan server on-premise dengan Agen Amazon CloudWatch ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html)
+ [ Menggunakan metrik Amazon CloudWatch ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/working_with_metrics.html)

# OPS 10. Bagaimana cara mengelola peristiwa operasi dan beban kerja?
<a name="ops-10"></a>

 Siapkan dan validasikan prosedur untuk merespons peristiwa guna meminimalkan gangguannya pada beban kerja Anda. 

**Topics**
+ [OPS10-BP01 Menggunakan proses untuk manajemen peristiwa, insiden, dan masalah](ops_event_response_event_incident_problem_process.md)
+ [OPS10-BP02 Menjalankan proses untuk setiap peringatan](ops_event_response_process_per_alert.md)
+ [OPS10-BP03 Memprioritaskan peristiwa operasional berdasarkan dampaknya terhadap bisnis](ops_event_response_prioritize_events.md)
+ [OPS10-BP04 Tetapkan jalur eskalasi](ops_event_response_define_escalation_paths.md)
+ [OPS10-BP05 Menentukan rencana komunikasi pelanggan untuk peristiwa yang berdampak pada layanan](ops_event_response_push_notify.md)
+ [OPS10-BP06 Mengomunikasikan status melalui dasbor](ops_event_response_dashboards.md)
+ [OPS10-BP07 Otomatiskan tanggapan terhadap acara](ops_event_response_auto_event_response.md)

# OPS10-BP01 Menggunakan proses untuk manajemen peristiwa, insiden, dan masalah
<a name="ops_event_response_event_incident_problem_process"></a>

Kemampuan untuk mengelola peristiwa, insiden, dan masalah secara efisien adalah kunci untuk menjaga kondisi kesehatan dan kinerja beban kerja. Sangat penting untuk mengenali dan memahami perbedaan antara elemen-elemen ini untuk mengembangkan sebuah strategi respons dan resolusi yang efektif. Dengan membentuk dan mengikuti proses yang ditentukan dengan baik untuk setiap aspek, tim Anda dapat dengan cepat dan efektif menangani setiap tantangan operasional yang muncul.

 **Hasil yang diinginkan:** Organisasi Anda mengelola peristiwa-peristiwa operasional, insiden, dan masalah secara efektif melalui proses yang terdokumentasi dengan baik dan tersimpan secara terpusat. Proses-proses tersebut diperbarui secara konsisten untuk mencerminkan setiap perubahan, merampingkan proses penanganan, dan mempertahankan keandalan layanan serta kinerja beban kerja yang tinggi. 

 **Anti-pola umum:** 
+  Anda merespons peristiwa secara reaktif, bukan proaktif. 
+  Pendekatan-pendekatan yang tidak konsisten diambil untuk berbagai jenis peristiwa atau insiden yang berbeda. 
+ Organisasi Anda tidak menganalisis dan belajar dari insiden-insiden yang terjadi untuk mencegah kejadian di masa mendatang.

 **Manfaat menjalankan praktik terbaik ini:** 
+  Proses respons yang efisien dan terstandardisasi. 
+  Berkurangnya dampak insiden pada layanan dan pelanggan. 
+  Resolusi masalah yang lebih cepat. 
+  Perbaikan berkelanjutan dalam proses operasional. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Menerapkan praktik terbaik ini berarti Anda melacak peristiwa-peristiwa beban kerja. Anda memiliki proses untuk menangani insiden dan masalah. Proses ini didokumentasikan, dibagikan, dan sering diperbarui. Masalah diidentifikasi, diprioritaskan, dan diperbaiki. 

 **Memahami peristiwa, insiden, dan masalah** 
+  **Peristiwa:** Sebuah *peristiwa* adalah sebuah pengamatan atas suatu tindakan, kejadian, atau perubahan status. Peristiwa dapat direncanakan atau tidak direncanakan dan dapat berasal dari dalam atau luar beban kerja. 
+  **Insiden:** *Insiden* adalah peristiwa-peristiwa yang memerlukan respons, seperti gangguan yang tidak terencana atau penurunan kualitas layanan. Insiden-insiden tersebut mewakili gangguan yang membutuhkan perhatian cepat untuk memulihkan operasi beban kerja yang normal. 
+  **Masalah:** *Masalah* adalah penyebab-penyebab yang mendasari satu atau beberapa insiden. Mengidentifikasi dan menyelesaikan masalah mencakup langkah-langkah untuk menyelidiki insiden dengan lebih mendalam untuk mencegah kejadian di masa mendatang. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

 **Peristiwa** 

1.  **Memantau peristiwa:** 
   +  [Menerapkan observabilitas](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/implement-observability.html) dan [memanfaatkan observabilitas beban kerja](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/utilizing-workload-observability.html). 
   +  Tindakan pemantauan yang dilakukan oleh pengguna, peran, atau layanan AWS dicatat sebagai peristiwa di dalam [AWS CloudTrail](https://aws.amazon.com/cloudtrail/). 
   +  Respons perubahan operasional di dalam aplikasi Anda dalam waktu nyata dengan [Amazon EventBridge](https://aws.amazon.com/eventbridge/). 
   +  Lakukan penilaian, pemantauan, dan pencatatan perubahan konfigurasi sumber daya secara berkelanjutan dengan [AWS Config](https://aws.amazon.com/config/). 

1.  **Ciptakan proses:** 
   +  Kembangkan sebuah proses untuk menilai peristiwa mana yang signifikan dan memerlukan pemantauan. Langkah ini melibatkan pengaturan ambang batas dan parameter untuk aktivitas normal dan abnormal. 
   +  Tentukan kriteria eskalasi suatu peristiwa menjadi insiden. Kriteria ini dapat didasarkan pada tingkat keparahan, dampak yang ditimbulkan pada pengguna, atau penyimpangan dari perilaku yang diperkirakan. 
   +  Lakukan peninjauan terhadap proses pemantauan dan respons peristiwa secara rutin. Langkah ini mencakup analisis insiden masa lalu, penyesuaian ambang batas, dan penyempurnaan mekanisme pembuatan peringatan. 

 **Insiden** 

1.  **Merespons insiden:** 
   +  Gunakan wawasan dari alat-alat observabilitas untuk mengidentifikasi dan merespons insiden dengan cepat. 
   +  Implementasikan [AWS Systems Manager Ops Center](https://aws.amazon.com/systems-manager/features/#OpsCenter) untuk mengagregasi, mengatur, dan memprioritaskan item dan insiden operasional. 
   +  Gunakan layanan-layanan seperti [Amazon CloudWatch](https://aws.amazon.com/cloudwatch/) dan [AWS X-Ray](https://aws.amazon.com/xray/) untuk analisis dan pemecahan masalah yang lebih dalam. 
   +  Pertimbangkan [AWS Managed Services (AMS)](https://aws.amazon.com/managed-services/) untuk meningkatkan manajemen insiden, dengan memanfaatkan kemampuan proaktif, pencegahan, dan detektifnya. AMS akan memperluas dukungan operasional dengan layanan-layanan seperti pemantauan, deteksi dan respons insiden, dan manajemen keamanan. 
   +  Pelanggan Dukungan Perusahaan dapat menggunakan [Deteksi dan Respons Insiden AWS](https://aws.amazon.com/premiumsupport/aws-incident-detection-response/), yang akan menyediakan pemantauan proaktif terus-menerus dan manajemen insiden untuk beban kerja produksi. 

1.  **Buat proses manajemen insiden:** 
   +  Tetapkan sebuah proses manajemen insiden yang terstruktur, termasuk peran yang jelas, protokol komunikasi, dan langkah-langkah penyelesaian masalah. 
   +  Integrasikan manajemen insiden dengan alat seperti [Amazon Q Developer dalam aplikasi obrolan](https://aws.amazon.com/chatbot/) untuk mendapatkan respons dan koordinasi yang efisien. 
   +  Kategorikan insiden berdasarkan tingkat keparahan, dengan [rencana respons insiden](https://docs.aws.amazon.com/incident-manager/latest/userguide/response-plans.html) yang telah ditentukan sebelumnya untuk masing-masing kategori. 

1.  **Pelajari dan tingkatkan:** 
   +  Lakukan [analisis pasca-insiden](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_evolve_ops_perform_rca_process.html) untuk memahami akar penyebab masalah dan efektivitas penyelesaian masalah. 
   +  Lakukan pembaruan dan peningkatan secara berkelanjutan terhadap rencana-rencana respons berdasarkan tinjauan dan praktik yang berkembang. 
   +  Buatlah dokumentasi dari dan bagikan pelajaran yang diperoleh ke seluruh tim untuk meningkatkan ketahanan operasional. 
   +  Pelanggan Dukungan Perusahaan dapat meminta [Lokakarya Manajemen Insiden](https://aws.amazon.com/premiumsupport/technology-and-programs/proactive-services/#Operational_Workshops_and_Deep_Dives) dari Manajer Akun Teknis mereka. Lokakarya terpandu ini akan menguji rencana respons insiden yang ada sekarang dan akan membantu Anda mengidentifikasi area-area yang perlu ditingkatkan. 

 **Masalah** 

1.  **Identifikasi masalah:** 
   +  Gunakan data dari insiden-insiden sebelumnya untuk mengidentifikasi pola-pola yang berulang yang mungkin menandakan adanya masalah sistemik yang lebih mendalam. 
   +  Manfaatkan alat-alat seperti [AWS CloudTrail](https://aws.amazon.com/cloudtrail/) dan [Amazon CloudWatch](https://aws.amazon.com/cloudwatch/) untuk melakukan analisis tren dan mengungkap masalah-masalah mendasar. 
   +  Libatkan tim lintas fungsi, termasuk tim operasional, pengembangan, dan unit bisnis, untuk mendapatkan perspektif yang beragam tentang akar penyebab masalah. 

1.  **Buat proses manajemen masalah:** 
   +  Kembangkan sebuah proses terstruktur untuk manajemen masalah, dengan fokus pada penyelesaian masalah jangka panjang, bukan perbaikan-perbaikan cepat. 
   +  Sertakan teknik-teknik analisis akar masalah (RCA) untuk menyelidiki dan memahami penyebab dasar terjadinya insiden. 
   +  Perbarui kebijakan operasional, prosedur, dan infrastruktur berdasarkan temuan yang didapatkan untuk mencegah terulangnya kejadian. 

1.  **Terus lakukan perbaikan:** 
   +  Pupuk budaya pembelajaran dan perbaikan yang konstan, dengan mendorong tim untuk mengidentifikasi dan mengatasi setiap potensi masalah secara proaktif. 
   +  Tinjau dan revisi proses dan alat manajemen masalah agar selaras dengan lanskap bisnis dan teknologi yang berkembang. 
   +  Bagikan wawasan dan praktik terbaik ke seluruh organisasi untuk membangun sebuah lingkungan operasional yang lebih tangguh dan efisien. 

1.  **Libatkan AWS Dukungan:** 
   +  Gunakan sumber daya AWS dukungan, seperti [AWS Trusted Advisor](https://aws.amazon.com/premiumsupport/technology/trusted-advisor/), untuk panduan proaktif dan rekomendasi pengoptimalan. 
   +  Pelanggan Dukungan Perusahaan dapat mengakses program khusus seperti [AWS Countdown](https://aws.amazon.com/premiumsupport/aws-countdown/) untuk mendapatkan dukungan saat terjadi peristiwa kritis. 

 **Tingkat upaya untuk rencana implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS04-BP01 Identifikasi indikator kinerja utama](ops_observability_identify_kpis.md) 
+  [OPS04-BP02 Melaksanakan telemetri aplikasi](ops_observability_application_telemetry.md) 
+  [OPS07-BP03 Menggunakan runbook untuk menjalankan prosedur](ops_ready_to_support_use_runbooks.md)
+  [OPS07-BP04 Menggunakan playbook untuk menyelidiki masalah](ops_ready_to_support_use_playbooks.md) 
+  [OPS08-BP01 Menganalisis metrik beban kerja](ops_workload_observability_analyze_workload_metrics.md) 
+  [OPS11-BP02 Lakukan analisis pasca-insiden](ops_evolve_ops_perform_rca_process.md) 

 **Dokumen terkait:** 
+  [Panduan Respons Insiden Keamanan AWS](https://docs.aws.amazon.com/whitepapers/latest/aws-security-incident-response-guide/welcome.html) 
+ [Deteksi dan Respons Insiden AWS](https://aws.amazon.com/premiumsupport/aws-incident-detection-response/)
+ [Kerangka Kerja Adopsi Cloud AWS: Perspektif Operasional - Manajemen insiden dan masalah ](https://docs.aws.amazon.com/whitepapers/latest/aws-caf-operations-perspective/incident-and-problem-management.html)
+  [Manajemen Insiden di Era DevOps dan SRE](https://www.infoq.com/presentations/incident-management-devops-sre/) 
+  [PagerDuty - Apa itu Manajemen Insiden?](https://www.pagerduty.com/resources/learn/what-is-incident-management/) 

 **Video terkait:** 
+ [ Kiat respons insiden teratas dari AWS](https://www.youtube.com/watch?v=Cu20aOvnHwA)
+ [AWS re:Invent 2022 - Amazon Builders' Library: 25 tahun keunggulan operasional Amazon ](https://www.youtube.com/watch?v=DSRhgBd_gtw)
+ [AWS re:Invent 2022 - Deteksi dan Respons Insiden AWS (SUP201) ](https://www.youtube.com/watch?v=IbSgM4IP9IE)
+ [ Memperkenalkan Incident Manager dari AWS Systems Manager](https://www.youtube.com/watch?v=I6lScgh4qds)

 **Contoh terkait:** 
+  [Layanan Proaktif AWS – Lokakarya Manajemen Insiden](https://aws.amazon.com/premiumsupport/technology-and-programs/proactive-services/#Operational_Workshops_and_Deep_Dives) 
+ [ Cara Mengotomatiskan Respons Insiden dengan PagerDuty dan Manajer Insiden AWS Systems Manager](https://aws.amazon.com/blogs/mt/how-to-automate-incident-response-with-pagerduty-and-aws-systems-manager-incident-manager/)
+ [ Libatkan Perespons Insiden dengan Jadwal Personel Siaga di Manajer Insiden AWS Systems Manager](https://aws.amazon.com/blogs/mt/engage-incident-responders-with-the-on-call-schedules-in-aws-systems-manager-incident-manager/)
+ [ Tingkatkan Visibilitas dan Kolaborasi selama Penanganan Insiden di Manajer Insiden AWS Systems Manager](https://aws.amazon.com/blogs/mt/improve-the-visibility-and-collaboration-during-incident-handling-in-aws-systems-manager-incident-manager/)
+ [ Laporan insiden dan permintaan layanan di AMS ](https://docs.aws.amazon.com/managedservices/latest/userguide/support-experience.html)

 **Layanan terkait:** 
+  [Amazon EventBridge](https://docs.aws.amazon.com/eventbridge/latest/userguide/eb-what-is.html) 

# OPS10-BP02 Menjalankan proses untuk setiap peringatan
<a name="ops_event_response_process_per_alert"></a>

 Menetapkan proses yang jelas dan terdefinisi untuk setiap peringatan di dalam sistem Anda sangat penting untuk manajemen insiden yang efektif dan efisien. Praktik ini memastikan bahwa setiap peringatan menghasilkan respons spesifik yang dapat ditindaklanjuti, sehingga meningkatkan keandalan dan responsivitas operasi Anda. 

 **Hasil yang diinginkan:** Setiap peringatan memulai rencana respons spesifik dan terdefinisi dengan baik. Jika memungkinkan, respons dilakukan secara otomatis, dengan kepemilikan yang jelas dan jalur eskalasi yang sudah ditentukan. Peringatan ditautkan ke basis pengetahuan yang mutakhir sehingga setiap operator dapat memberikan respons secara konsisten dan efektif. Respons diberikan secara cepat dan seragam, sehingga meningkatkan efisiensi dan keandalan operasional. 

 **Anti-pola umum:** 
+  Peringatan tidak memiliki proses respons yang telah ditentukan sebelumnya, sehingga menyebabkan resolusi yang seadanya dan tertunda. 
+  Jumlah peringatan yang terlalu banyak dapat menyebabkan terabaikannya peringatan-peringatan penting. 
+  Peringatan-peringatan ditangani secara tidak konsisten karena tidak adanya kepemilikan dan tanggung jawab yang jelas. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Mengurangi kewalahan akibat peringatan dengan hanya memunculkan peringatan yang dapat ditindaklanjuti. 
+  Penurunan rata-rata waktu resolusi (MTTR) untuk masalah operasional. 
+  Penurunan rata-rata waktu untuk menyelidiki (MTTI), sehingga membantu mengurangi MTTR. 
+  Peningkatan kemampuan untuk menskalakan respons-respons operasional. 
+  Peningkatan konsistensi dan keandalan dalam menangani peristiwa-peristiwa operasional. 

 Misalnya, Anda memiliki proses yang ditentukan untuk peristiwa AWS Health untuk akun-akun penting, termasuk alarm aplikasi, masalah operasional, dan peristiwa siklus hidup terencana (seperti memperbarui versi Amazon EKS sebelum klaster diperbarui secara otomatis), dan Anda memberikan kemampuan bagi tim Anda untuk secara aktif memantau, berkomunikasi, dan merespons peristiwa-peristiwa ini. Tindakan ini membantu Anda mencegah gangguan layanan yang disebabkan oleh perubahan di sisi AWS atau memitigasinya lebih cepat ketika terjadi masalah yang tak terduga. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Untuk membuat sebuah proses untuk setiap peringatan, diperlukan pembuatan rencana respons yang jelas untuk setiap peringatan, otomatisasi respons apabila memungkinkan, dan penyempurnaan proses-proses ini secara berkelanjutan berdasarkan umpan balik operasional dan perubahan persyaratan. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

 Diagram berikut ini menggambarkan alur kerja manajemen insiden di dalam [Manajer Insiden AWS Systems Manager](https://aws.amazon.com/systems-manager/features/incident-manager/). Ini dirancang untuk merespons masalah operasional dengan cara menciptakan insiden secara otomatis sebagai respons terhadap peristiwa tertentu dari [Amazon CloudWatch](https://aws.amazon.com/cloudwatch/) atau [Amazon EventBridge](https://aws.amazon.com/eventbridge/). Ketika insiden dibuat, baik secara otomatis maupun manual, Manajer Insiden memusatkan manajemen insiden, mengatur informasi sumber daya AWS yang relevan, dan memulai rencana respons yang telah ditentukan sebelumnya. Ini mencakup menjalankan runbook Systems Manager Automation untuk tindakan cepat, serta membuat item kerja operasional induk di OpsCenter untuk melacak tugas dan analisis terkait. Proses yang efisien ini mempercepat dan mengoordinasikan respons insiden di seluruh lingkungan AWS Anda. 

![\[Diagram alur yang menggambarkan cara kerja Manajer Insiden - Amazon Q Developer dalam aplikasi obrolan, rencana eskalasi dan kontak, dan runbook mengalir ke rencana respons, yang mengalir ke insiden dan analisis. Amazon CloudWatch juga mengalir ke paket respons.\]](http://docs.aws.amazon.com/id_id/wellarchitected/latest/framework/images/incident-manager-how-it-works.png)


1.  **Gunakan alarm komposit:** Buat [alarm komposit](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Create_Composite_Alarm.html) di CloudWatch untuk mengelompokkan alarm terkait, mengurangi noise, dan memungkinkan respons yang lebih bermakna. 

1.  **Terus dapatkan informasi dengan [AWS Health](https://docs.aws.amazon.com/health/latest/ug/what-is-aws-health.html).** AWS Health adalah sumber informasi otoritatif tentang kondisi sumber daya AWS Cloud Anda. Gunakan AWS Health untuk memvisualisasikan dan mendapatkan notifikasi tentang peristiwa layanan saat ini dan perubahan yang akan datang, seperti peristiwa siklus hidup yang direncanakan, sehingga Anda dapat mengambil langkah-langkah untuk mengurangi dampaknya. 

   1.  [Buat notifikasi peristiwa AWS Health sesuai keperluan](https://docs.aws.amazon.com/health/latest/ug/user-notifications.html) yang dikirim ke saluran email dan obrolan melalui [Notifikasi Pengguna AWS](https://docs.aws.amazon.com/notifications/latest/userguide/what-is-service.html) serta integrasikan secara programatis dengan [alat pemantauan dan peringatan Anda melalui Amazon EventBridge](https://docs.aws.amazon.com/health/latest/ug/cloudwatch-events-health.html) atau [API AWS Health](https://docs.aws.amazon.com/health/latest/APIReference/Welcome.html). 

   1.  Rencanakan dan lacak progres pada peristiwa kesehatan yang memerlukan tindakan dengan mengintegrasikan dengan manajemen perubahan atau alat ITSM (seperti [Jira atau](https://docs.aws.amazon.com/smc/latest/ag/cloud-sys-health.html) [ServiceNow](https://docs.aws.amazon.com/smc/latest/ag/sn-aws-health.html)) yang mungkin sudah Anda gunakan melalui Amazon EventBridge atau API AWS Health. 

   1.  Jika Anda menggunakan AWS Organizations, aktifkan [tampilan organisasi untuk AWS Health](https://docs.aws.amazon.com/health/latest/ug/aggregate-events.html) guna menggabungkan peristiwa AWS Health di seluruh akun. 

1.  **Integrasikan alarm Amazon CloudWatch dengan Manajer Insiden:** Konfigurasikan alarm CloudWatch untuk membuat insiden secara otomatis di [Manajer Insiden AWS Systems Manager](https://docs.aws.amazon.com/incident-manager/latest/userguide/response-plans.html). 

1.  **Integrasikan Amazon EventBridge dengan Manajer Insiden:** Buat [aturan EventBridge](https://docs.aws.amazon.com/eventbridge/latest/userguide/eb-create-rule.html) untuk bereaksi terhadap peristiwa dan membuat insiden menggunakan rencana respons yang ditentukan. 

1.  **Mempersiapkan insiden di Manajer Insiden:** 
   +  Buat [rencana respons](https://docs.aws.amazon.com/incident-manager/latest/userguide/response-plans.html) terperinci di Manajer Insiden untuk setiap jenis peringatan. 
   +  Buat saluran obrolan melalui [Amazon Q Developer dalam aplikasi obrolan](https://docs.aws.amazon.com/incident-manager/latest/userguide/chat.html) yang terhubung ke rencana respons di Manajer Insiden, sehingga akan memfasilitasi komunikasi waktu nyata selama insiden di seluruh platform seperti Slack, Microsoft Teams, dan Amazon Chime. 
   +  Menggabungkan [runbook Otomatisasi Systems Manager](https://docs.aws.amazon.com/incident-manager/latest/userguide/runbooks.html) dalam Manajer Insiden untuk mendorong respons otomatis terhadap insiden. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS04-BP01 Identifikasi indikator kinerja utama](ops_observability_identify_kpis.md) 
+  [OPS08-BP04 Membuat peringatan yang dapat ditindaklanjuti](ops_workload_observability_create_alerts.md) 

 **Dokumen terkait:** 
+ [Kerangka Kerja Adopsi Cloud AWS: Perspektif Operasional - Manajemen insiden dan masalah ](https://docs.aws.amazon.com/whitepapers/latest/aws-caf-operations-perspective/incident-and-problem-management.html)
+ [Menggunakan alarm Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html)
+ [ Menyiapkan Manajer Insiden AWS Systems Manager](https://docs.aws.amazon.com/incident-manager/latest/userguide/setting-up.html)
+ [ Mempersiapkan insiden di Manajer Insiden ](https://docs.aws.amazon.com/incident-manager/latest/userguide/incident-response.html)

 **Video terkait:** 
+ [ Kiat respons insiden teratas dari AWS](https://www.youtube.com/watch?v=Cu20aOvnHwA)
+ [ re:Invent 2023 \$1 Mengelola peristiwa siklus hidup sumber daya dalam skala besar dengan AWS Health](https://www.youtube.com/watch?v=VoLLNL5j9NA)

 **Contoh terkait:** 
+ [Lokakarya AWS - Manajer Insiden AWS Systems Manager - Mengotomatiskan respons insiden terhadap peristiwa keamanan ](https://catalog.workshops.aws/automate-incident-response/en-US/settingupim/onboarding)

# OPS10-BP03 Memprioritaskan peristiwa operasional berdasarkan dampaknya terhadap bisnis
<a name="ops_event_response_prioritize_events"></a>

 Merespons peristiwa operasional dengan cepat adalah hal yang sangat penting, tetapi tidak semua peristiwa sama. Ketika Anda melakukan prioritas berdasarkan dampak bisnis, Anda juga memprioritaskan penanganan peristiwa yang berpotensi menimbulkan konsekuensi signifikan, seperti keamanan, kerugian finansial, pelanggaran peraturan, atau kerusakan reputasi. 

 **Hasil yang diinginkan:** Respons terhadap peristiwa operasional diprioritaskan berdasarkan dampak yang mungkin ditimbulkannya terhadap operasi dan tujuan bisnis. Hal ini membuat respons menjadi efisien dan efektif. 

 **Anti-pola umum:** 
+  Setiap peristiwa diperlakukan dengan tingkat urgensi yang sama, sehingga menyebabkan kebingungan dan ketertundaan dalam menangani masalah-masalah kritis. 
+  Anda gagal membedakan antara peristiwa berdampak tinggi dan rendah, sehingga menyebabkan kesalahan alokasi sumber daya. 
+  Organisasi Anda tidak memiliki kerangka prioritas yang jelas, sehingga menghasilkan respons-respons yang tidak konsisten terhadap peristiwa-peristiwa operasional. 
+  Peristiwa diprioritaskan berdasarkan urutan pelaporannya, bukan dampaknya terhadap hasil bisnis. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Memastikan fungsi-fungsi bisnis penting mendapatkan perhatian terlebih dahulu, sehingga akan meminimalkan potensi kerugian. 
+  Memperbaiki alokasi sumber daya selama saat terjadi peristiwa secara serentak. 
+  Meningkatkan kemampuan organisasi untuk mempertahankan kepercayaan dan memenuhi persyaratan-persyaratan berdasarkan peraturan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Ketika dihadapkan dengan beberapa peristiwa operasional, sebuah pendekatan prioritas yang terstruktur berdasarkan dampak dan urgensi sangatlah penting. Pendekatan ini akan membantu Anda dalam mengambil keputusan tepat berdasarkan informasi, mengerahkan upaya pada hal-hal yang paling membutuhkan, dan mengurangi risiko terhadap kelangsungan bisnis. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  **Lakukan penilaian dampak:** Kembangkan sebuah sistem klasifikasi untuk mengevaluasi tingkat keparahan peristiwa dalam hal dampak yang mungkin ditimbulkannya terhadap operasi dan tujuan bisnis. Contoh berikut ini menunjukkan kategori-kategori dampak:     
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/wellarchitected/latest/framework/ops_event_response_prioritize_events.html)

1.  **Lakukan penilaian tingkat urgensi:** Tentukan tingkat urgensi dalam hal seberapa cepat suatu peristiwa membutuhkan respons, dengan mempertimbangkan faktor-faktor seperti keamanan, implikasi keuangan, dan perjanjian tingkat layanan (SLA). Contoh berikut ini menunjukkan kategori-kategori urgensi:     
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/wellarchitected/latest/framework/ops_event_response_prioritize_events.html)

1.  **Buat matriks prioritas:** 
   +  Gunakan matriks untuk melakukan referensi silang antara dampak dan urgensi, sehingga tingkat prioritas dapat ditetapkan ke berbagai kombinasi. 
   +  Buat agar matriks tersebut mudah diakses dan dipahami oleh semua anggota tim yang bertanggung jawab untuk memberikan respons atas peristiwa-peristiwa operasional. 
   +  Contoh matriks berikut ini menampilkan tingkat keparahan insiden berdasarkan urgensi dan dampak:     
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/wellarchitected/latest/framework/ops_event_response_prioritize_events.html)

1.  **Latih dan komunikasikan:** Latih tim-tim respons tentang matriks prioritas dan pentingnya mengikuti matriks tersebut saat terjadi insiden. Komunikasikan proses penyusunan prioritas kepada semua pemangku kepentingan untuk menetapkan harapan-harapan yang jelas. 

1.  **Integrasikan dengan respons insiden:** 
   +  Sertakan matriks prioritas ke dalam rencana dan alat respons insiden Anda. 
   +  Lakukan otomatisasi terhadap klasifikasi dan penyusunan prioritas peristiwa jika memungkinkan untuk mempercepat waktu respons. 
   +  Pelanggan Dukungan Perusahaan dapat memanfaatkan [Deteksi dan Respons Insiden AWS](https://aws.amazon.com/premiumsupport/aws-incident-detection-response/), yang menyediakan pemantauan proaktif dalam 24x7 dan manajemen insiden untuk beban kerja produksi. 

1.  **Tinjau dan adaptasi:** Lakukan peninjauan secara rutin terhadap efektivitas proses penyusunan prioritas dan lakukan penyesuaian berdasarkan umpan balik dan perubahan dalam lingkungan bisnis. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS03-BP03 Eskalasi didorong](ops_org_culture_team_enc_escalation.md) 
+  [OPS08-BP04 Membuat peringatan yang dapat ditindaklanjuti](ops_workload_observability_create_alerts.md) 
+  [OPS09-BP01 Mengukur sasaran operasi dan KPI dengan metrik](ops_operations_health_measure_ops_goals_kpis.md) 

 **Dokumen terkait:** 
+ [ Atlassian - Memahami tingkat keparahan insiden ](https://www.atlassian.com/incident-management/kpis/severity-levels)
+ [ Peta Proses IT - Daftar Periksa Prioritas Insiden ](https://wiki.en.it-processmaps.com/index.php/Checklist_Incident_Priority)

# OPS10-BP04 Tetapkan jalur eskalasi
<a name="ops_event_response_define_escalation_paths"></a>

Tetapkan jalur eskalasi yang jelas di dalam protokol respons insiden Anda untuk memfasilitasi tindakan yang tepat waktu dan efektif. Ini mencakup penentuan perintah untuk eskalasi, memberikan detail proses eskalasi, dan memberikan persetujuan tindakan di awal untuk mempercepat pengambilan keputusan dan mengurangi waktu rata-rata resolusi (MTTR).

 **Hasil yang diinginkan:** Proses terstruktur dan efisien yang meneruskan insiden ke personel yang tepat, sehingga waktu respons dan dampak menjadi minimum. 

 **Anti-pola umum:** 
+ Kurangnya kejelasan tentang prosedur pemulihan menyebabkan muncul respons seadanya selama insiden kritis.
+ Tidak adanya penentuan izin dan kepemilikan yang mengakibatkan ketertundaan ketika diperlukan tindakan mendesak.
+  Para pemangku kepentingan dan pelanggan tidak menerima informasi sesuai dengan harapan. 
+  Keputusan-keputusan penting tertunda. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Respons insiden yang efisien melalui prosedur-prosedur eskalasi yang telah ditentukan sebelumnya. 
+  Mengurangi waktu henti dengan tindakan-tindakan yang telah disetujui sebelumnya dan penanggung jawab yang jelas. 
+  Alokasi sumber daya yang lebih baik dan penyesuaian tingkat dukungan berdasarkan tingkat keparahan insiden. 
+  Komunikasi yang lebih baik dengan para pemangku kepentingan dan pelanggan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Jalur eskalasi yang ditentukan dengan benar sangatlah penting untuk memberikan respons insiden yang cepat. Manajer Insiden AWS Systems Manager mendukung penyusunan rencana eskalasi terstruktur dan jadwal personel siaga, yang memberikan peringatan kepada personel yang tepat sehingga mereka siap bertindak ketika insiden terjadi. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  **Siapkan perintah eskalasi:** Siapkan [alarm CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html#alarms-and-actions) untuk membuat sebuah insiden di [Manajer Insiden AWS Systems Manager](https://docs.aws.amazon.com//incident-manager/latest/userguide/incident-creation.html). 

1.  ** Siapkan jadwal panggilan:** Buat [jadwal panggilan](https://docs.aws.amazon.com/incident-manager/latest/userguide/incident-manager-on-call-schedule-create.html) di Incident Manager yang selaras dengan jalur eskalasi Anda. Bekali personel siaga dengan izin dan alat yang diperlukan untuk bertindak cepat. 

1.  ** Detail prosedur eskalasi: ** 
   +  Tentukan kondisi-kondisi spesifik yang membuat insiden harus dieskalasi. 
   +  Buat [rencana eskalasi](https://docs.aws.amazon.com/incident-manager/latest/userguide/escalation.html) di Incident Manager. 
   +  Saluran eskalasi harus terdiri dari suatu kontak atau jadwal personel siaga. 
   +  Tentukan peran dan tanggung jawab tim di setiap tingkat eskalasi. 

1.  **Tindakan mitigasi sebelum persetujuan:** Lakukan kerja sama dengan pengambil keputusan untuk menyetujui tindakan di awal untuk skenario yang diantisipasi. Gunakan [runbook Systems Manager Automation](https://docs.aws.amazon.com//incident-manager/latest/userguide/tutorials-runbooks.html) yang terintegrasi dengan Incident Manager untuk mempercepat resolusi insiden. 

1.  **Tentukan kepemilikan:** Identifikasi dengan jelas pemilik internal untuk setiap langkah jalur eskalasi. 

1.  **Sediakan detail eskalasi pihak ketiga:** 
   +  Buatlah dokumentasi perjanjian tingkat layanan (SLA) pihak ketiga, dan selaraskan dengan tujuan-tujuan internal. 
   +  Tetapkan protokol yang jelas untuk komunikasi vendor selama terjadi insiden. 
   +  Integrasikan kontak vendor ke dalam alat-alat manajemen insiden sehingga bisa diakses langsung. 
   +  Lakukan latihan rutin yang menyertakan skenario respons pihak ketiga. 
   +  Jaga agar informasi eskalasi vendor terdokumentasi dengan baik dan mudah diakses. 

1.  **Latih dan latih rencana eskalasi:** Latih tim Anda menjalankan proses eskalasi dan lakukan latihan respons insiden rutin atau hari permainan. Pelanggan Dukungan Perusahaan dapat meminta [Lokakarya Manajemen Insiden](https://aws.amazon.com/premiumsupport/technology-and-programs/proactive-services/). 

1.  **Lanjutkan untuk perbaikan:** Tinjau efektivitas jalur eskalasi Anda secara rutin. Perbarui proses Anda berdasarkan pelajaran yang dipetik dari insiden yang sudah lewat (post-mortem) dan umpan balik berkelanjutan. 

 **Tingkat upaya untuk rencana implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS08-BP04 Membuat peringatan yang dapat ditindaklanjuti](ops_workload_observability_create_alerts.md) 
+  [OPS10-BP02 Menjalankan proses untuk setiap peringatan](ops_event_response_process_per_alert.md) 
+  [OPS11-BP02 Lakukan analisis pasca-insiden](ops_evolve_ops_perform_rca_process.md) 

 **Dokumen terkait:** 
+ [Rencana Eskalasi Manajer Insiden AWS Systems Manager](https://docs.aws.amazon.com/incident-manager/latest/userguide/escalation.html)
+ [ Bekerja dengan jadwal panggilan di Incident Manager ](https://docs.aws.amazon.com/incident-manager/latest/userguide/incident-manager-on-call-schedule.html)
+ [ Membuat dan Mengelola Runbook ](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-documents.html)
+ [ Manajemen peningkatan akses sementara dengan AWS IAM Identity Center](https://aws.amazon.com/blogs/security/temporary-elevated-access-management-with-iam-identity-center/)
+ [ Atlassian - Kebijakan eskalasi untuk manajemen insiden yang efektif ](https://www.atlassian.com/incident-management/on-call/escalation-policies)

# OPS10-BP05 Menentukan rencana komunikasi pelanggan untuk peristiwa yang berdampak pada layanan
<a name="ops_event_response_push_notify"></a>

 Komunikasi yang efektif selama peristiwa yang berdampak pada layanan sangat penting untuk menjaga kepercayaan dan transparansi dengan pelanggan. Rencana komunikasi yang terdefinisi dengan baik membantu organisasi Anda berbagi informasi dengan cepat dan jelas, baik secara internal maupun eksternal, selama insiden. 

 **Hasil yang diinginkan:** 
+  Rencana komunikasi yang solid sebagai pedoman yang efektif bagi para pelanggan dan pemangku kepentingan selama peristiwa yang berdampak pada layanan. 
+  Transparansi dalam komunikasi untuk membangun kepercayaan dan mengurangi kecemasan pelanggan. 
+  Meminimalkan dampak peristiwa yang berdampak pada layanan terhadap pengalaman pelanggan dan operasional bisnis. 

 **Anti-pola umum:** 
+  Komunikasi yang tidak memadai atau tertunda menyebabkan kebingungan dan ketidakpuasan pada pelanggan. 
+  Pesan yang terlalu teknis atau tidak jelas akan gagal menyampaikan dampak sebenarnya pada pengguna. 
+  Tidak ada strategi komunikasi yang telah ditentukan sebelumnya, sehingga menghasilkan pesan yang tidak konsisten dan reaktif. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Meningkatkan kepercayaan dan kepuasan pelanggan dengan melakukan komunikasi yang proaktif dan jelas. 
+  Mengurangi beban pada tim dukungan dengan menangani kekhawatiran pelanggan terlebih dahulu. 
+  Meningkatkan kemampuan untuk mengelola dan memulihkan insiden secara efektif. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Pembuatan rencana komunikasi yang komprehensif untuk peristiwa-peristiwa yang berdampak pada layanan melibatkan banyak aspek, mulai dari pemilihan saluran yang tepat hingga penyusunan pesan dan nada pesan. Rencana harus dapat disesuaikan, dapat diskalakan, dan memenuhi skenario pemadaman (outage) yang berbeda-beda. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  **Menentukan peran dan tanggung jawab:** 
   +  Tugaskan manajer insiden utama untuk mengawasi aktivitas respons insiden. 
   +  Tunjuk seorang manajer komunikasi yang bertanggung jawab untuk mengoordinasikan semua komunikasi eksternal dan internal. 
   +  Libatkan manajer dukungan untuk menyediakan komunikasi yang konsisten melalui tiket dukungan. 

1.  **Identifikasi saluran komunikasi:** Pilih saluran seperti obrolan di tempat kerja, email, SMS, media sosial, pemberitahuan dalam aplikasi, dan halaman status. Saluran-saluran tersebut harus tangguh dan mampu beroperasi secara independen selama terjadi peristiwa yang berdampak pada layanan. 

1.  ** Lakukan komunikasi dengan cepat, jelas, dan rutin kepada pelanggan: ** 
   +  Kembangkan templat-templat untuk berbagai skenario gangguan layanan, dengan menekankan kesederhanaan dan detail-detail penting. Sertakan informasi tentang gangguan layanan, waktu penyelesaian yang diharapkan, dan dampak. 
   +  Gunakan Amazon Pinpoint untuk memberi tahu para pelanggan menggunakan notifikasi push, notifikasi dalam aplikasi, email, pesan teks, pesan suara, dan pesan melalui saluran khusus. 
   +  Gunakan Amazon Simple Notiﬁcation Service (Amazon SNS) untuk memberi tahu pelanggan (subscriber) secara terprogram atau melalui email, notifikasi push seluler, dan pesan teks. 
   +  Komunikasikan status melalui dasbor dengan membagikan dasbor Amazon CloudWatch kepada publik. 
   +  Dorong keterlibatan media sosial: 
     +  Pantau media sosial secara aktif untuk memahami sentimen pelanggan. 
     +  Buat postingan di platform media sosial untuk menyampaikan informasi terbaru kepada publik dan menciptakan keterlibatan komunitas. 
     +  Siapkan templat untuk melakukan komunikasi media sosial yang konsisten dan jelas. 

1.  **Koordinasikan komunikasi internal:** Implementasikan protokol internal menggunakan alat seperti Amazon Q Developer dalam aplikasi obrolan untuk koordinasi dan komunikasi tim. Gunakan dasbor CloudWatch untuk mengkomunikasikan status. 

1.  ** Orkestrasi komunikasi dengan alat dan layanan-layanan khusus: ** 
   +  Gunakan Manajer Insiden AWS Systems Manager dengan Amazon Q Developer dalam aplikasi obrolan untuk menyiapkan saluran-saluran obrolan khusus untuk komunikasi internal waktu nyata dan koordinasi selama insiden. 
   +  Gunakan runbook Manajer Insiden AWS Systems Manager untuk mengotomatiskan notifikasi pelanggan melalui Amazon Pinpoint, Amazon SNS, atau alat-alat pihak ketiga seperti platform media sosial selama terjadi insiden. 
   +  Integrasikan alur kerja persetujuan di dalam runbook untuk meninjau dan mengotorisasi semua komunikasi eksternal secara opsional sebelum dikirim. 

1.  ** Latih dan tingkatkan: ** 
   +  Lakukan pelatihan tentang penggunaan alat dan strategi komunikasi. Berdayakan tim untuk mengambil keputusan secara tepat waktu selama terjadi insiden. 
   +  Uji rencana komunikasi dengan menjalankan latihan rutin atau game day. Gunakan pengujian ini untuk menyempurnakan perpesanan dan mengevaluasi efektivitas saluran. 
   +  Implementasikan mekanisme umpan balik untuk menilai efektivitas komunikasi selama terjadi insiden. Terus kembangkan rencana komunikasi berdasarkan umpan balik dan perubahan kebutuhan. 

 **Tingkat upaya untuk rencana implementasi:** Tinggi 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS07-BP03 Menggunakan runbook untuk menjalankan prosedur](ops_ready_to_support_use_runbooks.md) 
+  [OPS10-BP06 Mengomunikasikan status melalui dasbor](ops_event_response_dashboards.md) 
+  [OPS11-BP02 Lakukan analisis pasca-insiden](ops_evolve_ops_perform_rca_process.md) 

 **Dokumen terkait:** 
+ [ Atlassian - Praktik terbaik komunikasi insiden ](https://www.atlassian.com/incident-management/incident-communication)
+ [ Atlassian - Cara menulis pembaruan status yang baik ](https://www.atlassian.com/blog/statuspage/how-to-write-a-good-status-update)
+ [ PagerDuty - Panduan Komunikasi Insiden ](https://www.pagerduty.com/resources/learn/a-guide-to-incident-communications/)

 **Video terkait:** 
+ [ Atlassian - Buat rencana komunikasi insiden Anda sendiri: Templat insiden ](https://www.youtube.com/watch?v=ZROVn6-K2qU)

 **Contoh terkait:** 
+  [Dasbor AWS Health](https://aws.amazon.com/premiumsupport/technology/aws-health-dashboard/) 

# OPS10-BP06 Mengomunikasikan status melalui dasbor
<a name="ops_event_response_dashboards"></a>

 Gunakan dasbor sebagai alat strategis untuk menyampaikan status operasional waktu nyata dan metrik utama kepada audiens yang berbeda, termasuk tim teknis internal, pimpinan, dan pelanggan. Dasbor ini menawarkan representasi visual tersentralisasi tentang kesehatan sistem dan kinerja bisnis, sehingga meningkatkan transparansi dan efisiensi pengambilan keputusan. 

 **Hasil yang diinginkan:** 
+  Dasbor Anda memberikan gambaran yang komprehensif tentang sistem dan metrik-metrik bisnis yang relevan untuk berbagai pemangku kepentingan. 
+  Para pemangku kepentingan dapat mengakses informasi operasional secara proaktif, sehingga mengurangi kebutuhan permintaan status yang harus sering kali dilakukan. 
+  Pengambilan keputusan waktu nyata disempurnakan selama operasi dan insiden normal. 

 **Anti-pola umum:** 
+ Rekayasawan yang bergabung dengan panggilan manajemen insiden mengharuskan adanya pembaruan status untuk mengejar ketertinggalan.
+ Mengandalkan pelaporan manual untuk manajemen, yang menyebabkan ketertundaan dan potensi ketidakakuratan.
+  Tim operasi sering terganggu dengan permintaan pembaruan status selama terjadi insiden. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Memberdayakan para pemangku kepentingan dengan akses langsung ke informasi penting, sehingga mendorong pengambilan keputusan tepat yang berdasar informasi. 
+  Mengurangi inefisiensi operasional dengan meminimalkan pelaporan manual dan permintaan status yang sering dilakukan. 
+  Meningkatkan transparansi dan kepercayaan melalui visibilitas waktu nyata pada kinerja sistem dan metrik-metrik bisnis. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Dasbor menyampaikan status sistem dan metrik-metrik bisnis Anda secara efektif dan dapat disesuaikan dengan kebutuhan kelompok audiens yang berbeda. Alat-alat seperti dasbor Amazon CloudWatch dan Amazon Quick dapat membantu Anda untuk membuat dasbor interaktif waktu nyata untuk pemantauan sistem dan kecerdasan bisnis. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  **Identifikasi kebutuhan pemangku kepentingan:** Tentukan kebutuhan informasi khusus untuk kelompok audiens yang berbeda-beda, seperti tim teknis, pimpinan, dan pelanggan. 

1.  **Pilih alat yang tepat:** Pilih alat yang sesuai seperti [dasbor Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html) untuk pemantauan sistem dan [Amazon Quick](https://aws.amazon.com/quicksight/) untuk kecerdasan bisnis interaktif. [AWS Health](https://docs.aws.amazon.com/health/latest/ug/what-is-aws-health.html) memberikan pengalaman siap pakai di [Dasbor AWS Health](https://health.aws.amazon.com/health/home), atau Anda dapat menggunakan peristiwa Health di Amazon EventBridge atau melalui API AWS Health untuk melengkapi dasbor Anda sendiri. 

1.  **Rancang dasbor yang efektif:** 
   +  Rancang dasbor yang menyajikan metrik dan KPI yang relevan secara jelas, sehingga dasbor menjadi mudah dimengerti dan dapat ditindaklanjuti. 
   +  Gabungkan tampilan tingkat sistem dan tingkat bisnis sesuai kebutuhan. 
   +  Sertakan dasbor tingkat tinggi (untuk gambaran umum) dan dasbor tingkat rendah (untuk analisis mendetail). 
   +  Integrasikan alarm otomatis di dalam dasbor untuk menyoroti masalah-masalah kritis. 
   +  Buatlah anotasi dasbor dengan sasaran dan ambang batas metrik-metrik penting untuk visibilitas langsung. 

1.  **Integrasikan sumber data:** 
   +  Gunakan [Amazon CloudWatch](https://aws.amazon.com/cloudwatch/) untuk menggabungkan dan menampilkan metrik dari berbagai layanan AWS dan [metrik kueri dari sumber data lain](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/MultiDataSourceQuerying.html), yang akan membuat tampilan terpadu dari metrik kesehatan dan bisnis sistem Anda. 
   +  Gunakan fitur seperti [Wawasan Log CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/AnalyzingLogData.html) untuk melakukan kueri dan memvisualisasikan data log dari berbagai aplikasi dan layanan. 
   +  Gunakan peristiwa AWS Health untuk terus mendapatkan informasi tentang status operasional dan masalah operasional yang dikonfirmasi dari layanan AWS melalui [API AWS Health](https://docs.aws.amazon.com/health/latest/APIReference/Welcome.html) atau [peristiwa AWS Health di Amazon EventBridge](https://docs.aws.amazon.com/health/latest/ug/cloudwatch-events-health.html). 

1.  **Berikan akses mandiri:** 
   +  Bagikan dasbor CloudWatch dengan para pemangku kepentingan yang relevan untuk memberikan akses informasi mandiri dengan menggunakan [fitur berbagi dasbor](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/cloudwatch-dashboard-sharing.html). 
   +  Pastikan dasbor mudah diakses dan menyediakan informasi terkini dalam waktu nyata. 

1.  **Perbarui dan perbaiki secara rutin:** 
   +  Lakukan pembaruan dan penyempurnaan secara terus-menerus pada dasbor agar selaras dengan kebutuhan bisnis yang terus berkembang dan umpan balik yang diberikan para pemangku kepentingan. 
   +  Tinjau dasbor secara rutin agar tetap relevan dan efektif untuk menyampaikan informasi yang diperlukan. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS08-BP05 Membuat dasbor](ops_workload_observability_create_dashboards.md) 

 **Dokumen terkait:** 
+ [ Membangun dasbor untuk visibilitas operasional ](https://aws.amazon.com/builders-library/building-dashboards-for-operational-visibility/)
+ [ Menggunakan dasbor Amazon CloudWatch ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html)
+ [ Membuat dasbor fleksibel dengan variabel dasbor ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/cloudwatch_dashboard_variables.html)
+ [ Berbagi dasbor CloudWatch ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/cloudwatch-dashboard-sharing.html)
+ [ Metrik kueri dari sumber data lain ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/MultiDataSourceQuerying.html)
+ [ Menambahkan widget kustom ke sebuah dasbor CloudWatch ](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/add_custom_widget_dashboard.html)

 **Contoh terkait:** 
+ [ Lokakarya Satu Observabilitas - Dasbor ](https://catalog.us-east-1.prod.workshops.aws/workshops/31676d37-bbe9-4992-9cd1-ceae13c5116c/en-US/aws-native/dashboards)

# OPS10-BP07 Otomatiskan tanggapan terhadap acara
<a name="ops_event_response_auto_event_response"></a>

 Mengotomatiskan respons peristiwa sangatlah penting untuk penanganan operasional yang cepat, konsisten, dan bebas kesalahan. Ciptakan proses yang efisien dan gunakan alat untuk mengelola dan merespons peristiwa secara otomatis, sehingga meminimalkan intervensi manual dan meningkatkan efektivitas operasional. 

 **Hasil yang diinginkan:** 
+  Mengurangi kesalahan manusia dan waktu resolusi yang lebih cepat melalui otomatisasi. 
+  Penanganan peristiwa operasional yang konsisten dan andal. 
+  Peningkatan efisiensi operasional dan keandalan sistem. 

 **Anti-pola umum:** 
+ Penanganan peristiwa secara manual menyebabkan terjadinya penundaan dan kesalahan.
+ Otomatisasi diabaikan dalam tugas-tugas penting yang repetitif.
+  Tugas manual yang repetitif menyebabkan kewalahan akibat peringatan dan terlewatkannya masalah-masalah kritis. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Respons peristiwa yang lebih cepat, sehingga mengurangi waktu henti sistem. 
+  Operasi yang andal dengan penanganan peristiwa yang otomatis dan konsisten. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Integrasikan otomatisasi untuk menciptakan alur kerja operasional yang efisien dan meminimalkan intervensi manual. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  **Identifikasi peluang otomatisasi:** Tentukan tugas-tugas repetitif untuk diotomatisasi, seperti remediasi masalah, pengayaan tiket, manajemen kapasitas, penskalaan, deployment, dan pengujian. 

1.  **Identifikasi perintah-perintah otomatisasi:** 
   +  Menilai dan menentukan kondisi atau metrik tertentu yang memulai respons otomatis menggunakan tindakan [ CloudWatch alarm Amazon](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html#alarms-and-actions). 
   +  Gunakan [Amazon EventBridge](https://aws.amazon.com/eventbridge/) untuk merespons peristiwa dalam AWS layanan, beban kerja khusus, dan aplikasi SaaS. 
   +  [Pertimbangkan peristiwa inisiasi seperti [entri log tertentu](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/MonitoringLogData.html), [ambang metrik kinerja](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html), atau perubahan status sumber daya.](https://docs.aws.amazon.com/config/latest/developerguide/remediation.html) AWS 

1.  **Implementasikan otomatisasi berbasis peristiwa:** 
   +  Gunakan runbook AWS Systems Manager Otomasi untuk menyederhanakan tugas pemeliharaan, penerapan, dan remediasi. 
   +  [Membuat insiden di Manajer Insiden](https://docs.aws.amazon.com/incident-manager/latest/userguide/incident-creation.html) secara otomatis mengumpulkan dan menambahkan detail tentang AWS sumber daya yang terlibat ke insiden tersebut. 
   +  Secara proaktif memantau kuota menggunakan [Monitor Kuota untuk AWS](https://aws.amazon.com/solutions/implementations/quota-monitor/). 
   +  Secara otomatis menyesuaikan kapasitas dengan [AWS Auto Scaling](https://aws.amazon.com/autoscaling/) untuk menjaga ketersediaan dan kinerja. 
   +  [Otomatiskan jaringan pipa pengembangan dengan Amazon. CodeCatalyst](https://codecatalyst.aws/explore) 
   +  Uji asap atau terus memantau titik akhir dan APIs [menggunakan pemantauan sintetis](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html). 

1.  **Lakukan mitigasi risiko melalui otomatisasi:** 
   +  Menerapkan [respons keamanan otomatis](https://aws.amazon.com/solutions/implementations/automated-security-response-on-aws/) untuk mengatasi risiko dengan cepat. 
   +  Gunakan [AWS Systems Manager State Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-state.html) untuk mengurangi penyimpangan konfigurasi. 
   +  [Memperbaiki sumber daya yang tidak sesuai dengan. Aturan AWS Config](https://docs.aws.amazon.com/config/latest/developerguide/remediation.html) 

 **Tingkat upaya untuk rencana implementasi:** Tinggi 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS08-BP04 Membuat peringatan yang dapat ditindaklanjuti](ops_workload_observability_create_alerts.md) 
+  [OPS10-BP02 Menjalankan proses untuk setiap peringatan](ops_event_response_process_per_alert.md) 

 **Dokumen terkait:** 
+  [Menggunakan runbook Systems Manager Automation dengan Incident Manager](https://docs.aws.amazon.com/incident-manager/latest/userguide/tutorials-runbooks.html) 
+  [Membuat insiden di Incident Manager](https://docs.aws.amazon.com/incident-manager/latest/userguide/incident-creation.html) 
+  [AWS kuota layanan](https://docs.aws.amazon.com/general/latest/gr/aws_service_limits.html) 
+  [Pantau penggunaan sumber daya dan kirim notifikasi saat mendekati kuota](https://docs.aws.amazon.com/solutions/latest/quota-monitor-for-aws/solution-overview.html) 
+  [AWS Auto Scaling](https://aws.amazon.com/autoscaling/) 
+  [Apa itu Amazon CodeCatalyst?](https://docs.aws.amazon.com/codecatalyst/latest/userguide/welcome.html) 
+  [Menggunakan CloudWatch alarm Amazon](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 
+  [Menggunakan tindakan CloudWatch alarm Amazon](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html#alarms-and-actions) 
+  [Memediasi Sumber Daya yang Tidak Sesuai dengan Aturan AWS Config](https://docs.aws.amazon.com/config/latest/developerguide/remediation.html) 
+  [Membuat metrik dari peristiwa log dengan menggunakan filter](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/MonitoringLogData.html) 
+  [AWS Systems Manager State Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-state.html) 

 **Video terkait:** 
+ [Buat Runbook Otomasi dengan AWS Systems Manager](https://www.youtube.com/watch?v=fQ_KahCPBeU)
+ [Cara mengotomatiskan Operasi TI di AWS](https://www.youtube.com/watch?v=GuWj_mlyTug)
+ [AWS Security Hub CSPM aturan otomatisasi](https://www.youtube.com/watch?v=XaMfO_MERH8)
+ [Mulai proyek perangkat lunak Anda dengan cepat dengan CodeCatalyst cetak biru Amazon](https://www.youtube.com/watch?v=rp7roaoPzFE)

 **Contoh terkait:** 
+ [Amazon CodeCatalyst Tutorial: Membuat proyek dengan cetak biru aplikasi web tiga tingkat modern](https://docs.aws.amazon.com/codecatalyst/latest/userguide/getting-started-template-project.html)
+ [ Lokakarya Satu Observabilitas ](https://catalog.us-east-1.prod.workshops.aws/workshops/31676d37-bbe9-4992-9cd1-ceae13c5116c/en-US)
+ [ Menanggapi insiden menggunakan Incident Manager](https://catalog.workshops.aws/getting-started-with-com/en-US/operations-management/incident-manager)

# Kembangkan
<a name="a-evolve"></a>

**Topics**
+ [OPS 11. Bagaimana cara mengembangkan operasi?](ops-11.md)

# OPS 11. Bagaimana cara mengembangkan operasi?
<a name="ops-11"></a>

 Luangkan waktu dan sumber daya khusus untuk peningkatan bertahap yang hampir berkelanjutan untuk meningkatkan dan efisiensi operasi Anda. 

**Topics**
+ [OPS11-BP01 Buatlah suatu proses untuk peningkatan berkelanjutan](ops_evolve_ops_process_cont_imp.md)
+ [OPS11-BP02 Lakukan analisis pasca-insiden](ops_evolve_ops_perform_rca_process.md)
+ [OPS11-BP03 Menerapkan loop umpan balik](ops_evolve_ops_feedback_loops.md)
+ [OPS11-BP04 Melakukan manajemen pengetahuan](ops_evolve_ops_knowledge_management.md)
+ [OPS11-BP05 Menetapkan pendorong untuk perbaikan](ops_evolve_ops_drivers_for_imp.md)
+ [OPS11-BP06 Validasi wawasan](ops_evolve_ops_validate_insights.md)
+ [OPS11-BP07 Lakukan tinjauan metrik operasi](ops_evolve_ops_metrics_review.md)
+ [OPS11-BP08 Mendokumentasikan dan membagikan pelajaran yang didapatkan](ops_evolve_ops_share_lessons_learned.md)
+ [OPS11-BP09 Alokasikan waktu untuk melakukan perbaikan](ops_evolve_ops_allocate_time_for_imp.md)

# OPS11-BP01 Buatlah suatu proses untuk peningkatan berkelanjutan
<a name="ops_evolve_ops_process_cont_imp"></a>

 Evaluasi beban kerja Anda berdasarkan praktik terbaik arsitektur internal dan eksternal. Lakukan tinjauan beban kerja yang sering dan terencana. Prioritaskan peluang perbaikan ke dalam jadwal pengembangan perangkat lunak Anda. 

 **Hasil yang diinginkan:** 
+  Anda sering menganalisis beban kerja berdasarkan praktik-praktik terbaik arsitektur. 
+  Anda memberikan peluang perbaikan dengan prioritas yang setara pada fitur-fitur di dalam proses pengembangan perangkat lunak Anda. 

 **Anti-pola umum:** 
+  Anda belum menjalankan peninjauan arsitektur pada beban kerja Anda sejak melakukan deployment beberapa tahun lalu. 
+  Anda memberikan prioritas yang lebih rendah untuk peluang perbaikan. Dibandingkan dengan fitur-fitur baru, peluang ini tetap berada di backlog. 
+  Tidak ada standar untuk mengimplementasikan modifikasi terhadap praktik-praktik terbaik untuk organisasi. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Beban kerja Anda selalu dimutakhirkan dengan praktik terbaik arsitektur. 
+  Anda mengembangkan beban kerja Anda secara terencana. 
+  Anda dapat memanfaatkan praktik-praktik terbaik organisasi untuk meningkatkan semua beban kerja. 
+  Anda menghasilkan keuntungan stabil yang memberikan dampak kumulatif, yang mendorong efisiensi yang lebih menyeluruh. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Lakukan tinjauan arsitektur dari beban kerja Anda dalam rentang waktu yang lebih pendek. Gunakan praktik-praktik terbaik internal dan eksternal, evaluasi beban kerja Anda, dan identifikasi peluang perbaikan. Prioritaskan peluang perbaikan ke dalam jadwal pengembangan perangkat lunak Anda. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  Lakukan peninjauan arsitektur secara berkala pada beban kerja produksi Anda dengan frekuensi yang sudah disepakati. Gunakan standar arsitektur terdokumentasi yang menyertakan praktik terbaik khusus AWS. 

   1.  Gunakan standar yang ditetapkan secara internal untuk peninjauan ini. Jika Anda tidak memiliki standar internal, gunakan Kerangka Kerja AWS Well-Architected. 

   1.  Gunakan AWS Well-Architected Tool untuk membuat lensa kustom praktik-praktik terbaik internal Anda dan lakukan peninjauan arsitektur Anda. 

   1.  Hubungi Manajer Akun Teknis atau Arsitek Solusi AWS Anda untuk melakukan Peninjauan Kerangka Kerja Well-Architected terpandu pada beban kerja Anda. 

1.  Prioritaskan peluang perbaikan yang diidentifikasi selama peninjauan ke dalam proses pengembangan perangkat lunak Anda. 

 **Tingkat upaya untuk rencana implementasi:** Rendah. Anda dapat menggunakan Kerangka Kerja AWS Well-Architected untuk melakukan peninjauan arsitektur tahunan Anda. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS11-BP02 Menjalankan analisis setelah insiden](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_evolve_ops_perform_rca_process.html) 
+  [OPS11-BP08 Mendokumentasikan dan membagikan pelajaran yang didapatkan](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_evolve_ops_share_lessons_learned.html) 
+  [OPS04 - Mengimplementasikan observabilitas](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_evolve_ops_process_cont_imp.html) 

 **Dokumen terkait:** 
+  [AWS Well-Architected Tool - Lensa Kustom](https://docs.aws.amazon.com/wellarchitected/latest/userguide/lenses-custom.html) 
+  [Laporan Resmi AWS Well-Architected - Proses peninjauan](https://docs.aws.amazon.com/wellarchitected/latest/framework/the-review-process.html) 
+  [Sesuaikan Ulasan Well-Architected menggunakan Lensa Kustom dan AWS Well-Architected Tool](https://aws.amazon.com/blogs/mt/customize-well-architected-reviews-using-custom-lenses-and-the-aws-well-architected-tool/) 
+  [Menerapkan siklus hidup Lensa Kustom AWS Well-Architected di organisasi Anda](https://aws.amazon.com/blogs/architecture/implementing-the-aws-well-architected-custom-lens-lifecycle-in-your-organization/) 

 **Video terkait:** 
+  [AWS re:Invent 2023 - Menskalakan praktik terbaik AWS Well-Architected di seluruh organisasi Anda](https://youtu.be/UXtZCoE9qfQ?si=OPATCOY2YAwiF2TS) 

 **Contoh terkait:** 
+  [AWS Well-Architected Tool](https://docs.aws.amazon.com/wellarchitected/latest/userguide/intro.html) 

# OPS11-BP02 Lakukan analisis pasca-insiden
<a name="ops_evolve_ops_perform_rca_process"></a>

 Tinjau peristiwa yang memengaruhi pelanggan dan identifikasi faktor yang berkontribusi serta tindakan pencegahannya. Gunakan informasi ini untuk mengembangkan langkah-langkah mitigasi untuk meminimalkan atau mencegah kemungkinan terjadi lagi. Kembangkan prosedur untuk respons efektif dan cepat. Komunikasikan faktor-faktor yang berkontribusi dan tindakan-tindakan korektif yang diperlukan, yang disesuaikan dengan audiens target. 

 **Hasil yang diinginkan:** 
+  Anda telah menetapkan proses manajemen insiden yang mencakup analisis pasca-insiden. 
+  Anda menerapkan rencana observabilitas untuk mengumpulkan data tentang peristiwa. 
+  Dengan data ini, Anda memahami dan mengumpulkan metrik yang mendukung proses analisis pasca-insiden Anda. 
+  Anda belajar dari insiden untuk meningkatkan hasil di masa depan. 

 **Anti-pola umum:** 
+  Anda mengelola server aplikasi. Kira-kira setiap 23 jam 55 menit, semua sesi aktif Anda dihapus. Anda berupaya mengidentifikasi masalah yang terjadi di server aplikasi Anda. Anda menduga bahwa masalah ini mungkin masalah jaringan, tetapi tidak dapat memperoleh bantuan dari tim jaringan karena mereka terlalu sibuk. Anda tidak menetapkan proses di awal yang dapat Anda jadikan panduan untuk mendapatkan dukungan dan mengumpulkan informasi yang dibutuhkan guna mengetahui masalah yang sedang terjadi. 
+  Anda mengalami kehilangan data di dalam beban kerja Anda. Hal ini baru pertama kali terjadi dan penyebabnya belum jelas. Anda menganggap bahwa kejadian ini tidak penting karena Anda dapat membuat ulang data. Kehilangan data makin sering terjadi dan memengaruhi pelanggan Anda. Hal ini juga menambah beban operasional Anda karena harus memulihkan data yang hilang. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Anda memiliki proses yang telah ditetapkan di awal untuk menentukan komponen, kondisi, tindakan, dan peristiwa yang berkontribusi terhadap suatu insiden, yang membantu Anda mengidentifikasi peluang untuk perbaikan. 
+  Anda menggunakan data dari analisis pasca-insiden untuk melakukan perbaikan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Gunakan sebuah proses untuk menentukan faktor yang berkontribusi. Tinjau semua insiden yang memengaruhi pelanggan. Buatlah sebuah proses untuk mengidentifikasi dan membuat dokumentasi dari faktor-faktor yang berkontribusi terhadap sebuah insiden agar Anda dapat mengembangkan langkah-langkah mitigasi untuk membatasi atau mencegah kejadian serupa serta mengembangkan prosedur untuk merespons dengan cepat dan efektif. Komunikasikan akar masalah insiden sebagaimana mestinya, dan sesuaikan komunikasi dengan audiens target Anda. Bagikan pembelajaran secara terbuka di dalam organisasi Anda. 

### Langkah-langkah implementasi
<a name="implementation-steps"></a>

1.  Kumpulkan meterik-metrik seperti perubahan deployment, perubahan konfigurasi, waktu mulai insiden, waktu alarm, waktu keterlibatan, waktu mulai mitigasi, dan waktu penyelesaian insiden. 

1.  Jelaskan titik-titik waktu utama pada kronologi (timeline) untuk memahami peristiwa insiden. 

1.  Ajukan pertanyaan-pertanyaan berikut: 

   1.  Apakah Anda dapat mempersingkat waktu deteksi? 

   1.  Apakah ada pembaruan metrik dan alarm yang dapat mendeteksi insiden lebih dini? 

   1.  Apakah Anda dapat mempersingkat waktu diagnosis? 

   1.  Apakah ada pembaruan pada rencana respons atau rencana eskalasi Anda yang melibatkan perespons yang tepat lebih dini? 

   1.  Apakah Anda dapat mempersingkat waktu mitigasi? 

   1.  Apakah ada langkah-langkah runbook atau panduan yang dapat Anda tambahkan atau tingkatkan? 

   1.  Apakah Anda dapat mencegah terjadinya insiden di masa mendatang? 

1.  Buat daftar periksa dan tindakan. Lacak dan selesaikan semua tindakan. 

 **Tingkat upaya untuk rencana implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS11-BP01 Buatlah suatu proses untuk peningkatan berkelanjutan](ops_evolve_ops_process_cont_imp.md) 
+ [OPS4 - Menerapkan observabilitas](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/implement-observability.html)

 **Dokumen terkait:** 
+  [Menjalankan analisis pasca-insiden di Incident Manager](https://docs.aws.amazon.com/incident-manager/latest/userguide/analysis.html) 
+  [Peninjauan Kesiapan Operasional](https://docs.aws.amazon.com/wellarchitected/latest/operational-readiness-reviews/iteration.html) 

# OPS11-BP03 Menerapkan loop umpan balik
<a name="ops_evolve_ops_feedback_loops"></a>

Loop umpan balik menyediakan wawasan yang dapat ditindaklanjuti yang mendorong pengambilan keputusan. Masukkan loop umpan balik ke dalam prosedur dan beban kerja Anda. Ini akan membantu Anda mengidentifikasi permasalahan dan area yang memerlukan perbaikan. Loop umpan balik juga memvalidasi investasi yang dilakukan dalam upaya perbaikan. Loop umpan balik ini adalah landasan untuk meningkatkan beban kerja Anda secara berkelanjutan.

 Loop umpan balik terbagi dalam dua kategori: *umpan balik langsung* dan *analisis retrospektif*. Umpan balik langsung (immediate feedback) dikumpulkan melalui peninjauan kinerja dan hasil dari aktivitas operasi. Umpan balik ini berasal dari anggota tim, pelanggan, atau output otomatis dari aktivitas. Umpan balik langsung diterima dari hal-hal seperti pengujian A/B dan pengiriman fitur baru, dan ini penting bagi gagal cepat (fail fast). 

 Analisis retrospektif dilakukan secara rutin untuk menangkap umpan balik dari peninjauan metrik dan hasil operasional dari waktu ke waktu. Retrospektif ini terjadi pada akhir sprint, secara terjadwal, atau setelah perilisan atau peristiwa besar. Tipe loop umpan balik ini memvalidasi investasi dalam operasi atau beban kerja Anda. Loop umpan balik ini akan membantu Anda mengukur keberhasilan dan memvalidasi strategi Anda. 

 **Hasil yang diinginkan:** Anda menggunakan umpan balik langsung dan analisis retrospektif untuk mendorong perbaikan. Terdapat sebuah mekanisme untuk mendapatkan umpan balik dari pengguna dan anggota tim. Analisis retrospektif digunakan untuk mengidentifikasi kecenderungan yang mendorong perbaikan. 

 **Anti-pola umum:** 
+ Anda meluncurkan fitur baru tetapi tidak ada cara untuk menerima umpan balik pelanggan tentangnya.
+ Setelah berinvestasi dalam perbaikan operasi, Anda tidak melakukan analisis retrospektif untuk memvalidasinya.
+ Anda mengumpulkan umpan balik pelanggan tetapi tidak meninjaunya secara rutin.
+ Loop umpan balik mendatangkan item-item tindakan yang diajukan tetapi item-item tersebut tidak disertakan dalam proses pengembangan perangkat lunak.
+  Pelanggan tidak menerima umpan balik tentang perbaikan yang mereka ajukan. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Anda dapat bekerja mundur (work backward) dari pelanggan untuk mendorong fitur-fitur baru. 
+  Budaya organisasi Anda dapat merespons perubahan lebih cepat. 
+  Tren digunakan untuk mengidentifikasi peluang perbaikan. 
+  Retrospektif memvalidasi investasi yang dilakukan pada beban kerja dan operasi Anda. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Dengan mengimplementasikan praktik-praktik terbaik ini, Anda dapat menggunakan umpan balik langsung dan analisis retrospektif. Loop umpan balik ini mendorong perbaikan. Terdapat banyak mekanisme untuk umpan balik langsung, termasuk survei, jajak pendapat pelanggan, atau formulir umpan balik. Organisasi Anda juga menggunakan retrospektif untuk mengidentifikasi peluang-peluang perbaikan dan memvalidasi inisiatif. 

 **Contoh pelanggan** 

 AnyCompany Retail membuat formulir web di mana pelanggan dapat memberikan umpan balik atau melaporkan masalah. Selama melakukan scrum mingguan, umpan balik pengguna dievaluasi oleh tim pengembangan perangkat lunak. Umpan balik digunakan secara rutin sebagai landasan pengembangan platform mereka. Mereka melakukan analisis retrospektif di akhir setiap sprint untuk mengidentifikasi item yang ingin mereka tingkatkan. 

## Langkah-langkah implementasi
<a name="implementation-steps"></a>

1. Umpan balik langsung
   +  Anda memerlukan sebuah mekanisme untuk menjangkau umpan balik dari pelanggan dan anggota tim. Aktivitas operasi Anda juga dapat dikonfigurasi untuk menghadirkan umpan balik otomatis. 
   +  Organisasi Anda perlu sebuah proses untuk meninjau umpan balik ini, menentukan hal-hal yang harus ditingkatkan, dan menjadwalkan perbaikan. 
   +  Umpan balik harus ditambahkan ke dalam proses pengembangan perangkat lunak Anda. 
   +  Seiring Anda melakukan perbaikan, lakukan tindak lanjut dengan pemberi umpan balik. 
     +  Anda dapat menggunakan [AWS Systems Manager OpsCenter](https://docs.aws.amazon.com/systems-manager/latest/userguide/OpsCenter.html)untuk membuat dan melacak peningkatan ini sebagai [OpsItems](https://docs.aws.amazon.com/systems-manager/latest/userguide/OpsCenter-working-with-OpsItems.html).

1.  Analisis retrospektif 
   +  Lakukan retrospektif di akhir siklus pengembangan, pada jadwal yang ditetapkan, atau setelah perilisan besar. 
   +  Kumpulkan para pemangku kepentingan yang terlibat dalam beban kerja untuk melakukan rapat retrospektif. 
   +  Buat tiga kolom di papan tulis atau lembar kerja: Hentikan, Mulai, dan Pertahankan 
     +  *Stop* adalah untuk apa pun yang Anda ingin tidak dilakukan lagi oleh tim Anda. 
     +  *Start* adalah gagasan yang ingin mulai Anda lakukan. 
     +  *Keep* adalah untuk item-item yang ingin tetap Anda lakukan. 
   +  Keliling ruangan dan kumpulkan umpan balik dari para pemangku kepentingan. 
   +  Buat prioritas umpan balik. Tetapkan tindakan dan pemangku kepentingan untuk item-item Mulai atau Pertahankan. 
   +  Tambahkan tindakan-tindakan ke proses pengembangan perangkat lunak Anda dan sampaikan pembaruan status kepada para pemangku kepentingan seiring Anda melakukan perbaikan. 

 **Tingkat upaya untuk rencana implementasi:** Sedang. Untuk mengimplementasikan praktik terbaik ini, Anda memerlukan cara untuk menyerap umpan balik langsung dan menganalisisnya. Selain itu, Anda perlu membangun sebuah proses analisis retrospektif. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS01-BP01 Mengevaluasi kebutuhan pelanggan eksternal](ops_priorities_ext_cust_needs.md): Loop umpan balik adalah sebuah mekanisme untuk mengumpulkan kebutuhan pelanggan eksternal. 
+  [OPS01-BP02 Mengevaluasi kebutuhan nasabah internal](ops_priorities_int_cust_needs.md): Para pemangku kepentingan internal dapat menggunakan loop umpan balik untuk menyampaikan kebutuhan dan persyaratan. 
+  [OPS11-BP02 Lakukan analisis pasca-insiden](ops_evolve_ops_perform_rca_process.md): Analisis pasca-insiden adalah bentuk analisis retrospektif yang penting yang dilakukan setelah insiden. 
+  [OPS11-BP07 Lakukan tinjauan metrik operasi](ops_evolve_ops_metrics_review.md): Peninjauan metrik operasi mengidentifikasi tren dan area perbaikan. 

 **Dokumen terkait:** 
+  [7 Jebakan yang Harus Dihindari Saat Membangun CCOE](https://aws.amazon.com/blogs/enterprise-strategy/7-pitfalls-to-avoid-when-building-a-ccoe/) 
+  [Playbook Tim Atlassian - Retrospektif](https://www.atlassian.com/team-playbook/plays/retrospective) 
+  [Definisi Email: Loop Umpan Balik](https://aws.amazon.com/blogs/messaging-and-targeting/email-definitions-feedback-loops/) 
+  [Membangun Loop Umpan Balik Berdasarkan Tinjauan Kerangka AWS Well-Architected](https://aws.amazon.com/blogs/architecture/establishing-feedback-loops-based-on-the-aws-well-architected-framework-review/) 
+  [IBMMetodologi Garasi - Pegang retrospektif](https://www.ibm.com/garage/method/practices/learn/practice_retrospective_analysis/) 
+  [Investopedia — Siklus PDCS](https://www.investopedia.com/terms/p/pdca-cycle.asp) 
+  [Memaksimalkan Efektivitas Developer oleh Tim Cochran](https://martinfowler.com/articles/developer-effectiveness.html) 
+  [Ulasan Kesiapan Operasi (ORR) Whitepaper - Iterasi](https://docs.aws.amazon.com/wellarchitected/latest/operational-readiness-reviews/iteration.html) 
+  [ITILCSI- Peningkatan Layanan Berkelanjutan](https://wiki.en.it-processmaps.com/index.php/ITIL_CSI_-_Continual_Service_Improvement)
+  [Saat Toyota bertemu e-commerce: Bersandar pada Amazon](https://www.mckinsey.com/capabilities/operations/our-insights/when-toyota-met-e-commerce-lean-at-amazon) 

 **Video terkait:** 
+  [Membangun Loop Umpan Balik Pelanggan yang Efektif](https://www.youtube.com/watch?v=zz_VImJRZ3U) 

 **Contoh terkait: ** 
+  [Astuto - Alat umpan balik pelanggan sumber terbuka](https://github.com/riggraz/astuto) 
+  [AWS Solusi - Q nABot on AWS](https://aws.amazon.com/solutions/implementations/qnabot-on-aws/) 
+  [Fider - Platform untuk mengatur umpan balik pelanggan](https://github.com/getfider/fider) 

 **Layanan terkait:** 
+  [AWS Systems Manager OpsCenter](https://docs.aws.amazon.com/systems-manager/latest/userguide/OpsCenter.html) 

# OPS11-BP04 Melakukan manajemen pengetahuan
<a name="ops_evolve_ops_knowledge_management"></a>

Manajemen pengetahuan membantu anggota tim menemukan informasi untuk melakukan pekerjaan mereka. Di dalam organisasi yang mau belajar, informasi dibagikan secara bebas sehingga individu diberdayakan. Informasi dapat ditemukan atau dicari. Informasi bersifat akurat dan mutakhir. Ada mekanisme untuk membuat informasi baru, memperbarui informasi yang sudah ada, dan mengarsipkan informasi yang kedaluwarsa. Contoh paling umum dari platform manajemen pengetahuan adalah suatu sistem manajemen konten seperti wiki. 

 **Hasil yang diinginkan:** 
+  Anggota tim memiliki akses ke informasi yang akurat secara tepat waktu. 
+  Informasi dapat dicari. 
+  Ada mekanisme untuk menambahkan, memperbarui, dan mengarsipkan informasi. 

 **Anti-pola umum:** 
+ Tidak ada penyimpanan pengetahuan tersentralisasi. Anggota tim mengelola catatan mereka sendiri di mesin mereka secara lokal.
+  Anda memiliki wiki yang di-hosting secara mandiri tetapi tidak ada mekanisme untuk mengelola informasi, yang mengakibatkan informasi menjadi kedaluwarsa. 
+  Seseorang melihat ada informasi yang kurang tetapi tidak ada proses untuk meminta penambahannya ke tim wiki. Mereka menambahkannya sendiri tetapi mereka melewatkan langkah yang penting, sehingga mengakibatkan terjadinya gangguan (outage). 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Anggota tim diberdayakan karena informasi dibagikan secara bebas. 
+  Anggota tim baru menjalani masa orientasi dengan lebih cepat karena dokumentasinya mutakhir dan dapat dicari. 
+  Informasi bersifat tepat waktu, akurat, dan dapat ditindaklanjuti. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Manajemen pengetahuan adalah segi penting dari organisasi yang mau belajar. Untuk memulai, Anda memerlukan tempat penyimpanan terpusat guna menyimpan pengetahuan Anda (contoh yang umum yakni wiki yang di-hosting secara mandiri). Anda harus membuat proses untuk menambahkan, memperbarui, dan mengarsipkan pengetahuan. Buatlah standar mengenai apa yang harus didokumentasikan dan izinkan semua orang memberi kontribusi. 

 **Contoh pelanggan** 

 AnyCompany Retail menghosting Wiki internal tempat semua pengetahuan disimpan. Anggota tim didorong untuk menambahkan pengetahuan seiring pengerjaan tugas sehari-hari mereka. Setiap tiga bulan sekali, tim lintas fungsi mengevaluasi halaman mana yang paling jarang diperbarui dan menentukan apakah halaman tersebut harus diarsipkan atau diperbarui. 

 **Langkah-langkah implementasi** 

1.  Mulailah dengan mengidentifikasi sistem manajemen konten tempat pengetahuan akan disimpan. Dapatkan kesepakatan dari para para pemangku kepentingan di seluruh organisasi Anda. 

   1.  Jika Anda belum memiliki sistem manajemen konten, pertimbangkan untuk menjalankan wiki yang di-hosting secara mandiri atau menggunakan tempat penyimpanan kontrol versi sebagai titik awal. 

1.  Kembangkan runbook untuk menambahkan, memperbarui, dan mengarsipkan informasi. Didik tim Anda tentang proses-proses ini. 

1.  Identifikasi pengetahuan apa yang harus disimpan di sistem manajemen konten. Mulailah dengan aktivitas harian (runbook dan playbook) yang dilakukan anggota tim. Bekerja samalah dengan para pemangku kepentingan untuk memprioritaskan pengetahuan yang akan ditambahkan. 

1.  Secara berkala, bekerja dengan pemangku kepentingan untuk mengidentifikasi out-of-date informasi dan mengarsipkannya atau memperbaruinya. 

 **Tingkat upaya untuk rencana implementasi:** Sedang. Jika Anda belum memiliki sistem manajemen konten, Anda dapat membuat wiki yang di-hosting secara mandiri atau menggunakan tempat penyimpanan dokumen dengan pengontrolan versi. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS11-BP08 Mendokumentasikan dan membagikan pelajaran yang didapatkan](ops_evolve_ops_share_lessons_learned.md) - Manajemen pengetahuan memfasilitasi pembagian informasi tentang pelajaran yang didapatkan. 

 **Dokumen terkait:** 
+ [ Atlassian - Manajemen Pengetahuan ](https://www.atlassian.com/itsm/knowledge-management)

 **Contoh terkait:** 
+ [ DokuWiki ](https://www.dokuwiki.org/dokuwiki)
+ [ Gollum ](https://github.com/gollum/gollum)
+ [ MediaWiki ](https://www.mediawiki.org/wiki/MediaWiki)
+ [ Wiki.js ](https://github.com/Requarks/wiki)

# OPS11-BP05 Menetapkan pendorong untuk perbaikan
<a name="ops_evolve_ops_drivers_for_imp"></a>

 Identifikasi pendorong perbaikan untuk membantu Anda mengevaluasi dan memprioritaskan peluang berdasarkan data dan loop umpan balik. Jelajahi peluang perbaikan di dalam sistem dan proses Anda, dan otomatiskan jika sesuai. 

 **Hasil yang diinginkan:** 
+  Anda melacak data dari seluruh lingkungan Anda. 
+  Anda mengorelasikan peristiwa dan aktivitas dengan hasil bisnis. 
+  Anda dapat mencari kesamaan dan perbedaan di antara lingkungan dan sistem. 
+  Anda memelihara riwayat aktivitas mendetail untuk deployment dan hasil Anda. 
+  Anda mengumpulkan data untuk mendukung postur keamanan Anda. 

 **Anti-pola umum:** 
+  Anda mengumpulkan data dari seluruh lingkungan Anda tetapi tidak mengorelasikan peristiwa dan aktivitas. 
+  Anda mengumpulkan data mendetail dari seluruh estate Anda, dan hal tersebut mendorong aktivitas dan biaya Amazon CloudWatch dan AWS CloudTrail yang tinggi. Namun, Anda tidak menggunakan data ini secara bermakna. 
+  Anda tidak memperhitungkan hasil bisnis ketika menentukan pendorong untuk perbaikan. 
+  Anda tidak mengukur dampak fitur-fitur baru. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Anda meminimalkan dampak motivasi berbasis peristiwa atau investasi emosional dengan menentukan kriteria perbaikan. 
+  Anda merespons peristiwa-peristiwa bisnis, bukan hanya peristiwa teknis. 
+  Anda mengukur lingkungan Anda untuk mengidentifikasi area-area perbaikan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Pahami pendorong perbaikan: Anda sebaiknya hanya melakukan perubahan pada suatu sistem ketika hasil-hasil yang diinginkan didukung. 
  +  Kemampuan yang diinginkan: Lakukan evaluasi terhadap fitur dan kemampuan yang diinginkan saat mengevaluasi peluang-peluang perbaikan. 
    +  [Yang Baru dengan AWS](https://aws.amazon.com/new/) 
  +  Masalah yang tidak dapat diterima: Lakukan evaluasi pada masalah, bug, dan kerentanan yang tidak dapat diterima saat mengevaluasi peluang-peluang perbaikan. Lacak opsi penyesuaian ukuran, dan cari peluang optimalisasi. 
    +  [Buletin Keamanan Terkini AWS](https://aws.amazon.com/security/security-bulletins/) 
    +  [AWS Trusted Advisor](https://aws.amazon.com/premiumsupport/trustedadvisor/) 
    +  [Dasbor Inteligensi Cloud](https://www.wellarchitectedlabs.com/cloud-intelligence-dashboards/) 
  +  Persyaratan kepatuhan: Lakukan evaluasi terhadap pembaruan dan perubahan yang diperlukan untuk mempertahankan kepatuhan Anda terhadap peraturan, kebijakan, atau agar tetap memperoleh dukungan pihak ketiga, saat meninjau peluang untuk perbaikan. 
    +  [Kepatuhan AWS](https://aws.amazon.com/compliance/) 
    +  [Program Kepatuhan AWS](https://aws.amazon.com/compliance/programs/) 
    +  [Berita Terbaru Kepatuhan AWS](https://aws.amazon.com/compliance/compliance-latest-news/) 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS01 Prioritas organisasi](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/organization-priorities.html) 
+  [OPS02 Hubungan dan Kepemilikan](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/relationships-and-ownership.html) 
+  [OPS04-BP01 Identifikasikan indikator performa utama](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_observability_identify_kpis.html) 
+  [OPS08 Memanfaatkan observabilitas beban kerja](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/utilizing-workload-observability.html) 
+  [OPS09 Memahami Kesehatan Operasional](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/understanding-operational-health.html) 
+  [OPS11-BP03 Mengimplementasikan loop umpan balik](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_evolve_ops_feedback_loops.html) 

 **Dokumen terkait:** 
+  [Amazon Athena](https://aws.amazon.com/athena/?whats-new-cards.sort-by=item.additionalFields.postDateTime&whats-new-cards.sort-order=desc) 
+  [Quick](https://aws.amazon.com/quicksight/) 
+  [Kepatuhan AWS](https://aws.amazon.com/compliance/) 
+  [Berita Terbaru Kepatuhan AWS](https://aws.amazon.com/compliance/compliance-latest-news/) 
+  [Program Kepatuhan AWS](https://aws.amazon.com/compliance/programs/) 
+  [AWS Glue](https://aws.amazon.com/glue/?whats-new-cards.sort-by=item.additionalFields.postDateTime&whats-new-cards.sort-order=desc) 
+  [Buletin Keamanan Terkini AWS](https://aws.amazon.com/security/security-bulletins/) 
+  [AWS Trusted Advisor](https://aws.amazon.com/premiumsupport/trustedadvisor/) 
+  [Ekspor data log Anda ke Amazon S3](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/S3Export.html) 
+  [Yang Baru dengan AWS](https://aws.amazon.com/new/) 
+  [Keharusan Inovasi yang Berpusat pada Pelanggan](https://aws.amazon.com/executive-insights/content/the-imperatives-of-customer-centric-innovation/) 
+  [Transformasi Digital: Kehebohan Sementara atau Kebutuhan Strategis?](https://aws.amazon.com/blogs/enterprise-strategy/digital-transformation-hype-or-a-strategic-necessity/) 

 **Video Terkait** 
+  [AWS re:Invent 2023 - Meningkatkan efisiensi operasional dan ketahanan dengan Dukungan (SUP310)](https://youtu.be/jaehZYBNG0Y?si=UNEaLZsXDrxcBgYo) 

# OPS11-BP06 Validasi wawasan
<a name="ops_evolve_ops_validate_insights"></a>

 Tinjau respons dan hasil analisis Anda dengan tim lintas fungsi serta pemilik bisnis. Gunakan tinjauan tersebut untuk menetapkan pemahaman umum, mengidentifikasi dampak-dampak tambahan, dan menentukan alur tindakan. Sesuaikan respons sebagaimana mestinya. 

 **Hasil yang diinginkan:** 
+  Anda meninjau wawasan bersama dengan para pemilik bisnis secara rutin. Pemilik bisnis memberikan konteks tambahan untuk wawasan yang baru diperoleh. 
+  Anda meninjau wawasan dan meminta umpan balik dari rekan-rekan di bidang teknis, dan Anda membagikan pembelajaran Anda ke seluruh tim. 
+  Anda memublikasikan data dan wawasan untuk ditinjau oleh tim teknis dan bisnis lainnya. Anda memperhitungkan pembelajaran Anda untuk praktik-praktik baru oleh departemen lain. 
+  Ringkas dan tinjau wawasan baru bersama para pemimpin senior. Pemimpin senior menggunakan wawasan baru untuk menentukan strategi. 

 **Anti-pola umum:** 
+  Anda merilis fitur baru. Fitur ini mengubah beberapa perilaku pelanggan Anda. Observabilitas Anda tidak memperhitungkan perubahan ini. Anda tidak mengukur manfaat perubahan ini. 
+  Anda mendorong pembaruan baru dan mengabaikan penyegaran AndaCDN. CDNCache tidak lagi kompatibel dengan rilis terbaru. Anda mengukur persentase permintaan dengan kesalahan. Semua pengguna Anda melaporkan HTTP 400 kesalahan saat berkomunikasi dengan server backend. Anda menyelidiki kesalahan klien dan menemukan bahwa waktu Anda terbuang sia-sia karena Anda mengukur dimensi yang salah. 
+  Perjanjian tingkat layanan Anda menetapkan waktu aktif 99,9%, dan sasaran titik pemulihan Anda adalah empat jam. Pemilik layanan menyatakan bahwa sistem memiliki nol waktu henti (down time). Anda mengimplementasikan solusi replikasi yang mahal dan kompleks, yang menyita banyak waktu dan uang. 

 **Manfaat menjalankan praktik terbaik ini: ** 
+  Ketika Anda memvalidasi wawasan bersama para pemilik bisnis dan orang yang ahli di bidangnya, Anda membangun pemahaman yang sama dan memandu perbaikan dengan lebih efektif. 
+  Anda menemukan masalah tersembunyi dan memperhitungkannya untuk keputusan masa depan. 
+  Fokus Anda beralih dari hasil teknis ke hasil bisnis. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  **Validasikan wawasan:** Berinteraksi dengan para pemilik bisnis dan orang yang ahli di bidangnya untuk memastikan ada pemahaman dan kesepakatan bersama tentang makna data yang dikumpulkan. Identifikasi masalah-masalah tambahan, dampak potensial, dan tentukan alur tindakan. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS01-BP06 Mengevaluasi pengorbanan sambil mengelola manfaat dan risiko](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_priorities_eval_tradeoffs.html) 
+  [OPS02-BP06 Tanggung jawab antar tim telah ditentukan sebelumnya atau dinegosiasikan](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_ops_model_def_neg_team_agreements.html) 
+  [OPS11-BP03 Menerapkan loop umpan balik](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_evolve_ops_feedback_loops.html) 

 **Dokumen terkait:** 
+  [Merancang Cloud Center of Excellence (CCOE)](https://aws.amazon.com/blogs/enterprise-strategy/designing-a-cloud-center-of-excellence-ccoe/) 

 **Video terkait:** 
+  [Membangun observabilitas untuk meningkatkan ketahanan](https://youtu.be/6bJkYtrMMPI?si=yu8tVMz4a6ax9f34&t=2695) 

# OPS11-BP07 Lakukan tinjauan metrik operasi
<a name="ops_evolve_ops_metrics_review"></a>

 Lakukan analisis retrospektif rutin terhadap metrik operasi dengan peserta lintas tim dari berbagai area bisnis. Gunakan tinjauan ini untuk mengidentifikasi peluang perbaikan, potensi pilihan tindakan, dan untuk membagikan pelajaran yang diperoleh. Cari peluang perbaikan di semua lingkungan Anda (misalnya pengembangan, pengujian, dan produksi). 

 **Hasil yang diinginkan:** 
+  Anda sering meninjau metrik yang memengaruhi bisnis 
+  Anda mendeteksi dan meninjau anomali melalui kemampuan observabilitas Anda 
+  Anda menggunakan data untuk mendukung hasil dan sasaran bisnis 

 **Anti-pola umum:** 
+  Jendela pemeliharaan Anda mengganggu promosi retail yang signifikan. Bisnis tidak tahu bahwa ada jadwal pemeliharaan standar yang dapat ditunda jika terdapat peristiwa lain yang memengaruhi bisnis. 
+  Anda mengalami pemadaman berkepanjangan karena Anda umumnya menggunakan pustaka yang sudah usang di organisasi Anda. Sejak saat itu Anda beralih ke pustaka yang didukung. Tim-tim lain yang ada di organisasi Anda tidak tahu bahwa mereka terpapar risiko. 
+  Anda tidak secara teratur meninjau pencapaian pelangganSLAs. Anda sedang tren untuk tidak bertemu pelanggan SLAs Anda. Ada hukuman finansial yang terkait dengan tidak bertemu pelanggan SLAs Anda. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Ketika Anda melakukan pertemuan rutin untuk meninjau-metrik metrik operasi, peristiwa, dan insiden, Anda dapat menjaga pemahaman bersama lintas tim. 
+  Tim Anda bertemu secara rutin untuk meninjau metrik dan insiden, yang memposisikan Anda untuk mengambil tindakan terhadap risiko dan mengenali pelanggan. SLAs 
+  Anda berbagi pelajaran yang diperoleh, yang menyediakan data untuk penyusunan prioritas dan perbaikan tertarget untuk hasil bisnis. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Lakukan analisis retrospektif rutin terhadap metrik operasi dengan peserta lintas tim dari berbagai area bisnis. 
+  Libatkan pemangku kepentingan, termasuk tim bisnis, pengembangan, dan operasi, untuk memvalidasi temuan dari umpan balik langsung dan analisis retrospektif, serta untuk membagikan pelajaran yang diperoleh. 
+  Gunakan wawasan mereka untuk mengidentifikasi peluang perbaikan dan potensi pilihan tindakan. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS08-BP05 Buat dasbor](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_workload_observability_create_dashboards.html) 
+  [OPS09-BP03 Meninjau metrik operasi dan memprioritaskan peningkatan](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_operations_health_review_ops_metrics_prioritize_improvement.html) 
+  [OPS10-BP01 Gunakan proses untuk manajemen peristiwa, insiden, dan masalah](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_event_response_event_incident_problem_process.html) 

 **Dokumen terkait:** 
+  [Amazon CloudWatch](https://aws.amazon.com/cloudwatch/) 
+  [ CloudWatch Referensi metrik dan dimensi Amazon](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html) 
+  [Menerbitkan metrik kustom](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/publishingMetrics.html) 
+  [Menggunakan CloudWatch metrik Amazon](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/working_with_metrics.html) 
+  [Dasbor dan visualisasi dengan CloudWatch](https://docs.aws.amazon.com/prescriptive-guidance/latest/implementing-logging-monitoring-cloudwatch/cloudwatch-dashboards-visualizations.html) 

# OPS11-BP08 Mendokumentasikan dan membagikan pelajaran yang didapatkan
<a name="ops_evolve_ops_share_lessons_learned"></a>

 Dokumentasikan dan bagikan pelajaran yang didapatkan dari aktivitas operasional sehingga Anda dapat menggunakannya secara internal dan di seluruh tim. Anda harus membagikan pelajaran yang didapatkan oleh tim Anda guna meningkatkan manfaat di seluruh organisasi Anda. Bagikan informasi dan sumber daya untuk mencegah kesalahan yang dapat dihindari dan memudahkan upaya pengembangan, dan berfokus pada pengiriman fitur-fitur yang diinginkan. 

 Gunakan AWS Identity and Access Management (IAM) untuk menetapkan izin yang memungkinkan akses terkontrol ke sumber daya yang ingin Anda bagikan di dalam dan antarakun. 

 **Hasil yang diinginkan:** 
+  Anda menggunakan repositori terkontrol versi untuk membagikan pustaka aplikasi, prosedur dalam skrip, dokumentasi prosedur, dan dokumentasi sistem lainnya. 
+  Anda membagikan standar infrastruktur Anda dalam bentuk templat AWS CloudFormation terkontrol versi. 
+  Anda meninjau pelajaran yang didapatkan di seluruh tim. 

 **Anti-pola umum:** 
+  Anda mengalami pemadaman berkepanjangan karena organisasi Anda umumnya menggunakan pustaka yang mengandung masalah. Sejak saat itu Anda beralih ke pustaka yang andal. Tim-tim lain di organisasi Anda tidak mengetahui bahwa mereka terpapar risiko. Tidak ada orang yang mendokumentasikan dan membagikan pengalaman dengan pustaka ini, dan mereka tidak menyadari risiko tersebut. 
+  Anda mengidentifikasi sebuah masalah edge di dalam layanan mikro yang digunakan bersama secara internal yang menyebabkan terganggunya sesi. Anda pun memperbarui panggilan Anda ke layanan guna menghindari masalah edge tersebut. Tim-tim lain yang ada di organisasi Anda tidak tahu bahwa mereka terpapar risiko. 
+  Anda menemukan cara untuk mengurangi secara signifikan persyaratan pemanfaatan CPU untuk salah satu layanan mikro Anda. Anda tidak tahu bahwa tim lain bisa memanfaatkan teknik ini. 

 **Manfaat menerapkan praktik terbaik ini:** Bagikan pelajaran yang didapatkan untuk mendukung perbaikan dan memaksimalkan manfaat pengalaman. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Rendah 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  **Dokumentasikan dan bagikan pelajaran yang didapatkan** Miliki prosedur untuk mendokumentasikan pelajaran didapatkan dari aktivitas operasional dan analisis retrospektif agar dapat digunakan oleh tim lain. 
+  **Bagikan pembelajaran:** Miliki prosedur untuk membagikan pelajaran yang didapatkan serta artefak terkait ke seluruh tim. Sebagai contoh, bagikan prosedur, panduan, tata kelola, dan praktik terbaik yang telah diperbarui melalui wiki yang dapat diakses. Bagikan skrip, kode, dan pustaka melalui repositori umum. 
  +  Manfaatkan [AWS re:Post Private](https://aws.amazon.com/repost-private/) sebagai layanan pengetahuan untuk merampingkan kolaborasi dan berbagi pengetahuan dalam organisasi Anda. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS02-BP06 Tanggung jawab antara tim telah dinegosiasikan atau ditetapkan sebelumnya](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_ops_model_def_neg_team_agreements.html) 
+  [OPS05-BP01 Menggunakan kontrol versi](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_dev_integ_version_control.html) 
+  [OPS05-BP06 Membagikan standar desain](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_dev_integ_share_design_stds.html) 
+  [OPS11-BP03 Mengimplementasikan loop umpan balik](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_evolve_ops_feedback_loops.html) 
+  [OPS11-BP07 Melakukan peninjauan metrik operasi](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_evolve_ops_metrics_review.html) 

 **Dokumen terkait:** 
+ [ Tingkatkan kolaborasi dan bagikan pengetahuan cloud secara aman dengan AWS re:Post Private](https://aws.amazon.com/blogs/aws/increase-collaboration-and-securely-share-cloud-knowledge-with-aws-repost-private/)
+ [ Kurangi penundaan proyek dengan solusi docs-as-code ](https://aws.amazon.com/blogs/infrastructure-and-automation/reduce-project-delays-with-docs-as-code-solution/)

 **Video terkait:** 
+ [AWS re:invent 2023 - Berkolaborasi dalam perusahaan Anda dan dengan AWS menggunakan AWS re:Post Private](https://www.youtube.com/watch?v=HNq_kU2QJLU)
+  [Dukungan Anda \$1 Menjelajahi Latihan Diskusi Manajemen Insiden](https://www.youtube.com/watch?v=0m8sGDx-pRM) 

# OPS11-BP09 Alokasikan waktu untuk melakukan perbaikan
<a name="ops_evolve_ops_allocate_time_for_imp"></a>

 Dedikasikan waktu dan sumber daya dalam proses Anda untuk memungkinkan peningkatan bertahap yang berkelanjutan. 

 **Hasil yang diinginkan:** 
+  Anda dapat membuat duplikat lingkungan sementara, yang menurunkan risiko, usaha, serta biaya eksperimen dan pengujian. 
+  Lingkungan duplikat ini dapat digunakan untuk menguji kesimpulan dari analisis dan eksperimen Anda, serta mengembangkan dan menguji peningkatan terencana. 
+  Anda menjalankan gamedays, dan Anda menggunakan Fault Injection Service (FIS) untuk menyediakan kontrol dan pagar pembatas yang dibutuhkan tim untuk menjalankan eksperimen di lingkungan seperti produksi. 

 **Anti-pola umum:** 
+  Ada masalah performa yang diketahui dalam aplikasi Anda. Ini ditambahkan ke backlog di balik setiap implementasi fitur terencana. Jika peringkat fitur terencana yang ditambahkan tetap konstan, masalah performa tidak akan pernah tertangani. 
+  Untuk mendukung peningkatan berkelanjutan yang disetujui, administrator dan developer menggunakan seluruh waktu tambahan mereka untuk memilih dan mengimplementasikan peningkatan. Tidak ada peningkatan yang diselesaikan. 
+  Penerimaan operasional sudah selesai, dan Anda tidak menguji praktik operasional lagi. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan mendedikasikan waktu dan sumber daya dalam proses, Anda memungkinkan peningkatan bertahap yang berkelanjutan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Rendah 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Alokasikan waktu untuk membuat peningkatan: Dedikasikan waktu dan sumber daya dalam proses Anda untuk membuat peningkatan bertahap yang berkelanjutan. 
+  Implementasikan perubahan guna meningkatkan dan mengevaluasi hasil untuk menentukan keberhasilan. 
+  Jika hasilnya tidak memenuhi tujuan, dan peningkatan masih menjadi prioritas, lakukan tindakan alternatif. 
+  Simulasikan beban kerja produksi melalui game day, dan gunakan pembelajaran dari simulasi ini untuk melakukan peningkatan. 

## Sumber daya
<a name="resources"></a>

 **Praktik-praktik terbaik terkait:** 
+  [OPS05-BP08 Gunakan beberapa lingkungan](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_dev_integ_multi_env.html) 

 **Video terkait:** 
+  [AWS RE: invent 2023 - Meningkatkan ketahanan aplikasi dengan Fault Injection Service AWS](https://youtu.be/N0aZZVVZiUw?si=ivYa9ScBfHcj-IAq)