# Keunggulan operasional
<a name="a-operational-excellence"></a>

**Topics**
+ [Organisasi](a-organization.md)
+ [Persiapan](a-prepare.md)
+ [Operasi](a-operate.md)
+ [Evolusi](a-evolve.md)

# Organisasi
<a name="a-organization"></a>

**Topics**
+ [OPS 1 Bagaimana cara menentukan apa saja prioritas Anda?](w2aac19b5b5b5.md)
+ [OPS 2 Bagaimana cara menyusun organisasi untuk mendukung hasil bisnis Anda?](w2aac19b5b5b7.md)
+ [OPS 3 Bagaimana budaya organisasi Anda mendukung hasil bisnis Anda?](w2aac19b5b5b9.md)

# OPS 1 Bagaimana cara menentukan apa saja prioritas Anda?
<a name="w2aac19b5b5b5"></a>

 Setiap orang harus memahami bagian mereka dalam memungkinkan kesuksesan bisnis. Miliki tujuan bersama guna menetapkan prioritas untuk sumber daya. Ini akan memaksimalkan manfaat dari upaya Anda. 

**Topics**
+ [OPS01-BP01 Mengevaluasi kebutuhan pelanggan eksternal](ops_priorities_ext_cust_needs.md)
+ [OPS01-BP02 Mengevaluasi kebutuhan pelanggan internal](ops_priorities_int_cust_needs.md)
+ [OPS01-BP03 Mengevaluasi persyaratan tata kelola](ops_priorities_governance_reqs.md)
+ [OPS01-BP04 Evaluasi persyaratan kepatuhan](ops_priorities_compliance_reqs.md)
+ [OPS01-BP05 Mengevaluasi lanskap ancaman](ops_priorities_eval_threat_landscape.md)
+ [OPS01-BP06 Mengevaluasi kompromi](ops_priorities_eval_tradeoffs.md)
+ [OPS01-BP07 Kelola manfaat dan risiko](ops_priorities_manage_risk_benefit.md)

# OPS01-BP01 Mengevaluasi kebutuhan pelanggan eksternal
<a name="ops_priorities_ext_cust_needs"></a>

 Libatkan pemangku kepentingan utama, termasuk tim bisnis, pengembangan, dan operasional, untuk menentukan ke mana harus memfokuskan usaha terkait kebutuhan pelanggan eksternal. Hal ini akan memastikan bahwa Anda memiliki pemahaman menyeluruh mengenai dukungan operasi yang dibutuhkan untuk mencapai hasil bisnis yang diinginkan. 

 **Antipola umum:** 
+  Anda memutuskan untuk tidak menyediakan dukungan pelanggan di luar jam kerja, tetapi Anda belum meninjau riwayat data permintaan dukungan. Anda tidak tahu apakah hal ini akan memengaruhi pelanggan Anda. 
+  Anda mengembangkan fitur baru tetapi belum melibatkan pelanggan untuk mencari tahu apakah hal tersebut diinginkan—jika diinginkan, dalam bentuk apa—dan belum menjalankan eksperimen untuk memvalidasi kebutuhan serta metode pengiriman. 

 **Manfaat menerapkan praktik terbaik ini:** Pelanggan yang kebutuhannya terpenuhi berpotensi menjadi pelanggan tetap. Mengevaluasi dan memahami kebutuhan pelanggan eksternal akan menginformasikan cara Anda memprioritaskan usaha untuk memberikan nilai bisnis. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Pahami kebutuhan bisnis: Kesuksesan bisnis dapat terwujud dengan adanya tujuan dan pemahaman bersama di seluruh pemangku kepentingan, termasuk tim bisnis, pengembangan, dan operasional. 
  +  Tinjau tujuan bisnis, kebutuhan, dan prioritas pelanggan eksternal: Libatkan pemangku kepentingan utama, termasuk tim bisnis, pengembangan, dan operasional, untuk mendiskusikan tujuan, kebutuhan, dan prioritas pelanggan eksternal. Hal ini memastikan bahwa Anda memiliki pemahaman menyeluruh mengenai dukungan operasional yang dibutuhkan untuk mencapai hasil bisnis dan pelanggan. 
  +  Tetapkan pemahaman bersama: Tetapkan pemahaman bersama terkait fungsi bisnis beban kerja, peran masing-masing tim dalam mengoperasikan beban kerja, dan bagaimana faktor-faktor ini mendukung tujuan bisnis bersama bagi seluruh pelanggan internal dan eksternal. 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Konsep Kerangka Kerja AWS Well-Architected – Loop umpan balik](https://wa.aws.amazon.com/wellarchitected/2020-07-02T19-33-23/wat.concept.feedback-loop.en.html) 

# OPS01-BP02 Mengevaluasi kebutuhan pelanggan internal
<a name="ops_priorities_int_cust_needs"></a>

 Libatkan pemangku kepentingan utama, termasuk tim bisnis, pengembangan, dan operasional, untuk menentukan ke mana harus memfokuskan usaha terkait kebutuhan pelanggan internal. Hal ini akan memastikan bahwa Anda memiliki pemahaman menyeluruh mengenai dukungan operasi yang dibutuhkan untuk mencapai hasil bisnis yang diinginkan. 

 Gunakan prioritas yang ditetapkan untuk memfokuskan usaha peningkatan yang dapat memberikan dampak paling besar (misalnya, mengembangkan keterampilan tim, meningkatkan kinerja beban kerja, mengurangi biaya, mengotomatiskan runbook, atau meningkatkan pemantauan). Perbarui prioritas Anda sesuai perubahan kebutuhan. 

 **Antipola umum:** 
+  Anda memutuskan untuk mengubah alokasi alamat IP untuk tim produk tanpa berkonsultasi dengan mereka agar manajemen jaringan menjadi lebih mudah. Anda tidak tahu dampak yang akan ditimbulkan kepada tim produk. 
+  Anda mengimplementasikan alat pengembangan baru tetapi belum melibatkan pelanggan internal untuk mencari tahu apakah alat itu dibutuhkan atau kompatibel dengan praktik yang sudah ada. 
+  Anda mengimplementasikan sistem pemantauan baru tetapi belum menghubungi pelanggan internal untuk mencari tahu apakah mereka memiliki kebutuhan pemantauan atau pelaporan yang perlu dipertimbangkan. 

 **Manfaat menerapkan praktik terbaik ini:** Mengevaluasi dan memahami kebutuhan pelanggan internal akan menginformasikan cara Anda memprioritaskan usaha untuk memberikan nilai bisnis. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Pahami kebutuhan bisnis: Kesuksesan bisnis dapat terwujud dengan tujuan dan pemahaman bersama di seluruh pemangku kepentingan, termasuk tim bisnis, pengembangan, dan operasional. 
  +  Tinjau tujuan bisnis, kebutuhan, dan prioritas pelanggan internal: Libatkan pemangku kepentingan utama, termasuk tim bisnis, pengembangan, dan operasional, untuk mendiskusikan tujuan, kebutuhan, dan prioritas pelanggan internal. Hal ini memastikan bahwa Anda memiliki pemahaman menyeluruh mengenai dukungan operasional yang dibutuhkan untuk mencapai hasil bisnis dan pelanggan. 
  +  Tetapkan pemahaman bersama: Tetapkan pemahaman bersama terkait fungsi bisnis beban kerja, peran masing-masing tim dalam mengoperasikan beban kerja, dan bagaimana faktor-faktor ini mendukung tujuan bisnis bersama bagi seluruh pelanggan internal dan eksternal. 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Konsep Kerangka Kerja AWS Well-Architected – Loop umpan balik](https://wa.aws.amazon.com/wellarchitected/2020-07-02T19-33-23/wat.concept.feedback-loop.en.html) 

# OPS01-BP03 Mengevaluasi persyaratan tata kelola
<a name="ops_priorities_governance_reqs"></a>

 Pastikan Anda memahami peraturan atau kewajiban, dapat menuntut atau menekankan fokus tertentu, yang ditetapkan oleh organisasi Anda. Evaluasikan faktor internal, seperti kebijakan, standar, dan persyaratan organisasi. Validasikan bahwa Anda memiliki mekanisme untuk mengidentifikasi perubahan tata kelola. Jika persyaratan tata kelola belum teridentifikasi, pastikan bahwa Anda telah menerapkan uji kelayakan untuk penetapan ini. 

 **Antipola umum:** 
+  Anda sedang diaudit dan diminta untuk memberikan bukti kepatuhan terhadap tata kelola internal. Anda tidak mengetahui seberapa patuh Anda karena tidak pernah mengevaluasi apa saja persyaratan kepatuhan Anda. 
+  Anda telah disusupi sehingga mengalami kerugian finansial. Anda mendapati bahwa asuransi yang seharusnya dapat membayar kerugian finansial tersebut bergantung pada implementasi Anda terhadap kontrol keamanan tertentu yang belum diberlakukan dan diwajibkan oleh tata kelola Anda. 
+  Akun administratif Anda telah disusupi sehingga merusak reputasi situs web perusahaan Anda dan menurunkan kepercayaan pelanggan. Tata kelola internal Anda mewajibkan penggunaan Autentikasi Multifaktor (MFA) untuk mengamankan akun administratif. Anda tidak mengamankan akun administratif Anda dengan MFA dan tidak patuh terhadap tindakan pendisiplinan. 

 **Manfaat menerapkan praktik terbaik ini:** Mengevaluasi dan memahami persyaratan tata kelola yang diterapkan oleh organisasi Anda ke beban kerja untuk menginformasikan bagaimana Anda memprioritaskan usaha untuk memberikan nilai bisnis. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Pahami persyaratan tata kelola: Evaluasikan faktor tata kelola internal, seperti kebijakan organisasi atau program, kebijakan program, kebijakan sistem atau masalah tertentu, standar, prosedur, dasar-dasar, serta panduan. Validasikan bahwa Anda memiliki mekanisme untuk mengidentifikasi perubahan tata kelola. Jika persyaratan tata kelola belum teridentifikasi, pastikan bahwa Anda telah menerapkan uji kelayakan untuk penetapan ini. 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Kepatuhan AWS Cloud](https://aws.amazon.com/compliance/) 

# OPS01-BP04 Evaluasi persyaratan kepatuhan
<a name="ops_priorities_compliance_reqs"></a>

 Evaluasi faktor-faktor eksternal, seperti persyaratan kepatuhan terhadap peraturan dan standar industri, untuk memastikan Anda mengetahui pedoman atau kewajiban yang mungkin mewajibkan atau menekankan fokus tertentu. Jika persyaratan kepatuhan belum teridentifikasi, pastikan bahwa Anda menerapkan uji kelayakan untuk penetapan ini. 

 **Antipola umum:** 
+  Anda sedang diaudit dan diminta untuk memberikan bukti kepatuhan terhadap peraturan industri. Anda tidak mengetahui status kepatuhan Anda karena tidak pernah mengevaluasi apa saja persyaratan kepatuhan Anda. 
+  Akun administratif Anda telah disusupi sehingga data pelanggan diunduh dan merusak kepercayaan pelanggan. Praktik terbaik industri Anda mewajibkan penggunaan MFA untuk mengamankan akun administratif. Anda tidak mengamankan akun administratif Anda dengan MFA dan dapat dituntut oleh pelanggan Anda. 

 **Manfaat menerapkan praktik terbaik ini:** Mengevaluasi dan memahami persyaratan kepatuhan yang berlaku untuk beban kerja Anda akan menginformasikan bagaimana Anda memprioritaskan usaha untuk memberikan nilai bisnis. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Pahami persyaratan kepatuhan: Evaluasi faktor-faktor eksternal, seperti persyaratan kepatuhan terhadap peraturan dan standar industri, untuk memastikan Anda mengetahui pedoman atau kewajiban yang mungkin mewajibkan atau menekankan fokus tertentu. Jika persyaratan kepatuhan belum teridentifikasi, pastikan uji kelayakan diterapkan pada penetapan ini. 
  +  Pahami persyaratan kepatuhan terhadap peraturan: Identifikasi persyaratan kepatuhan terhadap peraturan yang secara hukum harus Anda penuhi. Gunakan persyaratan ini untuk memfokuskan upaya Anda. Contohnya antara lain, kewajiban dari undang-undang privasi dan perlindungan data. 
    +  [AWS Kepatuhan](https://aws.amazon.com/compliance/) 
    +  [AWS Program Kepatuhan](https://aws.amazon.com/compliance/programs/) 
    +  [AWS Berita Terbaru Tentang Kepatuhan](https://aws.amazon.com/compliance/compliance-latest-news/) 
  +  Pahami praktik terbaik dan standar industri: Identifikasi persyaratan praktik terbaik dan standar industri yang berlaku untuk beban kerja Anda, seperti Standar Keamanan Data Industri Kartu Pembayaran (PCI DSS). Gunakan persyaratan ini untuk memfokuskan upaya Anda. 
    +  [AWS Program Kepatuhan](https://aws.amazon.com/compliance/programs/) 
  +  Pahami persyaratan kepatuhan internal: Identifikasi persyaratan kepatuhan dan praktik terbaik yang ditetapkan oleh organisasi Anda. Gunakan persyaratan ini untuk memfokuskan upaya Anda. Contohnya antara lain, standar klasifikasi data dan kebijakan keamanan informasi. 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [AWS Cloud Kepatuhan](https://aws.amazon.com/compliance/) 
+  [AWS Kepatuhan](https://aws.amazon.com/compliance/) 
+  [AWS Berita Terbaru Tentang Kepatuhan](https://aws.amazon.com/compliance/compliance-latest-news/) 
+  [AWS Program Kepatuhan](https://aws.amazon.com/compliance/programs/) 

# OPS01-BP05 Mengevaluasi lanskap ancaman
<a name="ops_priorities_eval_threat_landscape"></a>

 Evaluasi ancaman pada bisnis (misalnya, persaingan, risiko dan kewajiban bisnis, risiko operasional, serta ancaman keamanan informasi) dan pelihara informasi yang ada di registri risiko. Sertakan dampak risiko ketika menentukan ke mana upaya harus difokuskan. 

 Kerangka kerja [Well-Architected Framework](https://aws.amazon.com/architecture/well-architected/) menekankan pembelajaran, pengukuran, dan peningkatan. Framework menyediakan pendekatan yang konsisten bagi Anda untuk mengevaluasi arsitektur, dan mengimplementasikan desain yang akan mengalami penskalaan seiring waktu. AWS menyediakan [AWS Well-Architected Tool](https://aws.amazon.com/well-architected-tool/) untuk membantu Anda meninjau pendekatan sebelum pengembangan, status beban kerja Anda sebelum produksi, dan status beban kerja Anda dalam produksi. Anda dapat membandingkannya dengan praktik terbaik arsitektur AWS terkini, memantau keseluruhan status beban kerja Anda, dan mendapatkan wawasan tentang potensi risiko. 

 Pelanggan AWS memenuhi syarat untuk Tinjauan Well-Architected terpandu tentang beban kerja misi penting mereka untuk [mengukur arsitektur mereka](https://aws.amazon.com/premiumsupport/programs/) berdasarkan praktik terbaik AWS. Pelanggan Dukungan Korporat memenuhi syarat untuk [Tinjauan Operasi](https://aws.amazon.com/premiumsupport/programs/), yang dirancang untuk membantu mereka mengidentifikasi celah dalam pendekatan operasi di cloud mereka. 

 Interaksi lintas tim pada tinjauan ini membantu membangun pemahaman bersama tentang beban kerja Anda serta bagaimana peran tim membantu meraih keberhasilan. Kebutuhan yang diidentifikasi melalui tinjauan dapat membantu membentuk prioritas Anda. 

 [AWS Trusted Advisor](https://aws.amazon.com/premiumsupport/technology/trusted-advisor/) adalah alat yang menyediakan akses ke set inti pemeriksaan yang menyarankan optimalisasi yang dapat membantu membentuk prioritas Anda. [Pelanggan Dukungan Bisnis dan Korporat](https://aws.amazon.com/premiumsupport/plans/) menerima akses ke pemeriksaan tambahan yang berfokus pada keamanan, keandalan, kinerja, dan optimalisasi biaya yang dapat membantu membentuk prioritas mereka lebih lanjut. 

 **Antipola umum:** 
+  Anda menggunakan pustaka perangkat lunak versi lama dalam produk Anda. Anda tidak tahu bahwa ada pembaruan keamanan pustaka untuk masalah yang mungkin memiliki dampak yang tidak diinginkan pada beban kerja Anda. 
+  Kompetitor Anda baru saja merilis versi produk mereka yang mengatasi keluhan pelanggan Anda tentang produk Anda. Anda belum memprioritaskan penanganan masalah-masalah yang dikenal ini. 
+  Pembuat peraturan telah menyasar perusahaan yang tidak mematuhi persyaratan kepatuhan hukum seperti Anda. Anda belum memprioritaskan penanganan persyaratan kepatuhan Anda yang belum terpenuhi. 

 **Manfaat menjalankan praktik terbaik ini:** Identifikasi dan pemahaman tentang ancaman terhadap organisasi dan beban kerja Anda dapat membantu Anda menentukan ancaman mana yang harus ditangani, tingkat prioritasnya, serta sumber daya yang diperlukan untuk melakukannya. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Evaluasi lanskap ancaman: Evaluasi ancaman terhadap bisnis (misalnya kompetisi, risiko dan kewajiban bisnis, risiko operasional, dan ancaman keamanan informasi), sehingga Anda dapat menyertakan dampaknya ketika menentukan ke mana upaya perlu difokuskan. 
  +  [Buletin Keamanan Terkini AWS](https://aws.amazon.com/security/security-bulletins/) 
  +  [AWS Trusted Advisor](https://aws.amazon.com/premiumsupport/trustedadvisor/) 
  +  Pelihara model ancaman: Buat dan pelihara model ancaman yang mengidentifikasi potensi ancaman, mitigasi terencana dan sedang diterapkan, serta prioritasnya. Tinjau kemungkinan ancaman yang berwujud insiden, biaya untuk melakukan pemulihan dari insiden tersebut serta perkiraan bahaya yang ditimbulkan, dan biaya untuk mencegah insiden tersebut. Revisi proritas seiring perubahan konten model ancaman. 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Kepatuhan AWS Cloud](https://aws.amazon.com/compliance/) 
+  [Buletin Keamanan Terkini AWS](https://aws.amazon.com/security/security-bulletins/) 
+  [AWS Trusted Advisor](https://aws.amazon.com/premiumsupport/trustedadvisor/) 

# OPS01-BP06 Mengevaluasi kompromi
<a name="ops_priorities_eval_tradeoffs"></a>

 Evaluasi dampak kompromi antarkepentingan yang bertentangan atau pendekatan alternatif, untuk membantu mengambil keputusan yang matang saat menentukan ke mana upaya perlu difokuskan atau memiliki opsi tindakan. Misalnya, meningkatkan kecepatan masuk pasar untuk fitur baru dapat diprioritaskan daripada optimalisasi biaya, atau Anda bisa memilih basis data relasional untuk data non-relasional guna menyederhanakan upaya migrasi sistem, dibandingkan bermigrasi ke basis data yang dioptimalkan untuk tipe data Anda dan memperbarui aplikasi Anda. 

 AWS dapat membantu mengedukasi tim Anda tentang AWS dan layanannya untuk meningkatkan pemahaman mereka tentang bagaimana pilihan mereka dapat menimbulkan dampak pada beban kerja. Anda harus menggunakan sumber daya yang disediakan oleh [AWS Dukungan](https://aws.amazon.com/premiumsupport/programs/) ([Pusat Pengetahuan AWS](https://aws.amazon.com/premiumsupport/knowledge-center/), [Forum Diskusi AWS](https://forums.aws.amazon.com/index.jspa), dan [Pusat AWS Dukungan](https://console.aws.amazon.com/support/home/)) dan [Dokumentasi AWS](https://docs.aws.amazon.com/) untuk mengedukasi tim Anda. Hubungi AWS Dukungan melalui Pusat AWS Dukungan jika Anda memiliki pertanyaan seputar AWS. 

 AWS juga membagikan pola dan praktik terbaik yang telah kami pelajari melalui operasi AWS di [Amazon Builders' Library](https://aws.amazon.com/builders-library/). Beragam jenis informasi berguna lainnya dapat diakses melalui [Blog AWS](https://aws.amazon.com/blogs/) dan [Podcast AWS Resmi](https://aws.amazon.com/podcasts/aws-podcast/). 

 **Antipola umum:** 
+  Anda menggunakan basis data relasional untuk mengelola data seri waktu dan non-relasional. Terdapat opsi-opsi basis data yang dioptimalkan untuk mendukung tipe data yang Anda gunakan tetapi Anda tidak menyadari manfaatnya karena Anda belum mengevaluasi kompromi antarsolusi. 
+  Investor Anda meminta Anda mendemonstrasikan kepatuhan terhadap Standar Keamanan Data Industri Kartu Pembayaran (PCI DSS). Anda tidak mempertimbangkan kompromi antara memenuhi permintaan mereka dan melanjutkan upaya pengembangan Anda saat ini. Alih-alih, Anda melanjutkan upaya pengembangan tanpa menunjukkan kepatuhan. Investor Anda menghentikan dukungan untuk perusahaan Anda karena mengkhawatirkan keamanan platform Anda serta investasi mereka. 

 **Manfaat menjalankan praktik terbaik ini:** Memahami implikasi dan konsekuensi pilihan yang Anda ambil dapat membantu Anda membuat prioritas opsi. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Evaluasi kompromi: Evaluasi dampak kompromi antarkepentingan yang bertentangan untuk membantu mengambil keputusan yang matang saat menentukan ke mana upaya perlu difokuskan. Misalnya, mempercepat waktu masuk pasar untuk fitur baru dapat diprioritaskan daripada optimalisasi biaya. 
+  AWS dapat membantu mengedukasi tim Anda tentang AWS dan layanannya untuk meningkatkan pemahaman mereka tentang bagaimana pilihan mereka dapat menimbulkan dampak pada beban kerja. Anda harus menggunakan sumber daya yang disediakan oleh AWS Dukungan (Pusat Pengetahuan AWS, Forum DiskusiAWS, dan Pusat AWS Dukungan) serta Dokumentasi AWS untuk mengedukasi tim Anda. Hubungi AWS Dukungan melalui Pusat AWS Dukungan jika Anda memiliki pertanyaan seputar AWS. 
+  AWS juga membagikan pola dan praktik terbaik yang telah kami pelajari melalui operasi AWS di Amazon Builders’ Library. Beragam jenis informasi berguna lainnya dapat diakses melalui Blog AWS dan Podcast AWS Resmi. 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Blog AWS](https://aws.amazon.com/blogs/) 
+  [Kepatuhan AWS Cloud](https://aws.amazon.com/compliance/) 
+  [Forum Diskusi AWS](https://forums.aws.amazon.com/index.jspa) 
+  [Dokumentasi AWS](https://docs.aws.amazon.com/) 
+  [Pusat Pengetahuan AWS](https://aws.amazon.com/premiumsupport/knowledge-center/) 
+  [AWS Dukungan](https://aws.amazon.com/premiumsupport/) 
+  [Pusat AWS Dukungan](https://console.aws.amazon.com/support/home/) 
+  [Amazon Builders' Library](https://aws.amazon.com/builders-library/) 
+  [Podcast AWS Resmi](https://aws.amazon.com/podcasts/aws-podcast/) 

# OPS01-BP07 Kelola manfaat dan risiko
<a name="ops_priorities_manage_risk_benefit"></a>

 Kelola manfaat dan risiko untuk mengambil keputusan yang bijaksana ketika menentukan di mana akan memfokuskan upaya. Contohnya, mungkin akan bermanfaat untuk melakukan deploy beban kerja dengan masalah yang tak terselesaikan sehingga fitur baru yang signifikan dapat dibuat tersedia bagi pelanggan. Risiko terkait mungkin dapat dimitigasi, atau membiarkan risiko tetap ada mungkin menjadi tidak dapat diterima, jika demikian, Anda akan mengambil tindakan untuk mengatasi risiko tersebut. 

 Anda mungkin mendapatkan bahwa Anda ingin menekankan subset kecil prioritas pada titik waktu tertentu. Gunakan pendekatan yang seimbang dalam jangka panjang untuk memastikan pengembangan kemampuan yang diperlukan dan pengelolaan risiko. Perbarui prioritas Anda sesuai perubahan kebutuhan 

 **Antipola umum:** 
+  Anda telah memutuskan untuk menyertakan pustaka yang melakukan semua yang Anda perlukan yang ditemukan salah satu developer Anda di internet. Anda belum mengevaluasi risiko adopsi pustaka ini dari sumber tak dikenal dan Anda tidak tahu jika pustaka memiliki kelemahan atau kode jahat. 
+  Anda telah memutuskan untuk mengembangkan dan melakukan deploy fitur baru dan bukannya memperbaiki masalah yang ada. Anda belum mengevaluasi risiko meninggalkan masalah sampai fitur dilakukan deploy dan Anda tidak tahu apa saja dampaknya pada pelanggan Anda. 
+  Anda telah memutuskan untuk tidak melakukan deploy fitur yang sering diminta oleh pelanggan karena masalah yang tidak jelas dari tim kepatuhan Anda. 

 **Manfaat menerapkan praktik terbaik ini:** Mengidentifikasi manfaat yang tersedia dari pilihan Anda, dan menyadari risiko terhadap organisasi Anda, memungkinkan Anda untuk mengambil keputusan yang bijaksana. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Rendah 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Kelola manfaat dan risiko: Seimbangkan manfaat dari keputusan terhadap risiko yang terlibat. 
  +  Identifikasi manfaat: Identifikasi manfaat berdasarkan tujuan, kebutuhan, dan prioritas bisnis. Contohnya antara lain waktu masuk pasar, keamanan, keandalan, performa, dan biaya. 
  +  Identifikasi risiko: Identifikasi risiko berdasarkan tujuan, kebutuhan, dan prioritas bisnis. Contohnya antara lain waktu masuk pasar, keamanan, keandalan, performa, dan biaya. 
  +  Evaluasi manfaat dibandingkan risiko dan ambil keputusan yang bijaksana: Tentukan dampak manfaat dan risiko berdasarkan tujuan, kebutuhan, dan prioritas pemangku kepentingan utama Anda, termasuk bagian bisnis, pengembangan, dan operasi. Evaluasi nilai manfaat dibandingkan dengan probabilitas terwujudnya risiko dan kerugian dampaknya. Contohnya, menekankan kecepatan masuk pasar dan bukannya keandalan dapat memberikan keunggulan yang bersaing. Tetapi, ini dapat mengakibatkan berkurangnya waktu aktif jika ada masalah keandalan. 

# OPS 2 Bagaimana cara menyusun organisasi untuk mendukung hasil bisnis Anda?
<a name="w2aac19b5b5b7"></a>

 Tim Anda harus memahami bagian mereka dalam mencapai hasil bisnis. Tim harus memahami peran mereka dalam kesuksesan tim lain, peran tim lain dalam kesuksesan mereka, dan memiliki tujuan bersama. Memahami tanggung jawab, kepemilikan, bagaimana keputusan diambil, dan siapa yang memiliki otoritas untuk mengambil keputusan akan membantu memfokuskan upaya dan memaksimalkan manfaat dari tim Anda. 

**Topics**
+ [OPS02-BP01 Sumber daya memiliki pemilik teridentifikasi](ops_ops_model_def_resource_owners.md)
+ [OPS02-BP02 Proses dan Prosedur memiliki pemilik teridentifikasi](ops_ops_model_def_proc_owners.md)
+ [OPS02-BP03 Aktivitas operasi memiliki pemilik teridentifikasi yang bertanggung jawab atas kinerjanya](ops_ops_model_def_activity_owners.md)
+ [OPS02-BP04 Anggota tim tahu tanggung jawab mereka](ops_ops_model_know_my_job.md)
+ [OPS02-BP05 Mekanisme tersedia untuk mengidentifikasi tanggung jawab dan kepemilikan](ops_ops_model_find_owner.md)
+ [OPS02-BP06 Mekanisme tersedia untuk meminta penambahan, perubahan, dan pengecualian](ops_ops_model_req_add_chg_exception.md)
+ [OPS02-BP07 Tanggung jawab antara tim telah dinegosiasi atau ditetapkan sebelumnya](ops_ops_model_def_neg_team_agreements.md)

# OPS02-BP01 Sumber daya memiliki pemilik teridentifikasi
<a name="ops_ops_model_def_resource_owners"></a>

 Pahami siapa yang memegang kepemilikan dari setiap aplikasi, beban kerja, platform, dan komponen infrastruktur, nilai bisnis apa yang diberikan oleh komponen, serta alasan adanya kepemilikan tersebut. Memahami nilai bisnis dari masing-masing komponen dan bagaimana komponen tersebut mendukung hasil bisnis dapat memberikan informasi tentang proses dan prosedur yang diterapkan padanya. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan memahami kepemilikan, Anda dapat mengidentifikasi siapa yang dapat menyetujui pengembangan, mengimplementasikan pengembangan tersebut, atau melakukan keduanya. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Sumber daya memiliki pemilik yang teridentifikasi: Tentukan pentingnya kepemilikan untuk kasus penggunaan sumber daya di lingkungan Anda. Sebutkan dan catat pemilik untuk sumber daya, yang mencakup setidaknya nama, informasi kontak, organisasi, serta tim. Simpan informasi kepemilikan sumber daya menggunakan metadata seperti tanda atau grup sumber daya. Gunakan AWS Organizations untuk menyusun akun dan mengimplementasikan kebijakan guna memastikan kepemilikan dan informasi kontak terdokumentasi. 
  +  Tentukan bentuk kepemilikan dan cara penetapannya: Kepemilikan dapat memiliki beberapa definisi dengan kasus penerapan yang berbeda di organisasi Anda. Anda dapat menetapkan pemilik beban kerja sebagai individu yang memiliki risiko dan kewajiban operasi beban kerja, serta memiliki otoritas untuk membuat keputusan terkait beban kerja. Anda dapat menetapkan kepemilikan dengan ketentuan tanggung jawab administratif dan keuangan jika kepemilikan diperluas ke organisasi induk. Developer dapat menjadi pemilik lingkungan pengembangannya serta bertanggung jawab atas insiden yang disebabkan oleh operasi tersebut. Peran produknya juga bertanggung jawab atas biaya keuangan yang terkait dengan operasi pengembangan mereka. 
  +  Tentukan siapa yang memiliki organisasi, akun, kumpulan sumber daya, atau komponen individu: Tentukan dan catat kepemilikan di dalam lokasi yang dapat diakses dengan sesuai dan diorganisasi untuk mendukung penemuan. Perbarui definisi dan detail kepemilikan jika ada perubahan. 
  +  Dokumentasikan kepemilikan dalam metadata untuk sumber daya: Dokumentasikan kepemilikan sumber daya menggunakan metadata seperti tanda atau grup sumber daya, yang menyebutkan informasi kontak dan kepemilikan. Gunakan AWS Organizations untuk menyusun dan memastikan kepemilikan, serta memastikan bahwa informasi kontak terdokumentasi. 

# OPS02-BP02 Proses dan Prosedur memiliki pemilik teridentifikasi
<a name="ops_ops_model_def_proc_owners"></a>

 Pahami siapa pemegang kepemilikan atas definisi dari masing-masing proses dan prosedur, alasan prosedur dan proses tertentu digunakan, serta alasan adanya kepemilikan tersebut. Dengan memahami alasan untuk menggunakan proses dan prosedur tertentu, identifikasi peluang pengembangan yang dapat dilakukan. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan memahami kepemilikan, Anda dapat mengidentifikasi siapa yang dapat menyetujui pengembangan, mengimplementasikan pengembangan tersebut, atau melakukan keduanya. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Proses dan prosedur memiliki pemilik teridentifikasi yang bertanggung jawab atas definisinya: Dokumentasikan proses dan prosedur yang digunakan di lingkungan Anda, serta individu atau tim yang bertanggung jawab atas definisinya. 
  +  Identifikasikan proses dan prosedur: Identifikasi aktivitas operasi yang dijalankan untuk mendukung beban kerja Anda. Dokumentasikan aktivitas ini di lokasi yang mudah ditemukan. 
  +  Tentukan siapa yang memiliki definisi proses atau prosedur: Identifikasi secara khusus individu atau tim yang bertanggung jawab atas spesifikasi aktivitas. Mereka bertanggung jawab untuk memastikan aktivitas dapat dijalankan dengan sukses oleh anggota tim yang memiliki keterampilan memadai dengan izin, akses, serta alat yang sesuai. Jika terdapat masalah saat menjalankan aktivitas tersebut, anggota tim yang menjalankannya bertanggung jawab untuk memberikan tanggapan mendetail yang diperlukan agar aktivitas tersebut dapat ditingkatkan. 
  +  Dokumentasikan kepemilikan di metadata artefak aktivitas: Prosedur yang diotomatiskan dalam layanan seperti AWS Systems Manager, melalui dokumen, dan AWS Lambda, sebagai fungsi, mendukung dokumentasi informasi metadata sebagai tanda. Dokumentasikan kepemilikan sumber daya menggunakan grup sumber daya atau tanda, yang menentukan informasi kontak dan kepemilikan. Gunakan AWS Organizations untuk membuat kebijakan penandaan serta memastikan dokumentasi informasi kontak serta kepemilikan. 

# OPS02-BP03 Aktivitas operasi memiliki pemilik teridentifikasi yang bertanggung jawab atas kinerjanya
<a name="ops_ops_model_def_activity_owners"></a>

 Pahami siapa yang bertanggung jawab untuk menjalankan aktivitas tertentu terhadap beban kerja yang ditentukan serta alasan adanya tanggung jawab tersebut. Memahami siapa yang bertanggung jawab untuk menjalankan aktivitas dapat memberikan informasi tentang siapa yang akan melakukan aktivitas tersebut, memvalidasi hasilnya, serta memberikan umpan balik kepada pemilik aktivitas. 

 **Manfaat menerapkan praktik terbaik ini:** Memahami siapa yang bertanggung jawab untuk menjalankan sebuah aktivitas dapat memberikan informasi tentang siapa yang harus diberi tahu saat diperlukan tindakan dan siapa yang akan melakukan tindakan, memvalidasi hasilnya, serta memberikan umpan balik kepada pemilik aktivitas tersebut. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Aktivitas operasi memiliki pemilik teridentifikasi yang bertanggung jawab atas kinerjanya: Dokumentasikan tanggung jawab untuk menjalankan proses dan prosedur yang digunakan di lingkungan Anda. 
  +  Identifikasikan proses dan prosedur: Identifikasi aktivitas operasi yang dijalankan untuk mendukung beban kerja Anda. Dokumentasikan aktivitas ini di lokasi yang mudah ditemukan. 
  +  Tentukan siapa yang bertanggung jawab untuk menjalankan setiap aktivitas: Identifikasikan tim yang bertanggung jawab atas aktivitas. Pastikan mereka memiliki detail aktivitas, keterampilan yang diperlukan dan izin yang tepat, akses, dan alat yang sesuai untuk menjalankan aktivitas. Mereka harus memahami kapan aktivitas tersebut harus dijalankan (misalnya, sesuai peristiwa atau jadwal). Buat informasi ini dapat ditemukan sehingga para anggota organisasi Anda dapat mengidentifikasi siapa yang perlu mereka hubungi, tim atau individu, untuk kebutuhan tertentu. 

# OPS02-BP04 Anggota tim tahu tanggung jawab mereka
<a name="ops_ops_model_know_my_job"></a>

 Memahami tanggung jawab peran Anda dan bagaimana Anda berkontribusi terhadap hasil bisnis memberitahukan penentuan prioritas tugas Anda dan mengapa peran Anda itu penting. Ini memampukan anggota tim untuk mengenali kebutuhan dan merespons dengan tepat. 

 **Manfaat menerapkan praktik terbaik ini:** Memahami tanggung jawab Anda memberitahukan keputusan yang Anda ambil, tindakan yang Anda ambil, dan penyerahan aktivitas Anda ke pemiliknya yang benar. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Pastikan anggota tim memahami peran dan tanggung jawab mereka: Identifikasi peran dan tanggung jawab anggota tim dan pastikan mereka memahami yang diharapkan dari peran mereka. Buat informasi ini dapat ditemukan sehingga para anggota organisasi Anda dapat mengidentifikasi siapa yang perlu mereka kontak, tim atau individu, untuk kebutuhan tertentu. 

# OPS02-BP05 Mekanisme tersedia untuk mengidentifikasi tanggung jawab dan kepemilikan
<a name="ops_ops_model_find_owner"></a>

 Apabila tidak ada individu atau tim yang diidentifikasi, terdapat jalur eskalasi yang ditetapkan ke seseorang yang memiliki wewenang untuk menetapkan kepemilikan atau rencana untuk penanganan kebutuhan tersebut. 

 **Manfaat menjalankan praktik terbaik ini:** Dengan memahami siapa yang memiliki tanggung jawab atau kepemilikan, Anda dapat menghubungi tim atau anggota tim yang tepat untuk melakukan permintaan atau mengalihkan tugas. Dengan adanya orang yang diidentifikasi yang memiliki wewenang untuk menetapkan tanggung jawab atau kepemilikan atau rencana untuk menangani kebutuhan, risiko tidak adanya aksi dan tidak tertanganinya kebutuhan dapat diminimalkan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Mekanisme tersedia untuk mengidentifikasi tanggung jawab dan kepemilikan: Sediakan mekanisme yang dapat diakses bagi anggota organisasi untuk menemukan dan mengidentifikasi kepemilikan dan tanggung jawab. Mekanisme ini memungkinkan mereka untuk mengidentifikasi siapa yang harus dihubungi, baik tim maupun individu, untuk kebutuhan tertentu. 

# OPS02-BP06 Mekanisme tersedia untuk meminta penambahan, perubahan, dan pengecualian
<a name="ops_ops_model_req_add_chg_exception"></a>

 Anda dapat melakukan permintaan kepada pemilik proses, prosedur, dan sumber daya. Buat keputusan yang matang untuk menyetujui permintaan apabila memungkinkan dan dianggap tepat setelah dilakukan evaluasi manfaat dan risiko. 

 **Manfaat menjalankan praktik terbaik ini:** Tersedianya mekanisme sangat penting untuk meminta penambahan, perubahan, dan pengecualian guna mendukung aktivitas tim. Tanpa opsi ini, status yang ada akan menjadi kendala inovasi. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Mekanisme tersedia untuk meminta penambahan, perubahan, dan pengecualian: Ketika standar kaku, inovasi terkendala. Sediakan mekanisme untuk anggota organisasi Anda untuk melakukan permintaan kepada pemilik proses, prosedur, dan sumber daya guna mendukung kebutuhan bisnis mereka. 

# OPS02-BP07 Tanggung jawab antara tim telah dinegosiasi atau ditetapkan sebelumnya
<a name="ops_ops_model_def_neg_team_agreements"></a>

 Miliki perjanjian yang telah ditetapkan atau dinegosiasi antara tim yang menjelaskan bagaimana mereka akan bekerja sama dan saling mendukung satu sama lain (contohnya, waktu respons, tujuan tingkat layanan, atau perjanjian tingkat layanan). Memahami dampak dari pekerjaan tim atas hasil bisnis, dan hasil dari tim lain dan organisasi, memberitahukan penentuan prioritas tugas mereka dan memampukan mereka untuk merespons dengan tepat. 

 Ketika tanggung jawab dan kepemilikan tidak ditetapkan atau tidak diketahui, Anda menanggung risiko tidak menangani aktivitas yang diperlukan secara tepat waktu serta risiko munculnya upaya yang berulang dan kemungkinan bertentangan untuk menangani kebutuhan-kebutuhan tersebut. 

 **Manfaat menerapkan praktik terbaik ini:** Menetapkan tanggung jawab antara tim, tujuan, dan metode untuk mengomunikasikan kebutuhan, mempermudah aliran permintaan dan membantu memastikan informasi yang diperlukan akan diberikan. Ini mengurangi penundaan akibat tugas transisi antara tim dan membantu mendukung pencapaian hasil bisnis. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Rendah 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Tanggung jawab antara tim telah dinegosiasi atau ditetapkan sebelumnya: Menentukan metode interaksi tim, dan informasi yang diperlukan oleh mereka untuk mendukung satu sama lain, dapat membantu meminimalkan penundaan yang terjadi karena permintaan secara berulang ditinjau dan diklarifikasi. Memiliki perjanjian spesifik yang menetapkan harapan (contohnya, waktu respons, atau waktu penyelesaian) memampukan tim untuk membuat rencana dan sumber daya yang efektif dengan baik. 

# OPS 3 Bagaimana budaya organisasi Anda mendukung hasil bisnis Anda?
<a name="w2aac19b5b5b9"></a>

 Berikan dukungan kepada anggota tim Anda sehingga mereka dapat menjadi lebih efektif dalam mengambil tindakan dan mendukung hasil bisnis Anda. 

**Topics**
+ [OPS03-BP01 Sponsor Eksekutif](ops_org_culture_executive_sponsor.md)
+ [OPS03-BP02 Anggota tim diberdayakan untuk bertindak ketika terdapat risiko pada hasil](ops_org_culture_team_emp_take_action.md)
+ [OPS03-BP03 Imbauan eskalasi](ops_org_culture_team_enc_escalation.md)
+ [OPS03-BP04 Komunikasi yang tepat waktu, jelas, dan dapat ditindaklanjuti](ops_org_culture_effective_comms.md)
+ [OPS03-BP05 Mendorong eksperimen](ops_org_culture_team_enc_experiment.md)
+ [OPS03-BP06 Mendorong dan mendukung anggota tim untuk mempertahankan dan mengembangkan tingkat keterampilan mereka](ops_org_culture_team_enc_learn.md)
+ [OPS03-BP07 Bekali tim dengan sumber daya dengan sesuai](ops_org_culture_team_res_appro.md)
+ [OPS03-BP08 Pendapat yang beragam didukung dan dicari di dalam dan lintas tim](ops_org_culture_diverse_inc_access.md)

# OPS03-BP01 Sponsor Eksekutif
<a name="ops_org_culture_executive_sponsor"></a>

 Pimpinan senior dengan jelas menetapkan ekspektasi untuk organisasi dan mengevaluasi kesuksesan. Pimpinan senior adalah sponsor, pendukung, dan pendorong untuk pengadopsian praktik terbaik serta perkembangan organisasi. 

 **Manfaat menerapkan praktik terbaik ini:** Pimpinan yang terlibat, ekspektasi yang dikomunikasikan dengan jelas, serta tujuan bersama, dapat memastikan anggota tim mengetahui apa yang diharapkan dari mereka. Dengan mengevaluasi kesuksesan, penghalang kesuksesan dapat diidentifikasi, sehingga dapat diatasi melalui intervensi oleh pendukung sponsor atau delegasinya. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Sponsor Eksekutif: Pimpinan senior dengan jelas menetapkan ekspektasi untuk organisasi dan mengevaluasi kesuksesan. Pimpinan senior adalah sponsor, pendukung, dan pendorong untuk pengadopsian praktik terbaik serta perkembangan organisasi. 
  +  Tetapkan ekspektasi: Tentukan dan publikasikan tujuan untuk organisasi Anda, termasuk cara mengukur tujuan tersebut. 
  +  Lacak capaian tujuan: Ukur capaian bertahap dari tujuan secara rutin serta bagikan hasilnya, agar tindakan yang sesuai dapat segera dilakukan jika hasil sedang dipertaruhkan. 
  +  Sediakan sumber daya yang diperlukan untuk mencapai target Anda: Lakukan peninjauan secara rutin apakah sumber daya masih sesuai, atau berikan sumber daya tambahan jika diperlukan, berdasarkan pada: informasi baru, perubahan target, tanggung jawab, atau lingkungan bisnis Anda. 
  +  Dukung tim Anda: Tetap berinteraksi dengan tim Anda sehingga Anda memahami bagaimana kondisi mereka dan mengetahui jika ada faktor eksternal yang memengaruhi mereka. Ketika ada faktor eksternal yang memengaruhi kinerja mereka, evaluasi kembali tujuan dan sesuaikan target sebagaimana mestinya. Identifikasikan masalah yang menghambat kemajuan tim Anda. Bertindaklah atas nama tim Anda untuk membantu mengatasi masalah dan menghilangkan beban yang tidak perlu. 
  +  Jadilah penggerak untuk pengadopsian praktik terbaik: Identifikasikan praktik terbaik yang terbukti memberikan manfaat terukur serta beri pengakuan kepada pencipta dan penggunanya. Dukung adopsi lebih lanjut untuk memperbesar manfaat yang dapat dicapai. 
  +  Jadilah penggerak perkembangan tim Anda: Ciptakan budaya peningkatan berkelanjutan. Dukung peningkatan dan perkembangan yang dicapai baik oleh perorangan maupun organisasi. Berikan target jangka panjang yang harus dikejar dan mengharuskan pencapaian bertahap dari waktu ke waktu. Sesuaikan visi ini untuk menyempurnakan kebutuhan, tujuan bisnis, serta lingkungan bisnis Anda seiring dengan perubahannya. 

# OPS03-BP02 Anggota tim diberdayakan untuk bertindak ketika terdapat risiko pada hasil
<a name="ops_org_culture_team_emp_take_action"></a>

 Pemilik beban kerja telah menetapkan panduan dan cakupan yang memberdayakan anggota tim untuk merespons ketika terdapat risiko pada hasil. Mekanisme eskalasi digunakan untuk mendapatkan petunjuk ketika peristiwa berada di luar cakupan yang ditetapkan. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan menguji dan memvalidasi perubahan sejak dini, Anda dapat mengatasi masalah dengan biaya minim dan membatasi dampak terhadap pelanggan. Dengan menguji sebelum deployment, Anda meminimalkan munculnya kesalahan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Anggota tim diberdayakan untuk bertindak ketika terdapat risiko pada hasil: Bekali anggota tim Anda dengan izin, alat, dan peluang untuk mempraktikkan keterampilan yang diperlukan untuk merespons secara efektif. 
  +  Beri anggota tim Anda peluang untuk mempraktikkan keterampilan yang diperlukan untuk merespons: Sediakan alternatif lingkungan aman di mana proses dan prosedur dapat diuji dan digunakan untuk latihan dengan aman. Lakukan aktivitas permainan untuk memberi kesempatan pada anggota tim untuk mendapatkan pengalaman merespons insiden dunia nyata dalam lingkungan simulasi yang aman. 
  +  Tetapkan dan kenali wewenang anggota tim untuk bertindak: Tetapkan secara khusus wewenang anggota tim untuk bertindak dengan memberikan izin dan akses ke beban kerja dan komponen yang mereka dukung. Ketahui bahwa mereka diberdayakan untuk bertindak ketika terdapat risiko pada hasil. 

# OPS03-BP03 Imbauan eskalasi
<a name="ops_org_culture_team_enc_escalation"></a>

 Anggota tim memiliki mekanisme dan diimbau untuk mengeskalasikan masalah ke pengambil keputusan dan pemangku kepentingan jika mereka yakin terdapat risiko pada hasil. Eskalasi harus dilakukan sejak dini dan secara sering agar risiko dapat diidentifikasi, dan dicegah sebelum menyebabkan insiden. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Dorong eskalasi sejak dini dan secara sering: Akui pada tingkat organisasi bahwa eskalasi yang dilakukan sejak dini dan secara sering merupakan praktik terbaik. Akui dan terima pada tingkat organisasi bahwa eskalasi mungkin saja terbukti tidak berdasar, tetapi lebih baik mengambil kesempatan untuk mencegah insiden daripada melewatkan kesempatan untuk melakukan eskalasi. 
  +  Miliki mekanisme untuk eskalasi: Miliki prosedur terdokumentasi yang menetapkan kapan dan bagaimana eskalasi harus dilakukan. Dokumentasikan sekelompok personel dengan wewenang berjenjang untuk mengambil tindakan atau menyetujui tindakan beserta informasi kontak mereka. Eskalasi harus berlanjut sampai anggota tim yakin bahwa risiko telah dialihkan ke personel yang mampu mengatasinya, atau mereka telah menghubungi personel yang memiliki hak atas risiko dan tanggung jawab atas operasi beban kerja. Personel tersebutlah yang memiliki semua keputusan akhir terkait beban kerja mereka. Eskalasi harus menyertakan sifat risiko, tingkat kekritisan beban kerja, orang yang terkena dampak, apa dampaknya, dan urgensinya, yakni kapan dampak diperkirakan akan dialami. 
  +  Lindungi karyawan yang melakukan eskalasi: Miliki kebijakan yang melindungi anggota tim dari tindakan pembalasan jika mereka melakukan eskalasi di sekitar pengambil keputusan atau pemangku kepentingan yang tidak responsif. Terapkan mekanisme untuk mengidentifikasi apakah hal ini terjadi dan beri respons yang tepat. 

# OPS03-BP04 Komunikasi yang tepat waktu, jelas, dan dapat ditindaklanjuti
<a name="ops_org_culture_effective_comms"></a>

 Mekanisme dihadirkan dan digunakan untuk memberikan pengingat secara tepat waktu kepada anggota tim tentang risiko yang diketahui dan peristiwa yang direncanakan. Konteks, detail, dan waktu (ketika memungkinkan) yang diperlukan diberikan untuk membantu menentukan apakah memerlukan tindakan, tindakan apa yang diperlukan, serta untuk melakukan tindakan tepat waktu. Misalnya, memberikan peringatan kerentanan perangkat lunak agar patching dapat dipercepat, atau memberikan peringatan tentang promosi penjualan yang direncanakan sehingga pemberhentian perubahan dapat diimplementasikan untuk menghindari gangguan layanan. 

 Peristiwa yang direncanakan dapat dicatat dalam kalender perubahan atau jadwal pemeliharaan sehingga anggota tim dapat mengidentifikasi aktivitas yang tertunda. 

 Di AWS, [Kalender Perubahan AWS Systems Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-change-calendar.html) dapat digunakan untuk mencatat detail ini. Ini mendukung pemeriksaan terprogram status kalender untuk menentukan apakah kalender sedang terbuka atau tertutup untuk aktivitas di titik waktu tertentu. Aktivitas operasi dapat direncanakan di jendela waktu spesifik *yang disetujui* dan yang disiapkan untuk aktivitas yang berpotensi terganggu. Periode Pemeliharaan AWS Systems Manager memungkinkan Anda untuk menjadwalkan aktivitas untuk instans [dan sumber daya yang didukung lainnya](https://docs.aws.amazon.com/ARG/latest/userguide/supported-resources.html#supported-resources-console) guna mengotomatiskan aktivitas dan membuat aktivitas tersebut mudah ditemukan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Komunikasi yang tepat waktu, jelas, dan dapat ditindaklanjuti: Mekanisme diterapkan untuk memberikan pemberitahuan risiko atau peristiwa terencana dengan cara yang jelas dan dapat ditindaklanjuti, melalui peringatan yang memadai untuk memberi respons yang sesuai. 
  +  Dokumentasikan aktivitas terencana dalam kalender perubahan dan beri pemberitahuan: Sediakan sumber informasi yang dapat diakses berisi peristiwa yang direncanakan. Beri pemberitahuan tentang peristiwa yang direncanakan dari sistem yang sama. 
  +  Lacak peristiwa dan aktivitas yang dapat memengaruhi beban kerja Anda: Memantau pemberitahuan kerentanan dan informasi patch untuk memahami kerentanan risiko tinggi dan potensial yang berkaitan dengan komponen beban kerja Anda. Berikan pemberitahuan kepada anggota tim agar mereka dapat mengambil tindakan. 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Kalender Perubahan AWS Systems Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-change-calendar.html) 
+  [Periode Pemeliharaan AWS Systems Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-maintenance.html) 

# OPS03-BP05 Mendorong eksperimen
<a name="ops_org_culture_team_enc_experiment"></a>

 Eksperimen meningkatkan proses pembelajaran dan membuat anggota tim terus tertarik dan terlibat. Hasil yang tidak sesuai ekspektasi merupakan eksperimen yang berhasil mengidentifikasi jalur yang tidak mengarah ke keberhasilan. Anggota tim tidak dihukum atas eksperimen yang berhasil dengan hasil yang tidak sesuai ekspektasi. Eksperimen diperlukan untuk menciptakan inovasi dan mewujudkan ide. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Dukung eksperimen: Dorong eksperimen untuk mendukung pembelajaran dan inovasi. 
  +  Lakukan eksperimen dengan beragam teknologi: Dorong eksperimen dengan teknologi yang dapat diterapkan saat ini atau di masa mendatang untuk pencapaian hasil bisnis Anda. Pengetahuan ini dapat memberikan gambaran inovasi masa depan. 
  +  Lakukan eksperimen dengan berfokus pada tujuan: Dorong eksperimen dengan tujuan spesifik yang ingin diraih anggota tim, atau dengan teknologi yang dapat diterapkan dalam waktu dekat. Pengetahuan ini dapat membantu Anda berinovasi. 
  +  Sediakan waktu terstruktur untuk bereksperimen: Berikan waktu khusus bagi anggota tim untuk lepas dari tugas harian mereka, agar mereka dapat fokus pada eksperimen mereka. 
  +  Sediakan sumber daya untuk mendukung eksperimen: Anggarkan dana untuk sumber daya yang diperlukan untuk melakukan eksperimen (misalnya, sumber daya cloud atau perangkat lunak). 
  +  Hargai kesuksesan: Berikan penghargaan atas nilai yang dihasilkan dari eksperimen. Pahami bahwa eksperimen dengan hasil yang tidak sesuai ekspektasi merupakan eksperimen yang berhasil mengidentifikasi jalur yang tidak mengarah ke keberhasilan. Anggota tim tidak dihukum atas hasil eksperimen yang tidak sesuai ekspektasi. 

# OPS03-BP06 Mendorong dan mendukung anggota tim untuk mempertahankan dan mengembangkan tingkat keterampilan mereka
<a name="ops_org_culture_team_enc_learn"></a>

 Tim harus mengembangkan tingkat keterampilan mereka untuk mengadopsi perkembangan teknologi, serta untuk mengimbangi perubahan permintaan dan tanggung jawab dalam mendukung beban kerja Anda. Perkembangan keterampilan menggunakan teknologi dapat menjadi sumber kepuasan tim dan mendorong inovasi. Dukung anggota tim Anda untuk mendapatkan dan mempertahankan sertifikasi industri yang memvalidasi dan mengakui perkembangan keterampilan mereka. Terapkan pelatihan silang untuk mendorong transfer pengetahuan dan meminimalkan dampak signifikan yang terjadi karena kehilangan anggota tim berpengalaman yang memiliki keterampilan dan pengetahuan terkait lembaga. Berikan waktu khusus yang terstruktur untuk pembelajaran. 

 AWS menyediakan sumber daya, termasuk [Pusat Sumber Daya untuk Memulai AWS](https://aws.amazon.com/getting-started/), [Blog AWS](https://aws.amazon.com/blogs/), [AWS Online Tech Talks](https://aws.amazon.com/getting-started/), [Acara dan Webinar AWS](https://aws.amazon.com/events/), serta [Lab AWS Well-Architected](https://wellarchitectedlabs.com/), yang menyediakan panduan, contoh, dan ringkasan mendetail untuk mengedukasi tim Anda. 

 AWS juga membagikan pola dan praktik terbaik yang telah kami pelajari melalui operasi AWS di [Amazon Builders' Library](https://aws.amazon.com/builders-library/) serta berbagai macam materi edukasi bermanfaat lainnya dari [Blog AWS](https://aws.amazon.com/blogs/) dan [Official AWS Podcast](https://aws.amazon.com/podcasts/aws-podcast/). 

 Anda harus memanfaatkan sumber daya edukasi yang disediakan oleh AWS seperti lab Well-Architected, [AWS Dukungan](https://aws.amazon.com/premiumsupport/programs/) ([Pusat Pengetahuan AWS](https://aws.amazon.com/premiumsupport/knowledge-center/), [Forum Diskusi AWS](https://forums.aws.amazon.com/index.jspa), dan [Pusat AWS Dukungan](https://console.aws.amazon.com/support/home/)) dan [Dokumentasi AWS](https://docs.aws.amazon.com/whitepapers/latest/aws-security-incident-response-guide/welcome.html) untuk mengedukasi tim Anda. Hubungi AWS Dukungan melalui Pusat AWS Dukungan jika Anda memiliki pertanyaan seputar AWS. 

 [AWS Training and Certification](https://aws.amazon.com/training/) menyediakan beberapa pelatihan gratis melalui kursus digital mandiri tentang dasar-dasar AWS. Anda juga dapat mengikuti pelatihan yang dipandu instruktur untuk mendukung perkembangan keterampilan AWS tim Anda. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Dorong dan dukung anggota tim untuk mempertahankan dan mengembangkan tingkat keterampilan mereka: Diperlukan edukasi yang berkelanjutan untuk mengadopsi teknologi baru, mendorong inovasi, dan mengimbangi perubahan permintaan serta tanggung jawab dalam mendukung beban kerja Anda. 
  +  Sediakan sumber daya untuk kepentingan edukasi: Sediakan waktu khusus yang terstruktur, akses ke materi pelatihan, sumber daya lab, dan dukung partisipasi untuk mengikuti konferensi dan organisasi profesional yang memberikan kesempatan untuk belajar dari pendidik dan rekan. Berikan akses bagi anggota tim junior untuk belajar dari anggota tim senior atau biarkan tim junior meniru pekerjaan tim senior serta melihat metode dan keterampilan mereka. Dorong pembelajaran tentang konten yang tidak terkait langsung dengan pekerjaan agar mereka memiliki pandangan yang lebih luas. 
  +  Edukasi tim dan interaksi antartim: Buat rencana untuk kebutuhan anggota tim terkait pembelajaran berkelanjutan. Berikan kesempatan kepada anggota tim untuk bergabung dengan tim lain (sementara atau seterusnya) guna berbagi keterampilan dan praktik terbaik yang bermanfaat bagi organisasi Anda. 
  +  Dukung untuk mendapatkan dan mempertahankan sertifikasi industri: Dukung anggota tim Anda untuk mendapatkan dan mempertahankan sertifikasi industri yang memvalidasi kemampuan yang telah mereka pelajari, serta akui pencapaian mereka. 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Pusat Sumber Daya untuk Memulai AWS](https://aws.amazon.com/getting-started/) 
+  [Blog AWS](https://aws.amazon.com/blogs/) 
+  [Kepatuhan AWS Cloud](https://aws.amazon.com/compliance/) 
+  [Forum Diskusi AWS](https://forums.aws.amazon.com/index.jspa) 
+  [Dokumentasi AWS](https://docs.aws.amazon.com/whitepapers/latest/aws-security-incident-response-guide/welcome.html) 
+  [AWS Online Tech Talks](https://aws.amazon.com/getting-started/) 
+  [Acara dan Webinar AWS](https://aws.amazon.com/events/) 
+  [Pusat Pengetahuan AWS](https://aws.amazon.com/premiumsupport/knowledge-center/) 
+  [AWS Dukungan](https://aws.amazon.com/premiumsupport/programs/) 
+  [AWS Training and Certification](https://aws.amazon.com/training/) 
+  [Lab AWS Well-Architected](https://wellarchitectedlabs.com/), 
+  [Amazon Builders' Library](https://aws.amazon.com/builders-library/) 
+  [Official AWS Podcast](https://aws.amazon.com/podcasts/aws-podcast/). 

# OPS03-BP07 Bekali tim dengan sumber daya dengan sesuai
<a name="ops_org_culture_team_res_appro"></a>

 Pertahankan kapasitas anggota tim, serta sediakan alat dan sumber daya untuk mendukung kebutuhan beban kerja Anda. Pemberian tugas yang terlalu banyak kepada anggota tim meningkatkan risiko insiden yang diakibatkan oleh kesalahan manusia. Investasi alat dan sumber daya (misalnya, menyediakan otomatisasi untuk aktivitas yang sering dilakukan) dapat meningkatkan efektivitas tim, serta memungkinkan mereka untuk mendukung aktivitas tambahan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Bekali tim dengan sumber daya yang sesuai: Pastikan Anda memiliki pemahaman tentang keberhasilan tim Anda serta faktor yang berkontribusi dalam keberhasilan atau ketidakberhasilan mereka. Dukung tim dengan sumber daya yang sesuai. 
  +  Pahami kinerja tim: Ukur pencapaian hasil operasional dan pengembangan aset oleh tim Anda. Lacak perubahan pada output dan tingkat kesalahan dari waktu ke waktu. Berinteraksilah dengan tim untuk memahami tantangan terkait pekerjaan yang memengaruhi mereka (misalnya, meningkatnya tanggung jawab, perubahan teknologi, kehilangan personel, atau peningkatan pelanggan yang didukung). 
  +  Pahami dampak pada kinerja mereka: Tetap berinteraksi dengan tim Anda sehingga Anda memahami bagaimana keadaan mereka dan apakah ada faktor eksternal yang memengaruhi mereka. Ketika tim Anda terdampak oleh faktor eksternal, evaluasi kembali tujuan dan sesuaikan target sebagaimana mestinya. Identifikasi rintangan yang menghambat kemajuan tim Anda. Bertindaklah sebagai perwakilan tim Anda untuk membantu mengatasi rintangan dan menghapus beban yang tidak perlu. 
  +  Sediakan sumber daya yang diperlukan tim untuk meraih keberhasilan: Tinjau secara teratur apakah sumber daya masih layak, apakah diperlukan sumber daya tambahan, dan buat penyesuaian yang tepat untuk mendukung tim. 

# OPS03-BP08 Pendapat yang beragam didukung dan dicari di dalam dan lintas tim
<a name="ops_org_culture_diverse_inc_access"></a>

 Manfaatkan keragaman lintas organisasi untuk mencari berbagai perspektif unik. Gunakan perspektif ini untuk meningkatkan inovasi, menantang asumsi Anda, dan mengurangi risiko bias konfirmasi. Kembangkan inklusi, keragaman, dan kemudahan akses dalam tim Anda untuk mendapatkan perspektif yang menguntungkan. 

 Budaya organisasi berdampak langsung pada retensi dan kepuasan kerja anggota tim. Dukung keterlibatan dan kemampuan anggota tim Anda untuk mendukung keberhasilan bisnis Anda. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Rendah 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Cari pendapat dan perspektif yang beragam: Dorong kontribusi dari semua orang. Beri suara untuk kelompok yang kurang terwakili. Rotasikan peran dan tanggung jawab dalam rapat. 
  +  Perluas peran dan tanggung jawab: Sediakan kesempatan bagi anggota tim untuk mengambil peran yang mungkin jarang bisa mereka ambil. Mereka akan mendapatkan pengalaman dan perspektif dari peran tersebut, serta dari interaksi dengan anggota tim baru yang mungkin tidak akan berinteraksi dengan mereka di luar peran tersebut. Mereka akan membawa pengalaman dan perspektif mereka ke peran baru serta anggota tim yang berinteraksi dengan mereka. Begitu perspektif meningkat, kesempatan bisnis tambahan bisa muncul, atau kesempatan baru untuk peningkatan bisa teridentifikasi. Buat anggota tim bergantian dalam melakukan tugas umum yang biasanya dilakukan anggota lain untuk memahami tuntutan dan dampak melakukan tugas tersebut. 
  +  Sediakan lingkungan yang aman dan ramah: Miliki kebijakan dan kontrol yang melindungi mental dan keselamatan fisik anggota tim dalam organisasi Anda. Anggota tim harus bisa berinteraksi tanpa rasa takut akan pembalasan. Ketika anggota tim merasa aman dan diterima, mereka mungkin menjadi lebih terlibat dan produktif. Makin beragam organisasi Anda, makin baik pemahaman Anda tentang orang-orang yang Anda dukung termasuk pelanggan Anda. Ketika anggota tim Anda merasa nyaman, merasa bebas untuk berbicara, dan yakin bahwa suara mereka akan didengar, mereka lebih berpeluang untuk membagikan wawasan berharga (misalnya, peluang pemasaran, kebutuhan aksesibilitas, segmen pasar yang belum terlayani, risiko yang tidak diketahui di lingkungan Anda). 
  +  Dukung anggota tim untuk berpartisipasi penuh: Sediakan sumber daya yang diperlukan bagi karyawan Anda untuk berpartisipasi penuh pada semua aktivitas yang berkaitan dengan pekerjaan. Anggota tim yang menghadapi tantangan harian telah mengembangkan keterampilan untuk pekerjaan di sekitar mereka. Keterampilan yang dikembangkan secara khusus ini bisa memberi keuntungan yang signifikan bagi organisasi Anda. Mendukung anggota tim dengan akomodasi yang diperlukan akan meningkatkan keuntungan yang bisa Anda terima dari kontribusi mereka. 

# Persiapan
<a name="a-prepare"></a>

**Topics**
+ [OPS 4 Bagaimana cara mendesain beban kerja Anda sehingga Anda dapat memahami keadaannya?](w2aac19b5b7b5.md)
+ [OPS 5 Bagaimana cara mengurangi kecacatan, mempermudah perbaikan, dan meningkatkan aliran ke dalam produksi?](w2aac19b5b7b7.md)
+ [OPS 6 Bagaimana cara memitigasi risiko deployment?](w2aac19b5b7b9.md)
+ [OPS 7 Bagaimana cara mengetahui bahwa Anda siap untuk mendukung beban kerja?](w2aac19b5b7c11.md)

# OPS 4 Bagaimana cara mendesain beban kerja Anda sehingga Anda dapat memahami keadaannya?
<a name="w2aac19b5b7b5"></a>

 Desain beban kerja Anda sehingga memberikan informasi yang diperlukan ke semua komponen (misalnya, metrik, log, dan jejak) agar Anda memahami keadaan internalnya. Ini memungkinkan Anda untuk memberikan respons yang efektif bila sesuai. 

**Topics**
+ [OPS04-BP01 Mengimplementasikan telemetri aplikasi](ops_telemetry_application_telemetry.md)
+ [OPS04-BP02 Mengimplementasikan dan mengonfigurasikan telemetri beban kerja](ops_telemetry_workload_telemetry.md)
+ [OPS04-BP03 Mengimplementasikan telemetri aktivitas pengguna](ops_telemetry_customer_telemetry.md)
+ [OPS04-BP04 Mengimplementasikan telemetri dependensi](ops_telemetry_dependency_telemetry.md)
+ [OPS04-BP05 Mengimplementasikan keterlacakan transaksi](ops_telemetry_dist_trace.md)

# OPS04-BP01 Mengimplementasikan telemetri aplikasi
<a name="ops_telemetry_application_telemetry"></a>

 Telemetri aplikasi menjadi fondasi observabilitas beban kerja Anda. Aplikasi Anda harus memberikan telemetri yang menyediakan wawasan ke kondisi aplikasi dan capaian hasil bisnis. Mulai dari penyelesaian masalah hingga pengukuran dampak fitur baru, telemetri aplikasi memberikan informasi tentang cara membangun, mengoperasikan, dan mengembangkan beban kerja Anda. 

 Telemetri aplikasi terdiri dari metrik dan log. Metrik adalah informasi diagnostik, seperti tegangan dan suhu. Metrik digunakan secara kolektif untuk menggambarkan kondisi aplikasi Anda. Mengumpulkan informasi metrik seiring waktu dapat membantu mengembangkan acuan dasar dan mendeteksi anomali. Log adalah pesan dari aplikasi tentang kondisi internalnya atau peristiwa yang terjadi. Kode kesalahan, pengidentifikasi transaksi, dan tindakan pengguna, adalah contoh peristiwa yang dicatat. 

 **Hasil yang Diinginkan:** 
+  Aplikasi Anda memberikan metrik dan log yang menyediakan wawasan ke kondisi aplikasi serta capaian hasil bisnis. 
+  Metrik dan log disimpan secara terpusat untuk semua aplikasi di dalam beban kerja. 

 **Antipola umum:** 
+  Aplikasi Anda tidak memberikan telemetri. Anda terpaksa bergantung pada pelanggan Anda untuk tahu apabila terjadi masalah. 
+  Pelanggan melaporkan bahwa aplikasi Anda tidak responsif. Anda tidak memiliki telemetri dan tidak dapat mengonfirmasi bahwa ada masalah, atau menjelaskan masalah tersebut tanpa menggunakan langsung aplikasinya untuk memahami pengalaman pengguna saat ini. 

 **Manfaat menerapkan praktik terbaik ini:** 
+  Anda dapat mengetahui kondisi aplikasi Anda, pengalaman pengguna, serta capaian hasil bisnis. 
+  Anda dapat memberikan reaksi secara cepat terhadap perubahan kondisi aplikasi Anda. 
+  Anda dapat meningkatkan tren kondisi aplikasi. 
+  Anda dapat mengambil keputusan yang bijaksana terkait peningkatan aplikasi. 
+  Anda dapat mendeteksi dan mengatasi masalah aplikasi dengan lebih cepat. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Implementasi telemetri aplikasi terdiri dari tiga langkah: mengidentifikasi lokasi penyimpanan telemetri, mengidentifikasi telemetri yang menggambarkan status aplikasi, dan melengkapi aplikasi agar memberikan telemetri. 

 Sebagai contoh, sebuah perusahaan e-commerce memiliki layanan mikro berbasis arsitektur. Sebagai bagian dari proses desain arsitekturnya, perusahaan itu mengidentifikasi telemetri aplikasi yang akan membantu memahami kondisi dari setiap layanan mikro. Misalnya, layanan keranjang pengguna memberikan telemetri tentang peristiwa seperti penambahan ke keranjang, pengabaian keranjang, dan lamanya waktu untuk menambahkan item ke keranjang. Semua layanan mikro akan mencatat informasi transaksi, kesalahan, dan peringatan. Telemetri akan dikirim ke Amazon CloudWatch untuk penyimpanan dan analisis. 

 **Langkah implementasi** 

 Langkah pertama adalah mengidentifikasi lokasi pusat untuk penyimpanan telemetri untuk aplikasi dalam beban kerja. Jika Anda belum memiliki platformnya, [Amazon CloudWatch](https://aws.amazon.com/cloudwatch) menyediakan kumpulan telemetri, dasbor, analisis, dan kemampuan menghasilkan peristiwa. 

 Untuk mengidentifikasi telemetri yang dibutuhkan, mulailah dengan pertanyaan-pertanyaan ini: 
+  Apakah aplikasi saya dalam kondisi baik? 
+  Apakah aplikasi saya mencapai hasil bisnis? 

   Aplikasi Anda harus memberikan log dan metrik yang secara kolektif menjawab pertanyaan-pertanyaan tersebut. Apabila Anda tidak dapat menjawab pertanyaan tersebut menggunakan telemetri yang ada, ajak pemangku kepentingan rekayasa dan bisnis untuk membuat daftar telemetri yang dapat menjawabnya. Anda dapat meminta saran teknis ahli dari tim Akun AWS Anda saat mengidentifikasi dan mengembangkan telemetri aplikasi baru. 

   Setelah telemetri aplikasi tambahan diidentifikasi, lakukan kerja sama dengan pemangku kepentingan rekayasa untuk melengkapi aplikasi Anda. [AWS Distro for Open Telemetry](https://aws-otel.github.io/) menyediakan API, pustaka, dan agen yang mengumpulkan telemetri aplikasi. [Contoh ini menunjukkan cara melengkapi aplikasi JavaScript dengan metrik kustom](https://aws-otel.github.io/docs/getting-started/js-sdk/metric-manual-instr). 

   Pelanggan yang ingin memahami layanan observabilitas yang ditawarkan AWS dapat memanfaatkan [One Observability Workshop](https://catalog.workshops.aws/observability/en-US) secara mandiri atau meminta dukungan dari tim Akun AWS mereka untuk memandunya. Lokakarya ini memandu Anda ke seluruh solusi observabilitas di AWS dan memberikan contoh lengkap penggunaannya. 

   Untuk mengetahui lebih dalam tentang telemetri aplikasi, baca [artikel Menginstrumentasikan sistem terdistribusi untuk visibilitas operasional](https://aws.amazon.com/builders-library/instrumenting-distributed-systems-for-operational-visibility/) di Amazon Builder’s Library. Artikel tersebut menjelaskan cara Amazon menginstrumentasikan aplikasi, serta dapat digunakan sebagai panduan untuk mengembangkan panduan instrumentasi Anda sendiri. 

 **Tingkat usaha untuk rencana implementasi:** Sedang 

## Sumber daya
<a name="resources"></a>

 **Praktik terbaik terkait:** 

[OPS04-BP02 Mengimplementasikan dan mengonfigurasikan telemetri beban kerja](ops_telemetry_workload_telemetry.md) – Telemetri aplikasi adalah komponen telemetri beban kerja. Untuk memahami kondisi beban kerja secara keseluruhan, Anda perlu memahami kondisi masing-masing aplikasi yang menyusun beban kerja. 

[OPS04-BP03 Mengimplementasikan telemetri aktivitas pengguna](ops_telemetry_customer_telemetry.md) – Telemetri aktivitas pengguna sering kali merupakan subset telemetri aplikasi. Aktivitas pengguna seperti peristiwa penambahan ke keranjang, aliran klik, atau transaksi terselesaikan, memberikan wawasan ke pengalaman pengguna. 

[OPS04-BP04 Mengimplementasikan telemetri dependensi](ops_telemetry_dependency_telemetry.md) – Pemeriksaan dependensi berkaitan dengan telemetri aplikasi Anda dan dapat diinstrumentasikan ke aplikasi. Jika aplikasi Anda mengandalkan dependensi eksternal seperti DNS atau basis data, Aplikasi tersebut dapat memberikan metrik dan log tentang keterjangkauan, waktu habis, dan peristiwa lainnya. 

[OPS04-BP05 Mengimplementasikan keterlacakan transaksi](ops_telemetry_dist_trace.md) – Pelacakan transaksi seluruh beban kerja mengharuskan aplikasi untuk memberikan informasi tentang cara pemrosesan peristiwa yang dibagikan. Cara masing-masing aplikasi menangani peristiwa-peristiwa ini ditunjukkan melalui telemetri aplikasinya. 

[OPS08-BP02 Menentukan metrik beban kerja](ops_workload_health_design_workload_metrics.md) – Metrik beban kerja adalah indikator kondisi utama untuk beban kerja Anda. Metrik aplikasi utama merupakan bagian dari metrik beban kerja. 

 **Dokumen terkait:** 
+  [AWS Builders Library – Menginstrumentasikan Sistem Terdistribusi untuk Visibilitas Operasional](https://aws.amazon.com/builders-library/instrumenting-distributed-systems-for-operational-visibility/) 
+  [AWS Distro for OpenTelemetry](https://aws-otel.github.io/) 
+  [Laporan Resmi Keunggulan Operasional AWS Well-Architected – Telemetri Desain](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/design-telemetry.html) 
+  [Membuat metrik dari log peristiwa menggunakan filter](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/MonitoringLogData.html) 
+  [Mengimplementasikan Pencatatan Log dan Pemantauan dengan Amazon CloudWatch](https://docs.aws.amazon.com/prescriptive-guidance/latest/implementing-logging-monitoring-cloudwatch/welcome.html) 
+  [Memantau kinerja dan kondisi aplikasi dengan AWS Distro for OpenTelemetry](https://aws.amazon.com/blogs/opensource/monitoring-application-health-and-performance-with-aws-distro-for-opentelemetry/) 
+  [Baru – Cara meningkatkan pemantauan metrik aplikasi kustom Anda menggunakan Agen Amazon CloudWatch](https://aws.amazon.com/blogs/devops/new-how-to-better-monitor-your-custom-application-metrics-using-amazon-cloudwatch-agent/) 
+  [Observabilitas di AWS](https://aws.amazon.com/products/management-and-governance/use-cases/monitoring-and-observability/) 
+  [Skenario – Publikasikan metrik ke CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/PublishMetrics.html) 
+  [Mulai Membangun – Cara Memantau Aplikasi secara Efektif](https://aws.amazon.com/startups/start-building/how-to-monitor-applications/) 
+  [Menggunakan CloudWatch dengan SDK AWS](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/sdk-general-information-section.html) 

 **Video terkait:** 
+  [AWS re:Invent 2021 - Observability the open-source way](https://www.youtube.com/watch?v=vAnIhIwE5hY) 
+  [Collect Metrics and Logs from Amazon EC2 instances with the CloudWatch Agent](https://www.youtube.com/watch?v=vAnIhIwE5hY) 
+  [How to Easily Setup Application Monitoring for Your AWS Workloads - AWS Online Tech Talks](https://www.youtube.com/watch?v=LKCth30RqnA) 
+  [Mastering Observability of Your Serverless Applications - AWS Online Tech Talks](https://www.youtube.com/watch?v=CtsiXhiAUq8) 
+  [Open Source Observability with AWS - AWS Virtual Workshop](https://www.youtube.com/watch?v=vAnIhIwE5hY) 

 **Contoh terkait:** 
+  [Contoh Sumber Daya Pemantauan dan Pencatatan AWS](https://github.com/aws-samples/logging-monitoring-apg-guide-examples) 
+  [Solusi AWS: Kerangka Kerja Pemantauan Amazon CloudWatch](https://aws.amazon.com/solutions/implementations/amazon-cloudwatch-monitoring-framework/?did=sl_card&trk=sl_card) 
+  [Solusi AWS : Pencatatan Log Terpusat](https://aws.amazon.com/solutions/implementations/centralized-logging/) 
+  [One Observability Workshop](https://catalog.workshops.aws/observability/en-US) 

# OPS04-BP02 Mengimplementasikan dan mengonfigurasikan telemetri beban kerja
<a name="ops_telemetry_workload_telemetry"></a>

 Desain dan konfigurasikan beban kerja Anda untuk memberikan informasi tentang kondisi internal dan statusnya saat ini, misalnya, volume panggilan API, kode status HTTP, serta peristiwa penskalaan. Gunakan informasi ini untuk menentukan kapan respons dibutuhkan. 

 Gunakan layanan seperti [Amazon CloudWatch](https://aws.amazon.com/cloudwatch/) untuk mengagregatkan log dan metrik dari komponen beban kerja (misalnya, log API dari [AWS CloudTrail](https://aws.amazon.com/cloudtrail/), [metrik AWS Lambda](https://docs.aws.amazon.com/lambda/latest/dg/lambda-monitoring.html), [Log Alur Amazon VPC](https://docs.aws.amazon.com/vpc/latest/userguide/flow-logs.html), dan [layanan lainnya](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/aws-services-sending-logs.html)). 

 **Antipola umum:** 
+  Pelanggan Anda mengeluhkan rendahnya kinerja. Karena tidak ada perubahan dalam aplikasi, Anda menduga bahwa ada masalah dengan komponen beban kerja. Anda tidak memiliki telemetri untuk dianalisis guna menentukan komponen apa yang menyebabkan rendahnya kinerja. 
+  Aplikasi Anda tidak dapat dijangkau. Telemetri Anda tidak memadai untuk menentukan apakah ini adalah masalah jaringan. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan memahami apa yang terjadi di dalam beban kerja, Anda dapat merespons sesuai keperluan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Implementasikan telemetri metrik dan log: Lengkapi beban kerja Anda untuk memberikan informasi tentang kondisi internal, status, dan pencapaian hasil bisnisnya. Gunakan informasi ini untuk menentukan kapan respons dibutuhkan. 
  +  [Dapatkan observabilitas yang lebih baik tentang VM Anda dengan Amazon CloudWatch - AWS Online Tech Talks](https://youtu.be/1Ck_me4azMw) 
  +  [Cara kerja Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/cloudwatch_architecture.html) 
  +  [Apa itu Amazon CloudWatch?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) 
  +  [Menggunakan metrik Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/working_with_metrics.html) 
  +  [Apa itu Amazon CloudWatch Logs?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/WhatIsCloudWatchLogs.html) 
    +  Implementasikan dan konfigurasikan telemetri beban kerja: Desain dan konfigurasikan beban kerja Anda untuk memperoleh informasi tentang kondisi internal dan statusnya saat ini (misalnya, volume panggilan API, kode status HTTP, serta peristiwa penskalaan). 
      +  [Referensi dimensi dan metrik Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html) 
      +  [AWS CloudTrail](https://aws.amazon.com/cloudtrail/) 
      +  [Apa Itu AWS CloudTrail?](https://docs.aws.amazon.com/awscloudtrail/latest/userguide/cloudtrail-user-guide.html) 
      +  [Log Alur VPC](https://docs.aws.amazon.com/vpc/latest/userguide/flow-logs.html) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [AWS CloudTrail](https://aws.amazon.com/cloudtrail/) 
+  [Dokumentasi Amazon CloudWatch](https://docs.aws.amazon.com/cloudwatch/index.html) 
+  [Referensi dimensi dan metrik Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html) 
+  [Cara kerja Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/cloudwatch_architecture.html) 
+  [Menggunakan metrik Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/working_with_metrics.html) 
+  [Log Alur VPC](https://docs.aws.amazon.com/vpc/latest/userguide/flow-logs.html) 
+  [Apa Itu AWS CloudTrail?](https://docs.aws.amazon.com/awscloudtrail/latest/userguide/cloudtrail-user-guide.html) 
+  [Apa itu Amazon CloudWatch Logs?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/WhatIsCloudWatchLogs.html) 
+  [Apa itu Amazon CloudWatch?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) 

 **Video terkait:** 
+  [Manajemen Kinerja Aplikasi di AWS](https://www.youtube.com/watch?v=5T4stR-HFas) 
+  [Dapatkan Observabilitas yang Lebih Baik tentang VM Anda dengan Amazon CloudWatch](https://youtu.be/1Ck_me4azMw) 
+  [Dapatkan observabilitas yang lebih baik tentang VM Anda dengan Amazon CloudWatch - AWS Online Tech Talks](https://youtu.be/1Ck_me4azMw) 

# OPS04-BP03 Mengimplementasikan telemetri aktivitas pengguna
<a name="ops_telemetry_customer_telemetry"></a>

 Lengkapi kode aplikasi Anda untuk mengirimkan informasi tentang aktivitas pengguna, misalnya, aliran klik, atau transaksi yang dimulai, ditinggalkan, dan diselesaikan. Gunakan informasi ini untuk membantu memahami bagaimana aplikasi digunakan, pola penggunaan, serta untuk menentukan kapan respons dibutuhkan. 

 **Antipola umum:** 
+  Pengembang Anda telah men-deploy fitur baru tanpa telemetri pengguna, dan penggunaannya meningkat. Anda tidak bisa menentukan apakah penggunaan yang meningkat itu berasal dari penggunaan fitur baru, atau merupakan masalah yang dimunculkan oleh kode baru. 
+  Pengembang Anda telah men-deploy fitur baru tanpa telemetri pengguna. Anda tidak tahu apakah pelanggan Anda menggunakannya jika tidak menghubungi dan bertanya kepada mereka. 

 **Manfaat menjalankan praktik terbaik ini:** Pahami bagaimana pelanggan menggunakan aplikasi Anda untuk mengidentifikasi pola penggunaan, perilaku tidak terduga, serta memungkinkan Anda untuk merespons jika diperlukan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Terapkan telemetri aktifitas pengguna: Desain kode aplikasi Anda untuk mengirimkan informasi tentang aktivitas pengguna (misalnya, aluran klik, atau transaksi yang dimulai, ditinggalkan, dan diselesaikan). Gunakan informasi ini untuk membantu memahami bagaimana aplikasi digunakan, pola penggunaan, serta untuk menentukan kapan respons dibutuhkan. 

# OPS04-BP04 Mengimplementasikan telemetri dependensi
<a name="ops_telemetry_dependency_telemetry"></a>

 Desain dan konfigurasikan beban kerja Anda untuk memberikan informasi tentang status sumber daya yang memengaruhinya (misalnya, keterjangkauan atau waktu respons). Contoh dependensi eksternal dapat meliputi, basis data eksternal, DNS, dan konektivitas. Gunakan informasi ini untuk menentukan kapan respons dibutuhkan. 

 **Antipola umum:** 
+  Anda tidak dapat memastikan bahwa penyebab aplikasi Anda tidak dapat dijangkau adalah masalah DNS tanpa melakukan pemeriksaan secara manual untuk melihat apakah penyedia DNS masih berfungsi. 
+  Aplikasi keranjang belanja Anda tidak dapat menyelesaikan transaksi. Anda tidak dapat memastikan bahwa ada masalah dengan penyedia pemrosesan kartu kredit Anda tanpa menghubungi penyedia untuk melakukan verifikasi. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan memahami kondisi dependensi, Anda dapat merespons jika diperlukan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Implementasikan telemetri dependensi: Desain dan konfigurasikan beban kerja Anda untuk memberikan informasi tentang kondisi dan status sistem yang memengaruhinya. Beberapa contoh mencakup: basis data eksternal, DNS, konektivitas jaringan, serta layanan pemrosesan kartu kredit eksternal. 
  +  [Agen Amazon CloudWatch dengan integrasi AWS Systems Manager - kumpulan log dan metrik terpadu untuk Linux dan Windows](https://aws.amazon.com/blogs/aws/new-amazon-cloudwatch-agent-with-aws-systems-manager-integration-unified-metrics-log-collection-for-linux-windows/) 
  +  [Kumpulkan metrik dan log dari instans Amazon EC2 serta server on-premise dengan Agen CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Agen Amazon CloudWatch dengan integrasi AWS Systems Manager - kumpulan log dan metrik terpadu untuk Linux dan Windows](https://aws.amazon.com/blogs/aws/new-amazon-cloudwatch-agent-with-aws-systems-manager-integration-unified-metrics-log-collection-for-linux-windows/) 
+  [Kumpulkan metrik dan log dari instans Amazon EC2 serta server on-premise dengan Agen CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html) 

   **Contoh terkait:** 
+  [Lab Well-Architected – Pemantauan Dependensi](https://wellarchitectedlabs.com/operational-excellence/100_labs/100_dependency_monitoring/) 

# OPS04-BP05 Mengimplementasikan keterlacakan transaksi
<a name="ops_telemetry_dist_trace"></a>

 Implementasikan kode aplikasi Anda dan konfigurasikan komponen beban kerja untuk mendapatkan informasi tentang alur transaksi di seluruh beban kerja. Gunakan informasi ini untuk menentukan kapan respons dibutuhkan serta membantu Anda mengidentifikasi faktor yang berkontribusi terhadap masalah. 

 Di AWS, Anda dapat menggunakan layanan pelacakan terdistribusi, seperti [AWS X-Ray](https://aws.amazon.com/xray/), untuk mengumpulkan dan mencatat pelacakan saat transaksi melewati beban kerja Anda, menghasilkan peta untuk mengetahui bagaimana transaksi di seluruh layanan dan beban kerja Anda berlangsung, mendapatkan wawasan tentang hubungan antarkomponen, dan mengidentifikasi serta menganalisis masalah secara waktu nyata. 

 **Antipola umum:** 
+  Anda telah mengimplementasikan arsitektur layanan mikro nirserver yang mencakup beberapa akun. Pelanggan Anda mengalami masalah kinerja tersendat. Anda tidak dapat menemukan fungsi atau komponen mana yang bertanggung jawab karena pelacakan yang memungkinkan Anda untuk menemukan letak terjadinya masalah kinerja dan penyebab masalah di dalam aplikasi tidak memadai. 
+  Anda berusaha mengetahui letak hambatan kinerja di dalam beban kerja Anda agar hal tersebut dapat diatasi saat melakukan upaya pengembangan. Anda tidak dapat mengetahui hubungan antarkomponen aplikasi, dan layanan yang berinteraksi dengannya, untuk mengetahui letak hambatan karena pelacakan yang memungkinkan Anda untuk masuk ke dalam jalur dan layanan tertentu yang memengaruhi kinerja aplikasi tidak memadai. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan memahami alur transaksi di seluruh beban kerja, Anda dapat memahami perilaku yang diharapkan dari transaksi beban kerja Anda, serta merespons ketika terjadi perbedaan perilaku dari yang diharapkan di seluruh beban kerja Anda jika diperlukan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Rendah 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Implementasikan keterlacakan transaksi: Rancang aplikasi dan beban kerja Anda untuk mengirimkan informasi tentang alur transaksi di seluruh komponen sistem, seperti tahap transaksi, komponen aktif, dan waktu untuk menyelesaikan aktivitas. Gunakan informasi ini untuk mengetahui apa yang sedang berlangsung, yang telah selesai, serta hasil dari aktivitas yang sudah selesai. Hal ini membantu Anda mengetahui kapan respons dibutuhkan. Misalnya, waktu respons transaksi yang lebih lama dari perkiraan di dalam komponen dapat menunjukkan adanya masalah dengan komponen tersebut. 
  +  [AWS X-Ray](https://aws.amazon.com/xray/) 
  +  [Apa itu AWS X-Ray?](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [AWS X-Ray](https://aws.amazon.com/xray/) 
+  [Apa itu AWS X-Ray?](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html) 

# OPS 5 Bagaimana cara mengurangi kecacatan, mempermudah perbaikan, dan meningkatkan aliran ke dalam produksi?
<a name="w2aac19b5b7b7"></a>

 Adopsi pendekatan yang meningkatkan aliran perubahan ke dalam produksi, yang memampukan pemfaktoran ulang, umpan balik cepat atas kualitas, dan perbaikan bug. Ini mempercepat perubahan yang bermanfaat memasuki produksi, membatasi masalah yang di-deploy, dan memampukan identifikasi cepat serta perbaikan masalah akibat aktivitas deployment. 

**Topics**
+ [OPS05-BP01 Menggunakan kontrol versi](ops_dev_integ_version_control.md)
+ [OPS05-BP02 Menguji dan memvalidasi perubahan](ops_dev_integ_test_val_chg.md)
+ [OPS05-BP03 Menggunakan sistem manajemen konfigurasi](ops_dev_integ_conf_mgmt_sys.md)
+ [OPS05-BP04 Menggunakan sistem manajemen build dan deployment](ops_dev_integ_build_mgmt_sys.md)
+ [OPS05-BP05 Melakukan manajemen patch](ops_dev_integ_patch_mgmt.md)
+ [OPS05-BP06 Membagikan standar desain](ops_dev_integ_share_design_stds.md)
+ [OPS05-BP07 Mengimplementasikan praktik untuk meningkatkan kualitas kode](ops_dev_integ_code_quality.md)
+ [OPS05-BP08 Menggunakan beberapa lingkungan](ops_dev_integ_multi_env.md)
+ [OPS05-BP09 Membuat perubahan yang sering, kecil, dan dapat dikembalikan](ops_dev_integ_freq_sm_rev_chg.md)
+ [OPS05-BP10 Mengotomatiskan integrasi dan deployment sepenuhnya](ops_dev_integ_auto_integ_deploy.md)

# OPS05-BP01 Menggunakan kontrol versi
<a name="ops_dev_integ_version_control"></a>

 Gunakan kontrol versi untuk memungkinkan pelacakan perubahan dan rilis. 

 Banyak layanan AWS menawarkan kemampuan kontrol versi. Gunakan sistem kontrol revisi atau sumber seperti [AWS CodeCommit](https://aws.amazon.com/codecommit/) untuk mengelola kode dan artefak lain, seperti templat [AWS CloudFormation](https://aws.amazon.com/cloudformation/) yang dikontrol versi dari infrastruktur Anda. 

 **Antipola umum:** 
+  Anda telah mengembangkan dan menyimpan kode di stasiun kerja Anda. Anda mengalami kegagalan penyimpanan yang tidak dapat dipulihkan di stasiun kerja sehingga kode Anda hilang. 
+  Setelah menimpa kode yang ada dengan perubahan Anda, Anda memulai ulang aplikasi namun sudah tidak dapat beroperasi lagi. Anda tidak bisa kembali ke perubahan. 
+  Anda memiliki write lock pada file laporan yang perlu disunting orang lain. Mereka meminta Anda untuk berhenti mengerjakannya agar mereka bisa menyelesaikan tugas mereka. 
+  Tim penelitian Anda telah mengerjakan analisis mendetail yang akan membentuk pekerjaan mendatang Anda. Seseorang secara tidak sengaja menyimpan daftar belanjanya dan menimpa laporan akhir. Anda tidak bisa mengembalikan perubahan dan harus membuat ulang laporan tersebut. 

 **Manfaat menjalankan praktik terbaik ini:** Dengan menggunakan kemampuan kontrol versi, Anda dapat secara mudah kembali ke versi sebelumnya dengan status baik, dan membatasi risiko kehilangan aset. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Gunakan kontrol versi: Pelihara aset di repositori terkontrol versi. Tindakan ini mendukung pelacakan perubahan, deployment versi baru, deteksi perubahan pada versi yang ada, dan pengembalian ke versi sebelumnya (misalnya, kembali ke versi dengan status baik apabila terjadi kegagalan). Integrasikan kemampuan kontrol versi sistem manajemen konfigurasi Anda ke dalam prosedur Anda. 
  +  [Pengantar AWS CodeCommit](https://youtu.be/46PRLMW8otg) 
  +  [Apa Itu AWS CodeCommit?](https://docs.aws.amazon.com/codecommit/latest/userguide/welcome.html) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Apa Itu AWS CodeCommit?](https://docs.aws.amazon.com/codecommit/latest/userguide/welcome.html) 

 **Video terkait:** 
+  [Pengantar AWS CodeCommit](https://youtu.be/46PRLMW8otg) 

# OPS05-BP02 Menguji dan memvalidasi perubahan
<a name="ops_dev_integ_test_val_chg"></a>

 Uji dan validasi perubahan untuk membantu membatasi dan mendeteksi kesalahan. Otomatiskan pengujian untuk mengurangi kesalahan yang disebabkan oleh proses manual, dan mengurangi upaya untuk melakukan pengujian. 

 Banyak layanan AWS menawarkan kemampuan kontrol versi. Gunakan sistem kontrol revisi atau sumber seperti [AWS CodeCommit](https://aws.amazon.com/codecommit/) untuk mengelola kode dan artefak lain, seperti templat [AWS CloudFormation](https://aws.amazon.com/cloudformation/) yang dikontrol versi dari infrastruktur Anda. 

 **Antipola umum:** 
+  Anda melakukan deployment kode baru ke produksi dan pelanggan mulai menghubungi Anda karena aplikasi berhenti berjalan. 
+  Anda menerapkan grup keamanan baru untuk meningkatkan keamanan perimeter Anda. Tindakan ini berjalan dengan konsekuensi tidak terduga; Pengguna Anda tidak dapat mengakses aplikasi. 
+  Anda memodifikasi sebuah metode yang dipanggil oleh fungsi baru Anda. Ada fungsi lain yang juga bergantung pada metode tersebut dan berhenti berfungsi. Masalah ini tidak terdeteksi dan masuk ke tahap produksi. Fungsi lain tersebut tidak dipanggil dalam waktu tertentu dan akhirnya gagal dalam produksi tanpa ada korelasi dengan penyebabnya. 

 **Manfaat menjalankan praktik terbaik ini:** Dengan menguji dan memvalidasi perubahan sejak dini, Anda dapat mengatasi masalah dengan biaya minim dan membatasi dampak terhadap pelanggan. Dengan menguji sebelum deployment, Anda meminimalkan munculnya kesalahan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Uji dan validasi perubahan: Perubahan harus diuji dan hasilnya divalidasi pada semua tahap siklus hidup (seperti pengembangan, pengujian, dan produksi). Gunakan hasil pengujian untuk mengonfirmasi fitur baru dan memitigasi risiko serta dampak deployment yang gagal. Otomatiskan pengujian dan validasi untuk memastikan konsistensi peninjauan, untuk mengurangi kesalahan yang disebabkan oleh proses manual, dan mengurangi upaya. 
  +  [Apa itu AWS CodeBuild?](https://docs.aws.amazon.com/codebuild/latest/userguide/welcome.html) 
  +  [Dukungan build lokal untuk AWS CodeBuild](https://aws.amazon.com/blogs/devops/announcing-local-build-support-for-aws-codebuild/) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Alat Pengembang AWS](https://aws.amazon.com/products/developer-tools/) 
+  [Dukungan build lokal untuk AWS CodeBuild](https://aws.amazon.com/blogs/devops/announcing-local-build-support-for-aws-codebuild/) 
+  [Apa itu AWS CodeBuild?](https://docs.aws.amazon.com/codebuild/latest/userguide/welcome.html) 

# OPS05-BP03 Menggunakan sistem manajemen konfigurasi
<a name="ops_dev_integ_conf_mgmt_sys"></a>

 Gunakan sistem manajemen konfigurasi untuk membuat dan melacak perubahan konfigurasi. Sistem ini mengurangi kesalahan yang disebabkan oleh proses manual dan meminimalkan tingkat upaya untuk melakukan deployment perubahan. 

 Manajemen konfigurasi statis menetapkan nilai saat menginisialisasi sumber daya yang diharapkan tetap konsisten selama masa pakai sumber daya. Beberapa contoh menyertakan pengaturan konfigurasi untuk web atau server aplikasi pada instans, atau menentukan konfigurasi layanan AWS dalam [Konsol Manajemen AWS](https://docs.aws.amazon.com/awsconsolehelpdocs/index.html) atau melalui [AWS CLI](https://aws.amazon.com/cli/). 

 Manajemen konfigurasi dinamis menetapkan nilai saat inisialisasi. Nilai ini dapat atau diharapkan untuk berubah selama masa pakai sumber daya. Misalnya, Anda dapat menetapkan toggle fitur untuk mengaktifkan fungsionalitas dalam kode melalui perubahan konfigurasi, atau mengubah tingkat detail log selama insiden untuk memperoleh lebih banyak data, lalu mengubahnya kembali setelah insiden menghilangkan log yang saat ini tidak dibutuhkan dan pengeluaran yang terkait dengannya. 

 Jika Anda memiliki konfigurasi dinamis di aplikasi Anda yang berjalan di instans, kontainer, fungsi nirserver, atau perangkat, Anda dapat menggunakan [AWS AppConfig](https://docs.aws.amazon.com/appconfig/latest/userguide/what-is-appconfig.html) untuk melakukan deployment dan mengelolanya di seluruh lingkungan. 

 Di AWS, Anda dapat menggunakan [AWS Config](https://docs.aws.amazon.com/config/latest/developerguide/WhatIsConfig.html) untuk tetap mengawasi konfigurasi sumber daya AWS [di seluruh akun dan Wilayah](https://docs.aws.amazon.com/config/latest/developerguide/aggregate-data.html). Dengan demikian, Anda dapat melacak riwayat konfigurasi mereka, memahami bagaimana perubahan konfigurasi akan memengaruhi sumber daya lainnya, dan mengauditnya terhadap konfigurasi yang diharapkan atau diinginkan dengan menggunakan [Aturan AWS Config](https://docs.aws.amazon.com/config/latest/developerguide/evaluate-config.html) dan [Paket Konformasi AWS Config](https://docs.aws.amazon.com/config/latest/developerguide/conformance-packs.html). 

 Di AWS, Anda dapat membuat pipeline integrasi berkelanjutan/deployment berkelanjutan (CI/CD) menggunakan layanan seperti [Alat Developer AWS](https://aws.amazon.com/products/developer-tools/) (misalnya, AWS CodeCommit, [AWS CodeBuild](https://aws.amazon.com/codebuild/), [AWS CodePipeline](https://aws.amazon.com/codepipeline/), [AWS CodeDeploy](https://aws.amazon.com/codedeploy/), dan [AWS CodeStar](https://aws.amazon.com/codestar/)). 

 Miliki kalender perubahan dan lacak saat ada rencana acara atau aktivitas operasional atau bisnis signifikan yang dapat terpengaruh oleh implementasi perubahan. Sesuaikan aktivitas untuk mengelola risiko seputar rencana. [Kalender Perubahan AWS Systems Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-change-calendar.html) menyediakan mekanisme untuk mendokumentasikan blok waktu dengan keterangan terbuka atau tertutup terhadap perubahan beserta alasannya, serta [membagikan informasi tersebut](https://docs.aws.amazon.com/systems-manager/latest/userguide/change-calendar-share.html) dengan Akun AWS lainnya. Skrip AWS Systems Manager Automation dapat dikonfigurasi untuk mematuhi status kalender perubahan. 

 [Periode Pemeliharaan AWS Systems Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-maintenance.html) dapat digunakan untuk menjadwalkan kinerja skrip Run Command (Jalankan Perintah) atau Automation (Otomatisasi) AWS SSM, invokasi AWS Lambda, atau aktivitas AWS Step Functions pada waktu tertentu. Tandai aktivitas ini dalam kalender perubahan sehingga dapat disertakan dalam evaluasi. 

 **Antipola umum:** 
+  Anda memperbarui konfigurasi server web secara manual di seluruh armada dan beberapa server menjadi tidak responsif karena kesalahan pembaruan. 
+  Anda memperbarui armada server aplikasi selama berjam-jam. Inkonsistensi dalam konfigurasi selama perubahan menyebabkan perilaku tak terduga. 
+  Seseorang telah memperbarui grup keamanan Anda dan server web Anda tidak lagi dapat diakses. Tanpa mengetahui apa yang telah diubah, Anda menghabiskan banyak waktu untuk menyelidiki masalah tersebut sehingga memperpanjang waktu pemulihan. 

 **Manfaat menerapkan praktik terbaik ini:** Mengadopsi sistem manajemen konfigurasi meminimalkan tingkat upaya untuk membuat dan melacak perubahan, serta mengurangi frekuensi kesalahan yang disebabkan prosedur manual. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Gunakan sistem manajemen konfigurasi: Gunakan sistem manajemen konfigurasi untuk melacak dan mengimplementasikan perubahan, mengurangi kesalahan yang disebabkan proses manual, dan meminimalkan tingkat upaya. 
  +  [Manajemen konfigurasi infrastruktur](https://aws.amazon.com/answers/configuration-management/aws-infrastructure-configuration-management/) 
  +  [AWS Config](https://aws.amazon.com/config/) 
  +  [Apa itu AWS Config?](https://docs.aws.amazon.com/config/latest/developerguide/WhatIsConfig.html) 
  +  [Pengantar AWS CloudFormation](https://youtu.be/Omppm_YUG2g) 
  +  [Apa itu AWS CloudFormation?](https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/Welcome.html) 
  +  [AWS OpsWorks](https://aws.amazon.com/opsworks/) 
  +  [Apa itu AWS OpsWorks?](https://docs.aws.amazon.com/opsworks/latest/userguide/welcome.html) 
  +  [Pengantar AWS Elastic Beanstalk](https://youtu.be/SrwxAScdyT0) 
  +  [Apa itu AWS Elastic Beanstalk?](https://docs.aws.amazon.com/elasticbeanstalk/latest/dg/Welcome.html) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [AWS AppConfig](https://docs.aws.amazon.com/appconfig/latest/userguide/what-is-appconfig.html) 
+  [Alat Developer AWS](https://aws.amazon.com/products/developer-tools/) 
+  [AWS OpsWorks](https://aws.amazon.com/opsworks/) 
+  [Kalender Perubahan AWS Systems Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-change-calendar.html) 
+  [Periode Pemeliharaan AWS Systems Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-maintenance.html) 
+  [Manajemen konfigurasi infrastruktur](https://aws.amazon.com/answers/configuration-management/aws-infrastructure-configuration-management/) 
+  [Apa itu AWS CloudFormation?](https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/Welcome.html) 
+  [Apa itu AWS Config?](https://docs.aws.amazon.com/config/latest/developerguide/WhatIsConfig.html) 
+  [Apa itu AWS Elastic Beanstalk?](https://docs.aws.amazon.com/elasticbeanstalk/latest/dg/Welcome.html) 
+  [Apa itu AWS OpsWorks?](https://docs.aws.amazon.com/opsworks/latest/userguide/welcome.html) 

 **Video terkait:** 
+  [Pengantar AWS CloudFormation](https://youtu.be/Omppm_YUG2g) 
+  [Pengantar AWS Elastic Beanstalk](https://youtu.be/SrwxAScdyT0) 

# OPS05-BP04 Menggunakan sistem manajemen build dan deployment
<a name="ops_dev_integ_build_mgmt_sys"></a>

 Gunakan sistem manajemen build dan deployment. Sistem-sistem ini mengurangi kesalahan yang disebabkan oleh proses manual dan meminimalkan tingkat usaha untuk melakukan deployment perubahan. 

 Di AWS, Anda dapat membangun pipeline integrasi berkelanjutan/deployment berkelanjutan (CI/CD) menggunakan layanan seperti [Alat Pengembang AWS](https://aws.amazon.com/products/developer-tools/) (misalnya, AWS CodeCommit, [AWS CodeBuild](https://aws.amazon.com/codebuild/), [AWS CodePipeline](https://aws.amazon.com/codepipeline/), [AWS CodeDeploy](https://aws.amazon.com/codedeploy/), dan [AWS CodeStar](https://aws.amazon.com/codestar/)). 

 **Antipola umum:** 
+  Setelah menyusun kode pada sistem pengembangan, Anda menyalin file yang dapat dieksekusi ke sistem produksi namun file tersebut gagal untuk memulai. File log lokal mengindikasikan bahwa kegagalan tersebut dikarenakan hilangnya dependensi. 
+  Anda berhasil membangun aplikasi Anda dengan fitur baru pada lingkungan pengembangan dan memberikan kodenya ke tim Jaminan Kualitas (QA). Kode tersebut gagal dalam QA karena ada aset statis yang hilang. 
+  Pada hari Jumat, setelah berupaya keras, Anda berhasil membangun aplikasi Anda secara manual di lingkungan pengembangan Anda termasuk fitur yang baru dikodekan. Pada hari Senin, Anda tidak dapat mengulangi langkah-langkah yang membuat Anda berhasil membangun aplikasi. 
+  Anda melakukan pengujian yang telah Anda buat untuk rilisan baru Anda. Kemudian Anda menghabiskan minggu selanjutnya untuk mempersiapkan lingkungan pengujian dan melakukan seluruh pengujian integrasi yang ada disusul dengan pengujian kinerja. Kode baru tersebut memiliki dampak kinerja yang tidak dapat diterima dan harus dikembangkan ulang dan kemudian diuji ulang. 

 **Manfaat menjalankan praktik terbaik ini:** Dengan menyediakan mekanisme untuk mengatasi aktivitas build dan deployment, Anda mengurangi upaya yang diperlukan untuk melakukan tugas berulang, membebaskan anggota tim Anda untuk fokus pada tugas kreatif mereka yang berharga, serta mengurangi terjadinya kesalahan akibat prosedur manual. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Gunakan sistem manajemen build dan deployment: Gunakan sistem manajemen build dan deployment untuk melacak dan mengimplementasikan perubahan, mengurangi kesalahan yang disebabkan oleh proses manual, dan mengurangi upaya. Otomatiskan sepenuhnya pipeline integrasi dan deployment dari check-in kode hingga build, pengujian, deployment, dan validasi. Ini mengurangi waktu tunggu, sehingga meningkatkan frekuensi perubahan, dan mengurangi upaya. 
  +  [Apa itu AWS CodeBuild?](https://docs.aws.amazon.com/codebuild/latest/userguide/welcome.html) 
  +  [Praktik terbaik integrasi berkelanjutan untuk pengembangan perangkat lunak](https://www.youtube.com/watch?v=GEPJ7Lo346A) 
  +  [Slalom: CI/CD untuk aplikasi nirserver di AWS](https://www.youtube.com/watch?v=tEpx5VaW4WE) 
  +  [Pengantar AWS CodeDeploy - deployment perangkat lunak otomatis dengan Amazon Web Services](https://www.youtube.com/watch?v=Wx-ain8UryM) 
  +  [Apa itu AWS CodeDeploy?](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Alat Pengembang AWS](https://aws.amazon.com/products/developer-tools/) 
+  [Apa itu AWS CodeBuild?](https://docs.aws.amazon.com/codebuild/latest/userguide/welcome.html) 
+  [Apa itu AWS CodeDeploy?](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html) 

 **Video terkait:** 
+  [Praktik terbaik integrasi berkelanjutan untuk pengembangan perangkat lunak](https://www.youtube.com/watch?v=GEPJ7Lo346A) 
+  [Pengantar AWS CodeDeploy - deployment perangkat lunak otomatis dengan Amazon Web Services](https://www.youtube.com/watch?v=Wx-ain8UryM) 
+  [Slalom: CI/CD untuk aplikasi nirserver di AWS](https://www.youtube.com/watch?v=tEpx5VaW4WE) 

# OPS05-BP05 Melakukan manajemen patch
<a name="ops_dev_integ_patch_mgmt"></a>

 Lakukan manajemen patch untuk mendapatkan fitur, menangani permasalahan, dan menjaga kepatuhan terhadap tata kelola. Otomatiskan manajemen patch untuk mengurangi kesalahan yang disebabkan oleh proses manual, dan mengurangi upaya untuk melakukan patch. 

 Manajemen patch dan kerentanan adalah bagian dari aktivitas manajemen manfaat dan risiko Anda. Lebih baik miliki infrastruktur tetap dan deploy beban kerja pada status yang diketahui baik dan terverifikasi. Jika tidak memungkinkan, opsi yang tersisa ialah menerapkan patching. 

 Memperbarui image mesin, image kontainer, atau waktu proses dan pustaka tambahan Lambda [untuk menghapus kerentanan](https://docs.aws.amazon.com/lambda/latest/dg/security-configuration.html) adalah bagian dari manajemen patch. Anda harus mengelola pembaruan pada [Amazon Machine Images](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/AMIs.html) (AMI) untuk Linux atau image Windows Server menggunakan [EC2 Image Builder](https://aws.amazon.com/image-builder/). Anda dapat menggunakan [Amazon Elastic Container Registry](https://docs.aws.amazon.com/AmazonECR/latest/userguide/what-is-ecr.html) dengan pipeline Anda yang ada untuk [mengelola image Amazon ECS](https://docs.aws.amazon.com/AmazonECR/latest/userguide/ECR_on_ECS.html) dan [mengelola image Amazon EKS](https://docs.aws.amazon.com/AmazonECR/latest/userguide/ECR_on_EKS.html). AWS Lambda mencakup [fitur ](https://docs.aws.amazon.com/lambda/latest/dg/configuration-versions.html) manajemen versi. 

 Patching tidak boleh dilakukan pada sistem produksi tanpa mengujinya terlebih dahulu di lingkungan yang aman. Patch hanya bisa diterapkan jika mendukung hasil operasi atau bisnis. Di AWS, Anda dapat menggunakan [AWS Systems Manager Patch Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-patch.html) untuk mengotomatiskan proses patching sistem terkelola dan menjadwalkan aktivitas menggunakan [AWS Systems Manager Maintenance Windows](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-maintenance.html). 

 **Antipola umum:** 
+  Anda diberi tugas untuk menerapkan semua patch keamanan baru dalam waktu dua jam yang menyebabkan beberapa pemadaman akibat ketidaksesuaian aplikasi dengan patch. 
+  Pustaka yang tidak di-patch menimbulkan konsekuensi yang tidak dinginkan karena pihak yang tidak diketahui memanfaatkan kerentanan di dalamnya untuk mengakses beban kerja Anda. 
+  Anda melakukan patch pada lingkungan pengembangan secara otomatis tanpa memberi tahu pengembang. Anda menerima beberapa keluhan dari pengembang bahwa lingkungan mereka berhenti beroperasi sesuai dengan yang diharapkan. 
+  Anda belum melakukan patch pada perangkat lunak komersial siap pakai di instans tetap. Ketika Anda memiliki masalah dengan perangkat lunak dan menghubungi vendornya, Anda diberi tahu bahwa versi tersebut tidak didukung dan Anda harus melakukan patch pada tingkat tertentu untuk menerima bantuan. 
+  Patch yang baru-baru ini dirilis untuk perangkat lunak enkripsi yang Anda gunakan memiliki peningkatan kinerja yang signifikan. Sistem Anda yang tidak di-patch tetap memiliki masalah kinerja akibat tidak dilakukannya patching. 

 **Manfaat menjalankan praktik terbaik ini:** Dengan menjalankan proses manajemen patch, termasuk kriteria Anda untuk patching dan metodologi untuk distribusi ke seluruh lingkungan Anda, Anda akan mewujudkan manfaatnya serta dapat mengontrol dampaknya. Ini akan memungkinkan adopsi fitur dan kemampuan yang diinginkan, penyingkiran masalah, dan kepatuhan yang berkelanjutan terhadap tata kelola. Implementasikan sistem manajemen dan otomatisasi untuk mengurangi tingkat upaya untuk men-deploy patch dan mengurangi kesalahan yang disebabkan oleh proses manual. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Manajemen patch: Lakukan patch pada sistem untuk menyelesaikan masalah, untuk mendapatkan fitur atau kemampuan yang diinginkan, dan untuk tetap patuh terhadap kebijakan tata kelola serta persyaratan dukungan vendor. Pada sistem tetap, deploy dengan rangkaian patch yang sesuai untuk mencapai hasil yang diinginkan. Otomatiskan mekanisme manajemen patch untuk mengurangi waktu yang telah berlalu untuk melakukan patch, untuk mengurangi kesalahan yang disebabkan oleh proses manual, dan mengurangi upaya dalam melakukan patch. 
  +  [AWS Systems Manager Patch Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-patch.html) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Alat Pengembang AWS](https://aws.amazon.com/products/developer-tools/) 
+  [AWS Systems Manager Patch Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-patch.html) 

 **Video terkait:** 
+  [CI/CD untuk Aplikasi Nirserver di AWS](https://www.youtube.com/watch?v=tEpx5VaW4WE) 
+  [Mendesain dengan Mempertimbangkan Operasional](https://youtu.be/uh19jfW7hw4) 

   **Contoh terkait:** 
+  [Lab Well-Architected – Manajemen Inventaris dan Patch](https://wellarchitectedlabs.com/operational-excellence/100_labs/100_inventory_patch_management/) 

# OPS05-BP06 Membagikan standar desain
<a name="ops_dev_integ_share_design_stds"></a>

 Bagikan praktik terbaik kepada seluruh tim untuk meningkatkan kesadaran dan memaksimalkan manfaat dari upaya pengembangan. 

 Di AWS, Anda dapat mengelola dan menetapkan aplikasi, komputasi, infrastruktur, dan operasi, menggunakan metodologi kode. Ini akan mempermudah peluncuran, pembagian, dan pengadopsian. 

 Banyak layanan dan sumber daya AWS yang dirancang untuk dibagikan lintas akun, sehingga Anda dapat membagikan pembelajaran dan aset yang diciptakan ke seluruh tim. Misalnya, Anda dapat membagikan [repositori CodeCommit](https://docs.aws.amazon.com/codecommit/latest/userguide/cross-account.html) , [fungsi Lambda](https://docs.aws.amazon.com/lambda/latest/dg/lambda-permissions.html) , [bucket Amazon S3](https://aws.amazon.com/premiumsupport/knowledge-center/cross-account-access-s3/), dan [AMI](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/sharingamis-explicit.html) ke akun tertentu. 

 Ketika Anda memublikasikan pembaruan atau sumber daya baru, gunakan Amazon SNS untuk menyediakan [notifikasi lintas akun](https://docs.aws.amazon.com/lambda/latest/dg/with-sns-example.html). Pelanggan dapat menggunakan Lambda untuk memperoleh versi baru. 

 Jika standar bersama telah diterapkan di dalam organisasi Anda, tersedianya mekanisme sangat penting untuk meminta penambahan, perubahan, dan pengecualian terhadap standar dalam mendukung aktivitas tim. Tanpa opsi ini, standar akan menjadi penghambat inovasi. 

 **Antipola umum:** 
+  Anda telah membuat mekanisme autentikasi Anda sendiri, begitu juga dengan tim pengembangan lain di organisasi Anda. Pengguna Anda harus mempertahankan rangkaian kredensial terpisah untuk setiap bagian sistem yang ingin diakses. 
+  Anda telah membuat mekanisme autentikasi Anda sendiri, begitu juga dengan tim pengembangan lain di organisasi Anda. Organisasi Anda diberi persyaratan kepatuhan baru yang harus dipenuhi. Masing-masing tim pengembangan kini harus memperhatikan sumber daya untuk mengimplementasikan persyaratan baru. 
+  Anda telah membuat tata letak layar Anda sendiri, begitu juga dengan tim pengembangan lain di organisasi Anda. Pengguna Anda mengeluhkan tentang kesulitan menavigasi antarmuka yang tidak konsisten. 

 **Manfaat menerapkan praktik terbaik ini:** Gunakan standar bersama untuk mendukung pengadopsian praktik terbaik serta memaksimalkan manfaat dari upaya pengembangan dengan standar yang memenuhi persyaratan untuk beberapa aplikasi atau organisasi. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Bagikan standar desain: Bagikan praktik terbaik, standar desain, daftar periksa, prosedur operasi, serta panduan dan persyaratan tata kelola yang ada di seluruh tim untuk mengurangi kompleksitas dan memaksimalkan manfaat dari upaya pengembangan. Pastikan bahwa prosedur tersedia untuk meminta perubahan, tambahan, dan pengecualian untuk mendesain standar guna mendukung peningkatan dan inovasi yang berkelanjutan. Pastikan tim sadar terhadap konten yang dipublikasikan agar mereka dapat memanfaatkan konten, serta mengurangi pengerjaan ulang dan upaya yang tidak bermakna. 
  +  [Mendelegasikan akses ke lingkungan AWS Anda](https://www.youtube.com/watch?v=0zJuULHFS6A&t=849s) 
  +  [Bagikan repositori AWS CodeCommit](https://docs.aws.amazon.com/codecommit/latest/userguide/how-to-share-repository.html) 
  +  [Otorisasi mudah fungsi AWS Lambda](https://aws.amazon.com/blogs/compute/easy-authorization-of-aws-lambda-functions/) 
  +  [Membagikan AMI dengan Akun AWS tertentu](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/sharingamis-explicit.html) 
  +  [Percepat pembagian templat dengan URL desainer AWS CloudFormation](https://aws.amazon.com/blogs/devops/speed-template-sharing-with-an-aws-cloudformation-designer-url/) 
  +  [Menggunakan AWS Lambda dengan Amazon SNS](https://docs.aws.amazon.com/lambda/latest/dg/with-sns-example.html) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Otorisasi mudah fungsi AWS Lambda](https://aws.amazon.com/blogs/compute/easy-authorization-of-aws-lambda-functions/) 
+  [Bagikan repositori AWS CodeCommit](https://docs.aws.amazon.com/codecommit/latest/userguide/how-to-share-repository.html) 
+  [Membagikan AMI dengan Akun AWS tertentu](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/sharingamis-explicit.html) 
+  [Percepat pembagian templat dengan URL desainer AWS CloudFormation](https://aws.amazon.com/blogs/devops/speed-template-sharing-with-an-aws-cloudformation-designer-url/) 
+  [Menggunakan AWS Lambda dengan Amazon SNS](https://docs.aws.amazon.com/lambda/latest/dg/with-sns-example.html) 

 **Video terkait:** 
+  [Delegating access to your AWS environment](https://www.youtube.com/watch?v=0zJuULHFS6A&t=849s) 

# OPS05-BP07 Mengimplementasikan praktik untuk meningkatkan kualitas kode
<a name="ops_dev_integ_code_quality"></a>

 Implementasikan praktik untuk meningkatkan kualitas kode dan meminimalkan kecacatan. Beberapa contohnya termasuk, pengembangan yang didorong pengujian, peninjauan kode, dan pengadopsian standar. 

 Di AWS, Anda dapat mengintegrasikan layanan seperti [Amazon CodeGuru](https://docs.aws.amazon.com/codeguru/latest/reviewer-ug/welcome.html) dengan pipeline Anda untuk secara otomatis [mengidentifikasi potensi masalah keamanan dan kode](https://docs.aws.amazon.com/codeguru/latest/reviewer-ug/how-codeguru-reviewer-works.html) menggunakan analisis program dan machine learning. CodeGuru menyediakan rekomendasi terkait cara untuk mengimplementasikan praktik terbaik AWS untuk mengatasi masalah ini. 

 **Antipola umum:** 
+  Agar dapat menguji fitur lebih awal, Anda memutuskan untuk tidak mengintegrasikan pustaka sanitasi input standar Anda. Setelah pengujian, Anda mengeksekusi kode tanpa mengingat untuk menyelesaikan penggabungan pustaka. 
+  Anda memiliki pengalaman yang minim tentang set data yang sedang diproses dan tidak menyadari bahwa deret kasus edge dapat muncul di dalam set data Anda. Kasus edge tersebut tidak kompatibel dengan kode yang Anda implementasikan. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan mengadopsi praktik untuk meningkatkan kualitas kode, Anda dapat membantu meminimalkan masalah yang terjadi di produksi. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Implementasikan praktik untuk meningkatkan kualitas kode: Implementasikan praktik untuk meningkatkan kualitas kode guna meminimalkan kecacatan dan risiko di-deploy. Misalnya, pengembangan yang didorong pengujian, pair programming, peninjauan kode, dan adopsi standar. 
  +  [Amazon CodeGuru](https://docs.aws.amazon.com/codeguru/latest/reviewer-ug/welcome.html) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Amazon CodeGuru](https://docs.aws.amazon.com/codeguru/latest/reviewer-ug/welcome.html) 

# OPS05-BP08 Menggunakan beberapa lingkungan
<a name="ops_dev_integ_multi_env"></a>

 Gunakan beberapa lingkungan untuk bereksperimen, mengembangkan, dan menguji beban kerja Anda. Gunakan tingkat kontrol berjenjang seiring lingkungan mendekati tahap produksi untuk mendapatkan keyakinan bahwa beban kerja Anda akan beroperasi sesuai keinginan ketika di-deploy. 

 **Antipola umum:** 
+  Anda sedang melakukan pengembangan di sebuah lingkungan pengembangan bersama dan developer lain menimpa perubahan kode Anda. 
+  Kontrol keamanan terbatas di lingkungan pengembangan bersama Anda melarang Anda melakukan eksperimen dengan layanan dan fitur baru. 
+  Anda melakukan pengujian beban pada sistem produksi Anda dan menyebabkan pemadaman untuk pengguna Anda. 
+  Kesalahan fatal yang menyebabkan hilangnya data terjadi di produksi. Di lingkungan produksi, Anda mencoba membuat ulang kondisi yang menyebabkan data hilang tersebut sehingga Anda dapat mengidentifikasi bagaimana hal tersebut terjadi dan mencegahnya agar tidak terjadi lagi. Untuk mencegah kejadian hilang data lainnya selama pengujian, Anda terpaksa menjadikan aplikasi tidak tersedia untuk pengguna. 
+  Anda mengoperasikan layanan multi-tenant dan tidak dapat mendukung permintaan lingkungan khusus yang diajukan pelanggan. 
+  Anda mungkin tidak selalu melakukan pengujian, tetapi pengujian yang Anda lakukan terjadi di tahap produksi. 
+  Anda percaya bahwa dengan satu lingkungan tunggal, cakupan dampak perubahan hanya terjadi di dalam lingkungan tersebut. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan men-deploy beberapa lingkungan, Anda dapat mendukung beberapa lingkungan pengembangan, pengujian, dan produksi secara serentak tanpa menciptakan konflik antar developer atau komunitas pengguna. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Gunakan beberapa lingkungan: Sediakan lingkungan sandbox developer dengan kontrol minim untuk memungkinkan eksperimen. Sediakan lingkungan pengembangan individu untuk memungkinkan kerja secara paralel, sehingga ketangkasan pengembangan meningkat. Implementasikan kontrol yang lebih kuat di lingkungan ketika mendekati produksi agar developer dapat berinovasi. Gunakan infrastruktur sebagai kode dan sistem manajemen konfigurasi untuk men-deploy lingkungan yang dikonfigurasi sesuai dengan kontrol yang ada di dalam produksi guna memastikan sistem beroperasi sesuai keinginan saat di-deploy. Saat lingkungan tidak digunakan, nonaktifkan untuk menghindari biaya terkait sumber daya tidak terpakai (misalnya sistem pengembangan di malam hari dan di akhir pekan). Deploy lingkungan setara produksi saat melakukan pengujian beban untuk memungkinkan hasil yang valid. 
  +  [Apa itu AWS CloudFormation?](https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/Welcome.html) 
  +  [Bagaimana cara menghentikan dan memulai instans Amazon EC2 pada interval yang teratur menggunakan AWS Lambda?](https://aws.amazon.com/premiumsupport/knowledge-center/start-stop-lambda-cloudwatch/) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Bagaimana cara menghentikan dan memulai instans Amazon EC2 pada interval yang teratur menggunakan AWS Lambda?](https://aws.amazon.com/premiumsupport/knowledge-center/start-stop-lambda-cloudwatch/) 
+  [Apa itu AWS CloudFormation?](https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/Welcome.html) 

# OPS05-BP09 Membuat perubahan yang sering, kecil, dan dapat dikembalikan
<a name="ops_dev_integ_freq_sm_rev_chg"></a>

 Gunakan perubahan yang sering, kecil, dan dapat dikembalikan untuk mengurangi cakupan perubahan. Hal ini memudahkan pemecahan masalah, memungkinkan perbaikan yang lebih cepat, dan menyediakan opsi untuk mengembalikan perubahan. 

 **Antipola umum:** 
+  Anda melakukan deployment versi baru aplikasi Anda setiap kuartal. 
+  Anda sering melakukan perubahan pada skema basis data Anda. 
+  Anda melakukan pembaruan pengganti manual, menimpa instalasi dan konfigurasi yang ada. 

 **Manfaat menerapkan praktik terbaik ini:** Anda dapat merasakan manfaat dari upaya pengembangan dengan lebih cepat melalui deployment perubahan-perubahan kecil secara sering. Ketika perubahannya kecil, akan jauh lebih mudah untuk mengidentifikasi apakah terdapat konsekuensi yang tidak diinginkan. Ketika perubahan dapat dikembalikan, lebih sedikit risiko dari implementasi perubahan karena pemulihannya lebih mudah. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Rendah 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Buat perubahan yang sering, kecil, dan dapat dikembalikan: Perubahan yang sering, kecil, dan dapat dikembalikan mengurangi cakupan dan dampak perubahan. Hal ini memudahkan pemecahan masalah, memungkinkan perbaikan yang lebih cepat, dan menyediakan opsi untuk mengembalikan perubahan. Hal ini juga meningkatkan rasio nilai yang dapat anda berikan ke bisnis. 

# OPS05-BP10 Mengotomatiskan integrasi dan deployment sepenuhnya
<a name="ops_dev_integ_auto_integ_deploy"></a>

 Otomatiskan build, deployment, dan pengujian beban kerja. Hal ini mengurangi kesalahan yang disebabkan oleh proses manual, dan mengurangi upaya untuk melakukan deployment perubahan. 

 Terapkan metadata menggunakan [Tag Sumber Daya](https://docs.aws.amazon.com/general/latest/gr/aws_tagging.html) dan [AWS Resource Groups](https://docs.aws.amazon.com/ARG/latest/APIReference/Welcome.html) mengikuti strategi [pemberian tag yang konsisten](https://aws.amazon.com/answers/account-management/aws-tagging-strategies/) untuk memungkinkan identifikasi sumber daya. Beri tag pada sumber daya Anda untuk organisasi, akuntansi biaya, kontrol akses, dan penargetan eksekusi aktivitas operasi yang diotomatisasi. 

 **Antipola umum:** 
+  Pada hari Jumat, Anda menyelesaikan penulisan kode baru untuk cabang fitur Anda. Pada hari Senin, setelah menjalankan skrip pengujian kualitas kode dan setiap skrip pengujian unit, Anda akan mendaftarkan kode untuk rilisan terjadwal berikutnya. 
+  Anda ditugaskan untuk membuat kode perbaikan untuk sebuah masalah besar yang memengaruhi banyak pelanggan di tahap produksi. Setelah menguji perbaikan tersebut, Anda melakukan commit kode Anda dan mengirimkan manajemen perubahan melalui email untuk meminta persetujuan deployment ke produksi. 

 **Manfaat menjalankan praktik terbaik ini:** Dengan mengimplementasi sistem manajemen build dan deployment otomatis, Anda mengurangi kesalahan akibat proses manual dan mengurangi upaya untuk melakukan deployment perubahan sehingga anggota tim Anda dapat berkonsentrasi menghadirkan nilai bisnis. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Rendah 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Gunakan sistem manajemen build dan deployment: Gunakan sistem manajemen build dan deployment untuk melacak dan mengimplementasikan perubahan, mengurangi kesalahan yang disebabkan proses manual, dan meminimalkan upaya. Otomatiskan jalur deployment dan integrasi secara penuh dari check-in kode hingga build, pengujian, deployment, dan validasi. Ini mengurangi waktu penyelesaian proses, memampukan peningkatan frekuensi perubahan, dan mengurangi upaya. 
  +  [Apa itu AWS CodeBuild?](https://docs.aws.amazon.com/codebuild/latest/userguide/welcome.html) 
  +  [Praktik terbaik integrasi berkelanjutan untuk pengembangan perangkat lunak](https://www.youtube.com/watch?v=GEPJ7Lo346A) 
  +  [Slalom: CI/CD untuk aplikasi nirserver di AWS](https://www.youtube.com/watch?v=tEpx5VaW4WE) 
  +  [Pengantar AWS CodeDeploy - deployment perangkat lunak otomatis dengan Amazon Web Services](https://www.youtube.com/watch?v=Wx-ain8UryM) 
  +  [Apa itu AWS CodeDeploy?](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Apa itu AWS CodeBuild?](https://docs.aws.amazon.com/codebuild/latest/userguide/welcome.html) 
+  [Apa itu AWS CodeDeploy?](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html) 

 **Video terkait:** 
+  [Praktik terbaik integrasi berkelanjutan untuk pengembangan perangkat lunak](https://www.youtube.com/watch?v=GEPJ7Lo346A) 
+  [Pengantar AWS CodeDeploy - deployment perangkat lunak otomatis dengan Amazon Web Services](https://www.youtube.com/watch?v=Wx-ain8UryM) 
+  [Slalom: CI/CD untuk aplikasi nirserver di AWS](https://www.youtube.com/watch?v=tEpx5VaW4WE) 

# OPS 6 Bagaimana cara memitigasi risiko deployment?
<a name="w2aac19b5b7b9"></a>

 Adopsi pendekatan yang memberikan umpan balik cepat atas kualitas dan mampukan pemulihan cepat dari perubahan yang tidak memiliki hasil yang tidak diinginkan. Menggunakan praktik-praktik ini memitigasi dampak masalah akibat deployment perubahan. 

**Topics**
+ [OPS06-BP01 Antisipasikan perubahan yang tidak berhasil](ops_mit_deploy_risks_plan_for_unsucessful_changes.md)
+ [OPS06-BP02 Menguji dan memvalidasi perubahan](ops_mit_deploy_risks_test_val_chg.md)
+ [OPS06-BP03 Gunakan sistem manajemen deployment](ops_mit_deploy_risks_deploy_mgmt_sys.md)
+ [OPS06-BP04 Menguji menggunakan deployment terbatas](ops_mit_deploy_risks_test_limited_deploy.md)
+ [OPS06-BP05 Men-deploy menggunakan lingkungan paralel](ops_mit_deploy_risks_deploy_to_parallel_env.md)
+ [OPS06-BP06 Lakukan deployment perubahan yang sering, kecil, dan dapat dikembalikan](ops_mit_deploy_risks_freq_sm_rev_chg.md)
+ [OPS06-BP07 Mengotomatiskan integrasi dan deployment sepenuhnya](ops_mit_deploy_risks_auto_integ_deploy.md)
+ [OPS06-BP08 Mengotomatiskan pengujian dan pengembalian (rollback)](ops_mit_deploy_risks_auto_testing_and_rollback.md)

# OPS06-BP01 Antisipasikan perubahan yang tidak berhasil
<a name="ops_mit_deploy_risks_plan_for_unsucessful_changes"></a>

 Rencanakan untuk kembali ke keadaan yang diketahui pasti baik, atau perbaiki di lingkungan produksi jika perubahan tidak memiliki hasil yang diinginkan. Persiapan ini mengurangi waktu pemulihan melalui respons yang lebih cepat. 

 **Antipola umum:** 
+  Anda melakukan deployment dan aplikasi Anda telah menjadi tidak stabil tetapi tampaknya ada pengguna aktif di sistem. Anda harus memutuskan apakah akan mengembalikan perubahan yang akan berdampak pada pengguna aktif atau menunggu untuk mengembalikan perubahan karena tahu bagaimana pun juga pengguna dapat terkena dampaknya. 
+  Setelah membuat perubahan rutin, lingkungan baru Anda dapat diakses tetapi salah satu subnet Anda menjadi tidak dapat dijangkau. Anda harus memutuskan apakah akan mengembalikan semuanya atau mencoba memperbaiki subnet yang tidak dapat diakses tersebut. Sementara Anda sedang memutuskan hal ini, subnet tersebut tetap tidak dapat dijangkau. 

 **Manfaat menerapkan praktik terbaik ini:** Memiliki rencana akan mengurangi waktu rata-rata untuk pemulihan (MTTR) dari perubahan yang tidak berhasil, sehingga mengurangi dampak pada pengguna akhir Anda. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Antisipasikan perubahan yang tidak berhasil: Rencanakan untuk kembali ke keadaan yang diketahui pasti baik (yaitu mengembalikan perubahan), atau perbaiki di lingkungan produksi (yaitu menerapkan perubahan) jika perubahan tidak memiliki hasil yang diinginkan. Ketika Anda mengidentifikasi perubahan yang tidak dapat Anda kembalikan jika tidak berhasil, terapkan uji kelayakan sebelum melakukan perubahan. 

# OPS06-BP02 Menguji dan memvalidasi perubahan
<a name="ops_mit_deploy_risks_test_val_chg"></a>

 Uji perubahan dan validasi hasilnya di semua tahap siklus hidup untuk mengonfirmasi fitur baru dan meminimalkan risiko serta dampak deployment yang gagal. 

 Di AWS, Anda dapat membuat lingkungan paralel sementara untuk menurunkan risiko, upaya, serta biaya eksperimen dan pengujian. Otomatiskan deployment lingkungan ini menggunakan [AWS CloudFormation](https://aws.amazon.com/cloudformation/) untuk memastikan implementasi lingkungan sementara yang konsisten. 

 **Antipola umum:** 
+  Anda melakukan deployment fitur baru yang keren ke aplikasi Anda. Fitur tersebut tidak berfungsi. Anda tidak tahu. 
+  Anda memperbarui sertifikat Anda. Anda tidak sengaja menginstal sertifikat ke komponen yang salah. Anda tidak tahu. 

 **Manfaat menjalankan praktik terbaik ini:** Dengan menguji dan memvalidasi perubahan setelah deployment, Anda dapat mengidentifikasi masalah lebih awal dengan menyediakan kesempatan untuk mitigasi dampak pada pelanggan Anda. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Menguji dan memvalidasi perubahan: Uji perubahan dan validasi hasilnya di semua tahap siklus hidup (misalnya, pengembangan, pengujian, dan produksi) untuk mengonfirmasi fitur baru dan meminimalkan risiko serta dampak deployment yang gagal. 
  +  [AWS Cloud9](https://aws.amazon.com/cloud9/) 
  +  [Apa itu AWS Cloud9?](https://docs.aws.amazon.com/cloud9/latest/user-guide/welcome.html) 
  +  [Cara menguji dan melakukan debug AWS CodeDeploy secara lokal sebelum mengirimkan kode Anda](https://aws.amazon.com/blogs/devops/how-to-test-and-debug-aws-codedeploy-locally-before-you-ship-your-code/) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [AWS Cloud9](https://aws.amazon.com/cloud9/) 
+  [Alat Pengembang AWS](https://aws.amazon.com/products/developer-tools/) 
+  [Cara menguji dan melakukan debug AWS CodeDeploy secara lokal sebelum mengirimkan kode Anda](https://aws.amazon.com/blogs/devops/how-to-test-and-debug-aws-codedeploy-locally-before-you-ship-your-code/) 
+  [Apa itu AWS Cloud9?](https://docs.aws.amazon.com/cloud9/latest/user-guide/welcome.html) 

# OPS06-BP03 Gunakan sistem manajemen deployment
<a name="ops_mit_deploy_risks_deploy_mgmt_sys"></a>

 Gunakan sistem manajemen deployment untuk melacak dan mengimplementasikan perubahan. Ini mengurangi kesalahan yang disebabkan oleh proses manual dan mengurangi upaya untuk deployment perubahan. 

 Di AWS, Anda dapat membangun alur Integrasi Berkelanjutan/Deployment Berkelanjutan (CI/CD) menggunakan layanan seperti [AWS Alat Developer](https://aws.amazon.com/products/developer-tools/) (misalnya, AWS CodeCommit, [AWS CodeBuild](https://aws.amazon.com/codebuild/), [AWS CodePipeline](https://aws.amazon.com/codepipeline/), [AWS CodeDeploy](https://aws.amazon.com/codedeploy/), dan [AWS CodeStar](https://aws.amazon.com/codestar/)). 

 **Antipola umum:** 
+  Anda secara manual melakukan deploy pembaruan ke server aplikasi di semua armada Anda dan sejumlah server menjadi tidak responsif karena kesalahan dalam pembaruan. 
+  Anda secara manual melakukan deploy ke armada server aplikasi Anda selama berjam-jam. Inkonsistensi dalam versi selama perubahan menyebabkan perilaku tak terduga. 

 **Manfaat menerapkan praktik terbaik ini:** Mengadopsi sistem manajemen deployment mengurangi upaya untuk melakukan deploy perubahan, dan frekuensi kesalahan yang disebabkan oleh prosedur manual. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Gunakan sistem manajemen deployment: Gunakan sistem manajemen deployment untuk melacak dan mengimplementasikan perubahan. Sistem ini mengurangi kesalahan yang disebabkan oleh proses manual, dan mengurangi upaya untuk melakukan deploy perubahan. Otomatiskan alur deployment dan integrasi dari check-in kode melalui pengujian, deployment, dan validasi. Ini mengurangi waktu penyelesaian proses, memampukan peningkatan frekuensi perubahan, dan mengurangi lebih lanjut upaya yang diperlukan. 
  +  [Pengantar AWS CodeDeploy - deployment perangkat lunak otomatis dengan Amazon Web Services](https://www.youtube.com/watch?v=Wx-ain8UryM) 
  +  [Apa itu AWS CodeDeploy?](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html) 
  +  [Apa itu AWS Elastic Beanstalk?](https://docs.aws.amazon.com/elasticbeanstalk/latest/dg/Welcome.html) 
  +  [Apa itu Amazon API Gateway?](https://docs.aws.amazon.com/apigateway/latest/developerguide/welcome.html) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [AWS CodeDeploy Panduan Pengguna](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html) 
+  [AWS Alat Developer](https://aws.amazon.com/products/developer-tools/) 
+  [Coba Sampel Deployment Blue/Green di AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/applications-create-blue-green.html) 
+  [Apa itu AWS CodeDeploy?](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html) 
+  [Apa itu AWS Elastic Beanstalk?](https://docs.aws.amazon.com/elasticbeanstalk/latest/dg/Welcome.html) 
+  [Apa itu Amazon API Gateway?](https://docs.aws.amazon.com/apigateway/latest/developerguide/welcome.html) 

 **Video terkait:** 
+  [Pelajari Lebih Mendalam Teknik CD Lanjutan Menggunakan AWS](https://www.youtube.com/watch?v=Lrrgd0Kemhw) 
+  [Pengantar AWS CodeDeploy - deployment perangkat lunak otomatis dengan Amazon Web Services](https://www.youtube.com/watch?v=Wx-ain8UryM) 

# OPS06-BP04 Menguji menggunakan deployment terbatas
<a name="ops_mit_deploy_risks_test_limited_deploy"></a>

 Lakukan pengujian menggunakan deployment terbatas bersama dengan sistem yang ada untuk mengonfirmasi hasil yang diinginkan deployment skala penuh. Misalnya, gunakan pengujian canary deployment atau deployment one-box. 

 **Antipola umum:** 
+  Anda melakukan deployment perubahan yang tidak berhasil ke seluruh produksi sekaligus. Anda tidak tahu. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan menguji dan memvalidasi perubahan sesuai dengan deployment terbatas, Anda dapat mengidentifikasi masalah sejak dini dan meminimalkan dampak terhadap pelanggan dengan menyediakan kesempatan untuk memitigasi lebih lanjut dampak yang ditimbulkan pada pelanggan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Lakukan pengujian menggunakan deployment terbatas: Lakukan pengujian menggunakan deployment terbatas bersama dengan sistem yang ada untuk mengonfirmasi hasil yang diinginkan deployment skala penuh. Misalnya, gunakan pengujian canary deployment atau deployment one-box. 
  +  [Panduan Pengguna AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html) 
  +  [Deployment Blue/Green dengan AWS Elastic Beanstalk](https://docs.aws.amazon.com/elasticbeanstalk/latest/dg/using-features.CNAMESwap.html) 
  +  [Konfigurasikan canary API Gateway untuk meluncurkan deployment](https://docs.aws.amazon.com/apigateway/latest/developerguide/canary-release.html) 
  +  [Coba Sampel Deployment Blue/Green di AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/applications-create-blue-green.html) 
  +  [Mulai konfigurasi deployment di AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/deployment-configurations.html) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Panduan Pengguna AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html) 
+  [Deployment Blue/Green dengan AWS Elastic Beanstalk](https://docs.aws.amazon.com/elasticbeanstalk/latest/dg/using-features.CNAMESwap.html) 
+  [Konfigurasikan canary API Gateway untuk meluncurkan deployment](https://docs.aws.amazon.com/apigateway/latest/developerguide/canary-release.html) 
+  [Coba Sampel Deployment Blue/Green di AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/applications-create-blue-green.html) 
+  [Mulai konfigurasi deployment di AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/deployment-configurations.html) 

# OPS06-BP05 Men-deploy menggunakan lingkungan paralel
<a name="ops_mit_deploy_risks_deploy_to_parallel_env"></a>

 Implementasikan perubahan ke lingkungan paralel, kemudian beralih ke lingkungan baru. Pertahankan lingkungan sebelumnya sampai ada konfirmasi deployment berhasil. Tindakan ini meminimalkan waktu pemulihan dengan mengaktifkan pengembalian ke lingkungan sebelumnya. 

 **Antipola umum:** 
+  Anda melakukan deployment yang dapat diubah dengan memodifikasi sistem yang sudah ada. Setelah mengetahui bahwa perubahan tidak berhasil, Anda terpaksa memodifikasi sistem lagi untuk memulihkan versi yang lama sehingga memperpanjang waktu pemulihan Anda. 
+  Selama jadwal pemeliharaan, Anda menonaktifkan lingkungan lama kemudian mulai membangun lingkungan baru. Berjam-jam di dalam prosedur, Anda menemukan masalah yang tidak dapat dipulihkan pada deployment. Meskipun sangat lelah, Anda terpaksa menemukan prosedur deployment sebelumnya dan mulai membangun kembali lingkungan lama. 

 **Manfaat menjalankan praktik terbaik ini:** Dengan menggunakan lingkungan paralel, Anda dapat melakukan pra-deploy lingkungan baru dan beralih ke lingkungan tersebut jika diinginkan. Jika lingkungan baru tidak berhasil, Anda dapat dengan cepat memulihkannya dengan kembali ke lingkungan asli Anda. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Deploy menggunakan lingkungan paralel: Implementasikan perubahan ke lingkungan paralel, dan beralih atau pindah ke lingkungan baru. Pertahankan lingkungan sebelumnya sampai ada konfirmasi deployment berhasil. Ini meminimalkan waktu pemulihan dengan mengaktifkan pengembalian ke lingkungan sebelumnya. Contohnya, gunakan infrastruktur yang tidak dapat diubah dengan deployment blue/green. 
  +  [Bekerja dengan konfigurasi deployment di AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/deployment-configurations.html) 
  +  [Deployment Blue/Green dengan AWS Elastic Beanstalk](https://docs.aws.amazon.com/elasticbeanstalk/latest/dg/using-features.CNAMESwap.html) 
  +  [Menyiapkan deployment perilisan canary API Gateway](https://docs.aws.amazon.com/apigateway/latest/developerguide/canary-release.html) 
  +  [Mencoba Sampel Deployment Blue/Green di AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/applications-create-blue-green.html) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Panduan Pengguna AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html) 
+  [Deployment Blue/Green dengan AWS Elastic Beanstalk](https://docs.aws.amazon.com/elasticbeanstalk/latest/dg/using-features.CNAMESwap.html) 
+  [Menyiapkan deployment perilisan canary API Gateway](https://docs.aws.amazon.com/apigateway/latest/developerguide/canary-release.html) 
+  [Mencoba Sampel Deployment Blue/Green di AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/applications-create-blue-green.html) 
+  [Bekerja dengan konfigurasi deployment di AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/deployment-configurations.html) 

 **Video terkait: ** 
+  [Pelajari Lebih Dalam Teknik Penyampaian Kontinu Lanjutan Menggunakan AWS](https://www.youtube.com/watch?v=Lrrgd0Kemhw) 

# OPS06-BP06 Lakukan deployment perubahan yang sering, kecil, dan dapat dikembalikan
<a name="ops_mit_deploy_risks_freq_sm_rev_chg"></a>

 Gunakan perubahan yang sering, kecil, dan dapat dikembalikan untuk mengurangi cakupan perubahan. Hal ini menghasilkan pemecahan masalah yang lebih mudah dan perbaikan yang lebih cepat dengan opsi untuk membatalkan perubahan. 

 **Antipola umum:** 
+  Anda melakukan deployment versi baru aplikasi Anda setiap kuartal. 
+  Anda sering melakukan perubahan pada skema basis data Anda. 
+  Anda melakukan pembaruan pengganti manual, menimpa instalasi dan konfigurasi yang ada. 

 **Manfaat menjalankan praktik terbaik ini:** Anda merasakan manfaat dari upaya pengembangan lebih cepat dengan melakukan deployment perubahan-perubahan kecil secara sering. Ketika berukuran kecil, perubahan jauh lebih mudah diidentifikasi jika terdapat konsekuensi yang tidak diinginkan. Ketika perubahan dapat dikembalikan, lebih sedikit risiko dari implementasi perubahan karena pemulihannya lebih mudah. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Rendah 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Terapkan perubahan yang sering, kecil, dan dapat dikembalikan: Gunakan perubahan yang sering, kecil, dan dapat dikembalikan untuk mengurangi cakupan perubahan. Hal ini menghasilkan pemecahan masalah yang lebih mudah dan perbaikan yang lebih cepat dengan opsi untuk membatalkan perubahan. 

# OPS06-BP07 Mengotomatiskan integrasi dan deployment sepenuhnya
<a name="ops_mit_deploy_risks_auto_integ_deploy"></a>

 Otomatiskan build, deployment, dan pengujian beban kerja. Ini mengurangi kesalahan yang disebabkan oleh proses manual dan mengurangi upaya untuk melakukan deployment perubahan. 

 Terapkan metadata menggunakan [Tag Sumber Daya](https://docs.aws.amazon.com/general/latest/gr/aws_tagging.html) dan [AWS Resource Groups](https://docs.aws.amazon.com/ARG/latest/APIReference/Welcome.html) mengikuti strategi [pemberian tag yang konsisten](https://aws.amazon.com/answers/account-management/aws-tagging-strategies/) untuk memungkinkan identifikasi sumber daya. Beri tag pada sumber daya Anda untuk organisasi, akuntansi biaya, kontrol akses, dan penargetan eksekusi aktivitas operasi yang diotomatisasi. 

 **Antipola umum:** 
+  Pada hari jumat, Anda selesai menulis kode baru untuk cabang fitur Anda. Pada hari Senin, setelah menjalankan skrip pengujian kualitas kode dan setiap skrip pengujian unit, Anda akan mendaftarkan kode untuk rilisan terjadwal berikutnya. 
+  Anda ditugaskan untuk membuat kode perbaikan untuk sebuah masalah besar yang memengaruhi banyak pelanggan di tahap produksi. Setelah menguji perbaikan tersebut, Anda melakukan commit kode Anda dan mengirimkan manajemen perubahan melalui email untuk meminta persetujuan deployment ke produksi. 

 **Manfaat menjalankan praktik terbaik ini:** Dengan mengimplementasikan sistem manajemen build dan deployment otomatis, Anda mengurangi kesalahan yang disebabkan proses manual dan mengurangi upaya untuk melakukan deployment perubahan sehingga anggota tim Anda dapat berkonsentrasi menghadirkan nilai bisnis. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Rendah 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Gunakan sistem manajemen build dan deployment: Gunakan sistem manajemen build dan deployment untuk melacak dan mengimplementasikan perubahan, mengurangi kesalahan yang disebabkan proses manual, dan meminimalkan upaya. Otomatiskan jalur deployment dan integrasi secara penuh dari check-in kode hingga build, pengujian, deployment, dan validasi. Ini mengurangi waktu penyelesaian proses, memampukan peningkatan frekuensi perubahan, dan mengurangi upaya. 
  +  [Apa itu AWS CodeBuild?](https://docs.aws.amazon.com/codebuild/latest/userguide/welcome.html) 
  +  [Praktik terbaik integrasi berkelanjutan untuk pengembangan perangkat lunak](https://www.youtube.com/watch?v=GEPJ7Lo346A) 
  +  [Slalom: CI/CD untuk aplikasi nirserver di AWS](https://www.youtube.com/watch?v=tEpx5VaW4WE) 
  +  [Pengantar AWS CodeDeploy - deployment perangkat lunak otomatis dengan Amazon Web Services](https://www.youtube.com/watch?v=Wx-ain8UryM) 
  +  [Apa itu AWS CodeDeploy?](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html) 
  +  [Pelajari Lebih Dalam Teknik Penyampaian Kontinu Lanjutan Menggunakan AWS](https://www.youtube.com/watch?v=Lrrgd0Kemhw) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Mencoba Sampel Deployment Blue/Green di AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/applications-create-blue-green.html) 
+  [Apa itu AWS CodeBuild?](https://docs.aws.amazon.com/codebuild/latest/userguide/welcome.html) 
+  [Apa itu AWS CodeDeploy?](https://docs.aws.amazon.com/codedeploy/latest/userguide/welcome.html) 

 **Video terkait:** 
+  [Praktik terbaik integrasi berkelanjutan untuk pengembangan perangkat lunak](https://www.youtube.com/watch?v=GEPJ7Lo346A) 
+  [Pelajari Lebih Dalam Teknik Penyampaian Kontinu Lanjutan Menggunakan AWS](https://www.youtube.com/watch?v=Lrrgd0Kemhw) 
+  [Pengantar AWS CodeDeploy - deployment perangkat lunak otomatis dengan Amazon Web Services](https://www.youtube.com/watch?v=Wx-ain8UryM) 
+  [Slalom: CI/CD untuk aplikasi nirserver di AWS](https://www.youtube.com/watch?v=tEpx5VaW4WE) 

# OPS06-BP08 Mengotomatiskan pengujian dan pengembalian (rollback)
<a name="ops_mit_deploy_risks_auto_testing_and_rollback"></a>

 Otomatiskan pengujian lingkungan yang di-deploy untuk mengonfirmasi hasil yang diinginkan. Otomatiskan pengembalian ke keadaan yang diketahui baik sebelumnya ketika hasil tidak tercapai, untuk meminimalkan waktu pemulihan dan mengurangi kesalahan yang disebabkan oleh proses manual. 

 **Antipola umum:** 
+  Anda men-deploy perubahan ke beban kerja Anda. Setelah Anda melihat perubahan tersebut selesai, Anda mulai pengujian pasca-deployment. Setelah pengujian selesai, Anda menyadari beban kerja Anda tidak dapat dioperasikan dan koneksi pelanggan terputus. Kemudian Anda mulai mengembalikan ke versi sebelumnya. Setelah waktu yang lama untuk mendeteksi masalah, waktu pemulihan menjadi lebih panjang akibat deployment ulang manual Anda. 

 **Manfaat menjalankan praktik terbaik ini:** Dengan menguji dan memvalidasi perubahan setelah deployment, Anda dapat segera mengidentifikasi masalah. Dengan mengembalikan secara otomatis ke versi sebelumnya, dampak pada pelanggan diminimalkan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Rendah 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Mengotomatiskan pengujian dan pengembalian (rollback): Otomatiskan pengujian lingkungan yang di-deploy untuk mengonfirmasi hasil yang diinginkan. Otomatiskan pengembalian ke keadaan yang diketahui baik sebelumnya ketika hasil tidak tercapai, untuk meminimalkan waktu pemulihan dan mengurangi kesalahan yang disebabkan oleh proses manual. Contohnya, lakukan transaksi pengguna sintetis mendetail setelah deployment, verifikasi hasilnya, dan kembalikan jika terjadi kegagalan. 
  +  [Deploy ulang dan batalkan deployment dengan AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/deployments-rollback-and-redeploy.html) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Men-deploy ulang dan membatalkan deployment dengan AWS CodeDeploy](https://docs.aws.amazon.com/codedeploy/latest/userguide/deployments-rollback-and-redeploy.html) 

# OPS 7 Bagaimana cara mengetahui bahwa Anda siap untuk mendukung beban kerja?
<a name="w2aac19b5b7c11"></a>

 Evaluasi kesiapan operasional beban kerja, proses, dan prosedur, serta personel Anda untuk memahami risiko operasional terkait beban kerja Anda. 

**Topics**
+ [OPS07-BP01 Memastikan kemampuan personel](ops_ready_to_support_personnel_capability.md)
+ [OPS07-BP02 Memastikan peninjauan yang konsisten terkait kesiapan operasional](ops_ready_to_support_const_orr.md)
+ [OPS07-BP03 Menggunakan runbook untuk menjalankan prosedur](ops_ready_to_support_use_runbooks.md)
+ [OPS07-BP04 Menggunakan buku panduan untuk menyelidiki masalah](ops_ready_to_support_use_playbooks.md)
+ [OPS07-BP05 Membuat keputusan yang tepat untuk melakukan deployment sistem dan perubahan](ops_ready_to_support_informed_deploy_decisions.md)

# OPS07-BP01 Memastikan kemampuan personel
<a name="ops_ready_to_support_personnel_capability"></a>

 Miliki mekanisme untuk memvalidasi bahwa Anda memiliki personel terlatih dalam jumlah yang tepat untuk menyediakan dukungan untuk kebutuhan operasional. Latih personel dan sesuaikan kapasitas personel seperlunya untuk mempertahankan dukungan yang efektif. 

 Anda perlu memiliki cukup anggota tim untuk mencakup semua aktivitas (termasuk siap dipanggil kapan saja). Pastikan bahwa tim Anda memiliki keterampilan yang diperlukan untuk berhasil dalam pelatihan tentang beban kerja Anda, alat operasional Anda, dan AWS. 

 AWS menyediakan sumber daya, termasuk [Pusat Sumber Daya untuk Memulai AWS](https://aws.amazon.com/getting-started/), [Blog AWS](https://aws.amazon.com/blogs/), [AWS Online Tech Talks](https://aws.amazon.com/getting-started/), [Acara dan Webinar AWS](https://aws.amazon.com/events/), serta [Lab AWS Well-Architected](https://wellarchitectedlabs.com/), yang menyediakan panduan, contoh, dan ringkasan mendetail untuk mengedukasi tim Anda. Selain itu, [AWS Training and Certification](https://aws.amazon.com/training/) menyediakan beberapa pelatihan gratis melalui kursus digital mandiri tentang dasar-dasar AWS. Anda juga dapat mengikuti pelatihan yang dipandu instruktur untuk mendukung perkembangan keterampilan AWS tim Anda. 

 **Antipola umum:** 
+  Men-deploy beban kerja tanpa anggota tim yang memiliki keterampilan untuk mendukung platform dan layanan yang digunakan. 
+  Men-deploy beban kerja tanpa anggota tim yang tersedia selama jam dukungan yang diinginkan. 
+  Men-deploy beban kerja tanpa anggota tim yang cukup untuk mendukungnya jika terdapat anggota tim yang sedang cuti atau sakit. 
+  Men-deploy beban kerja tambahan tanpa meninjau dampak tambahan terhadap dukungan anggota tim pada beban kerja tersebut dan beban kerja lain. 

 **Manfaat menerapkan praktik terbaik ini:** Memiliki anggota tim yang terampil memungkinkan dukungan yang efektif untuk beban kerja. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Kemampuan personel: Validasi bahwa terdapat personel terlatih yang memadai untuk mendukung beban kerja secara efektif. 
  +  Ukuran tim: Pastikan Anda memiliki jumlah anggota tim yang cukup untuk menangani aktivitas operasional, termasuk tugas mendadak. 
  +  Keterampilan tim: Pastikan anggota tim Anda memiliki pelatihan yang memadai tentang AWS, beban kerja Anda, dan alat-alat operasional Anda untuk menjalankan tugas mereka. 
    +  [Acara dan Webinar AWS](https://aws.amazon.com/about-aws/events/) 
    +  [Selama datang di AWS Training and Certification](https://aws.amazon.com/training/) 
  +  Tinjau kemampuan: Tinjau ukuran dan keterampilan tim seiring perubahan kondisi operasional dan beban kerja, untuk memastikan terdapat kemampuan yang memadai untuk mempertahankan keunggulan operasional. Buat penyesuaian untuk memastikan ukuran dan keterampilan tim memenuhi persyaratan operasional untuk beban kerja yang didukung oleh tim. 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Blog AWS](https://aws.amazon.com/blogs/) 
+  [Acara dan Webinar AWS](https://aws.amazon.com/about-aws/events/) 
+  [Pusat Sumber Daya untuk Memulai AWS](https://aws.amazon.com/getting-started/) 
+  [AWS Online Tech Talks](https://aws.amazon.com/getting-started/) 
+  [Selama datang di AWS Training and Certification](https://aws.amazon.com/training/) 

 **Contoh terkait:** 
+  [Lab Well-Architected](https://wellarchitectedlabs.com/) 

# OPS07-BP02 Memastikan peninjauan yang konsisten terkait kesiapan operasional
<a name="ops_ready_to_support_const_orr"></a>

Gunakan Peninjauan Kesiapan Operasional (ORR) untuk memvalidasi bahwa Anda dapat mengoperasikan beban kerja Anda. ORR adalah mekanisme yang dikembangkan di Amazon untuk memvalidasi bahwa tim dapat mengoperasikan beban kerja mereka dengan aman. ORR adalah proses peninjauan dan inspeksi menggunakan daftar periksa persyaratan. ORR adalah pengalaman layanan mandiri yang digunakan tim untuk memastikan beban kerja mereka. ORR mencakup praktik terbaik dari pelajaran yang kami dapatkan selama bertahun-tahun membangun perangkat lunak. 

 Daftar periksa ORR terdiri dari rekomendasi arsitektur, proses operasional, manajemen peristiwa, dan kualitas rilis. Proses Koreksi Kesalahan (CoE) kami merupakan pendorong utama item-item ini. Analisis pascainsiden Anda sendiri harus mendorong pengembangan ORR Anda. ORR tidak hanya tentang mengikuti praktik terbaik tapi juga mencegah kemungkinan peristiwa yang telah Anda lihat sebelumnya. Terakhir, keamanan, pengelolaan, dan kepatuhan persyaratan juga dapat disertakan dalam ORR. 

 Jalankan ORR sebelum beban kerja meluncur ke ketersediaan umum dan kemudian ke seluruh siklus pengembangan perangkat lunak. Menjalankan ORR sebelum peluncuran meningkatkan kemampuan Anda untuk mengoperasikan beban kerja dengan aman. Jalankan kembali ORR Anda secara berkala pada beban kerja untuk mengetahui penyimpangan dari praktik terbaik. Anda dapat memiliki daftar periksa ORR untuk peluncuran layanan baru dan ORR untuk peninjauan berkala. Ini membantu Anda untuk tetap up to date dengan praktik terbaik yang muncul dan menggabungkan pelajaran yang didapatkan dari analisis pascainsiden. Saat penggunaan cloud Anda matang, Anda dapat membangun persyaratan ORR ke dalam arsitektur Anda secara default. 

 **Hasil yang diinginkan:**  Anda memiliki daftar periksa ORR dengan praktik terbaik untuk organisasi Anda. ORR dilakukan sebelum peluncuran beban kerja. ORR dijalankan secara berkala selama kursus siklus beban kerja. 

 **Antipola umum:** 
+ Anda meluncurkan beban kerja tanpa mengetahui apakah Anda dapat mengoperasikannya. 
+ Persyaratan pengelolaan dan keamanan tidak diikutsertakan ketika menyertifikasi beban kerja untuk peluncuran. 
+ Beban kerja tidak dievaluasi kembali secara berkala. 
+ Beban kerja diluncurkan tanpa diterapkannya prosedur yang diperlukan. 
+ Anda melihat pengulangan kegagalan akar masalah yang sama di beberapa beban kerja. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Beban kerja Anda mencakup praktik terbaik arsitektur, proses, dan manajemen. 
+  Pelajaran yang didapatkan digabungkan dalam proses ORR. 
+  Prosedur yang diperlukan tersedia ketika beban kerja diluncurkan. 
+  ORR dijalankan di seluruh siklus perangkat lunak beban kerja Anda. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 ORR adalah dua hal: proses dan daftar periksa. Proses ORR Anda harus diadopsi oleh organisasi Anda dan didukung oleh sponsor eksekutif. Minimal, ORR harus dilakukan sebelum beban kerja meluncur ke ketersediaan umum. Jalankan ORR di seluruh siklus pengembangan perangkat lunak untuk tetap up to date dengan praktik terbaik atau persyaratan baru. Daftar periksa ORR harus mencakup item konfigurasi, persyaratan keamanan dan pengelolaan, serta praktik terbaik dari organisasi Anda. Seiring waktu, Anda dapat menggunakan layanan, seperti [AWS Config](https://docs.aws.amazon.com/config/latest/developerguide/WhatIsConfig.html), [AWS Security Hub CSPM](https://docs.aws.amazon.com/securityhub/latest/userguide/what-is-securityhub.html), dan [Pagar Pembatas AWS Control Tower](https://docs.aws.amazon.com/controltower/latest/userguide/guardrails.html), untuk membangun praktik terbaik dari ORR ke pagar pembatas untuk deteksi praktik terbaik secara otomatis. 

 **Contoh pelanggan** 

 Setelah beberapa insiden produksi, AnyCompany Retail memutuskan untuk menerapkan proses ORR. Mereka membangun daftar periksa yang terdiri dari praktik terbaik, persyaratan pengelolaan dan kepatuhan, serta pelajaran yang didapatkan dari pemadaman. Beban kerja baru melakukan ORR sebelum diluncurkan. Setiap beban kerja melakukan ORR setiap tahun dengan sebagian praktik terbaik untuk menggabungkan praktik terbaik dan persyaratan baru yang ditambahkan ke daftar periksa ORR. Seiring waktu, AnyCompany Retail menggunakan [AWS Config](https://docs.aws.amazon.com/config/latest/developerguide/WhatIsConfig.html) untuk mendeteksi beberapa praktik terbaik, yang mempercepat proses ORR. 

 **Langkah implementasi** 

 Untuk mempelajari selengkapnya tentang ORR, baca: [laporan resmi Peninjauan Kesiapan Operasional (ORR)](https://docs.aws.amazon.com/wellarchitected/latest/operational-readiness-reviews/wa-operational-readiness-reviews.html). Laporan resmi ini menyediakan detail informasi tentang riwayat proses ORR, cara membangun praktik ORR Anda sendiri, dan cara mengembangkan daftar periksa ORR Anda. Langkah-langkah berikut ini merupakan versi singkat dari dokumen tersebut. Untuk pemahaman yang mendalam tentang apa itu ORR dan bagaimana membangunnya, sebaiknya baca laporan resmi tersebut. 

1. Kumpulkan pemangku kepentingan utama, termasuk perwakilan dari keamanan, operasi, dan pengembangan. 

1. Minta setiap pemangku kepentingan untuk menyediakan setidaknya satu persyaratan. Untuk iterasi pertama, coba batasi jumlah item menjadi 30 atau kurang. 
   +  [Lampiran B: Contoh pertanyaan ORR](https://docs.aws.amazon.com/wellarchitected/latest/operational-readiness-reviews/appendix-b-example-orr-questions.html) dari laporan resmi Peninjauan Kesiapan Operasional (ORR) yang berisi sampel pertanyaan yang dapat Anda gunakan untuk memulai. 

1. Kumpulkan persyaratan Anda ke dalam lembar kerja. 
   + Anda dapat menggunakan [lensa kustom](https://docs.aws.amazon.com/wellarchitected/latest/userguide/lenses-custom.html) di [AWS Well-Architected Tool](https://console.aws.amazon.com/wellarchiected/) untuk mengembangkan ORR Anda dan membagikannya ke seluruh akun dan Organisasi AWS Anda. 

1. Identifikasi satu beban kerja untuk diberikan ORR. Idealnya adalah beban kerja sebelum peluncuran atau beban kerja internal. 

1. Pelajari daftar periksa ORR dan catat semua penemuan yang dibuat. Penemuannya mungkin akan buruk jika terdapat mitigasi. Untuk penemuan yang minim mitigasi, tambahkan beban kerja ke backlog item Anda dan implementasikan sebelum peluncuran. 

1. Lanjutkan penambahan praktik terbaik dan persyaratan ke daftar periksa ORR Anda seiring waktu. 

 Pelanggan Dukungan dengan Enterprise Support dapat mengajukan permintaan [Lokakarya Peninjauan Kesiapan Operasional](https://aws.amazon.com/premiumsupport/technology-and-programs/proactive-services/) dari Manajer Akun Teknis mereka. Lokakarya ini adalah sesi *penelusuran mundur (working backward)* interaktif untuk mengembangkan daftar periksa ORR Anda. 

 **Tingkat upaya untuk rencana implementasi:** Tinggi. Untuk mengadopsi praktik ORR pada organisasi Anda diperlukan sponsor eksekutif dan dukungan pemangku kepentingan. Buat dan perbarui daftar periksa dengan masukan dari seluruh organisasi Anda. 

## Sumber daya
<a name="resources"></a>

 **Praktik Terbaik Terkait:** 
+ [OPS01-BP03 Mengevaluasi persyaratan tata kelola](ops_priorities_governance_reqs.md) – Persyaratan tata kelola sangat sesuai untuk daftar periksa ORR. 
+ [OPS01-BP04 Evaluasi persyaratan kepatuhan](ops_priorities_compliance_reqs.md) – Terkadang persyaratan kepatuhan tercantum di daftar periksa ORR. Terkadang persyaratan kepatuhan adalah proses yang terpisah. 
+ [OPS03-BP07 Bekali tim dengan sumber daya dengan sesuai](ops_org_culture_team_res_appro.md) – Kemampuan tim merupakan kandidat yang bagus untuk persyaratan ORR. 
+ [OPS06-BP01 Antisipasikan perubahan yang tidak berhasil](ops_mit_deploy_risks_plan_for_unsucessful_changes.md) – Rencana rollback atau rollfoward harus dibuat sebelum Anda meluncurkan beban kerja Anda. 
+ [OPS07-BP01 Memastikan kemampuan personel](ops_ready_to_support_personnel_capability.md) – Untuk mendukung beban kerja, Anda harus memiliki personel yang diperlukan. 
+ [SEC01-BP03 Mengidentifikasi dan memvalidasi tujuan kontrol](https://docs.aws.amazon.com/wellarchitected/latest/framework/sec_securely_operate_control_objectives.html) – Tujuan kontrol keamanan menyempurnakan persyaratan ORR. 
+ [REL13-BP01 Menetapkan sasaran pemulihan untuk waktu henti dan kehilangan data](https://docs.aws.amazon.com/wellarchitected/latest/framework/rel_planning_for_recovery_objective_defined_recovery.html) – Rencana pemulihan bencana merupakan persyaratan ORR yang bagus. 
+ [COST02-BP01 Mengembangkan kebijakan berdasarkan keperluan organisasi Anda](https://docs.aws.amazon.com/wellarchitected/latest/framework/cost_govern_usage_policies.html) – Kebijakan manajemen biaya bagus untuk dicantumkan dalam daftar ORR Anda. 

 **Dokumen terkait:** 
+  [AWS Control Tower - Pagar Pembatas di AWS Control Tower](https://docs.aws.amazon.com/controltower/latest/userguide/guardrails.html) 
+  [AWS Well-Architected Tool - Lensa Kustom](https://docs.aws.amazon.com/wellarchitected/latest/userguide/lenses-custom.html) 
+  [Templat Peninjauan Kesiapan Operasional oleh Adrian Hornsby](https://medium.com/the-cloud-architect/operational-readiness-review-template-e23a4bfd8d79) 
+  [Laporan Resmi Peninjauan Kesiapan Operasional (ORR)](https://docs.aws.amazon.com/wellarchitected/latest/operational-readiness-reviews/wa-operational-readiness-reviews.html) 

 **Video terkait:** 
+  [AWS Dukungan Anda \$1 Membangun Peninjauan Kesiapan Operasional (ORR) yang Efektif](https://www.youtube.com/watch?v=Keo6zWMQqS8) 

 **Contoh terkait:** 
+  [Sampel Lensa Peninjauan Kesiapan Operasional (ORR)](https://github.com/aws-samples/custom-lens-wa-sample/tree/main/ORR-Lens) 

 **Layanan terkait:** 
+  [AWS Config](https://docs.aws.amazon.com/config/latest/developerguide/WhatIsConfig.html) 
+  [AWS Control Tower](https://docs.aws.amazon.com/controltower/latest/userguide/what-is-control-tower.html) 
+  [AWS Security Hub CSPM](https://docs.aws.amazon.com/securityhub/latest/userguide/what-is-securityhub.html) 
+  [AWS Well-Architected Tool](https://docs.aws.amazon.com/wellarchitected/latest/userguide/intro.html) 

# OPS07-BP03 Menggunakan runbook untuk menjalankan prosedur
<a name="ops_ready_to_support_use_runbooks"></a>

 Sebuah *runbook* adalah proses terdokumentasi untuk mencapai hasil tertentu. Runbook terdiri dari serangkaian langkah yang diikuti seseorang untuk menyelesaikan sesuatu. Runbook telah digunakan dalam operasi sejak masa-masa awal industri penerbangan. Dalam operasi cloud, kita menggunakan runbook untuk mengurangi risiko dan mencapai hasil yang diinginkan. Dalam bentuk paling sederhananya, runbook adalah daftar periksa untuk menyelesaikan tugas. 

 Runbook adalah bagian penting dari operasi beban kerja Anda. Mulai dari orientasi anggota tim baru hingga melakukan deployment rilis utama, runbook adalah proses terkodifikasi yang memberikan hasil konsisten, siapa pun yang menggunakannya. Runbook harus dipublikasikan di lokasi sentral dan diperbarui seiring prosesnya berkembang karena memperbarui runbook adalah komponen utama dari proses manajemen perubahan. Runbook juga harus menyertakan panduan tentang penanganan kesalahan, alat, izin, pengecualian, dan eskalasi jika terjadi masalah. 

 Saat organisasi Anda matang, mulailah mengotomatiskan runbook. Mulailah dengan runbook yang singkat dan sering digunakan. Gunakan bahasa skrip untuk mengotomatiskan langkah-langkah atau mempermudah pelaksanaan langkah-langkah. Seiring Anda mengotomatiskan beberapa runbook pertama, Anda akan mendedikasikan waktu untuk mengotomatiskan runbook yang lebih kompleks. Seiring waktu, sebagian besar runbook Anda harus diotomatiskan dalam cara tertentu. 

 **Hasil yang diinginkan:** Tim Anda memiliki kumpulan panduan langkah demi langkah untuk melakukan tugas beban kerja. Runbook berisi hasil yang diinginkan, alat dan izin yang diperlukan, serta petunjuk untuk penanganan kesalahan. Runbook disimpan di lokasi sentral dan sering diperbarui. 

 **Antipola umum:** 
+  Mengandalkan memori untuk menyelesaikan setiap langkah dari suatu proses. 
+  Menerapkan perubahan secara manual tanpa daftar periksa. 
+  Anggota tim yang berbeda-beda melakukan proses yang sama, tetapi dengan langkah atau hasil yang berbeda. 
+  Membiarkan runbook tidak sinkron dengan perubahan sistem dan otomatisasi. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Mengurangi tingkat kesalahan untuk tugas manual. 
+  Operasi dilakukan secara konsisten. 
+  Anggota tim baru dapat mulai melakukan tugas dengan lebih cepat. 
+  Runbook dapat diotomatiskan untuk mengurangi upaya yang diperlukan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Runbook dapat memiliki beberapa bentuk, bergantung pada tingkat kematangan organisasi Anda. Minimal, runbook harus terdiri dari dokumen teks langkah demi langkah. Hasil yang diinginkan harus ditunjukkan dengan jelas. Dokumentasikan dengan jelas izin atau alat khusus yang diperlukan. Berikan panduan mendetail tentang penanganan kesalahan dan eskalasi jika terjadi kesalahan. Cantumkan pemilik runbook dan publikasikan di lokasi sentral. Setelah runbook Anda didokumentasikan, validasikan dengan meminta orang lain di tim Anda untuk menjalankannya. Seiring prosedur berkembang, perbarui runbook Anda sesuai dengan proses manajemen perubahan Anda. 

 Runbook teks Anda harus diotomatiskan seiring organisasi Anda makin matang. Dengan layanan seperti [otomatisasi AWS Systems Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-automation.html), Anda dapat mentransformasikan teks biasa menjadi otomatisasi yang dapat dijalankan dengan beban kerja Anda. Otomatisasi ini dapat dijalankan sebagai respons terhadap peristiwa, sehingga mengurangi beban operasional untuk memelihara beban kerja Anda. 

 **Contoh pelanggan** 

 AnyCompany Retail harus melakukan pembaruan skema basis data selama deployment perangkat lunak. Tim Operasi Cloud bekerja sama dengan Tim Administrasi Basis Data untuk membuat runbook guna menerapkan perubahan ini secara manual. Runbook ini mencantumkan setiap langkah prosesnya dalam bentuk daftar periksa. Runbook ini berisi bagian tentang penanganan kesalahan jika terjadi kesalahan. Mereka memublikasikan runbook di wiki internal mereka bersama dengan runbook mereka yang lain. Tim Operasi Cloud berencana untuk mengotomatiskan runbook dalam sprint mendatang. 

## Langkah implementasi
<a name="implementation-steps"></a>

 Jika Anda belum memiliki repositori dokumen, repositori kontrol versi adalah tempat yang tepat untuk mulai membangun pustaka runbook Anda. Anda dapat membangun runbook Anda menggunakan Markdown. Kami telah menyediakan contoh templat runbook yang dapat Anda gunakan untuk mulai membangun runbook. 

```
# Judul Runbook ## Info Runbook | ID Runbook | Deskripsi | Alat yang Digunakan | Izin Khusus | Penulis Runbook | Terakhir Diperbarui | POC Eskalasi | |-------|-------|-------|-------|-------|-------|-------| | RUN001 | Apa tujuan penggunaan runbook ini? Apa hasil yang diinginkan? | Alat | Izin | Nama Anda | 21-9-2022 | Nama Eskalasi | ## Langkah 1. Langkah pertama 2. Langkah kedua
```

1.  Jika Anda belum memiliki repositori atau wiki dokumentasi, buat repositori kontrol versi baru di sistem kontrol versi Anda. 

1.  Identifikasi proses yang tidak memiliki runbook. Proses yang ideal adalah proses yang dilakukan secara semireguler, sedikit jumlah langkahnya, dan memiliki kegagalan berdampak rendah. 

1.  Di repositori dokumen Anda, buat draf dokumen Markdown baru menggunakan templat tersebut. Isi `Judul Runbook` dan bidang yang diperlukan di bagian `Info Runbook`. 

1.  Dimulai dengan langkah pertama, isi bagian `Langkah` dalam runbook ini. 

1.  Berikan runbook ini kepada para anggota tim. Minta mereka menggunakan runbook ini untuk memvalidasi langkah-langkahnya. Jika ada sesuatu yang belum dimasukkan atau memerlukan kejelasan, perbarui runbook ini. 

1.  Publikasikan runbook ini ke penyimpanan dokumentasi internal Anda. Setelah dipublikasikan, beri tahu tim Anda dan pemangku kepentingan lainnya. 

1.  Seiring waktu, Anda akan membangun pustaka runbook. Saat pustaka tersebut tumbuh, mulailah bekerja untuk mengotomatiskan runbook. 

 **Tingkat upaya untuk rencana implementasi:** Rendah. Standar minimum untuk runbook adalah panduan teks langkah demi langkah. Mengotomatiskan runbook dapat meningkatkan upaya implementasi. 

## Sumber daya
<a name="resources"></a>

 **Praktik terbaik terkait:** 
+  [OPS02-BP02 Proses dan Prosedur memiliki pemilik teridentifikasi](ops_ops_model_def_proc_owners.md): Runbook harus memiliki pemilik yang bertanggung jawab untuk memeliharanya. 
+  [OPS07-BP04 Menggunakan buku panduan untuk menyelidiki masalah](ops_ready_to_support_use_playbooks.md): Runbook dan playbook mirip satu sama lain dengan satu perbedaan utama: runbook memiliki hasil yang diinginkan. Dalam banyak kasus, runbook dipicu setelah playbook mengidentifikasi akar penyebab. 
+  [OPS10-BP01 Menggunakan proses untuk manajemen peristiwa, insiden, dan masalah](ops_event_response_event_incident_problem_process.md): Runbook adalah bagian dari praktik manajemen yang baik terkait peristiwa, insiden, dan masalah. 
+  [OPS10-BP02 Menjalankan proses untuk setiap peringatan](ops_event_response_process_per_alert.md): Runbook dan playbook harus digunakan untuk menanggapi peringatan. Seiring waktu, reaksi ini harus diotomatiskan. 
+  [OPS11-BP04 Menjalankan manajemen pengetahuan](ops_evolve_ops_knowledge_management.md): Memelihara runbook adalah bagian penting dari manajemen pengetahuan. 

 **Dokumen terkait:** 
+ [Mencapai Keunggulan Operasional menggunakan playbook dan runbook otomatis](https://aws.amazon.com/blogs/mt/achieving-operational-excellence-using-automated-playbook-and-runbook/) 
+ [AWS Systems Manager: Bekerja dengan runbook](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-documents.html) 
+ [Playbook migrasi untuk migrasi besar AWS - Tugas 4: Meningkatkan runbook migrasi Anda](https://docs.aws.amazon.com/prescriptive-guidance/latest/large-migration-migration-playbook/task-four-migration-runbooks.html) 
+ [Gunakan runbook Otomatisasi AWS Systems Manager untuk menyelesaikan tugas operasional](https://aws.amazon.com/blogs/mt/use-aws-systems-manager-automation-runbooks-to-resolve-operational-tasks/) 

 **Video terkait:** 
+  [AWS re:Invent 2019: Panduan mandiri untuk runbook, laporan insiden, dan respons insiden (SEC318-R1)](https://www.youtube.com/watch?v=E1NaYN_fJUo) 
+  [Cara mengotomatiskan Operasi IT di AWS \$1 Amazon Web Services](https://www.youtube.com/watch?v=GuWj_mlyTug) 
+  [Integrasikan Skrip ke dalam AWS Systems Manager](https://www.youtube.com/watch?v=Seh1RbnF-uE) 

 **Contoh terkait:** 
+  [AWS Systems Manager: Panduan otomatisasi](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-walk.html) 
+  [AWS Systems Manager: Pulihkan volume root dari snapshot runbook terbaru](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-document-sample-restore.html)
+  [Membangun runbook respons insiden AWS menggunakan notebook Jupyter dan CloudTrail Lake](https://catalog.us-east-1.prod.workshops.aws/workshops/a5801f0c-7bd6-4282-91ae-4dfeb926a035/en-US) 
+  [Gitlab - Runbook](https://gitlab.com/gitlab-com/runbooks) 
+  [Rubix - Pustaka Python untuk membuat runbook di Notebook Jupyter](https://github.com/Nurtch/rubix) 
+  [Menggunakan Document Builder untuk membuat runbook kustom](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-walk-document-builder.html) 
+  [Lab Well-Architected: Mengotomatiskan operasi dengan Playbook dan Runbook](https://wellarchitectedlabs.com/operational-excellence/200_labs/200_automating_operations_with_playbooks_and_runbooks/) 

 **Layanan terkait:** 
+  [Otomatisasi AWS Systems Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-automation.html) 

# OPS07-BP04 Menggunakan buku panduan untuk menyelidiki masalah
<a name="ops_ready_to_support_use_playbooks"></a>

 Playbook adalah panduan mendetail yang digunakan untuk menyelidiki insiden. Ketika terjadi sebuah insiden, playbook digunakan untuk menyelidiki, membuat cakupan dampak, dan mengidentifikasi akar masalah. Playbook digunakan untuk berbagai skenario, dari deployment yang gagal hingga insiden keamanan. Dalam banyak kasus, playbook mengidentifikasi akar masalah yang dimitigasi menggunakan runbook. Playbook adalah komponen pokok dalam rencana respons insiden organisasi Anda. 

 Playbook yang baik memiliki sejumlah fitur utama. Playbook memberikan panduan secara mendetail bagi pengguna, dalam proses penemuan. Dengan berpikir secara holistik, langkah apa saja yang sebaiknya diikuti seseorang untuk mendiagnosis insiden? Tetapkan secara jelas di dalam playbook jika alat-alat khusus atau izin yang dinaikkan diperlukan di dalam playbook. Memiliki rencana komunikasi untuk memberi informasi kepada para pemangku kepentingan mengenai status penyelidikan adalah komponen utama. Dalam situasi ketika akar penyebab tidak dapat diidentifikasi, playbook harus memiliki rencana eskalasi. Jika akar masalah diidentifikasi, playbook harus mengarah ke runbook yang menjelaskan cara menyelesaikannya. Playbook harus disimpan secara terpusat dan dipelihara secara rutin. Jika playbook digunakan untuk pemberitahuan khusus, bekali tim Anda dengan penunjuk ke playbook di dalam pemberitahuan tersebut. 

 Otomatisasi playbook Anda seiring kematangan organisasi. Mulai dengan playbook yang mencakup insiden berisiko rendah. Gunakan penulisan skrip untuk mengotomatiskan langkah-langkah penemuan. Pastikan Anda memiliki runbook pendamping untuk memitigasi akar masalah umum. 

 **Hasil yang diinginkan:** Organisasi Anda memiliki playbook untuk insiden umum. Playbook disimpan di lokasi terpusat dan tersedia untuk anggota tim Anda. Playbook sering diperbarui. Runbook pendamping dibuat untuk akar masalah apa pun yang diketahui. 

 **Antipola umum:** 
+  Tidak ada cara standar untuk menyelidiki insiden. 
+  Anggota tim mengandalkan memori otot atau pengetahuan institusional untuk memecahkan masalah kegagalan deployment. 
+  Anggota tim baru mempelajari cara menyelidiki permasalahan melalui coba-coba. 
+  Praktik terbaik untuk menyelidiki permasalahan tidak dibagikan ke seluruh tim. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Playbook meningkatkan upaya Anda untuk memitigasi insiden. 
+  Anggota tim yang berbeda-beda dapat menggunakan playbook yang sama untuk mengidentifikasi akar masalah secara konsisten. 
+  Setelah akar masalah diketahui kemudian bisa dikembangkan runbook, sehingga dapat mempercepat waktu pemulihan. 
+  Playbook memungkinkan anggota tim untuk mulai berkontribusi lebih cepat. 
+  Tim dapat menskalakan proses mereka dengan playbook yang dapat diulang. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Bagaimana Anda membangun dan menggunakan playbook bergantung pada kematangan organisasi Anda. Jika Anda baru mengenal cloud, bangun playbook dalam bentuk teks di dalam repositori dokumen pusat. Seiring kematangan organisasi, playbook dapat menjadi semi-otomatis dengan bahasa skrip seperti Python. Skrip-skrip ini dapat dijalankan di dalam notebook Jupyter untuk mempercepat penemuan. Organisasi tingkat lanjut memiliki playbook yang sepenuhnya otomatis untuk permasalahan umum yang diperbaiki secara otomatis dengan runbook. 

 Mulai bangun playbook Anda dengan mengidentifikasi insiden-insiden umum yang terjadi pada beban kerja Anda. Pilih playbook untuk insiden berisiko rendah dan dengan akar masalah yang telah dipersempit menjadi beberapa permasalahan untuk mengawalinya. Setelah Anda memiliki playbook untuk skenario yang lebih sederhana, beralihlah ke skenario berisiko lebih tinggi atau skenario dengan akar masalah yang tidak dikenal dengan baik. 

 Playbook teks Anda harus diotomatiskan seiring pematangan organisasi Anda. Dengan layanan seperti [AWS Systems Manager Automations](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-automation.html), teks biasa dapat ditransformasikan menjadi otomatis. Otomatisasi ini dapat dijalankan terhadap beban kerja untuk mempercepat penyelidikan. Otomatisasi ini dapat diaktifkan untuk merespons peristiwa, sehingga mengurangi rata-rata waktu untuk menemukan dan menyelesaikan insiden. 

 Pelanggan dapat menggunakan [Manajer Insiden AWS Systems Manager](https://docs.aws.amazon.com/incident-manager/latest/userguide/what-is-incident-manager.html) untuk merespons insiden. Layanan ini menyediakan satu antarmuka untuk memeriksa insiden, memberi informasi kepada pemangku kepentingan selama penemuan dan mitigasi, dan berkolaborasi melalui insiden. Layanan ini menggunakan AWS Systems Manager Automations untuk mempercepat deteksi dan pemulihan. 

 **Contoh pelanggan** 

 Insiden produksi memberikan dampak pada AnyCompany Retail. Rekayasawan yang siap dipanggil kapan saja (on-call) menggunakan playbook untuk menyelidiki permasalahan. Seiring mereka mengikuti langkah-langkahnya, mereka terus memutakhirkan pemangku kepentingan utama yang diidentifikasi di dalam playbook. Rekayasawan mengidentifikasi akar masalah sebagai kondisi pacu di dalam layanan backend. Menggunakan runbook, rekayasawan meluncurkan ulang layanan, sehingga AnyCompany Retail dapat kembali online. 

## Langkah implementasi
<a name="implementation-steps"></a>

 Jika Anda belum memiliki repositori dokumen, kami menyarankan pembuatan repositori kontrol versi untuk pustaka playbook Anda. Anda dapat membangun playbook Anda menggunakan Markdown, yang kompatibel dengan sebagian besar sistem otomatisasi playbook. Jika Anda memulai dari nol, gunakan contoh templat playbook berikut ini. 

```
# Judul Playbook ## Info Playbook | ID Playbook | Deskripsi | Alat yang Digunakan | Izin Khusus | Penyusun Playbook | Terakhir Diperbarui | POC Eskalasi | Pemangku Kepentingan | Rencana Komunikasi | |-------|-------|-------|-------|-------|-------|-------|-------|-------| | RUN001 | Untuk apa playbook ini? Untuk insiden apa playbook ini? | Alat | Izin | Nama Anda | 21-09-2022 | Nama Eskalasi | Nama Pemangku Kepentingan | Bagaimana pembaruan akan disampaikan selama penyelidikan? | ## Langkah 1. Langkah pertama 2. Langkah kedua
```

1.  Jika Anda belum memiliki repositori dokumen atau wiki, buat repositori kontrol versi baru untuk playbook Anda di sistem kontrol versi Anda. 

1.  Identifikasi permasalahan umum yang memerlukan penyelidikan. Ini sebaiknya adalah skenario dengan akar masalah yang dibatasi ke beberapa permasalahan dan penyelesaiannya berisiko rendah. 

1.  Menggunakan templat Markdown, lengkapi bagian `Nama Playbook` dan bidang di bawah `Info Playbook`. 

1.  Lengkapi langkah-langkah pemecahan masalah. Sampaikan sejelas mungkin tindakan yang akan dilakukan atau area apa saja yang harus Anda selidiki. 

1.  Berikan playbook tersebut kepada anggota tim dan minta mereka mempelajari dan memvalidasinya. Jika terdapat hal yang terlewat atau tidak jelas, perbarui playbook. 

1.  Terbitkan playbook di dalam repositori dokumen Anda dan informasikan kepada tim dan pemangku kepentingan. 

1.  Pustaka playbook ini akan tumbuh seiring Anda menambahkan lebih banyak playbook. Setelah Anda memiliki beberapa playbook, mulailah mengotomatiskannya menggunakan alat seperti AWS Systems Manager Automations untuk terus menyinkronkan otomatisasi dan playbook. 

 **Tingkat upaya untuk rencana implementasi:** Rendah. Playbook Anda harus berupa dokumen teks yang disimpan di lokasi terpusat. Organisasi yang lebih matang akan beralih ke otomatisasi playbook. 

## Sumber daya
<a name="resources"></a>

 **Praktik terbaik terkait:** 
+  [OPS02-BP02 Proses dan Prosedur memiliki pemilik teridentifikasi](ops_ops_model_def_proc_owners.md): Runbook harus memiliki pemilik yang bertanggung jawab untuk memeliharanya. 
+  [OPS07-BP03 Menggunakan runbook untuk menjalankan prosedur](ops_ready_to_support_use_runbooks.md): Runbook dan playbook mirip, tetapi dengan satu perbedaan utama: runbook memiliki hasil yang diinginkan. Dalam banyak kasus, runbook digunakan setelah playbook mengidentifikasi akar penyebab. 
+  [OPS10-BP01 Menggunakan proses untuk manajemen peristiwa, insiden, dan masalah](ops_event_response_event_incident_problem_process.md): Playbook adalah bagian dari praktik manajemen yang baik terkait peristiwa, insiden, dan masalah. 
+  [OPS10-BP02 Menjalankan proses untuk setiap peringatan](ops_event_response_process_per_alert.md): Runbook dan playbook harus digunakan untuk menanggapi peringatan. Seiring waktu, reaksi ini harus diotomatiskan. 
+  [OPS11-BP04 Menjalankan manajemen pengetahuan](ops_evolve_ops_knowledge_management.md): Memelihara playbook adalah bagian penting dari manajemen pengetahuan. 

 **Dokumen terkait:** 
+ [ Mencapai Keunggulan Operasional menggunakan playbook dan runbook otomatis ](https://aws.amazon.com/blogs/mt/achieving-operational-excellence-using-automated-playbook-and-runbook/)
+  [AWS Systems Manager: Bekerja dengan runbook](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-documents.html) 
+ [ Gunakan runbook AWS Systems Manager Automations untuk menyelesaikan tugas operasional ](https://aws.amazon.com/blogs/mt/use-aws-systems-manager-automation-runbooks-to-resolve-operational-tasks/)

 **Video terkait:** 
+ [AWS re:Invent 2019: Panduan mandiri untuk runbook, laporan insiden, dan respons insiden (SEC318-R1) ](https://www.youtube.com/watch?v=E1NaYN_fJUo)
+ [Manajer Insiden AWS Systems Manager - Lokakarya Virtual AWS](https://www.youtube.com/watch?v=KNOc0DxuBSY)
+ [ Integrasikan Skrip ke dalam AWS Systems Manager](https://www.youtube.com/watch?v=Seh1RbnF-uE)

 **Contoh terkait:** 
+ [ Kerangka Kerja Playbook Pelanggan AWS](https://github.com/aws-samples/aws-customer-playbook-framework)
+ [AWS Systems Manager: Panduan otomatisasi ](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-walk.html)
+ [ Membangun runbook respons insiden AWS menggunakan notebook Jupyter dan CloudTrail Lake ](https://catalog.workshops.aws/workshops/a5801f0c-7bd6-4282-91ae-4dfeb926a035/en-US)
+ [ Rubix – Pustaka Python untuk membuat runbook di Notebook Jupyter ](https://github.com/Nurtch/rubix)
+ [ Menggunakan Document Builder untuk membuat runbook kustom ](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-walk-document-builder.html)
+ [ Lab Well-Architected: Mengotomatiskan operasi dengan Playbook dan Runbook ](https://wellarchitectedlabs.com/operational-excellence/200_labs/200_automating_operations_with_playbooks_and_runbooks/)
+ [ Lab Well-Architect: Playbook respons insiden dengan Jupyter ](https://www.wellarchitectedlabs.com/security/300_labs/300_incident_response_playbook_with_jupyter-aws_iam/)

 **Layanan terkait:** 
+ [AWS Systems Manager Automation ](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-automation.html)
+ [Manajer Insiden AWS Systems Manager](https://docs.aws.amazon.com/incident-manager/latest/userguide/what-is-incident-manager.html)

# OPS07-BP05 Membuat keputusan yang tepat untuk melakukan deployment sistem dan perubahan
<a name="ops_ready_to_support_informed_deploy_decisions"></a>

 Evaluasikan kemampuan tim untuk mendukung beban kerja dan kepatuhan beban kerja terhadap tata kelola. Evaluasikan hal tersebut terhadap manfaat deployment ketika menentukan untuk transisi sistem atau mengubah ke produksi. Untuk membuat keputusan yang tepat, pahami manfaat dan risikonya. 

 Pre-mortem adalah latihan simulasi tim terhadap kegagalan untuk mengembangkan strategi mitigasi. Gunakan pre-mortem untuk mengantisipasi kegagalan dan menciptakan prosedur ketika diperlukan. Ketika Anda membuat perubahan di daftar periksa yang Anda gunakan untuk mengevaluasi beban kerja Anda, rencanakan apa yang akan Anda lakukan dengan sistem langsung yang tidak lagi patuh. 

 **Antipola umum:** 
+  Memutuskan untuk melakukan deployment beban kerja tanpa memahami risiko keamanan yang ada dalam beban kerja. 
+  Memutuskan untuk melakukan deployment beban kerja tanpa memahami apakah beban kerja sesuai dengan standar dan tata kelola. 
+  Memutuskan untuk melakukan deployment beban kerja tanpa memahami apakah tim Anda dapat mendukungnya. 
+  Memutuskan untuk melakukan deployment beban kerja tanpa memahami manfaatnya untuk organisasi. 

 **Manfaat menerapkan praktik terbaik ini:** Memiliki anggota tim yang terampil memungkinkan dukungan yang efektif untuk beban kerja. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Rendah 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Buat keputusan yang tepat untuk melakukan deployment beban kerja dan perubahan: Evaluasikan kemampuan tim untuk mendukung beban kerja dan kepatuhan beban kerja terhadap tata kelola. Evaluasikan hal tersebut terhadap manfaat deployment ketika menentukan untuk transisi sistem atau mengubah ke produksi. Untuk membuat keputusan yang tepat, pahami manfaat dan risikonya. 

# Operasi
<a name="a-operate"></a>

**Topics**
+ [OPS 8 Bagaimana cara memahami kondisi beban kerja Anda?](w2aac19b5b9b5.md)
+ [OPS 9 Bagaimana cara memahami kondisi operasi Anda?](w2aac19b5b9b7.md)
+ [OPS 10 Bagaimana cara mengelola peristiwa operasi dan beban kerja?](w2aac19b5b9b9.md)

# OPS 8 Bagaimana cara memahami kondisi beban kerja Anda?
<a name="w2aac19b5b9b5"></a>

 Tetapkan, catat, dan analisis metrik beban kerja untuk mendapatkan visibilitas peristiwa beban kerja sehingga Anda dapat mengambil tindakan yang tepat. 

**Topics**
+ [OPS08-BP01 Identifikasi indikator performa utama](ops_workload_health_define_workload_kpis.md)
+ [OPS08-BP02 Menentukan metrik beban kerja](ops_workload_health_design_workload_metrics.md)
+ [OPS08-BP03 Mengumpulkan dan menganalisis metrik beban kerja](ops_workload_health_collect_analyze_workload_metrics.md)
+ [OPS08-BP04 Membuat dasar acuan metrik beban kerja](ops_workload_health_workload_metric_baselines.md)
+ [OPS08-BP05 Mempelajari pola aktivitas yang diharapkan untuk beban kerja](ops_workload_health_learn_workload_usage_patterns.md)
+ [OPS08-BP06 Memberikan pemberitahuan saat hasil beban kerja terpapar risiko](ops_workload_health_workload_outcome_alerts.md)
+ [OPS08-BP07 Memberikan peringatan saat anomali beban kerja terdeteksi](ops_workload_health_workload_anomaly_alerts.md)
+ [OPS08-BP08 Memvalidasi capaian hasil dan efektivitas KPI serta metrik](ops_workload_health_biz_level_view_workload.md)

# OPS08-BP01 Identifikasi indikator performa utama
<a name="ops_workload_health_define_workload_kpis"></a>

 Identifikasi indikator performa utama (KPI) berdasarkan hasil bisnis yang diinginkan (misalnya, tingkat pemesanan, tingkat retensi pelanggan, dan laba dibandingkan pengeluaran operasi) dan hasil pelanggan (misalnya, kepuasan pelanggan). Evaluasi KPI untuk menentukan kesuksesan beban kerja. 

 **Antipola umum:** 
+  Pimpinan bisnis bertanya kepada Anda seberapa keberhasilan beban kerja dalam memenuhi kebutuhan bisnis tetapi tidak memiliki kerangka acuan untuk menentukan keberhasilan. 
+  Anda tidak dapat menentukan apakah aplikasi komersial umum yang Anda operasikan untuk organisasi Anda menghemat biaya. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan mengidentifikasi indikator performa utama Anda dapat mencapai hasil bisnis sebagai pengujian kondisi dan kesuksesan beban kerja Anda. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Identifikasi indikator performa utama: Identifikasi indikator performa utama (KPI) berdasarkan hasil bisnis dan hasil pelanggan. Evaluasi KPI untuk menentukan kesuksesan beban kerja. 

# OPS08-BP02 Menentukan metrik beban kerja
<a name="ops_workload_health_design_workload_metrics"></a>

 Tentukan metrik beban kerja untuk mengukur pencapaian KPI (misalnya, keranjang belanja yang ditinggalkan, pesanan yang ditempatkan, biaya, harga, dan pengeluaran beban kerja yang dialokasikan). Tentukan metrik beban kerja untuk mengukur kondisi beban kerja (misalnya, waktu respons antar muka, rasio kesalahan, permintaan yang dibuat, permintaan yang diselesaikan, serta pemanfaatan). Evaluasi metrik untuk menentukan apakah beban kerja mencapai hasil yang diinginkan, dan untuk memahami kondisi beban kerja. 

 Anda harus mengirim data log ke layanan seperti CloudWatch Logs, dan membuat metrik dari observasi konten log yang diperlukan. 

 CloudWatch memiliki fitur khusus seperti [Wawasan Amazon CloudWatch untuk Server SQL dan .NET](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/appinsights-what-is.html) dan [Wawasan Kontainer](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/ContainerInsights.html) yang dapat membantu Anda melalui identifikasi dan pengaturan metrik kunci, log, dan alarm di seluruh sumber daya aplikasi tertentu yang didukung dan tumpukan teknologi. 

 **Antipola umum:** 
+  Anda memiliki metrik standar yang telah ditentukan, tidak terkait dengan KPI mana pun atau dikhususkan untuk beban kerja tertentu. 
+  Terjadi kesalahan dalam penghitungan metrik Anda yang akan membuat hasil tidak valid. 
+  Anda tidak memiliki metrik yang ditentukan untuk beban kerja Anda. 
+  Anda hanya mengukur ketersediaan. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan menentukan dan mengevaluasi metrik beban kerja, Anda dapat menentukan kondisi beban kerja Anda dan mengukur pencapaian hasil bisnis. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Tentukan metrik beban kerja: Tentukan metrik beban kerja untuk mengukur pencapaian KPI. Tentukan metrik beban kerja untuk mengukur kondisi beban kerja dan masing-masing komponennya. Evaluasi metrik untuk menentukan apakah beban kerja mencapai hasil yang diinginkan, dan untuk memahami kondisi beban kerja. 
  +  [Publikasikan metrik kustom](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/publishingMetrics.html) 
  +  [Mencari dan memfilter data log](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/MonitoringLogData.html) 
  +  [Referensi dimensi dan metrik Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Referensi dimensi dan metrik Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html) 
+  [Publikasikan metrik kustom](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/publishingMetrics.html) 
+  [Mencari dan memfilter data log](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/MonitoringLogData.html) 

# OPS08-BP03 Mengumpulkan dan menganalisis metrik beban kerja
<a name="ops_workload_health_collect_analyze_workload_metrics"></a>

 Melakukan tinjauan metrik proaktif rutin untuk mengidentifikasi tren dan menentukan di mana respons yang tepat perlu diberikan. 

 Anda harus mengagregasi data log dari aplikasi, komponen beban kerja, layanan, dan panggilan API Anda ke layanan seperti CloudWatch Logs. Hasilkan metrik dari pengamatan konten log yang diperlukan untuk memungkinkan wawasan tentang kinerja aktivitas operasi. 

 Di AWS, Anda dapat menganalisis metrik beban kerja dan mengidentifikasi masalah operasional menggunakan kemampuan machine learning yang dimiliki [Amazon DevOps Guru](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html). AWS DevOps Guru menyediakan notifikasi masalah operasional dengan saran [tertarget dan proaktif](https://docs.aws.amazon.com/devops-guru/latest/userguide/view-insights.html) untuk mengatasi masalah dan memelihara kondisi aplikasi 

 Di Model Tanggung Jawab Bersama AWS, bagian pemantauan dikirimkan kepada Anda melalui [Dasbor AWS Health](https://aws.amazon.com/premiumsupport/technology/personal-health-dashboard/). Dasbor ini menyediakan pemberitahuan dan panduan perbaikan ketika AWS mengalami peristiwa yang mungkin memengaruhi Anda. Pelanggan dengan langganan Dukungan Bisnis dan Korporat juga mendapatkan akses ke [API AWS Health](https://docs.aws.amazon.com/health/latest/ug/getting-started-api.html), yang memungkinkan integrasi ke sistem manajemen mereka. 

 Di AWS, Anda dapat [mengekspor data log Anda ke Amazon S3](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/S3Export.html) atau [mengirimkan log langsung](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/Sending-Logs-Directly-To-S3.html) ke [Amazon S3](https://aws.amazon.com/s3/) untuk penyimpanan jangka panjang. Menggunakan [AWS Glue](https://aws.amazon.com/glue/), Anda dapat menemukan dan mempersiapkan data log Anda di Amazon S3 untuk analitik, dengan menyimpan metadata terkait di [AWSAWS Glue Data Catalog](https://docs.aws.amazon.com/glue/latest/dg/populate-data-catalog.html). [Amazon Athena](https://aws.amazon.com/athena/), melalui integrasi native-nya dengan AWS Glue, kemudian dapat digunakan untuk menganalisis data log Anda, yang mengkuerinya menggunakan SQL standar. Menggunakan alat kecerdasan bisnis seperti [Quick](https://aws.amazon.com/quicksight/) Anda dapat memvisualisasi, menjelajahi, dan menganalisis data Anda. 

 Solusi [alternatifnya](https://aws.amazon.com/solutions/centralized-logging/?did=sl_card&trk=sl_card) adalah menggunakan [Amazon OpenSearch Service](https://aws.amazon.com/elasticsearch-service/) dan [OpenSearch Dashboards](https://aws.amazon.com/elasticsearch-service/the-elk-stack/kibana/) untuk mengumpulkan, menganalisis, dan menampilkan log di AWS di beberapa akun dan Wilayah AWS. 

 **Antipola umum:** 
+  Anda diminta oleh tim desain jaringan untuk menunjukkan tingkat pemanfaatan bandwidth jaringan saat ini. Anda menyediakan metrik saat ini, dengan pemanfaatan jaringan sebesar 35%. Mereka mengurangi kapasitas sirkuit sebagai langkah penghematan biaya yang menyebabkan masalah konektivitas yang meluas karena pengukuran titik waktu Anda tidak mencerminkan tren dalam tingkat pemanfaatan. 
+  Router Anda mengalami kegagalan. Router Anda mencatatkan log kesalahan memori nonkritis dengan frekuensi yang terus membesar hingga gagal sepenuhnya. Anda tidak mendeteksi tren ini sehingga Anda tidak mengganti memori yang bermasalah sebelum router menyebabkan gangguan layanan. 

 **Manfaat menjalankan praktik terbaik ini:** Dengan mengumpulkan dan menganalisis metrik beban kerja Anda, Anda mendapatkan pemahaman tentang kondisi beban kerja dan dapat memperoleh wawasan tentang tren-tren yang mungkin memberikan dampak pada beban kerja atau pencapaian hasil bisnis Anda. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Kumpulkan dan analisis metrik beban kerja: Lakukan tinjauan metrik proaktif rutin untuk mengidentifikasi tren dan menentukan di mana respons yang tepat perlu diberikan. 
  +  [Menggunakan metrik Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/working_with_metrics.html) 
  +  [Metrik Amazon CloudWatch dan referensi dimensi](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html) 
  +  [Kumpulkan metrik dan log dari instans Amazon EC2 dan server on-premise dengan Agen CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Amazon Athena](https://aws.amazon.com/athena/) 
+  [Metrik Amazon CloudWatch dan referensi dimensi](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html) 
+  [Amazon DevOps Guru](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html) 
+  [AWS Glue](https://aws.amazon.com/glue/) 
+  [AWSAWS Glue Data Catalog](https://docs.aws.amazon.com/glue/latest/dg/populate-data-catalog.html) 
+  [Amazon OpenSearch Service](https://aws.amazon.com/elasticsearch-service/) 
+  [Dasbor AWS Health](https://aws.amazon.com/premiumsupport/technology/personal-health-dashboard/) 
+  [Quick](https://aws.amazon.com/quicksight/) 
+  [Kumpulkan metrik dan log dari instans Amazon EC2 dan server on-premise dengan Agen CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html) 
+  [Menggunakan metrik Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/working_with_metrics.html) 

# OPS08-BP04 Membuat dasar acuan metrik beban kerja
<a name="ops_workload_health_workload_metric_baselines"></a>

 Buat dasar acuan untuk metrik guna menyediakan nilai yang diharapkan sebagai dasar perbandingan dan identifikasi komponen dengan kinerja yang terlalu rendah atau terlalu tinggi. Identifikasi ambang batas untuk perbaikan, investigasi, dan intervensi. 

 **Antipola umum:** 
+  Sebuah server berjalan dengan pemanfaatan CPU sebesar 95%, dan Anda ditanya apakah hal tersebut bagus atau buruk. Pemanfaatan CPU di server tersebut belum memiliki dasar acuan sehingga Anda tidak tahu apakah angka tersebut bagus atau buruk. 

 **Manfaat menjalankan praktik terbaik ini:** Dengan menetapkan nilai metrik dasar acuan, Anda mampu mengevaluasi nilai metrik saat ini, serta tren metrik, untuk menentukan apakah tindakan diperlukan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Buat dasar acuan untuk metrik beban kerja: Buat dasar acuan untuk metrik beban kerja guna menyediakan nilai yang diharapkan sebagai dasar perbandingan. 
  +  [Membuat Alarm Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Membuat Alarm Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 

# OPS08-BP05 Mempelajari pola aktivitas yang diharapkan untuk beban kerja
<a name="ops_workload_health_learn_workload_usage_patterns"></a>

 Buat pola aktivitas beban kerja untuk mengidentifikasi aktivitas anomali, sehingga Anda dapat memberikan respons yang sesuai jika diperlukan. 

 CloudWatch melalui [fitur Deteksi Anomali CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) menerapkan algoritma machine learning dan statistik untuk membuat rentang nilai ekspektasi sesuai dengan perilaku metrik normal. 

 [Amazon DevOps Guru](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html) dapat digunakan untuk mengidentifikasi perilaku anomali melalui korelasi peristiwa, analisis log, dan penerapan machine learning, untuk menganalisis telemetri beban kerja Anda. Saat terdeteksi perilaku yang tidak diharapkan, akan tersedia [peristiwa dan metrik terkait](https://docs.aws.amazon.com/devops-guru/latest/userguide/understanding-insights-console.html) serta saran untuk mengatasi perilaku tersebut. 

 **Antipola umum:** 
+  Anda sedang meninjau log pemanfaatan jaringan dan mendapati pemanfaatan jaringan yang meningkat antara pukul 11.30 dan 13.30, kemudian kembali terjadi pada pukul 16.30 hingga 18.00. Anda tidak tahu apakah kejadian ini harus dianggap normal atau tidak. 
+  Server web Anda melakukan boot ulang setiap pukul 03.00 dini hari. Anda tidak tahu apakah kejadian ini harus dianggap normal atau tidak. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan mempelajari pola perilaku, Anda dapat mengenali perilaku yang tidak diharapkan dan melakukan tindakan yang diperlukan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Pelajari pola aktivitas yang diharapkan untuk beban kerja: Tetapkan pola aktivitas beban kerja untuk menentukan perilaku yang menyimpang dari nilai ekspektasi agar Anda dapat memberikan respons yang sesuai jika diperlukan. 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Amazon DevOps Guru](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html) 
+  [fitur Deteksi Anomali CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) 

# OPS08-BP06 Memberikan pemberitahuan saat hasil beban kerja terpapar risiko
<a name="ops_workload_health_workload_outcome_alerts"></a>

 Berikan pemberitahuan saat terdapat risiko pada hasil beban kerja sehingga Anda dapat merespons dengan tepat jika perlu. 

 Idealnya, sebelumnya Anda telah mengidentifikasi ambang batas metrik yang dapat diberitahukan atau peristiwa yang dapat digunakan untuk memicu respons otomatis. 

 Di AWS, Anda dapat menggunakan [Amazon CloudWatch Synthetics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html) untuk membuat skrip canary guna memantau titik akhir dan API Anda dengan melakukan tindakan yang sama seperti pelanggan Anda. Telemetri yang dihasilkan dan [wawasan yang didapatkan](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries_Details.html) dapat membantu Anda mengidentifikasi masalah sebelum pelanggan merasakan dampaknya. 

 Anda juga dapat menggunakan [CloudWatch Logs Insights](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/AnalyzingLogData.html) untuk mencari dan menganalisis data log secara interaktif dengan menggunakan bahasa kueri yang dibuat khusus. CloudWatch Logs Insights secara otomatis [menemukan bidang dalam log](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CWL_AnalyzeLogData-discoverable-fields.html) dari layanan AWS, dan log event kustom dalam format JSON. Ini menskalakan dengan volume log dan kompleksitas kueri dan memberi jawaban dalam hitungan detik, sehingga membantu Anda mencari faktor penyebab insiden. 

 **Antipola umum:** 
+  Anda tidak memiliki konektivitas jaringan. Tidak ada yang menyadarinya. Tidak ada orang yang mencoba mengidentifikasi alasannya maupun melakukan tindakan untuk memulihkan konektivitas. 
+  Setelah sebuah patch, instans persisten Anda tidak tersedia, sehingga pengguna menjadi terganggu. Pengguna Anda mengajukan kasus dukungan. Tidak ada yang menerima notifikasi. Tidak ada yang melakukan tindakan. 

 **Manfaat menjalankan praktik terbaik ini:** Dengan mengidentifikasi bahwa terdapat risiko pada hasil bisnis dan memberitahukan tindakan yang perlu diambil, Anda memiliki peluang untuk mencegah atau memitigasi dampak insiden. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Beritahukan saat terdapat risiko pada hasil beban kerja: Berikan pemberitahuan saat terdapat risiko pada hasil beban kerja sehingga Anda dapat merespons dengan tepat jika diperlukan. 
  +  [Apa itu Amazon CloudWatch Events?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 
  +  [Membuat Alarm Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 
  +  [Memanggil fungsi Lambda menggunakan notifikasi Amazon SNS](https://docs.aws.amazon.com/sns/latest/dg/sns-lambda.html) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Amazon CloudWatch Synthetics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html) 
+  [CloudWatch Logs Insights](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/AnalyzingLogData.html) 
+  [Membuat Alarm Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 
+  [Memanggil fungsi Lambda menggunakan notifikasi Amazon SNS](https://docs.aws.amazon.com/sns/latest/dg/sns-lambda.html) 
+  [Apa itu Amazon CloudWatch Events?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 

# OPS08-BP07 Memberikan peringatan saat anomali beban kerja terdeteksi
<a name="ops_workload_health_workload_anomaly_alerts"></a>

 Aktifkan peringatan saat anomali beban kerja terdeteksi, agar Anda dapat memberikan respons yang sesuai jika diperlukan. 

 Analisis metrik beban kerja Anda dalam jangka waktu tertentu dapat membentuk pola perilaku yang dapat Anda ukur dengan memadai untuk menetapkan peristiwa atau memberikan alarm respons. 

 Setelah dilatih, fitur [fitur Deteksi Anomali CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) dapat digunakan untuk [memberikan alarm](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Create_Anomaly_Detection_Alarm.html) terhadap anomali terdeteksi, atau menyediakan nilai ekspektasi overlay ke dalam sebuah [grafik](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/graph_a_metric.html#create-metric-graph) data metrik untuk perbandingan berkelanjutan. 

 **Antipola umum:** 
+  Penjualan situs web retail Anda mengalami peningkatan signifikan secara tiba-tiba. Tidak ada yang menyadarinya. Tidak ada yang mencoba untuk mengidentifikasi penyebab lonjakan ini. Tidak ada yang melakukan tindakan untuk memastikan kualitas pengalaman pelanggan dengan beban tambahan tersebut. 
+  Dengan mengikuti penerapan patch, server tetap Anda akan sering melakukan boot ulang, hal ini dapat mengganggu pengguna. Server Anda biasanya melakukan boot ulang hingga tiga kali, tetapi tidak lebih dari itu. Tidak ada yang menyadarinya. Tidak ada yang mencoba mengidentifikasi apa yang terjadi. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan memahami pola perilaku beban kerja, Anda dapat mengidentifikasi perilaku menyimpang dan melakukan tindakan yang diperlukan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Rendah 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Aktifkan peringatan saat anomali beban kerja terdeteksi: Berikan peringatan saat anomali beban kerja terdeteksi sehingga Anda dapat memberikan respons yang sesuai jika diperlukan. 
  +  [Apa itu Amazon CloudWatch Events?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 
  +  [Membuat Alarm Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 
  +  [Memanggil fungsi Lambda menggunakan notifikasi Amazon SNS](https://docs.aws.amazon.com/sns/latest/dg/sns-lambda.html) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Membuat Alarm Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 
+  [fitur Deteksi Anomali CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) 
+  [Memanggil fungsi Lambda menggunakan notifikasi Amazon SNS](https://docs.aws.amazon.com/sns/latest/dg/sns-lambda.html) 
+  [Apa itu Amazon CloudWatch Events?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 

# OPS08-BP08 Memvalidasi capaian hasil dan efektivitas KPI serta metrik
<a name="ops_workload_health_biz_level_view_workload"></a>

 Buat tampilan tingkat bisnis mengenai operasi beban kerja Anda untuk membantu menentukan apakah Anda telah mencapai pemenuhan, serta mengidentifikasi area yang memerlukan pengembangan untuk mencapai tujuan bisnis. Validasikan efektivitas KPI dan metrik, serta lakukan revisi jika diperlukan. 

 AWS juga mendukung alat kecerdasan bisnis dan sistem analisis log pihak ketiga melalui layanan API dan SDK AWS (misalnya, Grafana, Kibana, dan Logstash). 

 **Antipola umum:** 
+  Waktu respons halaman belum pernah dianggap berkontribusi pada kepuasan pelanggan. Anda belum pernah membuat metrik atau ambang batas untuk waktu respons halaman. Pelanggan Anda mengeluhkan kelambatan. 
+  Anda belum mencapai target waktu respons minimum Anda. Dalam upaya untuk meningkatkan waktu respons, Anda telah menaikkan skala server aplikasi Anda. Anda telah melampaui target waktu respons dengan margin yang signifikan dan mengeluarkan biaya untuk kapasitas tak terpakai yang signifikan. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan meninjau dan merevisi KPI serta metrik, Anda memahami bagaimana beban kerja Anda mendukung pencapaian hasil bisnis Anda, serta dapat mengidentifikasi bagian yang memerlukan pengembangan untuk mencapai tujuan bisnis. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Rendah 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Validasikan pencapaian hasil dan efektivitas KPI serta metrik: Buat tampilan tingkat bisnis mengenai operasi beban kerja Anda untuk membantu menentukan apakah Anda telah mencapai pemenuhan, serta mengidentifikasi area yang memerlukan pengembangan untuk mencapai tujuan bisnis. Validasikan efektivitas KPI dan metrik, serta lakukan revisi jika diperlukan. 
  +  [Menggunakan dasbor Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html) 
  +  [Apa itu analitik log?](https://aws.amazon.com/log-analytics/) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Menggunakan dasbor Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html) 
+  [Apa itu analitik log?](https://aws.amazon.com/log-analytics/) 

# OPS 9 Bagaimana cara memahami kondisi operasi Anda?
<a name="w2aac19b5b9b7"></a>

 Tetapkan, catat, dan analisis metrik operasi untuk mendapatkan visibilitas peristiwa operasi sehingga Anda dapat mengambil tindakan yang tepat. 

**Topics**
+ [OPS09-BP01 Mengidentifikasi indikator kinerja utama](ops_operations_health_define_ops_kpis.md)
+ [OPS09-BP02 Tetapkan metrik operasi](ops_operations_health_design_ops_metrics.md)
+ [OPS09-BP03 Mengumpulkan dan menganalisis metrik operasi](ops_operations_health_collect_analyze_ops_metrics.md)
+ [OPS09-BP04 Membuat dasar acuan metrik operasi](ops_operations_health_ops_metric_baselines.md)
+ [OPS09-BP05 Mempelajari pola aktivitas yang diharapkan untuk operasi](ops_operations_health_learn_ops_usage_patterns.md)
+ [OPS09-BP06 Memperingatkan saat terdapat risiko pada hasil operasi](ops_operations_health_ops_outcome_alerts.md)
+ [OPS09-BP07 Membuat pemberitahuan saat anomali operasi terdeteksi](ops_operations_health_ops_anomaly_alerts.md)
+ [OPS09-BP08 Memvalidasi capaian hasil dan efektivitas KPI serta metrik](ops_operations_health_biz_level_view_ops.md)

# OPS09-BP01 Mengidentifikasi indikator kinerja utama
<a name="ops_operations_health_define_ops_kpis"></a>

 Identifikasikan indikator kinerja utama (KPI) berdasarkan hasil bisnis yang diinginkan (misalnya fitur baru yang diberikan) dan hasil pelanggan (misalnya kasus dukungan pelanggan). Evaluasikan KPI untuk menentukan kesuksesan operasi. 

 **Antipola umum:** 
+  Pimpinan bisnis bertanya kepada Anda tentang seberapa sukses operasi berjalan dalam mencapai tujuan bisnis, tetapi tidak memiliki kerangka acuan untuk menentukan kesuksesan. 
+  Anda tidak dapat menentukan apakah jendela pemeliharaan berdampak pada hasil bisnis. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan mengidentifikasi indikator kinerja utama, Anda dapat mencapai hasil bisnis sebagai pengujian kondisi dan kesuksesan operasi. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Identifikasikan indikator kinerja utama: Identifikasikan indikator kinerja utama (KPI) berdasarkan hasil bisnis dan hasil pelanggan. Evaluasikan KPI untuk menentukan kesuksesan operasi. 

# OPS09-BP02 Tetapkan metrik operasi
<a name="ops_operations_health_design_ops_metrics"></a>

 Tetapkan metrik operasi untuk mengukur pencapaian KPI (misalnya, deployment yang sukses, dan deployment yang gagal). Tetapkan metrik operasi untuk mengukur kondisi aktivitas operasi (misalnya, waktu rata-rata untuk mendeteksi insiden (MTTD), dan waktu rata-rata untuk pemulihan (MTTR) dari insiden). Evaluasi metrik untuk menentukan apakah operasi mencapai hasil yang diinginkan, dan untuk memahami kondisi aktivitas operasi Anda. 

 **Antipola umum:** 
+  Metrik operasi Anda didasarkan atas apa yang wajar menurut tim. 
+  Terjadi kesalahan dalam penghitungan metrik yang akan mengakibatkan hasil yang tidak benar. 
+  Anda tidak memiliki metrik yang ditentukan untuk aktivitas operasi Anda. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan menetapkan dan mengevaluasi metrik operasi, Anda dapat menentukan kondisi aktivitas operasi Anda dan mengukur pencapaian hasil bisnis. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Tetapkan metrik operasi: Tetapkan metrik operasi untuk mengukur pencapaian KPI. Tetapkan metrik operasi untuk mengukur kondisi operasi dan aktivitasnya. Evaluasi metrik untuk menentukan apakah operasi mencapai hasil yang diinginkan, dan untuk memahami kondisi operasi. 
  +  [Publikasikan metrik kustom](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/publishingMetrics.html) 
  +  [Mencari dan menyaring data log](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/MonitoringLogData.html) 
  +  [Metrik Amazon CloudWatch dan referensi dimensi](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [AWS Jawaban: Pencatatan Terpusat](https://aws.amazon.com/answers/logging/centralized-logging/) 
+  [Metrik Amazon CloudWatch dan referensi dimensi](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html) 
+  [Deteksi dan Reaksi Terhadap Perubahan Dalam Alur dengan Amazon CloudWatch Events](https://docs.aws.amazon.com/codepipeline/latest/userguide/detect-state-changes-cloudwatch-events.html) 
+  [Publikasikan metrik kustom](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/publishingMetrics.html) 
+  [Mencari dan menyaring data log](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/MonitoringLogData.html) 

 **Video terkait:** 
+  Buat Rencana Pemantauan 

# OPS09-BP03 Mengumpulkan dan menganalisis metrik operasi
<a name="ops_operations_health_collect_analyze_ops_metrics"></a>

 Lakukan tinjauan metrik proaktif rutin untuk mengidentifikasi tren dan menentukan di mana respons yang tepat perlu diberikan. 

 Anda harus mengagregasi data log dari pelaksanaan aktivitas operasi dan panggilan API operasi Anda, ke dalam layanan seperti CloudWatch Logs. Hasilkan metrik dari pengamatan konten log yang diperlukan untuk memperoleh wawasan tentang kinerja aktivitas operasi. 

 Di AWS, Anda dapat [mengekspor data log Anda ke Amazon S3](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/S3Export.html) atau [mengirimkan log langsung](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/Sending-Logs-Directly-To-S3.html) ke [Amazon S3](https://aws.amazon.com/s3/) untuk penyimpanan jangka panjang. Menggunakan [AWS Glue](https://aws.amazon.com/glue/), Anda dapat menemukan dan mempersiapkan data log Anda di Amazon S3 untuk analitik, dengan menyimpan metadata terkait di [AWSAWS Glue Data Catalog](https://docs.aws.amazon.com/glue/latest/dg/populate-data-catalog.html). [Amazon Athena](https://aws.amazon.com/athena/), melalui integrasi native-nya dengan AWS Glue, kemudian dapat digunakan untuk menganalisis data log Anda, yang mengkuerinya menggunakan SQL standar. Menggunakan alat kecerdasan bisnis seperti [Quick](https://aws.amazon.com/quicksight/) Anda dapat memvisualisasi, menjelajahi, dan menganalisis data Anda. 

 **Antipola umum:** 
+  Pengiriman fitur baru yang konsisten dianggap sebagai penanda kinerja utama. Anda tidak memiliki metode untuk mengukur seberapa sering deployment terjadi. 
+  Anda mencatatkan log deployment, deployment yang dibatalkan, patch, dan patch yang dibatalkan untuk melacak aktivitas operasi Anda, tetapi tidak ada orang yang meninjau metriknya. 
+  Anda memiliki tujuan waktu pemulihan untuk memulihkan basis data yang hilang dalam waktu lima belas menit yang ditetapkan ketika sistem diterapkan dan tidak memiliki pengguna. Sekarang Anda memiliki sepuluh ribu pengguna dan telah beroperasi selama dua tahun. Pemulihan terbaru memerlukan waktu lebih dari dua jam. Hal ini tidak dicatat dan tidak ada yang menyadarinya. 

 **Manfaat menjalankan praktik terbaik ini:** Dengan mengumpulkan dan menganalisis metrik operasi Anda, Anda mendapatkan pemahaman tentang kondisi operasi dan dapat memperoleh wawasan tentang tren-tren yang mungkin memberikan dampak pada operasi atau pencapaian hasil bisnis Anda. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Kumpulkan dan analisis metrik operasi: Lakukan tinjauan metrik proaktif rutin untuk mengidentifikasi tren dan menentukan di mana respons yang tepat perlu diberikan. 
  +  [Menggunakan metrik Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/working_with_metrics.html) 
  +  [Metrik Amazon CloudWatch dan referensi dimensi](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html) 
  +  [Kumpulkan metrik dan log dari instans Amazon EC2 dan server on-premise dengan Agen CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Amazon Athena](https://aws.amazon.com/athena/) 
+  [Metrik Amazon CloudWatch dan referensi dimensi](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html) 
+  [Quick](https://aws.amazon.com/quicksight/) 
+  [AWS Glue](https://aws.amazon.com/glue/) 
+  [AWSAWS Glue Data Catalog](https://docs.aws.amazon.com/glue/latest/dg/populate-data-catalog.html) 
+  [Kumpulkan metrik dan log dari instans Amazon EC2 dan server on-premise dengan Agen CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html) 
+  [Menggunakan metrik Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/working_with_metrics.html) 

# OPS09-BP04 Membuat dasar acuan metrik operasi
<a name="ops_operations_health_ops_metric_baselines"></a>

 Buat dasar acuan untuk metrik guna menyediakan nilai yang diharapkan sebagai dasar perbandingan dan identifikasi aktivitas operasi dengan kinerja yang terlalu rendah atau terlalu tinggi. 

 **Antipola umum:** 
+  Anda ditanyai tentang perkiraan waktu deployment. Anda belum mengukur berapa waktu yang diperlukan untuk deployment dan tidak dapat menentukan perkiraan waktu. 
+  Anda ditanyai tentang berapa lama waktu yang diperlukan untuk pulih dari suatu masalah pada server aplikasi. Anda tidak memiliki informasi tentang waktu pemulihan dari kontak pelanggan pertama. Anda tidak memiliki informasi tentang waktu pemulihan dari identifikasi pertama sebuah masalah melalui pemantauan. 
+  Anda ditanyai tentang jumlah personel dukungan yang diperlukan pada akhir pekan. Anda tidak tahu jumlah kasus dukungan yang umum terjadi pada akhir pekan dan tidak dapat memberikan perkiraan. 
+  Anda memiliki tujuan waktu pemulihan untuk memulihkan basis data yang hilang dalam waktu lima belas menit yang ditetapkan ketika sistem di-deploy dan tidak memiliki pengguna. Sekarang Anda memiliki sepuluh ribu pengguna dan telah beroperasi selama dua tahun. Anda tidak memiliki informasi tentang perubahan waktu pemulihan untuk basis data Anda. 

 **Manfaat menjalankan praktik terbaik ini:** Dengan menetapkan nilai metrik dasar acuan, Anda mampu mengevaluasi nilai metrik saat ini, serta tren metrik, untuk menentukan apakah tindakan diperlukan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Pelajari pola aktivitas yang diharapkan untuk operasi: Tetapkan pola aktivitas operasi untuk mengidentifikasi perilaku yang menyimpang dari nilai yang diharapkan agar Anda dapat memberikan respons yang sesuai jika diperlukan. 

# OPS09-BP05 Mempelajari pola aktivitas yang diharapkan untuk operasi
<a name="ops_operations_health_learn_ops_usage_patterns"></a>

 Buat pola aktivitas operasi untuk mengidentifikasi aktivitas anomali agar Anda dapat memberikan respons yang sesuai jika diperlukan. 

 **Antipola umum:** 
+  Tingkat kegagalan deployment Anda akhir-akhir ini meningkat secara signifikan. Anda menangani setiap kegagalan tersebut secara independen. Anda tidak menyadari bahwa kegagalan tersebut berkaitan dengan deployment yang dilakukan oleh karyawan baru yang belum memahami sistem manajemen deployment dengan baik. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan mempelajari pola perilaku, Anda dapat mengenali perilaku yang tidak diharapkan dan melakukan tindakan yang diperlukan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Pelajari pola aktivitas yang diharapkan untuk operasi: Tetapkan pola aktivitas operasi untuk mengidentifikasi perilaku yang menyimpang dari nilai yang diharapkan agar Anda dapat memberikan respons yang sesuai jika diperlukan. 

# OPS09-BP06 Memperingatkan saat terdapat risiko pada hasil operasi
<a name="ops_operations_health_ops_outcome_alerts"></a>

 Setiap kali hasil operasi terpapar risiko, sebuah peringatan harus dimunculkan dan ditindaklanjuti. Hasil operasi adalah aktivitas apa pun yang mendukung beban kerja dalam produksi. Ini mencakup semua hal mulai dari deployment versi baru aplikasi hingga pemulihan dari pemadaman. Hasil operasi harus diperlakukan sama pentingnya dengan hasil bisnis. 

Tim perangkat lunak harus mengidentifikasi metrik dan aktivitas operasi utama serta membuat peringatan untuk keduanya. Peringatan harus tepat waktu dan dapat ditindaklanjuti. Jika peringatan dimunculkan, referensi ke runbook atau playbook terkait harus disertakan. Peringatan tanpa tindakan terkait dapat memicu penumpukan peringatan.

 **Hasil yang diinginkan:** Saat aktivitas operasi terpapar risiko, peringatan dikirim untuk mendorong tindakan. Peringatan berisi konteks penyebab peringatan dimunculkan serta mengarah ke playbook untuk menyelidiki atau runbook untuk memitigasi. Jika memungkinkan, runbook diotomatiskan dan pemberitahuan dikirim. 

 **Antipola umum:** 
+ Anda sedang menyelidiki insiden dan kasus dukungan sedang diajukan. Kasus dukungan tersebut melanggar perjanjian tingkat layanan (SLA) tapi tidak ada peringatan yang dimunculkan. 
+ Deployment ke produksi yang dijadwalkan untuk tengah malam tertunda dikarenakan perubahan kode pada menit terakhir. Tidak ada peringatan yang dimunculkan dan deployment pun tertunda.
+ Terjadi penghentian produksi tapi tidak ada peringatan yang dikirim.
+  Waktu deployment Anda terus berjalan di luar perkiraan. Tidak ada tindakan yang diambil untuk menyelidikinya. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Pemberian peringatan ketika hasil operasi terpapar risiko meningkatkan kemampuan Anda untuk mendukung beban kerja Anda dengan mengantisipasi masalah. 
+  Hasil bisnis meningkat dikarenakan hasil operasi yang sehat. 
+  Deteksi dan perbaikan masalah operasi mengalami perbaikan. 
+  Kesehatan operasional secara keseluruhan mengalami peningkatan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Hasil operasi harus ditetapkan sebelum Anda dapat memperingatkannya. Mulailah dengan menetapkan aktivitas operasi apa yang paling penting bagi organisasi Anda. Apakah yang terpenting adalah deployment ke produksi dalam waktu kurang dari dua jam atau merespons kasus dukungan dalam waktu yang ditentukan? Organisasi Anda harus menetapkan aktivitas operasi utama serta bagaimana aktivitas tersebut diukur agar dapat dipantau, ditingkatkan, dan diperingatkan. Anda memerlukan lokasi sentral di mana telemetri beban kerja dan operasi disimpan dan dianalisis. Mekanisme yang sama harus bisa memunculkan peringatan ketika hasil operasi terpapar risiko. 

 **Contoh pelanggan** 

 Alarm CloudWatch dipicu selama deployment rutin di AnyCompany Retail. Waktu jeda untuk deployment dilanggar. Amazon EventBridge membuat OpsItem di AWS Systems Manager OpsCenter. Tim Operasi Cloud menggunakan playbook untuk menyelidiki masalah dan mengidentifikasi bahwa perubahan skema memerlukan waktu yang lebih lama dari yang diharapkan. Mereka memperingatkan pengembang yang berjaga dan melanjutkan pemantauan deployment. Setelah deployment selesai, tim Operasi Cloud menyelesaikan OpsItem. Tim akan menganalisis insiden selama postmortem. 

## Langkah implementasi
<a name="implementation-steps"></a>

1. Jika Anda belum mengidentifikasi KPI, metrik, dan aktivitas operasi, upayakan implementasi praktik terbaik sebelum pertanyaan ini (OPS09-BP01 sampai OPS09-BP05). 
   +  Pelanggan Dukungan dengan [Enterprise Support](https://aws.amazon.com/premiumsupport/plans/enterprise/) dapat mengajukan permintaan [Lokakarya KPI Operasi](https://aws.amazon.com/premiumsupport/technology-and-programs/proactive-services/#Operational_Workshops_and_Deep_Dives) dari Manajer Akun Teknis mereka. Lokakarya terkolaborasi ini membantu Anda menetapkan KPI dan metrik operasi selaras dengan tujuan bisnis, yang disediakan tanpa biaya tambahan. Hubungi Manajer Akun Teknis Anda untuk mengetahui lebih lanjut. 

1.  Setelah Anda membangun aktivitas, KPI, dan metrik operasi, konfigurasikan peringatan di platform observabilitas. Peringatan harus memiliki tindakan yang berkaitan, seperti playbook atau runbook. Peringatan tanpa tindakan harus dihindari. 

1.  Seiring waktu, Anda harus mengevaluasi metrik, KPI, dan aktivitas operasi Anda untuk mengidentifikasi area perbaikan. Serap umpan balik di runbook dan playbook dari operator untuk mengidentifikasi area perbaikan dalam merespons peringatan. 

1.  Peringatan harus disertai mekanisme untuk menandainya sebagai positif-palsu. Hal ini harus mengarah pada peninjauan ambang batas metrik. 

 **Tingkat upaya untuk rencana implementasi:** Sedang. Terdapat beberapa praktik terbaik yang harus diterapkan sebelum menerapkan praktik terbaik ini. Setelah aktivitas operasi diidentifikasi dan KPI operasi dibentuk, peringatan harus dibuat. 

## Sumber daya
<a name="resources"></a>

 **Praktik Terbaik Terkait:** 
+  [OPS02-BP03 Aktivitas operasi memiliki pemilik teridentifikasi yang bertanggung jawab atas kinerjanya](ops_ops_model_def_activity_owners.md): Setiap aktivitas dan hasil operasi harus memiliki pemilik yang teridentifikasi yang bertanggung jawab. Pemilik inilah yang harus diperingatkan ketika hasil terpapar risiko. 
+  [OPS03-BP02 Anggota tim diberdayakan untuk bertindak ketika terdapat risiko pada hasil](ops_org_culture_team_emp_take_action.md): Saat peringatan dimunculkan, tim Anda harus memiliki upaya untuk bertindak guna menyelesaikan masalah. 
+  [OPS09-BP01 Mengidentifikasi indikator kinerja utama](ops_operations_health_define_ops_kpis.md): Memperingatkan hasil operasi dimulai dengan mengidentifikasi KPI operasi. 
+  [OPS09-BP02 Tetapkan metrik operasi](ops_operations_health_design_ops_metrics.md): Tetapkan praktik terbaik ini sebelum Anda mulai membuat peringatan. 
+  [OPS09-BP03 Mengumpulkan dan menganalisis metrik operasi](ops_operations_health_collect_analyze_ops_metrics.md): Metrik operasi yang dikumpulkan secara terpusat diperlukan untuk membangun peringatan. 
+  [OPS09-BP04 Membuat dasar acuan metrik operasi](ops_operations_health_ops_metric_baselines.md): Dasar acuan metrik operasi menyediakan kemampuan untuk menyetel peringatan dan menghindari penumpukan peringatan. 
+  [OPS09-BP05 Mempelajari pola aktivitas yang diharapkan untuk operasi](ops_operations_health_learn_ops_usage_patterns.md): Anda dapat meningkatkan akurasi peringatan Anda dengan memahami pola aktivitas untuk peristiwa operasi. 
+  [OPS09-BP08 Memvalidasi capaian hasil dan efektivitas KPI serta metrik](ops_operations_health_biz_level_view_ops.md): Evaluasi pencapaian hasil operasi untuk memastikan bahwa KPI dan metrik Anda valid. 
+  [OPS10-BP02 Menjalankan proses untuk setiap peringatan](ops_event_response_process_per_alert.md): Setiap peringatan harus memiliki runbook atau playbook yang terkait dan menyediakan konteks untuk pihak yang diperingatkan. 
+  [OPS11-BP02 Menjalankan analisis setelah insiden](ops_evolve_ops_perform_rca_process.md): Lakukan analisis pascainsiden setelah peringatan untuk mengidentifikasi area perbaikan. 

 **Dokumen terkait:** 
+  [Arsitektur Referensi Pipeline Deployment AWS: Arsitektur Pipeline Aplikasi](https://pipelines.devops.aws.dev/application-pipeline/) 
+  [GitLab: Mulai Menggunakan Metrik Agile/DevOps](https://about.gitlab.com/handbook/marketing/strategic-marketing/devops-metrics/) 

 **Video terkait:** 
+  [Lakukan Agregrasi dan Atasi Masalah Operasional Menggunakan AWS Systems Manager OpsCenter](https://www.youtube.com/watch?v=r6ilQdxLcqY) 
+  [Integrasikan AWS Systems Manager OpsCenter dengan Alarm Amazon CloudWatch](https://www.youtube.com/watch?v=Gpc7a5kVakI) 
+  [Integrasikan Sumber Data Anda ke dalam AWS Systems Manager OpsCenter Menggunakan Amazon EventBridge](https://www.youtube.com/watch?v=Xmmu5mMsq3c) 

 **Contoh terkait:** 
+  [Otomatiskan tindakan penyelesaian untuk pemberitahuan Amazon EC2 dan selainnya menggunakan Otomatisasi Manajer Sistem Amazon EC2 dan AWS Health](https://aws.amazon.com/blogs/mt/automate-remediation-actions-for-amazon-ec2-notifications-and-beyond-using-ec2-systems-manager-automation-and-aws-health/) 
+  [Lokakarya Alat Manajemen dan Tata Kelola AWS - Operasi 2022](https://mng.workshop.aws/operations-2022.html) 
+  [Menyerap, menganalisis, dan memvisualisasikan metrik dengan Dasbor Pemantauan DevOps di AWS](https://docs.aws.amazon.com/solutions/latest/devops-monitoring-dashboard-on-aws/welcome.html) 

 **Layanan terkait:** 
+  [Amazon EventBridge](https://docs.aws.amazon.com/eventbridge/latest/userguide/eb-what-is.html) 
+  [Layanan Proaktif Dukungan - Lokakarya KPI Operasi](https://aws.amazon.com/premiumsupport/technology-and-programs/proactive-services/#Operational_Workshops_and_Deep_Dives) 
+  [AWS Systems Manager OpsCenter](https://docs.aws.amazon.com/systems-manager/latest/userguide/OpsCenter.html) 
+  [CloudWatch Events](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 

# OPS09-BP07 Membuat pemberitahuan saat anomali operasi terdeteksi
<a name="ops_operations_health_ops_anomaly_alerts"></a>

 Berikan pemberitahuan saat anomali operasi terdeteksi sehingga Anda dapat merespons dengan tepat jika perlu. 

 Analisis Anda terhadap metrik operasi dalam jangka waktu tertentu mungkin telah membentuk pola perilaku yang dapat Anda hitung secara memadai untuk menetapkan peristiwa atau memberikan alarm respons. 

 Setelah dilatih, fitur [fitur Deteksi Anomali CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) dapat digunakan untuk memunculkan [alarm](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Create_Anomaly_Detection_Alarm.html) tentang anomali yang terdeteksi atau dapat menyediakan nilai yang diperkirakan ke sebuah [grafik](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/graph_a_metric.html#create-metric-graph) data metrik untuk perbandingan berkelanjutan. 

 [Amazon DevOps Guru](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html) dapat digunakan untuk mengidentifikasi perilaku anomali melalui korelasi peristiwa, analisis log, dan penerapan machine learning, untuk menganalisis telemetri beban kerja Anda. Dengan [yang](https://docs.aws.amazon.com/devops-guru/latest/userguide/understanding-insights-console.html) didapatkan disajikan dengan data dan saran yang relevan. 

 **Antipola umum:** 
+  Anda sedang menerapkan patch ke armada instans Anda. Sebelumnya Anda telah berhasil menguji patch di lingkungan pengujian. Namun, patch tersebut gagal untuk banyak instans di armada Anda. Anda tidak melakukan apa pun. 
+  Anda mencatat terdapat deployment mulai Jumat sore. Organisasi Anda telah menetapkan jadwal pemeliharaan setiap Selasa dan Kamis. Anda tidak melakukan apa pun. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan memahami pola perilaku operasi, Anda dapat mengidentifikasi perilaku menyimpang dan melakukan tindakan yang diperlukan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Rendah 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Buat pemberitahuan saat anomali operasi terdeteksi: Berikan pemberitahuan saat anomali operasi terdeteksi sehingga Anda dapat merespons dengan tepat jika perlu. 
  +  [Apa itu Amazon CloudWatch Events?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 
  +  [Membuat alarm Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 
  +  [Memanggil fungsi Lambda menggunakan notifikasi Amazon SNS](https://docs.aws.amazon.com/sns/latest/dg/sns-lambda.html) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Amazon DevOps Guru](https://docs.aws.amazon.com/devops-guru/latest/userguide/welcome.html) 
+  [fitur Deteksi Anomali CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Anomaly_Detection.html) 
+  [Membuat alarm Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) 
+  [Deteksi dan Berikan Reaksi Terhadap Perubahan Status Pipeline dengan Amazon CloudWatch Events](https://docs.aws.amazon.com/codepipeline/latest/userguide/detect-state-changes-cloudwatch-events.html) 
+  [Memanggil fungsi Lambda menggunakan notifikasi Amazon SNS](https://docs.aws.amazon.com/sns/latest/dg/sns-lambda.html) 
+  [Apa itu Amazon CloudWatch Events?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 

# OPS09-BP08 Memvalidasi capaian hasil dan efektivitas KPI serta metrik
<a name="ops_operations_health_biz_level_view_ops"></a>

 Buat tampilan tingkat bisnis mengenai aktivitas operasi Anda untuk membantu menentukan apakah Anda sudah memenuhi kebutuhan dan untuk mengidentifikasi area yang memerlukan perbaikan untuk mencapai tujuan bisnis. Validasikan efektivitas KPI dan metrik, serta lakukan revisi jika diperlukan. 

 AWS juga mendukung alat kecerdasan bisnis dan sistem analisis log pihak ketiga melalui layanan API dan SDK AWS (misalnya, Grafana, Kibana, dan Logstash). 

 **Antipola umum:** 
+  Frekuensi deployment Anda telah meningkat seiring bertambahnya jumlah tim pengembangan. Perkiraan jumlah deployment yang Anda tetapkan adalah satu kali per minggu. Anda telah rutin melakukan deployment harian. Ketika terdapat masalah dalam sistem deployment Anda, dan deployment tidak mungkin berjalan, hal ini tidak terdeteksi selama berhari-hari. 
+  Bisnis Anda sebelumnya menyediakan dukungan hanya selama jam-jam kerja inti dari Senin sampai Jumat. Anda menetapkan target waktu respons hari kerja berikutnya untuk insiden. Baru-baru ini Anda mulai menawarkan cakupan dukungan setiap hari dan setiap saat dengan target waktu respons dua jam. Staf lembut Anda kewalahan dan pelanggan Anda kecewa. Terdapat indikasi adanya masalah terkait waktu respons insiden karena Anda melapor berdasarkan target hari kerja berikutnya. 

 **Manfaat menjalankan praktik terbaik ini:** Dengan meninjau dan merevisi KPI serta metrik, Anda memahami bagaimana beban kerja mendukung pencapaian hasil bisnis Anda dan dapat mengidentifikasi bagian yang memerlukan perbaikan untuk mencapai tujuan bisnis. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Rendah 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Validasikan pencapaian hasil dan efektivitas KPI serta metrik: Buat tampilan tingkat bisnis mengenai aktivitas operasi Anda untuk membantu menentukan apakah Anda telah memenuhi kebutuhan dan untuk mengidentifikasi area yang memerlukan perbaikan untuk mencapai tujuan bisnis. Validasikan efektivitas KPI dan metrik, serta lakukan revisi jika diperlukan. 
  +  [Menggunakan dasbor Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html) 
  +  [Apa itu analitik log?](https://aws.amazon.com/log-analytics/) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Menggunakan dasbor Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html) 
+  [Apa itu analitik log?](https://aws.amazon.com/log-analytics/) 

# OPS 10 Bagaimana cara mengelola peristiwa operasi dan beban kerja?
<a name="w2aac19b5b9b9"></a>

 Siapkan dan validasikan prosedur untuk merespons peristiwa guna meminimalkan gangguannya pada beban kerja Anda. 

**Topics**
+ [OPS10-BP01 Menggunakan proses untuk manajemen peristiwa, insiden, dan masalah](ops_event_response_event_incident_problem_process.md)
+ [OPS10-BP02 Menjalankan proses untuk setiap peringatan](ops_event_response_process_per_alert.md)
+ [OPS10-BP03 Memprioritaskan kejadian operasional berdasarkan dampaknya terhadap bisnis](ops_event_response_prioritize_events.md)
+ [OPS10-BP04 Tetapkan jalur eskalasi](ops_event_response_define_escalation_paths.md)
+ [OPS10-BP05 Mengaktifkan notifikasi push](ops_event_response_push_notify.md)
+ [OPS10-BP06 Mengomunikasikan status melalui dasbor](ops_event_response_dashboards.md)
+ [OPS10-BP07 Otomatiskan respons terhadap peristiwa](ops_event_response_auto_event_response.md)

# OPS10-BP01 Menggunakan proses untuk manajemen peristiwa, insiden, dan masalah
<a name="ops_event_response_event_incident_problem_process"></a>

Organisasi Anda memiliki proses untuk menangani peristiwa, insiden, dan masalah. *Peristiwa* adalah hal-hal yang terjadi dalam beban kerja Anda, tetapi mungkin tidak memerlukan intervensi. *Insiden* adalah peristiwa yang memerlukan intervensi. *Masalah* adalah peristiwa berulang yang memerlukan intervensi atau tidak dapat diselesaikan. Anda memerlukan proses untuk mengurangi dampak peristiwa ini pada bisnis Anda dan memastikan bahwa Anda merespons dengan tepat.

Ketika insiden dan masalah terjadi pada beban kerja Anda, Anda memerlukan proses untuk menanganinya. Bagaimana Anda akan mengomunikasikan status peristiwa dengan pemangku kepentingan? Siapa yang mengawasi pelaksanaan respons? Apa alat yang Anda gunakan untuk memitigasi peristiwa? Ini adalah contoh dari beberapa pertanyaan yang perlu Anda jawab untuk memiliki proses respons yang solid. 

Proses harus didokumentasikan di lokasi sentral dan tersedia bagi siapa saja yang terlibat dalam beban kerja Anda. Jika Anda tidak memiliki wiki atau penyimpanan dokumen sentral, repositori kontrol versi dapat digunakan. Anda akan terus memperbarui rencana ini seiring berkembangnya proses Anda. 

Masalah merupakan kandidat untuk otomatisasi. Peristiwa ini mengambil waktu Anda yang seharusnya dihabiskan untuk berinovasi. Mulailah dengan membangun proses berulang untuk memitigasi masalah. Seiring waktu, fokuslah untuk mengotomatiskan mitigasi atau memperbaiki masalah mendasar. Tindakan ini akan membebaskan waktu yang kemudian dapat dihabiskan untuk melakukan peningkatan dalam beban kerja Anda. 

**Hasil yang diinginkan:** Organisasi Anda memiliki proses untuk menangani peristiwa, insiden, dan masalah. Proses ini didokumentasikan dan disimpan di lokasi sentral. Dokumentasinya akan diperbarui seiring proses ini berubah. 

**Antipola umum:** 
+  Sebuah insiden terjadi pada akhir pekan dan teknisi yang berjaga tidak tahu harus melakukan tindakan apa. 
+  Seorang pelanggan mengirimi Anda email bahwa aplikasi Anda tidak beroperasi. Anda melakukan booting ulang server untuk memperbaikinya. Hal ini sering terjadi. 
+  Ada insiden yang mengharuskan banyak tim bekerja secara independen untuk mencoba menyelesaikannya. 
+  Deployment terjadi dalam beban kerja Anda tanpa didokumentasikan. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Anda memiliki jejak audit peristiwa dalam beban kerja Anda. 
+  Waktu Anda untuk pulih dari insiden berkurang. 
+  Anggota tim dapat menyelesaikan insiden dan masalah secara konsisten. 
+  Ada upaya yang lebih terkonsolidasi ketika menyelidiki sebuah insiden. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

Menerapkan praktik terbaik ini berarti Anda melacak peristiwa beban kerja. Anda memiliki proses untuk menangani insiden dan masalah. Proses ini didokumentasikan, dibagikan, dan sering diperbarui. Masalah diidentifikasi, diprioritaskan, dan diperbaiki. 

 **Contoh pelanggan** 

AnyCompany Retail mengkhususkan sebuah bagian dari wiki internal mereka untuk proses penanganan manajemen peristiwa, insiden, dan masalah. Semua peristiwa dikirim ke [Amazon EventBridge](https://docs.aws.amazon.com/eventbridge/latest/userguide/eb-what-is.html). Masalah diidentifikasi sebagai OpsItems di [AWS Systems Manager OpsCenter](https://docs.aws.amazon.com/systems-manager/latest/userguide/OpsCenter.html) dan diprioritaskan untuk diperbaiki, sehingga mengurangi tenaga kerja yang tidak terdiferensiasi. Seiring proses ini berubah, dokumentasinya diperbarui di wiki internal mereka. Mereka menggunakan [Manajer Insiden AWS Systems Manager](https://docs.aws.amazon.com/incident-manager/latest/userguide/what-is-incident-manager.html) untuk mengelola insiden dan mengoordinasikan upaya mitigasi. 

## Langkah implementasi
<a name="implementation-steps"></a>

1.  Peristiwa 
   +  Lacak peristiwa yang terjadi dalam beban kerja Anda, meskipun tidak diperlukan intervensi manusia. 
   +  Bekerja sama dengan pemangku kepentingan beban kerja untuk mengembangkan daftar peristiwa yang harus dilacak. Beberapa contohnya adalah deployment yang diselesaikan atau patching yang berhasil. 
   +  Anda dapat menggunakan layanan seperti [Amazon EventBridge](https://docs.aws.amazon.com/eventbridge/latest/userguide/eb-what-is.html) atau [Amazon Simple Notification Service](https://docs.aws.amazon.com/sns/latest/dg/welcome.html) untuk menghasilkan peristiwa kustom untuk pelacakan. 

1.  Insiden 
   +  Mulailah dengan mendefinisikan rencana komunikasi untuk insiden. Pemangku kepentingan mana yang harus diinformasikan? Bagaimana Anda akan terus menginformasikan mereka? Siapa yang mengawasi upaya koordinasi? Kami merekomendasikan untuk membuat saluran obrolan internal untuk komunikasi dan koordinasi. 
   +  Tentukan jalur eskalasi untuk tim yang mendukung beban kerja Anda, terutama jika tim ini tidak memiliki rotasi jaga. Berdasarkan tingkat dukungan Anda, Anda juga dapat mengajukan kasus ke Dukungan. 
   +  Buat buku playbook untuk menyelidiki insiden. Playbook Ini harus berisi rencana komunikasi dan langkah penyelidikan yang mendetail. Sertakan tindakan memeriksa [Dasbor AWS Health](https://docs.aws.amazon.com/health/latest/ug/what-is-aws-health.html) dalam penyelidikan Anda. 
   +  Dokumentasikan rencana respons insiden Anda. Komunikasikan rencana manajemen insiden agar pelanggan internal dan eksternal memahami aturan pelibatan dan apa yang diharapkan dari mereka. Latih anggota tim Anda tentang cara menggunakannya. 
   +  Pelanggan dapat menggunakan [Incident Manager](https://docs.aws.amazon.com/incident-manager/latest/userguide/what-is-incident-manager.html) untuk mengatur dan mengelola rencana respons insiden mereka. 
   +  Pelanggan Enterprise Support dapat meminta [Lokakarya Manajemen Insiden](https://aws.amazon.com/premiumsupport/technology-and-programs/proactive-services/#Operational_Workshops_and_Deep_Dives) dari Manajer Akun Teknis mereka. Lokakarya berpemandu ini akan menguji rencana respons insiden yang ada dan membantu Anda mengidentifikasi area yang perlu ditingkatkan. 

1.  Masalah 
   +  Masalah harus diidentifikasi dan dilacak dalam sistem ITSM Anda. 
   +  Identifikasi semua masalah yang diketahui dan prioritaskan berdasarkan tingkat upaya perbaikan dan dampak pada beban kerja.   
![\[Matriks prioritas tindakan untuk memprioritaskan masalah.\]](http://docs.aws.amazon.com/id_id/wellarchitected/2022-03-31/framework/images/impact-effort-chart.png)
   +  Selesaikan masalah yang berdampak tinggi dan memerlukan tingkat upaya yang rendah terlebih dahulu. Setelah masalah tersebut diselesaikan, lanjutkan ke masalah yang termasuk dalam kuadran upaya rendah berdampak rendah. 
   +  Anda dapat menggunakan [Systems Manager OpsCenter](systems-manager/latest/userguide/OpsCenter.html) untuk mengidentifikasi masalah ini, menyediakan runbook yang sesuai, dan melacaknya. 

**Tingkat upaya untuk rencana implementasi:** Sedang. Anda memerlukan proses dan alat untuk menerapkan praktik terbaik ini. Dokumentasikan proses Anda dan sediakan dokumentasi ini untuk siapa saja yang terkait dengan beban kerja. Perbarui dokumentasi ini secara rutin. Anda memiliki proses untuk mengelola dan memitigasi atau memperbaiki masalah. 

## Sumber daya
<a name="resources"></a>

 **Praktik terbaik terkait:** 
+  [OPS07-BP03 Menggunakan runbook untuk menjalankan prosedur](ops_ready_to_support_use_runbooks.md): Masalah yang diketahui memerlukan runbook terkait agar upaya mitigasinya konsisten.
+  [OPS07-BP04 Menggunakan buku panduan untuk menyelidiki masalah](ops_ready_to_support_use_playbooks.md): Insiden harus diselidiki menggunakan playbook. 
+  [OPS11-BP02 Menjalankan analisis setelah insiden](ops_evolve_ops_perform_rca_process.md): Selalu lakukan pemeriksaan pascainsiden setelah Anda pulih dari suatu insiden. 

 **Dokumen terkait:** 
+  [Atlassian - Manajemen insiden di era DevOps](https://www.atlassian.com/incident-management/devops) 
+  [Panduan Respons Insiden Keamanan AWS](https://docs.aws.amazon.com/whitepapers/latest/aws-security-incident-response-guide/welcome.html) 
+  [Manajemen Insiden di Era DevOps dan SRE](https://www.infoq.com/presentations/incident-management-devops-sre/) 
+  [PagerDuty - Apa itu Manajemen Insiden?](https://www.pagerduty.com/resources/learn/what-is-incident-management/) 

 **Video terkait:** 
+  [AWS re:Invent 2020: Manajemen insiden di organisasi terdistribusi](https://www.youtube.com/watch?v=tyS1YDhMVos) 
+  [AWS re:Invent 2021 - Membangun aplikasi generasi baru dengan arsitektur berbasis peristiwa](https://www.youtube.com/watch?v=U5GZNt0iMZY) 
+  [AWS Mendukung Anda \$1 Latihan Diskusi Menjelajahi Manajemen Insiden](https://www.youtube.com/watch?v=0m8sGDx-pRM) 
+  [Manajer Insiden AWS Systems Manager - Lokakarya Virtual AWS](https://www.youtube.com/watch?v=KNOc0DxuBSY) 
+  [AWS What's Next bersama Incident Manager \$1 Acara AWS](https://www.youtube.com/watch?v=uZL-z7cII3k) 

 **Contoh terkait:** 
+  [Lokakarya Alat Manajemen dan Tata Kelola AWS - OpsCenter](https://mng.workshop.aws/ssm/capability_hands-on_labs/opscenter.html) 
+  [Layanan Proaktif AWS – Lokakarya Manajemen Insiden](https://aws.amazon.com/premiumsupport/technology-and-programs/proactive-services/#Operational_Workshops_and_Deep_Dives) 
+  [Membangun aplikasi berbasis peristiwa dengan Amazon EventBridge](https://aws.amazon.com/blogs/compute/building-an-event-driven-application-with-amazon-eventbridge/) 
+  [Membangun arsitektur berbasis peristiwa di AWS](https://catalog.us-east-1.prod.workshops.aws/workshops/63320e83-6abc-493d-83d8-f822584fb3cb/en-US/) 

 **Layanan terkait:** 
+  [Amazon EventBridge](https://docs.aws.amazon.com/eventbridge/latest/userguide/eb-what-is.html) 
+  [Amazon SNS](https://docs.aws.amazon.com/sns/latest/dg/welcome.html) 
+  [Dasbor AWS Health](https://docs.aws.amazon.com/health/latest/ug/what-is-aws-health.html) 
+  [Manajer Insiden AWS Systems Manager](https://docs.aws.amazon.com/incident-manager/latest/userguide/what-is-incident-manager.html) 
+  [AWS Systems Manager OpsCenter](https://docs.aws.amazon.com/systems-manager/latest/userguide/OpsCenter.html) 

# OPS10-BP02 Menjalankan proses untuk setiap peringatan
<a name="ops_event_response_process_per_alert"></a>

 Tetapkan respons (runbook atau buku pedoman) dengan baik, dengan pemilik yang teridentifikasi secara khusus, untuk peristiwa apa pun yang diatur peringatannya. Ini memastikan respons yang efektif dan cepat terhadap peristiwa operasi dan mencegah peristiwa yang dapat ditindaklanjuti dihalangi oleh notifikasi yang kurang bernilai. 

 **Antipola umum:** 
+  Sistem pemantauan memberikan aliran koneksi yang disetujui bersama dengan pesan lainnya. Volume pesan sangat besar sehingga Anda melewatkan pesan kesalahan berkala yang perlu diintervensi. 
+  Anda menerima peringatan bahwa situs web terhenti. Tidak ada proses yang ditentukan jika hal seperti ini terjadi. Anda dipaksa untuk melakukan tindakan ad hoc untuk mendiagnosis dan menyelesaikan masalah. Mengembangkan proses ini seiring berjalannya waktu akan memperpanjang waktu pemulihan. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan memperingatkan hanya ketika tindakan diperlukan, Anda mencegah peringatan bernilai rendah menutupi peringatan bernilai tinggi. Dengan memiliki proses untuk setiap peringatan yang dapat ditindaklanjuti, Anda mengaktifkan respons yang konsisten dan cepat terhadap peristiwa di lingkungan Anda. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Proses per peringatan: Peristiwa apa pun yang Anda aktifkan peringatannya harus memiliki respons (runbook atau buku pedoman) yang jelas dengan pemilik yang teridentifikasi secara khusus (misalnya, individu, tim, atau peran) yang bertanggung jawab atas penyelesaian yang berhasil. Kinerja respons dapat diotomatiskan atau dilakukan oleh tim lain tetapi pemiliknya bertanggung jawab untuk memastikan proses memberikan hasil yang diharapkan. Dengan memiliki proses ini, Anda memastikan respons yang efektif dan cepat terhadap peristiwa operasi dan mencegah peristiwa yang dapat ditindaklanjuti dihalangi oleh notifikasi yang kurang bernilai. Misalnya, penskalaan otomatis dapat diterapkan untuk menskalakan front end web, tetapi tim operasi mungkin bertanggung jawab untuk memastikan bahwa aturan dan batas penskalaan otomatis sesuai untuk kebutuhan beban kerja. 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Fitur Amazon CloudWatch](https://aws.amazon.com/cloudwatch/features/) 
+  [Apa itu Amazon CloudWatch Events?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 

 **Video terkait:** 
+  [Build a Monitoring Plan](https://www.youtube.com/watch?v=OMmiGETJpfU) 

# OPS10-BP03 Memprioritaskan kejadian operasional berdasarkan dampaknya terhadap bisnis
<a name="ops_event_response_prioritize_events"></a>

 Ketika ada beberapa kejadian yang memerlukan intervensi, pastikan untuk mengatasi kejadian yang paling signifikan terhadap bisnis terlebih dahulu. Dampak dapat termasuk kematian atau cedera fisik, kerugian finansial, atau rusaknya reputasi dan kepercayaan. 

 **Antipola umum:** 
+  Anda menerima permintaan dukungan untuk menambahkan konfigurasi printer bagi pengguna. Saat sedang menangani masalah tersebut, Anda menerima permintaan dukungan yang menyatakan bahwa situs retail terhenti. Setelah menyelesaikan konfigurasi pencetak untuk pengguna, Anda mulai menangani masalah yang dialami situs web. 
+  Anda menerima pemberitahuan bahwa sistem pembayaran dan situs web retail Anda terhenti. Anda tidak tahu mana masalah yang harus diprioritaskan. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan memprioritaskan insiden yang dampaknya paling besar terhadap bisnis, Anda dapat menetapkan manajemen untuk dampak tersebut. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Prioritaskan peristiwa operasional berdasarkan dampaknya terhadap bisnis: Ketika ada beberapa kejadian yang memerlukan intervensi, atasi kejadian yang paling signifikan terhadap bisnis terlebih dahulu. Dampak dapat termasuk kematian atau cedera fisik, kerugian finansial, atau rusaknya reputasi atau kepercayaan. 

# OPS10-BP04 Tetapkan jalur eskalasi
<a name="ops_event_response_define_escalation_paths"></a>

 Tetapkan jalur eskalasi di runbook dan playbook Anda, termasuk apa yang memicu eskalasi, dan prosedur untuk eskalasi. Secara spesifik identifikasi pemilik untuk setiap tindakan guna memastikan respons yang efektif dan tepat waktu terhadap peristiwa operasi. 

 Identifikasi ketika keputusan manusia diperlukan sebelum tindakan diambil. Bekerja samalah dengan pengambil keputusan untuk mengambil keputusan tersebut lebih awal, dan untuk mendapatkan terlebih dulu persetujuan atas tindakan, sehingga MTTR tidak menjadi lebih lama karena menunggu respons. 

 **Antipola umum:** 
+  Situs retail Anda tidak berfungsi. Anda tidak memahami runbook untuk memulihkan situs itu. Anda mulai menelepon kolega dengan harapan seseorang akan dapat membantu Anda. 
+  Anda menerima kasus permintaan dukungan untuk aplikasi yang tidak dapat dijangkau. Anda tidak memiliki izin untuk administrasi sistem. Anda tidak tahu siapa yang memilikinya. Anda berusaha menghubungi pemilik sistem yang membuka kasus tersebut dan tidak mendapatkan respons. Anda tidak memiliki kontak untuk sistem dan kolega Anda tidak tahu. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan menetapkan eskalasi, pemicu untuk eskalasi, dan prosedur untuk eskalasi, Anda memungkinkan penambahan sumber daya secara sistematis ke insiden dengan tingkat yang sesuai untuk dampaknya. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Tetapkan jalur eskalasi: Tetapkan jalur eskalasi di runbook dan playbook Anda, termasuk apa yang memicu eskalasi, dan prosedur untuk eskalasi. Contohnya, eskalasi masalah dari rekayasawan dukungan ke rekayasawan dukungan senior ketika runbook tidak dapat menyelesaikan masalah, atau ketika jangka waktu yang ditetapkan sebelumnya telah lewat. Contoh lain dari jalur eskalasi yang benar adalah dari rekayasawan dukungan senior ke tim pengembangan untuk beban kerja ketika playbook tidak dapat mengidentifikasi jalur ke perbaikan, atau ketika jangka waktu yang ditetapkan sebelumnya telah lewat. Secara spesifik identifikasi pemilik untuk setiap tindakan guna memastikan respons yang efektif dan tepat waktu terhadap peristiwa operasi. Eskalasi dapat mencakup pihak ketiga. Contohnya, penyedia konektivitas jaringan atau vendor perangkat lunak. Eskalasi dapat mencakup pengambil keputusan resmi yang diidentifikasi untuk sistem yang terkena dampak. 

# OPS10-BP05 Mengaktifkan notifikasi push
<a name="ops_event_response_push_notify"></a>

 Berkomunikasilah secara langsung dengan pengguna Anda (misalnya melalui email atau SMS) ketika layanan yang mereka gunakan terganggu, serta ketika layanan kembali ke kondisi operasi normal, agar pengguna dapat mengambil tindakan yang tepat. 

 **Antipola umum:** 
+  Aplikasi Anda mengalami insiden penolakan layanan terdistribusi dan tidak memberikan respons selama berhari-hari. Tidak ada pesan kesalahan. Anda belum mengirimkan email notifikasi. Anda belum mengirimkan pesan teks notifikasi. Anda belum menyampaikan informasi di media sosial. Pelanggan Anda kesal dan mencari vendor lain yang dapat mendukung mereka. 
+  Pada hari Senin, aplikasi Anda mengalami masalah setelah patch tertentu dan tidak aktif selama beberapa jam. Pada hari Selasa, aplikasi Anda mengalami masalah setelah deployment kode dan tidak dapat diandalkan selama beberapa jam. Pada hari Rabu, aplikasi Anda mengalami masalah setelah deployment kode untuk memitigasi kerentanan keamanan terkait patch yang gagal dan aplikasi tidak tersedia selama beberapa jam. Pada hari Kamis, pelanggan Anda yang kesal mulai mencari vendor lain yang dapat mendukung mereka. 
+  Aplikasi Anda tidak akan tersedia pada akhir pekan ini untuk menjalani pemeliharaan. Anda tidak memberi tahu pelanggan Anda. Beberapa pelanggan telah menjadwalkan aktivitas yang melibatkan penggunaan aplikasi Anda. Mereka sangat kesal setelah mengetahui bahwa aplikasi Anda tidak tersedia. 

 **Manfaat menjalankan praktik terbaik ini:** Saat Anda menetapkan notifikasi, pemicu notifikasi, dan prosedur notifikasi, pelanggan Anda dapat menerima informasi dan memberikan respons saat mereka merasakan dampak dari masalah beban kerja Anda. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Aktifkan notifikasi push: Berkomunikasilah secara langsung dengan pengguna Anda (misalnya melalui email atau SMS) ketika layanan yang mereka gunakan terganggu, serta ketika layanan kembali ke kondisi operasi normal, agar pengguna dapat mengambil tindakan yang tepat. 
  +  [Fitur Amazon SES](https://aws.amazon.com/ses/details/) 
  +  [Apa Itu Amazon SES?](https://docs.aws.amazon.com/ses/latest/DeveloperGuide/Welcome.html) 
  +  [Atur notifikasi Amazon SNS](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/US_SetupSNS.html) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Fitur Amazon SES](https://aws.amazon.com/ses/details/) 
+  [Atur notifikasi Amazon SNS](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/US_SetupSNS.html) 
+  [Apa Itu Amazon SES?](https://docs.aws.amazon.com/ses/latest/DeveloperGuide/Welcome.html) 

# OPS10-BP06 Mengomunikasikan status melalui dasbor
<a name="ops_event_response_dashboards"></a>

 Menyediakan dasbor yang disesuaikan untuk audiens target mereka (misalnya, tim teknis internal, pimpinan, dan pelanggan) guna mengomunikasikan status operasi bisnis saat ini dan memberikan metrik kepentingan. 

 Anda dapat membuat dasbor menggunakan [Dasbor Amazon CloudWatch](https://aws.amazon.com/blogs/aws/cloudwatch-dashboards-create-use-customized-metrics-views/) dengan halaman beranda yang dapat disesuaikan di konsol CloudWatch. Dengan layanan kecerdasan bisnis seperti [Quick](https://aws.amazon.com/quicksight/) Anda dapat membuat dan memublikasikan dasbor interaktif yang menampilkan kondisi operasional dan beban kerja Anda (misalnya, tingkat pesanan, pengguna terhubung, dan waktu transaksi). Buat Dasbor yang memberikan tampilan tingkat bisnis dan sistem mengenai metrik Anda. 

 **Antipola umum:** 
+  Atas permintaan, Anda menjalankan laporan tentang pemanfaatan aplikasi Anda saat ini untuk manajemen. 
+  Selama insiden, Anda dihubungi setiap dua puluh menit oleh pemilik sistem yang ingin mengetahui apakah insiden sudah teratasi. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan membuat dasbor, Anda mengaktifkan akses layanan mandiri untuk pelanggan Anda agar mereka mengetahui jika mereka harus melakukan suatu tindakan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Komunikasikan status melalui dasbor: Sediakan dasbor yang disesuaikan untuk audiens target mereka (misalnya, tim teknis internal, pimpinan, dan pelanggan) guna mengomunikasikan status operasi bisnis saat ini dan menyediakan metrik kepentingan. Menyediakan opsi layanan mandiri untuk informasi status dapat mengurangi disrupsi permintaan penanganan status dari tim operator lapangan. Contohnya termasuk dasbor Amazon CloudWatch dan Dasbor AWS Health. 
  +  [Dasbor CloudWatch membuat dan menggunakan tampilan metrik yang disesuaikan](https://aws.amazon.com/blogs/aws/cloudwatch-dashboards-create-use-customized-metrics-views/) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Quick](https://aws.amazon.com/quicksight/) 
+  [Dasbor CloudWatch membuat dan menggunakan tampilan metrik yang disesuaikan](https://aws.amazon.com/blogs/aws/cloudwatch-dashboards-create-use-customized-metrics-views/) 

# OPS10-BP07 Otomatiskan respons terhadap peristiwa
<a name="ops_event_response_auto_event_response"></a>

 Otomatiskan respons terhadap peristiwa untuk mengurangi kesalahan yang disebabkan oleh proses manual, dan untuk memastikan respons yang konsisten dan tepat waktu. 

 Ada sejumlah cara untuk mengotomatiskan tindakan runbook dan playbook di AWS. Untuk merespons peristiwa dari perubahan keadaan di sumber daya AWS Anda, atau dari peristiwa kustom Anda sendiri, Anda harus membuat [aturan CloudWatch Events](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) untuk memicu respons melalui target CloudWatch (contohnya, fungsi Lambda, topik Amazon Simple Notification Service (Amazon SNS), tugas Amazon ECS, dan Otomatisasi AWS Systems Manager). 

 Untuk merespons metrik yang melampaui ambang batas untuk sumber daya (contohnya, waktu tunggu), Anda harus membuat [alarm CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html) untuk melakukan satu atau lebih tindakan menggunakan tindakan CloudWatch Events, tindakan Auto Scaling, atau untuk mengirimkan notifikasi ke topik Amazon SNS. Jika Anda harus melakukan tindakan kustom untuk merespons alarm, panggil Lambda melalui notifikasi Amazon SNS. Gunakan Amazon SNS untuk mempublikasikan notifikasi peristiwa dan pesan eskalasi agar orang selalu tahu. 

 AWS juga mendukung sistem pihak ketiga melalui API dan SDK layanan AWS. Ada sejumlah alat pemantauan yang disediakan oleh Partner AWS dan pihak ketiga yang memungkinkan pemantauan, notifikasi, dan respons. Beberapa alat ini antara lain New Relic, Splunk, Loggly, SumoLogic, dan Datadog. 

 Anda harus selalu menyediakan prosedur manual yang sangat penting untuk digunakan ketika prosedur otomatis gagal 

 **Antipola umum:** 
+  Developer memeriksa kodenya. Peristiwa ini bisa saja digunakan untuk mulai membangun kemudian melakukan pengujian tetapi tidak ada yang terjadi. 
+  Aplikasi Anda mencatat kesalahan spesifik sebelum berhenti berfungsi. Prosedur untuk memulai ulang aplikasi dipahami dengan baik dan dapat diberi skrip. Anda dapat menggunakan log event untuk memanggil skrip dan memulai ulang aplikasi. Tetapi, ketika kesalahan terjadi pada hari Minggu jam 3 pagi, Anda dibangunkan karena Anda adalah sumber daya yang siap dipanggil untuk memperbaiki sistem tersebut. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan menggunakan respons otomatis terhadap peristiwa, Anda mengurangi waktu untuk merespons dan membatasi timbulnya kesalahan akibat aktivitas manual. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Rendah 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Otomatiskan respons terhadap peristiwa: Otomatiskan respons terhadap peristiwa untuk mengurangi kesalahan yang disebabkan oleh proses manual, dan untuk memastikan respons yang konsisten dan tepat waktu. 
  +  [Apa itu Amazon CloudWatch Events?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 
  +  [Membuat aturan CloudWatch Events yang memicu peristiwa](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/Create-CloudWatch-Events-Rule.html) 
  +  [Membuat aturan CloudWatch Events yang memicu AWS panggilan API menggunakan AWS CloudTrail](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/Create-CloudWatch-Events-CloudTrail-Rule.html) 
  +  [Contoh peristiwa CloudWatch Events dari layanan yang didukung](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/EventTypes.html) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Amazon CloudWatch Fitur](https://aws.amazon.com/cloudwatch/features/) 
+  [Contoh peristiwa CloudWatch Events dari layanan yang didukung](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/EventTypes.html) 
+  [Membuat aturan CloudWatch Events yang memicu AWS panggilan API menggunakan AWS CloudTrail](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/Create-CloudWatch-Events-CloudTrail-Rule.html) 
+  [Membuat aturan CloudWatch Events yang memicu peristiwa](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/Create-CloudWatch-Events-Rule.html) 
+  [Apa itu Amazon CloudWatch Events?](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/WhatIsCloudWatchEvents.html) 

 **Video terkait:** 
+  [Buat Rencana Pemantauan](https://www.youtube.com/watch?v=OMmiGETJpfU) 

 **Contoh terkait:** 

# Evolusi
<a name="a-evolve"></a>

**Topics**
+ [OPS 11 Bagaimana cara mengembangkan operasi?](w2aac19b5c11b5.md)

# OPS 11 Bagaimana cara mengembangkan operasi?
<a name="w2aac19b5c11b5"></a>

 Dedikasikan waktu dan sumber daya untuk peningkatan bertahap yang berkelanjutan untuk meningkatkan dan efisiensi operasi Anda. 

**Topics**
+ [OPS11-BP01 Miliki proses untuk peningkatan berkelanjutan](ops_evolve_ops_process_cont_imp.md)
+ [OPS11-BP02 Menjalankan analisis setelah insiden](ops_evolve_ops_perform_rca_process.md)
+ [OPS11-BP03 Mengimplementasikan loop umpan balik](ops_evolve_ops_feedback_loops.md)
+ [OPS11-BP04 Menjalankan manajemen pengetahuan](ops_evolve_ops_knowledge_management.md)
+ [OPS11-BP05 Menetapkan pendorong untuk perbaikan](ops_evolve_ops_drivers_for_imp.md)
+ [OPS11-BP06 Memvalidasi wawasan](ops_evolve_ops_validate_insights.md)
+ [OPS11-BP07 Melakukan peninjauan metrik operasi](ops_evolve_ops_metrics_review.md)
+ [OPS11-BP08 Mendokumentasikan dan membagikan pelajaran yang didapatkan](ops_evolve_ops_share_lessons_learned.md)
+ [OPS11-BP09 Mengalokasikan waktu untuk membuat peningkatan](ops_evolve_ops_allocate_time_for_imp.md)

# OPS11-BP01 Miliki proses untuk peningkatan berkelanjutan
<a name="ops_evolve_ops_process_cont_imp"></a>

 Secara teratur evaluasi dan prioritaskan peluang untuk peningkatan guna memfokuskan upaya pada tempat di mana upaya dapat memberikan manfaat terbesar. 

 **Antipola umum:** 
+  Anda telah mendokumentasikan prosedur yang diperlukan untuk membuat lingkungan pengembangan atau pengujian. Anda dapat menggunakan CloudFormation untuk mengotomatiskan proses, tetapi Anda malah mengerjakannya secara manual dari konsol. 
+  Pengujian Anda menunjukkan bahwa sebagian besar penggunaan CPU di dalam aplikasi Anda berada di serangkaian kecil fungsi yang tidak efisien. Anda dapat berfokus untuk memperbaikinya dan mengurangi biaya, tetapi Anda telah ditugaskan untuk membuat fitur kegunaan baru. 

 **Manfaat menerapkan praktik terbaik ini:** Peningkatan berkelanjutan memberikan mekanisme untuk secara teratur mengevaluasi peluang untuk peningkatan, memprioritaskan peluang, dan memfokuskan upaya pada tempat di mana upaya dapat memberikan manfaat terbesar. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Tetapkan proses untuk peningkatan berkelanjutan: Secara teratur evaluasi dan prioritaskan peluang untuk peningkatan guna memfokuskan upaya pada tempat di mana upaya memberikan manfaat terbesar. Implementasikan perubahan untuk meningkatkan dan mengevaluasi hasil untuk menentukan kesuksesan. Jika hasilnya tidak memenuhi tujuan, dan peningkatan masih menjadi prioritas, ulang menggunakan tindakan alternatif. Proses operasi Anda harus mencakup waktu dan sumber daya yang didedikasikan untuk memungkinkan peningkatan bertahap yang berkelanjutan. 

# OPS11-BP02 Menjalankan analisis setelah insiden
<a name="ops_evolve_ops_perform_rca_process"></a>

 Tinjau peristiwa yang memengaruhi pelanggan, dan identifikasi faktor yang berkontribusi serta tindakan pencegahannya. Gunakan informasi ini untuk mengembangkan mitigasi guna meminimalkan atau mencegah kemungkinan terjadi lagi. Kembangkan prosedur untuk respons efektif dan cepat. Komunikasikan faktor yang berkontribusi dan tindakan korektif yang diperlukan, yang disesuaikan dengan audiens target. 

 **Antipola umum:** 
+  Anda mengelola server aplikasi. Kira-kira setiap 23 jam 55 menit, semua sesi aktif Anda dihapus. Anda berupaya mengidentifikasi masalah yang terjadi di server aplikasi Anda. Anda menduga bahwa ini mungkin masalah jaringan, tetapi tidak dapat memperoleh bantuan dari tim jaringan karena mereka terlalu sibuk. Anda tidak menetapkan proses di awal yang dapat Anda jadikan panduan untuk mendapatkan dukungan dan mengumpulkan informasi yang dibutuhkan guna mengetahui masalah yang sedang terjadi. 
+  Anda mengalami kehilangan data di dalam beban kerja Anda. Hal ini baru pertama kali terjadi dan penyebabnya belum jelas. Anda menganggap bahwa kejadian ini tidak penting karena Anda dapat membuat ulang data. Kehilangan data makin sering terjadi dan memengaruhi pelanggan Anda. Hal ini juga menambah beban operasional Anda karena harus memulihkan data yang hilang. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan proses yang telah ditetapkan di awal untuk menentukan komponen, kondisi, tindakan, dan kejadian yang berkontribusi terhadap insiden, Anda dapat mengidentifikasi peluang untuk pengembangan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Gunakan sebuah proses untuk mengetahui faktor yang berkontribusi: Tinjau semua insiden yang memengaruhi pelanggan. Buat sebuah proses untuk mengidentifikasi dan mendokumentasi faktor yang berkontribusi terhadap insiden agar Anda dapat mengembangkan mitigasi untuk membatasi atau mencegah kejadian serupa serta mengembangkan prosedur untuk merespons dengan cepat dan efektif. Komunikasikan penyebab utama sebagaimana diperlukan, yang disesuaikan dengan audiens target. 

# OPS11-BP03 Mengimplementasikan loop umpan balik
<a name="ops_evolve_ops_feedback_loops"></a>

Loop umpan balik menyediakan wawasan yang dapat ditindaklanjuti yang mendorong pengambilan keputusan. Masukkan loop umpan balik ke dalam prosedur dan beban kerja Anda. Ini membantu Anda mengidentifikasi permasalahan dan area yang memerlukan perbaikan. Loop umpan balik juga memvalidasi investasi yang dilakukan dalam upaya perbaikan. Loop umpan balik ini adalah landasan untuk meningkatkan beban kerja Anda secara berkelanjutan.

 Loop umpan balik dibagi ke dalam dua kategori: *umpan balik langsung* dan *analisis retrospektif*. Umpan balik langsung (immediate feedback) dikumpulkan melalui peninjauan kinerja dan hasil dari aktivitas operasi. Umpan balik ini berasal dari anggota tim, pelanggan, atau output otomatis dari aktivitas. Umpan balik langsung diterima dari hal-hal seperti pengujian A/B dan pengiriman fitur baru, dan ini penting untuk gagal cepat (fail fast). 

 Analisis retrospektif dilakukan secara rutin untuk menangkap umpan balik dari peninjauan metrik dan hasil operasional dari waktu ke waktu. Retrospektif ini terjadi pada akhir sprint, secara terjadwal, atau setelah perilisan atau peristiwa besar. Tipe loop umpan balik ini memvalidasi investasi dalam operasi atau beban kerja Anda. Loop umpan balik ini membantu Anda mengukur keberhasilan dan memvalidasi strategi Anda. 

 **Hasil yang diinginkan:** Anda menggunakan umpan balik langsung dan analisis retrospektif untuk mendorong perbaikan. Terdapat mekanisme untuk mendapatkan umpan balik pengguna dan anggota tim. Analisis retrospektif digunakan untuk mengidentifikasi tren-tren yang mendorong perbaikan. 

 **Antipola umum:** 
+ Anda meluncurkan fitur baru tetapi tidak ada cara untuk menerima umpan balik pelanggan tentangnya.
+ Setelah berinvestasi dalam perbaikan operasi, Anda tidak melakukan analisis retrospektif untuk memvalidasinya.
+ Anda mengumpulkan umpan balik pelanggan tetapi tidak meninjaunya secara rutin.
+ Loop umpan balik mendatangkan item-item tindakan yang diajukan tetapi item-item tersebut tidak disertakan dalam proses pengembangan perangkat lunak.
+  Pelanggan tidak menerima umpan balik tentang perbaikan yang mereka ajukan. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Anda dapat bekerja mundur dari pelanggan untuk mendorong fitur-fitur baru. 
+  Budaya organisasi Anda dapat merespons perubahan lebih cepat. 
+  Tren digunakan untuk mengidentifikasi peluang perbaikan. 
+  Retrospektif memvalidasi investasi yang dilakukan pada beban kerja dan operasi Anda. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>

 Dengan mengimplementasikan praktik terbaik ini, Anda dapat menggunakan umpan balik langsung serta analisis retrospektif. Loop umpan balik ini mendorong perbaikan. Terdapat banyak mekanisme untuk umpan balik langsung, termasuk survei, jajak pendapat pelanggan, atau formulir umpan balik. Organisasi Anda juga menggunakan retrospektif untuk mengidentifikasi peluang perbaikan dan memvalidasi inisiatif. 

 **Contoh pelanggan** 

 AnyCompany Retail membuat sebuah formulir web yang digunakan pelanggan untuk memberikan umpan balik atau melaporkan permasalahan. Selama scrum mingguan, umpan balik pengguna dievaluasi oleh tim pengembangan perangkat lunak. Umpan balik digunakan secara rutin sebagai landasan pengembangan platform mereka. Mereka melakukan analisis retrospektif di akhir setiap sprint untuk mengidentifikasi item yang ingin mereka tingkatkan. 

## Langkah implementasi
<a name="implementation-steps"></a>

1. Umpan balik langsung
   +  Anda memerlukan mekanisme untuk menjangkau umpan balik dari pelanggan dan anggota tim. Aktivitas operasi Anda juga dapat dikonfigurasi untuk menghadirkan umpan balik otomatis. 
   +  Organisasi Anda perlu meninjau umpan balik ini, menentukan hal-hal yang harus ditingkatkan, dan menjadwalkan perbaikan. 
   +  Umpan balik harus ditambahkan ke dalam proses pengembangan perangkat lunak Anda. 
   +  Seiring Anda melakukan perbaikan, sampaikan tindak lanjut kepada pemberi umpan balik. 
     +  Anda dapat menggunakan [AWS Systems Manager OpsCenter](https://docs.aws.amazon.com/systems-manager/latest/userguide/OpsCenter.html) untuk membuat dan melacak perbaikan ini dalam bentuk [OpsItems](https://docs.aws.amazon.com/systems-manager/latest/userguide/OpsCenter-working-with-OpsItems.html).

1.  Analisis retrospektif 
   +  Lakukan retrospektif di akhir siklus pengembangan, pada jadwal yang ditetapkan, atau setelah perilisan besar. 
   +  Kumpulkan pemangku kepentingan yang terlibat dalam beban kerja untuk rapat retrospektif. 
   +  Buat tiga kolom di papan tulis atau lembar kerja: Hentikan, Mulai, dan Pertahankan 
     +  *Hentikan* adalah untuk apa pun yang Anda ingin tidak dilakukan lagi oleh tim Anda. 
     +  *Mulai* adalah gagasan yang ingin mulai Anda lakukan. 
     +  *Pertahankan* adalah untuk item-item yang ingin tetap Anda lakukan. 
   +  Berkelilinglah dan kumpulkan umpan balik dari para pemangku kepentingan. 
   +  Buat prioritas umpan balik. Tugaskan tindakan dan pemangku kepentingan ke item-item Mulai atau Pertahankan. 
   +  Tambahkan tindakan ke proses pengembangan perangkat lunak dan komunikasikan pembaruan status ke pemangku kepentingan seiring Anda melakukan perbaikan. 

 **Tingkat upaya untuk rencana implementasi:** Sedang. Untuk mengimplementasikan praktik terbaik, Anda memerlukan cara untuk menyerap umpan balik langsung dan menganalisisnya. Selain itu, Anda perlu membangun proses analisis retrospektif. 

## Sumber daya
<a name="resources"></a>

 **Praktik terbaik terkait:** 
+  [OPS01-BP01 Mengevaluasi kebutuhan pelanggan eksternal](ops_priorities_ext_cust_needs.md): Loop umpan balik adalah mekanisme untuk mengumpulkan kebutuhan pelanggan eksternal. 
+  [OPS01-BP02 Mengevaluasi kebutuhan pelanggan internal](ops_priorities_int_cust_needs.md): Pemangku kepentingan internal dapat menggunakan loop umpan balik untuk mengomunikasikan kebutuhan dan persyaratan. 
+  [OPS11-BP02 Menjalankan analisis setelah insiden](ops_evolve_ops_perform_rca_process.md): Analisis pascainsiden adalah bentuk analisis retrospektif yang penting yang dilakukan setelah insiden. 
+  [OPS11-BP07 Melakukan peninjauan metrik operasi](ops_evolve_ops_metrics_review.md): Peninjauan metrik operasi mengidentifikasi tren dan area perbaikan. 

 **Dokumen terkait:** 
+  [7 Perangkap yang Perlu Dihindari Saat Membangun CCOE](https://aws.amazon.com/blogs/enterprise-strategy/7-pitfalls-to-avoid-when-building-a-ccoe/) 
+  [Playbook Tim Atlassian - Retrospektif](https://www.atlassian.com/team-playbook/plays/retrospective) 
+  [Definisi Email: Loop Umpan Balik](https://aws.amazon.com/blogs/messaging-and-targeting/email-definitions-feedback-loops/) 
+  [Membangun Loop Umpan Balik Berdasarkan Tinjauan AWS Well-Architected Framework](https://aws.amazon.com/blogs/architecture/establishing-feedback-loops-based-on-the-aws-well-architected-framework-review/) 
+  [Metodologi Garasi IBM - Melakukan retrospektif](https://www.ibm.com/garage/method/practices/learn/practice_retrospective_analysis/) 
+  [Investopedia - Siklus PDCS](https://www.investopedia.com/terms/p/pdca-cycle.asp) 
+  [Memaksimalkan Efektivitas Developer oleh Tim Cochran](https://martinfowler.com/articles/developer-effectiveness.html) 
+  [Laporan Resmi Peninjauan Kesiapan Operasional (ORR) - Iterasi](https://docs.aws.amazon.com/wellarchitected/latest/operational-readiness-reviews/iteration.html) 
+  [TIL CSI - Continual Service Improvement (Perbaikan Layanan Berkelanjutan)](https://wiki.en.it-processmaps.com/index.php/ITIL_CSI_-_Continual_Service_Improvement)
+  [Saat Toyota bertemu e-commerce: Bersandar pada Amazon](https://www.mckinsey.com/capabilities/operations/our-insights/when-toyota-met-e-commerce-lean-at-amazon) 

 **Video terkait:** 
+  [Membangun Loop Umpan Balik Pelanggan yang Efektif](https://www.youtube.com/watch?v=zz_VImJRZ3U) 

 **Contoh terkait: ** 
+  [Astuto - alat umpan balik pelanggan sumber terbuka](https://github.com/riggraz/astuto) 
+  [Solusi AWS - QnABot di AWS](https://aws.amazon.com/solutions/implementations/qnabot-on-aws/) 
+  [Fider - Platform untuk mengatur umpan balik pelanggan](https://github.com/getfider/fider) 

 **Layanan terkait:** 
+  [AWS Systems Manager OpsCenter](https://docs.aws.amazon.com/systems-manager/latest/userguide/OpsCenter.html) 

# OPS11-BP04 Menjalankan manajemen pengetahuan
<a name="ops_evolve_ops_knowledge_management"></a>

 Mekanisme disediakan bagi anggota tim Anda untuk menemukan informasi yang dicari dengan tepat waktu, mengaksesnya, dan mengidentifikasi bahwa informasi tersebut terkini dan lengkap. Mekanisme ada untuk mengidentifikasi konten yang dibutuhkan, konten yang perlu di-refresh, dan konten yang harus diarsipkan sehingga tidak lagi dirujuk. 

 **Antipola umum:** 
+  Seorang pelanggan yang frustrasi membuka kasus dukungan untuk permintaan fitur produk baru guna mengatasi masalah yang dialami. Ini ditambahkan ke daftar peningkatan prioritas. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Manajemen pengetahuan: Memastikan adanya mekanisme bagi anggota tim Anda untuk menemukan informasi yang dicari dengan tepat waktu, mengaksesnya, dan mengidentifikasi bahwa informasi tersebut terkini dan lengkap. Pertahankan mekanisme untuk mengidentifikasi konten yang dibutuhkan, konten yang perlu di-refresh, dan konten yang harus diarsipkan sehingga tidak lagi dirujuk. 

# OPS11-BP05 Menetapkan pendorong untuk perbaikan
<a name="ops_evolve_ops_drivers_for_imp"></a>

 Identifikasi pendorong untuk perbaikan untuk membantu Anda mengevaluasi dan memprioritaskan peluang. 

 Di AWS, Anda dapat mengagregasi log semua aktivitas operasi, beban kerja, dan infrastruktur Anda untuk membuat riwayat aktivitas yang mendetail. Kemudian, Anda dapat menggunakan alat-alat AWS untuk menganalisis operasi dan kesehatan beban kerja Anda seiring waktu (misalnya untuk mengidentifikasi tren, mengaitkan peristiwa dan aktivitas dengan hasil, dan membandingkan serta mengkontraskan antarlingkungan dan lintas sistem) untuk mengungkap peluang perbaikan berdasarkan pendorong Anda. 

 Anda harus menggunakan CloudTrail untuk melacak aktivitas API (melalui Konsol Manajemen AWS, CLI, SDK, dan API) untuk mengetahui apa yang terjadi di seluruh akun Anda. Lacak aktivitas deployment Alat pengembang AWS Anda dengan CloudTrail dan CloudWatch. Ini akan menambahkan riwayat aktivitas mendetail untuk deployment Anda serta hasilnya ke data log CloudWatch Logs Anda. 

 [Ekspor data log Anda ke Amazon S3](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/S3Export.html) untuk penyimpanan jangka panjang. Menggunakan [AWS Glue](https://aws.amazon.com/glue/?whats-new-cards.sort-by=item.additionalFields.postDateTime&whats-new-cards.sort-order=desc), Anda menemukan dan mempersiapkan data log Anda di Amazon S3 untuk analitik. Gunakan [Amazon Athena](https://aws.amazon.com/athena/?whats-new-cards.sort-by=item.additionalFields.postDateTime&whats-new-cards.sort-order=desc), melalui integrasi native-nya dengan AWS Glue, untuk menganalisis data log Anda. Gunakan alat kecerdasan bisnis seperti [Quick](https://aws.amazon.com/quicksight/) untuk memvisualisasi, menjelajahi, dan menganalisis data Anda 

 **Antipola umum:** 
+  Anda memiliki skrip yang berfungsi tetapi tidak elegan. Anda menginvestasikan waktu untuk menulis ulang skrip tersebut. Kini skrip tersebut terlihat sangat bagus. 
+  Perusahaan rintisan Anda sedang mencoba mendapatkan pendanaan lain dari sebuah pemodal ventura. Mereka meminta Anda mendemonstrasikan kepatuhan terhadap PCI DSS. Anda ingin membuat mereka terkesan sehingga Anda mendokumentasikan kepatuhan, tetapi Anda melewatkan tanggal pengiriman untuk seorang pelanggan dan kehilangan pelanggan tersebut. Ini bukan tindakan yang salah tetapi sekarang Anda bertanya-tanya apakah itu tindakan yang tepat. 

 **Manfaat menjalankan praktik terbaik ini:** Dengan menentukan kriteria yang ingin Anda gunakan untuk perbaikan, Anda dapat meminimalkan dampak motivasi berbasis peristiwa atau investasi emosional. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Pahami pendorong perbaikan: Anda sebaiknya hanya melakukan perubahan pada suatu sistem saat hasil yang diinginkan didukung. 
  +  Kemampuan yang diinginkan: Evaluasi fitur dan kemampuan yang diinginkan saat mengevaluasi peluang untuk perbaikan. 
    +  [Yang Baru dengan AWS](https://aws.amazon.com/new/) 
  +  Masalah yang tidak dapat diterima: Evaluasi masalah, bug, dan kerentanan yang tidak dapat diterima saat mengevaluasi peluang untuk perbaikan. 
    +  [Buletin Keamanan Terkini AWS](https://aws.amazon.com/security/security-bulletins/) 
    +  [AWS Trusted Advisor](https://aws.amazon.com/premiumsupport/trustedadvisor/) 
  +  Persyaratan kepatuhan: Evaluasi pembaruan dan perubahan yang diperlukan untuk mempertahankan kepatuhan terhadap peraturan, kebijakan, atau agar tetap memperoleh dukungan pihak ketiga, saat meninjau peluang untuk perbaikan. 
    +  [Kepatuhan AWS](https://aws.amazon.com/compliance/) 
    +  [Program Kepatuhan AWS](https://aws.amazon.com/compliance/programs/) 
    +  [Berita Terbaru Kepatuhan AWS](https://aws.amazon.com/compliance/compliance-latest-news/) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Amazon Athena](https://aws.amazon.com/athena/?whats-new-cards.sort-by=item.additionalFields.postDateTime&whats-new-cards.sort-order=desc) 
+  [Quick](https://aws.amazon.com/quicksight/) 
+  [Kepatuhan AWS](https://aws.amazon.com/compliance/) 
+  [Berita Terbaru Kepatuhan AWS](https://aws.amazon.com/compliance/compliance-latest-news/) 
+  [Program Kepatuhan AWS](https://aws.amazon.com/compliance/programs/) 
+  [AWS Glue](https://aws.amazon.com/glue/?whats-new-cards.sort-by=item.additionalFields.postDateTime&whats-new-cards.sort-order=desc) 
+  [Buletin Keamanan Terkini AWS](https://aws.amazon.com/security/security-bulletins/) 
+  [AWS Trusted Advisor](https://aws.amazon.com/premiumsupport/trustedadvisor/) 
+  [Ekspor data log Anda ke Amazon S3](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/S3Export.html) 
+  [Yang Baru dengan AWS](https://aws.amazon.com/new/) 

# OPS11-BP06 Memvalidasi wawasan
<a name="ops_evolve_ops_validate_insights"></a>

 Tinjau respons dan hasil analisis Anda dengan tim lintas fungsi serta pemilik bisnis. Gunakan tinjauan tersebut untuk menetapkan pemahaman umum, mengidentifikasi dampak tambahan, dan menentukan alur tindakan. Sesuaikan respons sebagaimana mestinya. 

 **Antipola umum:** 
+  Anda menemukan pemanfaatan CPU pada sistem sebesar 95% dan menjadikan hal itu sebagai prioritas untuk menemukan cara mengurangi beban pada sistem. Anda menentukan tindakan terbaik yang perlu dinaikkan skalanya. Sistemnya adalah transkoder dan sistem tersebut diskalakan untuk menjalankan 95% pemanfaatan CPU sepanjang waktu. Pemilik sistem dapat menjelaskan situasinya kepada Anda jika Anda menghubunginya. Waktu Anda terbuang. 
+  Pemilik sistem menyatakan bahwa sistem mereka bersifat kritis terhadap misi. Sistemnya tidak ditempatkan di lingkungan dengan keamanan tinggi. Untuk meningkatkan keamanan, Anda mengimplementasikan kontrol detektif dan preventif yang diperlukan untuk sistem yang kritis terhadap misi. Anda memberi tahu pemilik sistem bahwa pekerjaannya sudah selesai dan dia akan dikenakan biaya untuk sumber daya tambahan. Dalam diskusi setelah pemberitahuan ini, pemilik sistem mengetahui bahwa ada ketentuan formal untuk sistem yang kritis terhadap misi yang tidak dipenuhi oleh sistem ini. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan memvalidasi wawasan bersama pemilik bisnis dan orang yang ahli di bidangnya, Anda dapat menetapkan pemahaman umum dan memandu peningkatan dengan lebih efektif. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Validasikan wawasan: Berinteraksi dengan pemilik bisnis dan orang yang ahli di bidangnya untuk memastikan ada pemahaman dan kesepakatan bersama tentang makna data yang dikumpulkan. Identifikasikan masalah tambahan, dampak potensial, dan tentukan alur tindakan. 

# OPS11-BP07 Melakukan peninjauan metrik operasi
<a name="ops_evolve_ops_metrics_review"></a>

 Lakukan analisis retrospektif rutin terhadap metrik operasi dengan peserta lintas tim dari berbagai area bisnis. Gunakan tinjauan ini untuk mengidentifikasi peluang perbaikan, potensi pilihan tindakan, dan untuk membagikan pelajaran yang diperoleh. 

 Cari peluang perbaikan di semua lingkungan Anda (misalnya pengembangan, pengujian, dan produksi). 

 **Antipola umum:** 
+  Terdapat promosi ritel penting yang terganggu oleh jadwal pemeliharaan Anda. Bisnis tidak tahu bahwa ada jadwal pemeliharaan standar yang dapat ditunda jika terdapat peristiwa lain yang memengaruhi bisnis. 
+  Anda mengalami pemadaman berkepanjangan karena menggunakan pustaka bermasalah yang biasa digunakan di organisasi Anda. Sejak saat itu Anda beralih ke pustaka yang andal. Tim-tim lain di organisasi Anda tidak tahu bahwa mereka terpapar risiko. Jika Anda rutin melakukan pertemuan dan meninjau insiden ini, mereka akan mengetahui risiko tersebut. 
+  Kinerja transkoder Anda terus mengalami penurunan secara bertahap dan memengaruhi tim media. Saat ini kondisinya belum parah. Anda tidak akan memiliki kesempatan untuk tahu sampai kondisinya cukup buruk hingga menyebabkan insiden. Seandainya Anda meninjau metrik operasi dengan tim media, akan ada peluang untuk melakukan perubahan pada metrik, mengenali pengalaman mereka, dan mengatasi masalah. 
+  Anda tidak meninjau kepuasan Anda terhadap SLA pelanggan. Anda memiliki kecenderungan untuk tidak memenuhi SLA pelanggan. Terdapat denda finansial jika Anda tidak memenuhi SLA pelanggan. Jika rutin melakukan pertemuan untuk meninjau metrik untuk SLA ini, Anda akan memiliki kesempatan untuk mengenali dan menangani masalah. 

 **Manfaat menjalankan praktik terbaik ini:** Dengan melakukan pertemuan rutin untuk meninjau metrik operasi, peristiwa, dan insiden, Anda dapat menjaga pemahaman bersama lintas tim, membagikan pelajaran yang didapatkan, dan dapat memprioritaskan serta menargetkan perbaikan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak ditetapkan:** Sedang 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Tinjauan metrik operasi: Lakukan analisis retrospektif rutin terhadap metrik operasi dengan peserta lintas tim dari berbagai area bisnis. Libatkan pemangku kepentingan, termasuk tim bisnis, pengembangan, dan operasi, untuk memvalidasi temuan dari umpan balik langsung dan analisis retrospektif, serta untuk membagikan pelajaran yang didapatkan. Gunakan wawasan mereka untuk mengidentifikasi peluang perbaikan dan potensi pilihan tindakan. 
  +  [Amazon CloudWatch](https://aws.amazon.com/cloudwatch/) 
  +  [Menggunakan metrik Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/working_with_metrics.html) 
  +  [Memublikasikan metrik kustom](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/publishingMetrics.html) 
  +  [Metrik Amazon CloudWatch dan referensi dimensi](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Amazon CloudWatch](https://aws.amazon.com/cloudwatch/) 
+  [Metrik Amazon CloudWatch dan referensi dimensi](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html) 
+  [Memublikasikan metrik kustom](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/publishingMetrics.html) 
+  [Menggunakan metrik Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/working_with_metrics.html) 

# OPS11-BP08 Mendokumentasikan dan membagikan pelajaran yang didapatkan
<a name="ops_evolve_ops_share_lessons_learned"></a>

 Dokumentasikan dan bagikan pelajaran yang didapatkan dari aktivitas operasional sehingga Anda dapat menggunakannya secara internal dan di seluruh tim. 

 Anda harus membagikan pelajaran yang didapatkan oleh tim Anda guna meningkatkan manfaat di seluruh organisasi Anda. Anda perlu membagikan informasi dan sumber daya untuk mencegah kesalahan yang dapat dihindari dan memudahkan upaya pengembangan. Dengan demikian, Anda dapat fokus menghadirkan fitur-fitur yang diinginkan. 

 Gunakan AWS Identity and Access Management (IAM) untuk menetapkan izin yang memungkinkan akses terkontrol ke sumber daya yang ingin Anda bagikan di dalam dan antarakun. Anda harus menggunakan repositori AWS CodeCommit terkontrol versi untuk membagikan pustaka aplikasi, prosedur dalam skrip, dokumentasi prosedur, dan dokumentasi sistem lainnya. Bagikan standar komputasi Anda dengan membagikan akses ke AMI Anda dan dengan memberikan otorisasi penggunaan fungsi Lambda Anda di seluruh akun. Anda juga harus membagikan standar infrastruktur Anda dalam bentuk templat AWS CloudFormation. 

 Melalui API dan SDK AWS, Anda dapat mengintegrasikan alat dan repositori eksternal dan pihak ketiga (seperti GitHub, BitBucket, dan SourceForge). Ketika membagikan hal-hal yang Anda pelajari dan kembangkan, berhati-hatilah untuk menyusun izin guna memastikan integritas repositori yang dibagikan. 

 **Antipola umum:** 
+  Anda mengalami pemadaman berkepanjangan karena Anda menggunakan pustaka bermasalah yang biasa digunakan di organisasi Anda. Sejak saat itu Anda beralih ke pustaka yang andal. Tim-tim lain di organisasi Anda tidak tahu bahwa mereka terpapar risiko. Andai saja Anda mendokumentasikan dan membagikan pengalaman Anda dengan pustaka ini, mereka pasti tahu tentang risiko tersebut. 
+  Anda mengidentifikasi sebuah masalah di dalam layanan mikro yang digunakan bersama secara internal yang menyebabkan terganggunya sesi. Anda pun memperbarui panggilan Anda ke layanan guna menghindari masalah tersebut. Tim-tim lain di organisasi Anda tidak tahu bahwa mereka terpapar risiko. Andai saja Anda mendokumentasikan dan membagikan pengalaman Anda dengan pustaka ini, mereka pasti tahu tentang risiko tersebut. 
+  Anda menemukan cara untuk mengurangi secara signifikan persyaratan pemanfaatan CPU untuk salah satu layanan mikro Anda. Anda tidak tahu bahwa tim lain bisa memanfaatkan teknik ini. Andai saja Anda mendokumentasikan dan membagikan pengalaman Anda dengan pustaka ini, mereka pasti memiliki peluang untuk melakukannya. 

 **Manfaat menjalankan praktik terbaik ini:** Bagikan pelajaran yang didapatkan untuk mendukung perbaikan dan memaksimalkan manfaat pengalaman. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Rendah 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Dokumentasikan dan bagikan pelajaran yang didapatkan: Miliki prosedur untuk mendokumentasikan pelajaran didapatkan dari aktivitas operasional dan analisis retrospektif agar dapat digunakan oleh tim lain. 
  +  Bagikan pembelajaran: Miliki prosedur untuk membagikan pelajaran yang didapatkan serta artefak terkait ke seluruh tim. Sebagai contoh, bagikan prosedur, panduan, tata kelola, dan praktik terbaik yang telah diperbarui melalui wiki yang dapat diakses. Bagikan skrip, kode, dan pustaka melalui repositori umum. 
    +  [Mendelegasikan akses ke lingkungan AWS Anda](https://www.youtube.com/watch?v=0zJuULHFS6A&t=849s) 
    +  [Bagikan repositori AWS CodeCommit](https://docs.aws.amazon.com/codecommit/latest/userguide/how-to-share-repository.html) 
    +  [Otorisasi fungsi AWS Lambda secara mudah](https://aws.amazon.com/blogs/compute/easy-authorization-of-aws-lambda-functions/) 
    +  [Membagikan AMI kepada Akun AWS tertentu](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/sharingamis-explicit.html) 
    +  [Percepat pembagian tempat dengan URL desainer AWS CloudFormation](https://aws.amazon.com/blogs/devops/speed-template-sharing-with-an-aws-cloudformation-designer-url/) 
    +  [Menggunakan AWS Lambda dengan Amazon SNS](https://docs.aws.amazon.com/lambda/latest/dg/with-sns-example.html) 

## Sumber daya
<a name="resources"></a>

 **Dokumen terkait:** 
+  [Otorisasi fungsi AWS Lambda secara mudah](https://aws.amazon.com/blogs/compute/easy-authorization-of-aws-lambda-functions/) 
+  [Bagikan repositori AWS CodeCommit](https://docs.aws.amazon.com/codecommit/latest/userguide/how-to-share-repository.html) 
+  [Membagikan AMI kepada Akun AWS tertentu](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/sharingamis-explicit.html) 
+  [Percepat pembagian tempat dengan URL desainer AWS CloudFormation](https://aws.amazon.com/blogs/devops/speed-template-sharing-with-an-aws-cloudformation-designer-url/) 
+  [Menggunakan AWS Lambda dengan Amazon SNS](https://docs.aws.amazon.com/lambda/latest/dg/with-sns-example.html) 

 **Video terkait:** 
+  [Mendelegasikan akses ke lingkungan AWS Anda](https://www.youtube.com/watch?v=0zJuULHFS6A&t=849s) 

# OPS11-BP09 Mengalokasikan waktu untuk membuat peningkatan
<a name="ops_evolve_ops_allocate_time_for_imp"></a>

 Dedikasikan waktu dan sumber daya dalam proses Anda untuk memungkinkan peningkatan bertahap yang berkelanjutan. 

 Di AWS, Anda dapat membuat duplikat lingkungan sementara, menurunkan risiko, usaha, serta biaya eksperimen dan pengujian. Lingkungan duplikat ini dapat digunakan untuk menguji kesimpulan dari analisis dan eksperimen Anda, serta mengembangkan dan menguji peningkatan terencana. 

 **Antipola umum:** 
+  Ada masalah kinerja yang diketahui dalam aplikasi Anda. Ini ditambahkan ke backlog di balik setiap implementasi fitur terencana. Jika peringkat fitur terencana yang ditambahkan tetap konstan, masalah kinerja tidak akan pernah tertangani. 
+  Untuk mendukung peningkatan berkelanjutan yang disetujui, administrator dan developer menggunakan seluruh waktu tambahan mereka untuk memilih dan mengimplementasikan peningkatan. Tidak ada peningkatan yang diselesaikan. 

 **Manfaat menerapkan praktik terbaik ini:** Dengan mendedikasikan waktu dan sumber daya dalam proses, Anda memungkinkan peningkatan bertahap yang berkelanjutan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Rendah 

## Panduan implementasi
<a name="implementation-guidance"></a>
+  Alokasikan waktu untuk membuat peningkatan: Dedikasikan waktu dan sumber daya dalam proses Anda untuk memungkinkan peningkatan bertahap yang berkelanjutan. Implementasikan perubahan guna meningkatkan dan mengevaluasi hasil untuk menentukan keberhasilan. Jika hasilnya tidak memenuhi tujuan, dan peningkatan masih menjadi prioritas, lakukan tindakan alternatif.