

# OPS 7. Bagaimana cara mengetahui bahwa Anda siap untuk mendukung beban kerja?


 Evaluasi kesiapan operasional beban kerja, proses, dan prosedur, serta personel Anda untuk memahami risiko operasional terkait beban kerja Anda. 

**Topics**
+ [

# OPS07-BP01 Memastikan kemampuan personel
](ops_ready_to_support_personnel_capability.md)
+ [

# OPS07-BP02 Memastikan peninjauan yang konsisten terkait kesiapan operasional
](ops_ready_to_support_const_orr.md)
+ [

# OPS07-BP03 Menggunakan runbook untuk menjalankan prosedur
](ops_ready_to_support_use_runbooks.md)
+ [

# OPS07-BP04 Menggunakan playbook untuk menyelidiki masalah
](ops_ready_to_support_use_playbooks.md)
+ [

# OPS07-BP05 Membuat keputusan yang tepat untuk melakukan deployment sistem dan perubahan
](ops_ready_to_support_informed_deploy_decisions.md)
+ [

# OPS07-BP06 Membuat rencana dukungan untuk beban kerja produksi
](ops_ready_to_support_enable_support_plans.md)

# OPS07-BP01 Memastikan kemampuan personel
OPS07-BP01 Memastikan kemampuan personel

Miliki mekanisme untuk memvalidasi bahwa Anda memiliki jumlah personel terlatih yang sesuai untuk mendukung beban kerja. Mereka harus diberi pelatihan tentang platform dan layanan yang membentuk beban kerja Anda. Berikan kepada mereka pengetahuan yang diperlukan untuk mengoperasikan beban kerja. Anda harus memiliki cukup banyak personel terlatih untuk mendukung pengoperasian normal beban kerja dan menyelesaikan masalah-masalah terkait insiden yang terjadi. Anda harus memiliki cukup banyak personel sehingga Anda dapat melakukan rotasi untuk personel yang siap tugas mendadak dan personel yang liburan guna menghindari lelah ekstrim pada personel. 

 **Hasil yang diinginkan:** 
+  Ada cukup banyak personel terlatih untuk mendukung beban kerja pada saat beban kerja tersedia. 
+  Anda memberikan pelatihan tentang perangkat lunak dan layanan yang membentuk beban kerja Anda kepada personel. 

 **Anti-pola umum:** 
+ Melakukan deployment beban kerja tanpa anggota tim yang terlatih untuk mengoperasikan platform dan layanan yang digunakan. 
+  Tidak memiliki cukup banyak personel untuk mendukung pelaksanaan rotasi personel yang siap tugas mendadak atau personel yang sedang libur. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Memiliki anggota tim yang terampil membantu dukungan yang efektif untuk beban kerja. 
+  Dengan cukup banyak anggota tim, Anda dapat mendukung beban kerja dan pelaksanaan rotasi personel yang siap tugas mendadak sekaligus mengurangi risiko personel yang terlalu lelah. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Tinggi 

## Panduan implementasi
Panduan implementasi

 Pastikan bahwa terdapat personel yang terlatih dengan memadai untuk mendukung beban kerja. Pastikan Anda memiliki jumlah anggota tim yang cukup untuk menangani aktivitas-aktivitas operasional dalam kondisi normal, termasuk pelaksanaan rotasi personel yang siap bertugas mendadak. 

 **Contoh pelanggan** 

 AnyCompany Retail memastikan tim yang mendukung beban kerja memiliki staf yang terlatih dalam jumlah yang sesuai. Mereka memiliki cukup banyak rekayasawan untuk mendukung pelaksanaan rotasi personel yang siap tugas mendadak. Personel mendapatkan pelatihan tentang perangkat lunak dan platform yang merupakan dasar pembangunan beban kerja dan mereka didorong untuk mendapatkan sertifikasi. Ada cukup banyak personel sehingga orang dapat mengambil cuti sambil tetap ada dukungan untuk beban kerja dan rotasi personel yang siap tugas mendadak. 

### Langkah-langkah implementasi
Langkah-langkah implementasi

1.  Tetapkan jumlah personel yang memadai untuk mengoperasikan dan mendukung beban kerja Anda, termasuk tugas siap sedia, masalah keamanan, dan peristiwa siklus hidup, seperti tugas akhir dukungan dan rotasi sertifikat. 

1.  Latih personel Anda tentang perangkat lunak dan platform yang membentuk beban kerja Anda. 

   1.  [Pelatihan dan Sertifikasi AWS](https://aws.amazon.com/training/) memiliki pustaka kursus tentang AWS. Kursus-kursus ini disediakan gratis dan berbayar, baik secara online maupun tatap muka. 

   1.  [AWS menyelenggarakan acara dan webinar](https://aws.amazon.com/events/) tempat Anda belajar AWS dari para ahli. 

1. Lakukan tindakan berikut secara rutin. 
   +  Lakukan evaluasi terhadap ukuran dan keterampilan tim seiring perubahan kondisi pengoperasian dan beban kerja. 
   +  Sesuaikan ukuran dan keterampilan tim agar memenuhi persyaratan-persyaratan operasional. 
   +  Periksa kemampuan dan kapasitas untuk [mengatasi peristiwa siklus hidup yang direncanakan](https://docs.aws.amazon.com/health/latest/ug/aws-health-planned-lifecycle-events.html), peristiwa keamanan yang tidak direncanakan, dan notifikasi operasional melalui AWS Health. 

 **Tingkat upaya untuk rencana implementasi:** Tinggi. Mempekerjakan dan melatih tim untuk mendukung beban kerja mengharuskan Anda melakukan upaya yang cukup besar, tetapi hal itu akan memberikan manfaat besar dalam jangka panjang. 

## Sumber daya
Sumber daya

 **Praktik-praktik terbaik terkait:** 
+  [OPS11-BP04 Melakukan manajemen pengetahuan](ops_evolve_ops_knowledge_management.md) - Anggota tim harus memiliki informasi yang diperlukan untuk mengoperasikan dan mendukung beban kerja. Manajemen pengetahuan merupakan kunci untuk menyediakan informasi tersebut. 

 **Dokumen terkait:** 
+  [Acara dan Webinar AWS](https://aws.amazon.com/events/) 
+  [Pelatihan dan Sertifikasi AWS](https://aws.amazon.com/training/) 

# OPS07-BP02 Memastikan peninjauan yang konsisten terkait kesiapan operasional
OPS07-BP02 Memastikan peninjauan yang konsisten terkait kesiapan operasional

Gunakan Peninjauan Kesiapan Operasional (ORR) untuk memvalidasi bahwa Anda dapat mengoperasikan beban kerja Anda. ORR adalah sebuah mekanisme yang dikembangkan di Amazon untuk memvalidasi bahwa tim dapat mengoperasikan beban kerja mereka dengan aman. ORR adalah sebuah proses peninjauan dan inspeksi menggunakan daftar periksa persyaratan. ORR adalah sebuah pengalaman layanan mandiri yang digunakan tim untuk memastikan beban kerja mereka. ORR mencakup praktik-praktik terbaik dari pelajaran yang kami dapatkan selama bertahun-tahun membangun perangkat lunak. 

 Daftar periksa ORR terdiri dari rekomendasi berkaitan dengan arsitektur, proses operasional, manajemen peristiwa, dan kualitas rilis. Proses Koreksi Kesalahan (CoE) kami merupakan pendorong utama item-item ini. Analisis pasca-insiden Anda sendiri harus mendorong pengembangan ORR Anda. ORR tidak hanya tentang mengikuti praktik terbaik tapi juga mencegah berulangnya peristiwa yang telah Anda lihat sebelumnya. Terakhir, keamanan, pengelolaan, dan kepatuhan terhadap persyaratan juga dapat disertakan di dalam sebuah ORR. 

 Jalankan ORR sebelum beban kerja meluncur ke ketersediaan umum dan kemudian ke seluruh siklus pengembangan perangkat lunak. Menjalankan ORR sebelum peluncuran dapat meningkatkan kemampuan Anda untuk mengoperasikan beban kerja dengan aman. Jalankan kembali ORR Anda secara berkala pada beban kerja untuk mengetahui penyimpangan dari praktik terbaik. Anda dapat memiliki daftar periksa ORR untuk peluncuran layanan baru dan ORR untuk peninjauan secara berkala. Ini membantu Anda untuk tetap up to date dengan praktik terbaik yang muncul dan menggabungkan pelajaran yang didapatkan dari analisis pasca-insiden. Saat penggunaan cloud Anda sudah matang, Anda dapat membangun persyaratan ORR ke dalam arsitektur Anda secara default. 

 **Hasil yang Diinginkan:** Anda memiliki daftar periksa ORR dengan praktik terbaik untuk organisasi Anda. ORR dilakukan sebelum peluncuran beban kerja. ORR dijalankan secara berkala selama berlangsungnya siklus beban kerja. 

 **Anti-pola umum:** 
+ Anda meluncurkan beban kerja tanpa mengetahui apakah Anda dapat mengoperasikannya atau tidak. 
+ Persyaratan pengelolaan dan keamanan tidak diikutsertakan ketika menjamin peluncuran beban kerja. 
+ Beban kerja tidak dievaluasi kembali secara berkala. 
+ Beban kerja diluncurkan tanpa menerapkan prosedur-prosedur yang diperlukan. 
+ Anda melihat berulangnya kegagalan yang disebabkan akar masalah yang sama di beberapa beban kerja. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Beban kerja Anda mencakup praktik terbaik dalam hal arsitektur, proses, dan manajemen. 
+  Pelajaran yang didapatkan digabungkan dalam proses ORR. 
+  Prosedur yang diperlukan tersedia ketika beban kerja diluncurkan. 
+  ORR dijalankan di seluruh siklus perangkat lunak beban kerja Anda. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak dijalankan:** Tinggi 

## Panduan implementasi
Panduan implementasi

 ORR adalah dua hal: proses dan daftar periksa. Proses ORR Anda harus diadopsi oleh organisasi Anda dan didukung oleh seorang sponsor eksekutif. Minimal, ORR harus dilakukan sebelum beban kerja meluncur ke ketersediaan umum. Jalankan ORR di seluruh siklus pengembangan perangkat lunak untuk tetap up to date dengan praktik-praktik terbaik atau persyaratan baru. Daftar periksa ORR harus mencakup item-item konfigurasi, persyaratan keamanan dan pengelolaan, serta praktik terbaik dari organisasi Anda. Seiring waktu, Anda dapat menggunakan layanan-layanan, seperti [AWS Config](https://docs.aws.amazon.com/config/latest/developerguide/WhatIsConfig.html), [AWS Security Hub CSPM](https://docs.aws.amazon.com/securityhub/latest/userguide/what-is-securityhub.html), dan [AWS Control TowerGuardrails](https://docs.aws.amazon.com/controltower/latest/userguide/guardrails.html), untuk membangun praktik terbaik dari ORR ke pagar pembatas untuk deteksi otomatis atas praktik terbaik. 

 **Contoh pelanggan** 

 Setelah terjadi beberapa insiden produksi, AnyCompany Retail memutuskan untuk menerapkan proses ORR. Mereka membangun daftar periksa yang terdiri dari praktik terbaik, persyaratan pengelolaan dan kepatuhan, serta pelajaran yang didapatkan dari pemadaman (outage). Beban kerja baru melakukan ORR sebelum diluncurkan. Setiap beban kerja melakukan ORR setiap tahun dengan subset praktik terbaik untuk menggabungkan praktik-praktik terbaik dan persyaratan baru yang ditambahkan ke daftar periksa ORR. Seiring waktu, AnyCompany Retail digunakan [AWS Config](https://docs.aws.amazon.com/config/latest/developerguide/WhatIsConfig.html) untuk mendeteksi beberapa praktik terbaik, mempercepat proses ORR. 

 **Langkah-langkah implementasi** 

 Untuk mempelajari lebih lanjut tentang ORR, baca [laporan resmi Ulasan Kesiapan Operasional (ORR](https://docs.aws.amazon.com/wellarchitected/latest/operational-readiness-reviews/wa-operational-readiness-reviews.html)). Laporan resmi ini menyediakan detail informasi tentang riwayat proses ORR, cara membangun praktik ORR Anda sendiri, dan cara mengembangkan daftar periksa ORR Anda. Langkah-langkah berikut ini merupakan versi singkat dari dokumen tersebut. Untuk pemahaman yang mendalam tentang apa itu ORR dan cara membangunnya, sebaiknya baca laporan resmi tersebut. 

1. Kumpulkan para pemangku kepentingan utama, termasuk para perwakilan dari bagian keamanan, operasi, dan pengembangan. 

1. Minta setiap pemangku kepentingan untuk menyediakan setidaknya satu persyaratan. Untuk iterasi pertama, coba batasi jumlah item menjadi tiga puluh atau kurang. 
   +  [Lampiran B: Contoh pertanyaan ORR](https://docs.aws.amazon.com/wellarchitected/latest/operational-readiness-reviews/appendix-b-example-orr-questions.html) dari laporan resmi Peninjauan Kesiapan Operasional (ORR) yang berisi sampel pertanyaan yang dapat Anda gunakan untuk memulai. 

1. Kumpulkan persyaratan Anda ke dalam lembar kerja. 
   + Anda dapat menggunakan [lensa khusus](https://docs.aws.amazon.com/wellarchitected/latest/userguide/lenses-custom.html) di [AWS Well-Architected Tool](https://console.aws.amazon.com/wellarchiected/) untuk mengembangkan ORR Anda dan membagikannya di seluruh akun dan Organisasi AWS Anda. 

1. Identifikasi satu beban kerja untuk diberikan ORR. Idealnya adalah beban kerja sebelum peluncuran atau beban kerja internal. 

1. Pelajari daftar periksa ORR dan catat semua penemuan yang dibuat. Penemuannya mungkin akan dapat diterima jika terdapat mitigasi. Untuk penemuan yang tidak memiliki mitigasi, tambahkan beban kerja ke backlog item Anda dan implementasikan sebelum peluncuran. 

1. Seiring waktu, lanjutkan penambahan praktik terbaik dan persyaratan ke daftar periksa ORR Anda. 

 Pelanggan Dukungan dengan Dukungan Perusahaan dapat meminta [Lokakarya Tinjauan Kesiapan Operasional](https://aws.amazon.com/premiumsupport/technology-and-programs/proactive-services/) dari Manajer Akun Teknis mereka. Lokakarya ini adalah sesi *kerja mundur* interaktif untuk membuat daftar periksa ORR Anda sendiri. 

 **Tingkat upaya untuk rencana implementasi:** Tinggi. Untuk mengadopsi praktik ORR pada organisasi Anda diperlukan sponsor eksekutif dan dukungan pemangku kepentingan. Buat dan perbarui daftar periksa dengan masukan dari seluruh organisasi Anda. 

## Sumber daya
Sumber daya

 **Praktik-praktik terbaik terkait:** 
+ [OPS01-BP03 Mengevaluasi persyaratan tata kelola](ops_priorities_governance_reqs.md) – Persyaratan tata kelola sangat sesuai untuk daftar periksa ORR. 
+ [OPS01-BP04 Evaluasi persyaratan kepatuhan](ops_priorities_compliance_reqs.md) – Terkadang persyaratan kepatuhan tercantum di daftar periksa ORR. Terkadang persyaratan kepatuhan adalah proses yang terpisah. 
+ [OPS03-BP07 Tim sumber daya dengan tepat](ops_org_culture_team_res_appro.md) – Kemampuan tim merupakan kandidat yang bagus untuk persyaratan ORR. 
+ [OPS06-BP01 Rencana untuk perubahan yang gagal](ops_mit_deploy_risks_plan_for_unsucessful_changes.md) – Rencana rollback atau rollforward harus dibuat sebelum Anda meluncurkan beban kerja Anda. 
+ [OPS07-BP01 Memastikan kemampuan personel](ops_ready_to_support_personnel_capability.md) – Untuk mendukung beban kerja, Anda harus memiliki personel yang diperlukan. 
+ [SEC01-BP03 Mengidentifikasi dan memvalidasi tujuan kontrol](https://docs.aws.amazon.com/wellarchitected/latest/framework/sec_securely_operate_control_objectives.html) – Tujuan kontrol keamanan membuat persyaratan ORR yang sangat baik. 
+ [REL13-BP01 Tentukan tujuan pemulihan untuk waktu henti dan kehilangan data](https://docs.aws.amazon.com/wellarchitected/latest/framework/rel_planning_for_recovery_objective_defined_recovery.html) – Rencana pemulihan bencana adalah persyaratan ORR yang baik. 
+ [COST02-BP01 Kembangkan kebijakan berdasarkan persyaratan organisasi Anda](https://docs.aws.amazon.com/wellarchitected/latest/framework/cost_govern_usage_policies.html) – Kebijakan manajemen biaya baik untuk dimasukkan dalam daftar periksa ORR Anda. 

 **Dokumen terkait:** 
+  [AWS Control Tower - Pagar Pembatas di AWS Control Tower](https://docs.aws.amazon.com/controltower/latest/userguide/guardrails.html) 
+  [AWS Well-Architected Tool - Lensa Kustom](https://docs.aws.amazon.com/wellarchitected/latest/userguide/lenses-custom.html) 
+  [Templat Peninjauan Kesiapan Operasional oleh Adrian Hornsby](https://medium.com/the-cloud-architect/operational-readiness-review-template-e23a4bfd8d79) 
+  [Laporan Resmi Peninjauan Kesiapan Operasional (ORR)](https://docs.aws.amazon.com/wellarchitected/latest/operational-readiness-reviews/wa-operational-readiness-reviews.html) 

 **Video terkait:** 
+  [AWS Dukungan Anda \$1 Membangun Peninjauan Kesiapan Operasional (ORR) yang Efektif](https://www.youtube.com/watch?v=Keo6zWMQqS8) 

 **Contoh terkait:** 
+  [Sampel Lensa Peninjauan Kesiapan Operasional (ORR)](https://github.com/aws-samples/custom-lens-wa-sample/tree/main/ORR-Lens) 

 **Layanan terkait:** 
+  [AWS Config](https://docs.aws.amazon.com/config/latest/developerguide/WhatIsConfig.html) 
+  [AWS Control Tower](https://docs.aws.amazon.com/controltower/latest/userguide/what-is-control-tower.html) 
+  [AWS Security Hub CSPM](https://docs.aws.amazon.com/securityhub/latest/userguide/what-is-securityhub.html) 
+  [AWS Well-Architected Tool](https://docs.aws.amazon.com/wellarchitected/latest/userguide/intro.html) 

# OPS07-BP03 Menggunakan runbook untuk menjalankan prosedur
OPS07-BP03 Menggunakan runbook untuk menjalankan prosedur

 *Runbook* adalah sebuah proses terdokumentasi untuk meraih hasil tertentu. Runbook terdiri dari serangkaian langkah yang diikuti seseorang untuk menyelesaikan sesuatu. Runbook telah digunakan dalam operasi sejak masa-masa awal industri penerbangan. Dalam operasi cloud, kita menggunakan runbook untuk mengurangi risiko dan meraih hasil-hasil yang diinginkan. Dalam bentuk paling sederhananya, runbook adalah daftar periksa untuk menyelesaikan tugas. 

 Runbook adalah bagian penting dari operasi beban kerja Anda. Mulai dari pelaksanaan orientasi untuk anggota tim baru hingga melakukan deployment rilis besar, runbook adalah proses terkodifikasi yang dapat memberikan hasil-hasil yang konsisten, siapa pun yang menggunakannya. Runbook harus dipublikasikan di lokasi sentral dan diperbarui seiring berkembangnya proses karena memperbarui runbook adalah komponen utama dari proses manajemen perubahan. Runbook juga harus menyertakan panduan tentang cara menangani kesalahan, alat, izin, pengecualian, dan eskalasi jika terjadi masalah. 

 Saat organisasi Anda matang, mulailah mengotomatiskan runbook. Mulailah dengan runbook yang singkat dan sering kali digunakan. Gunakan bahasa skrip untuk mengotomatiskan langkah-langkah atau mempermudah pelaksanaan langkah-langkah. Seiring Anda mengotomatiskan beberapa runbook pertama, Anda harus mendedikasikan waktu untuk mengotomatiskan runbook yang lebih kompleks. Seiring waktu, sebagian besar runbook Anda harus diotomatiskan dalam cara tertentu. 

 **Hasil yang diinginkan:** Tim Anda memiliki kumpulan panduan langkah demi langkah untuk melakukan tugas-tugas beban kerja. Runbook berisi hasil yang diinginkan, alat dan izin yang diperlukan, serta petunjuk untuk penanganan kesalahan. Runbook disimpan di sebuah lokasi sentral (sistem kontrol versi) dan sering diperbarui. Misalnya, runbook Anda menyediakan kemampuan bagi tim Anda untuk memantau, mengomunikasikan, dan merespons peristiwa AWS Health untuk akun-akun penting selama terjadi alarm aplikasi, masalah operasional, dan peristiwa siklus hidup yang sudah direncanakan. 

 **Anti-pola umum:** 
+  Mengandalkan ingatan untuk menyelesaikan setiap langkah dari suatu proses. 
+  Menerapkan perubahan secara manual tanpa menggunakan daftar periksa. 
+  Anggota tim yang berbeda-beda melakukan proses yang sama, tetapi dengan langkah atau hasil yang berbeda. 
+  Membiarkan runbook tidak selaras dengan perubahan sistem dan otomatisasi. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Mengurangi tingkat kesalahan untuk tugas-tugas yang dilakukan manual. 
+  Operasi dilakukan secara konsisten. 
+  Anggota tim baru dapat mulai melakukan tugas dengan lebih cepat. 
+  Runbook dapat diotomatiskan untuk mengurangi upaya yang diperlukan. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
Panduan implementasi

 Runbook dapat memiliki beberapa bentuk, bergantung pada tingkat kematangan organisasi Anda. Minimal, runbook harus terdiri dari dokumen teks langkah demi langkah. Hasil yang diinginkan harus ditunjukkan dengan jelas. Buatlah dokumentasi yang jelas mengenai izin atau alat khusus yang diperlukan. Berikan panduan mendetail tentang cara menangani kesalahan dan cara melakukan eskalasi jika terjadi kesalahan. Cantumkan pemilik runbook dan publikasikan di sebuah lokasi sentral. Setelah runbook Anda didokumentasikan, kemudian validasi dengan meminta orang lain di tim Anda untuk menjalankannya. Seiring berkembangnya prosedur, perbarui runbook Anda sesuai dengan proses manajemen perubahan Anda. 

 Runbook teks Anda harus diotomatiskan seiring semakin matangnya organisasi Anda. Dengan menggunakan layanan-layanan seperti [AWS Systems Manager Automation](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-automation.html), Anda dapat mentransformasikan teks biasa menjadi otomatisasi yang dapat dijalankan dengan beban kerja Anda. Otomatisasi ini dapat dijalankan sebagai respons terhadap peristiwa, sehingga mengurangi beban operasional untuk memelihara beban kerja Anda. AWS Systems Manager Automation juga menyediakan [pengalaman desain visual](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-visual-designer.html) kode rendah untuk membuat runbook otomatisasi dengan lebih mudah. 

 **Contoh pelanggan** 

 AnyCompany Retail harus melakukan pembaruan skema basis data selama deployment perangkat lunak. Tim Operasi Cloud bekerja sama dengan Tim Administrasi Basis Data untuk membuat sebuah runbook guna menerapkan perubahan ini secara manual. Runbook ini mencantumkan setiap langkah yang ada dalam prosesnya dalam bentuk daftar periksa. Runbook ini berisi sebuah bagian yang menjelaskan cara menangani kesalahan saat terjadi kesalahan. Mereka memublikasikan runbook di wiki internal mereka bersama dengan runbook mereka yang lain. Tim Operasi Cloud berencana untuk mengotomatiskan runbook dalam sprint mendatang. 

### Langkah-langkah implementasi
Langkah-langkah implementasi

 Jika Anda belum memiliki repositori dokumen, repositori kontrol versi bisa menjadi tempat yang tepat untuk mulai membangun pustaka runbook Anda. Anda dapat membangun runbook Anda dengan menggunakan Markdown. Kami telah menyediakan contoh templat runbook yang dapat Anda gunakan untuk mulai membangun runbook. 

```
# Runbook Title
## Runbook Info
| Runbook ID | Description | Tools Used | Special Permissions | Runbook Author | Last Updated | Escalation POC | 
|-------|-------|-------|-------|-------|-------|-------|
| RUN001 | What is this runbook for? What is the desired outcome? | Tools | Permissions | Your Name | 2022-09-21 | Escalation Name |
## Steps
1. Step one
2. Step two
```

1.  Jika Anda belum memiliki repositori atau wiki dokumentasi, buatlah repositori kontrol versi baru di sistem kontrol versi Anda. 

1.  Identifikasi proses yang tidak memiliki runbook. Proses yang ideal adalah proses yang dilakukan secara semi-reguler, sedikit jumlah langkahnya, dan memiliki kegagalan yang dampaknya rendah. 

1.  Di repositori dokumen Anda, buat draf dokumen Markdown baru dengan menggunakan templat tersebut. Isi Judul Runbook dan bidang-bidang yang wajib diisi di bawah Info Runbook. 

1.  Dimulai dengan langkah pertama, isi bagian Langkah-langkah dalam runbook. 

1.  Berikan runbook kepada anggota tim. Minta mereka menggunakan runbook ini untuk memvalidasi langkah-langkahnya. Jika ada sesuatu yang belum dimasukkan atau memerlukan kejelasan, perbarui runbook ini. 

1.  Publikasikan runbook ini ke bagian penyimpanan dokumentasi internal Anda. Setelah dipublikasikan, beri tahu tim Anda dan para pemangku kepentingan lainnya. 

1.  Seiring waktu, Anda akan membangun sebuah pustaka runbook. Saat pustaka tersebut bertambah besar, mulailah bekerja untuk mengotomatiskan runbook. 

 **Tingkat upaya untuk rencana implementasi:** Rendah. Standar minimum untuk runbook adalah panduan teks langkah demi langkah. Mengotomatiskan runbook dapat meningkatkan upaya penerapan. 

## Sumber daya
Sumber daya

 **Praktik-praktik terbaik terkait:** 
+  [OPS02-BP02 Proses dan Prosedur memiliki pemilik teridentifikasi](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_ops_model_def_proc_owners.html) 
+  [OPS07-BP04 Menggunakan playbook untuk menyelidiki masalah](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_ready_to_support_use_playbooks.html) 
+  [OPS10-BP01 Menggunakan proses untuk manajemen peristiwa, insiden, dan masalah](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_event_response_event_incident_problem_process.html) 
+  [OPS10-BP02 Menjalankan proses untuk setiap peringatan](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_event_response_process_per_alert.html) 
+  [OPS11-BP04 Menjalankan manajemen pengetahuan](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_evolve_ops_knowledge_management.html) 

 **Dokumen terkait:** 
+  [Mencapai Keunggulan Operasional menggunakan playbook dan runbook otomatis](https://aws.amazon.com/blogs/mt/achieving-operational-excellence-using-automated-playbook-and-runbook/) 
+  [AWS Systems Manager: Bekerja dengan runbook](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-documents.html) 
+  [Playbook migrasi untuk migrasi besar AWS - Tugas 4: Meningkatkan runbook migrasi Anda](https://docs.aws.amazon.com/prescriptive-guidance/latest/large-migration-migration-playbook/task-four-migration-runbooks.html) 
+  [Gunakan runbook AWS System Manager Automation untuk menyelesaikan tugas-tugas operasional](https://aws.amazon.com/blogs/mt/use-aws-systems-manager-automation-runbooks-to-resolve-operational-tasks/) 

 **Video terkait:** 
+  [AWS re:Invent 2019: Panduan mandiri untuk runbook, laporan insiden, dan respons insiden](https://www.youtube.com/watch?v=E1NaYN_fJUo) 
+  [Cara melakukan otomatisasi Operasi IT di AWS \$1 Amazon Web Services](https://www.youtube.com/watch?v=GuWj_mlyTug) 
+  [Integrasikan Skrip ke dalam AWS Systems Manager](https://www.youtube.com/watch?v=Seh1RbnF-uE) 

 **Contoh terkait:** 
+  [Lab Well-Architected: Melakukan otomatisasi operasi dengan Playbook dan Runbook](https://wellarchitectedlabs.com/operational-excellence/200_labs/200_automating_operations_with_playbooks_and_runbooks/) 
+  [AWS Postingan Blog : Membangun Praktik Otomatisasi Cloud untuk Keunggulan Operasional: Praktik Terbaik dari AWS Managed Services](https://aws.amazon.com/blogs/mt/build-a-cloud-automation-practice-for-operational-excellence-best-practices-from-aws-managed-services/) 
+  [AWS Systems Manager: Panduan otomatisasi](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-walk.html) 
+  [AWS Systems Manager: Pulihkan volume root dari snapshot runbook terbaru](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-document-sample-restore.html) 
+  [Membangun runbook respons insiden AWS dengan menggunakan notebook Jupyter dan CloudTrail Lake](https://catalog.us-east-1.prod.workshops.aws/workshops/a5801f0c-7bd6-4282-91ae-4dfeb926a035/en-US) 
+  [Gitlab - Runbook](https://gitlab.com/gitlab-com/runbooks) 
+  [Rubix – Pustaka Python untuk membuat runbook di Notebook Jupyter](https://github.com/Nurtch/rubix) 
+  [Menggunakan Document Builder untuk membuat runbook kustom](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-walk-document-builder.html) 

 **Layanan terkait:** 
+  [AWS Systems Manager Automation](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-automation.html) 

# OPS07-BP04 Menggunakan playbook untuk menyelidiki masalah
OPS07-BP04 Menggunakan playbook untuk menyelidiki masalah

 *Playbook* adalah panduan mendetail yang digunakan untuk menyelidiki insiden. Ketika terjadi sebuah insiden, playbook digunakan untuk menyelidiki, membuat cakupan dampak, dan mengidentifikasi akar masalah penyebabnya. Playbook digunakan untuk berbagai skenario, dari deployment yang gagal hingga insiden keamanan. Dalam banyak kasus, playbook mengidentifikasi akar masalah yang dimitigasi dengan menggunakan runbook. Playbook adalah komponen pokok dalam rencana respons insiden organisasi Anda. 

 Playbook yang baik memiliki sejumlah fitur utama. Playbook memberikan panduan secara mendetail bagi pengguna, dalam proses penemuan. Dengan berpikir secara menyeluruh, langkah apa saja yang sebaiknya diikuti seseorang untuk mendiagnosis sebuah insiden? Tetapkan secara jelas di dalam playbook apakah alat-alat khusus atau izin yang lebih tinggi diperlukan di dalam playbook. Membuat sebuah rencana komunikasi untuk memberikan informasi terbaru kepada para pemangku kepentingan mengenai status penyelidikan adalah komponen utama. Dalam situasi ketika akar penyebab masalah tidak dapat diidentifikasi, playbook harus memiliki rencana eskalasi. Jika akar penyebab masalah sudah diidentifikasi, playbook harus mengarah ke sebuah runbook yang menjelaskan cara menyelesaikannya. Playbook harus disimpan secara terpusat dan dipelihara secara rutin. Jika playbook digunakan untuk pemberitahuan khusus, bekali tim Anda dengan penunjuk ke playbook yang ada di dalam pemberitahuan tersebut. 

 Otomatisasi playbook Anda seiring dengan kematangan organisasi. Mulailah dengan playbook yang mencakup insiden-insiden berisiko rendah. Gunakan penulisan skrip untuk mengotomatiskan langkah-langkah penemuan. Pastikan Anda memiliki runbook pendamping untuk memitigasi akar masalah umum. 

 **Hasil yang diinginkan:** Organisasi Anda memiliki playbook untuk insiden umum. Playbook disimpan di lokasi terpusat dan tersedia untuk anggota tim Anda. Playbook harus sering diperbarui. Runbook pendamping dibuat untuk akar masalah apa pun yang diketahui. 

 **Anti-pola umum:** 
+  Tidak ada cara standar untuk menyelidiki sebuah insiden. 
+  Anggota tim mengandalkan memori otot atau pengetahuan kelembagaan untuk memecahkan masalah kegagalan deployment. 
+  Anggota tim baru mempelajari cara menyelidiki permasalahan melalui coba-coba (trial and error). 
+  Praktik terbaik untuk menyelidiki permasalahan tidak dibagikan ke seluruh tim. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Playbook meningkatkan upaya Anda untuk memitigasi insiden. 
+  Anggota tim yang berbeda-beda dapat menggunakan playbook yang sama untuk mengidentifikasi akar penyebab masalah secara konsisten. 
+  Setelah akar penyebab masalah diketahui, kemudian bisa dikembangkan runbook untuk masalah tersebut, sehingga dapat mempercepat waktu pemulihan. 
+  Playbook akan membantu anggota tim untuk mulai berkontribusi lebih cepat. 
+  Tim dapat menskalakan proses mereka dengan playbook yang dapat diulangi langkah-langkahnya. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Sedang 

## Panduan implementasi
Panduan implementasi

 Cara Anda membangun dan menggunakan playbook bergantung pada kematangan organisasi Anda. Jika Anda baru mengenal cloud, buatlah playbook dalam bentuk teks di dalam repositori dokumen pusat. Seiring dengan kematangan organisasi, playbook bisa dibuat menjadi semi-otomatis dengan bahasa skrip seperti Python. Skrip-skrip ini dapat dijalankan di dalam notebook Jupyter untuk mempercepat penemuan. Organisasi tingkat lanjut memiliki playbook yang sepenuhnya otomatis untuk permasalahan-permasalahan umum yang diperbaiki secara otomatis dengan runbook. 

 Mulailah membangun playbook Anda dengan mengidentifikasi insiden-insiden umum yang terjadi pada beban kerja Anda. Untuk mengawali, pilihlah playbook untuk insiden-insiden dengan risiko rendah dan dengan akar penyebab masalah yang telah dipersempit menjadi beberapa permasalahan. Setelah Anda memiliki playbook untuk skenario yang lebih sederhana, beralihlah ke skenario yang memiliki risiko lebih tinggi atau skenario dengan akar penyebab masalah yang tidak diketahui dengan baik. 

 Playbook teks Anda harus diotomatiskan seiring dengan kematangan organisasi Anda. Menggunakan layanan seperti [AWS Systems Manager Automation](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-automation.html), teks datar dapat ditransformasi menjadi otomatisasi. Otomatisasi ini dapat dijalankan terhadap beban kerja untuk mempercepat penyelidikan. Otomatisasi ini dapat diaktifkan untuk merespons peristiwa, sehingga akan mengurangi rata-rata waktu untuk menemukan dan menyelesaikan insiden. 

 Pelanggan dapat menggunakan [AWS Systems Manager Incident Manager](https://docs.aws.amazon.com/incident-manager/latest/userguide/what-is-incident-manager.html) untuk menanggapi insiden. Layanan ini menyediakan satu antarmuka untuk memeriksa insiden, memberikan informasi kepada para pemangku kepentingan saat proses penemuan dan mitigasi, dan berkolaborasi selama berlangsungnya insiden. Layanan ini menggunakan AWS System Manager Automation untuk mempercepat deteksi dan pemulihan. 

 **Contoh pelanggan** 

 Insiden produksi memberikan dampak pada AnyCompany Retail. Rekayasawan yang siap dipanggil kapan saja (on-call) menggunakan playbook untuk menyelidiki permasalahan. Seiring mereka mengikuti langkah-langkahnya, mereka terus memutakhirkan para pemangku kepentingan utama yang diidentifikasi di dalam playbook. Rekayasawan mengidentifikasi akar penyebab masalah sebagai kondisi pacu di dalam layanan backend. Dengan menggunakan runbook, rekayasawan meluncurkan ulang layanan, sehingga AnyCompany Retail dapat kembali online. 

### Langkah-langkah implementasi
Langkah-langkah implementasi

 Jika Anda belum memiliki repositori dokumen, kami menyarankan Anda untuk membuat repositori kontrol versi untuk pustaka playbook Anda. Anda dapat membangun playbook Anda dengan menggunakan Markdown, yang kompatibel dengan sebagian besar sistem otomatisasi playbook. Jika Anda memulai dari nol, gunakan contoh templat playbook berikut ini. 

```
# Playbook Title
## Playbook Info
| Playbook ID | Description | Tools Used | Special Permissions | Playbook Author | Last Updated | Escalation POC | Stakeholders | Communication Plan |
|-------|-------|-------|-------|-------|-------|-------|-------|-------|
| RUN001 | What is this playbook for? What incident is it used for? | Tools | Permissions | Your Name | 2022-09-21 | Escalation Name | Stakeholder Name | How will updates be communicated during the investigation? |
## Steps
1. Step one
2. Step two
```

1.  Jika Anda belum memiliki repositori dokumen atau wiki, buatlah repositori kontrol versi baru untuk playbook Anda di sistem kontrol versi Anda. 

1.  Identifikasi permasalahan umum yang memerlukan penyelidikan. Ini sebaiknya adalah skenario dengan akar penyebab masalah yang dibatasi ke beberapa permasalahan dan penyelesaian yang memiliki risiko rendah. 

1.  Menggunakan templat Markdown, isilah bagian Nama Playbook dan bidang di bawah Info Playbook. 

1.  Lengkapi langkah-langkah pemecahan masalah. Sampaikan dengan sejelas mungkin tindakan-tindakan yang akan dilakukan atau area apa saja yang harus Anda selidiki. 

1.  Berikan playbook tersebut kepada anggota tim dan minta mereka mempelajari dan memvalidasinya. Jika terdapat hal yang terlewatkan atau tidak jelas, lakukan pembaruan playbook. 

1.  Terbitkan playbook di dalam repositori dokumen Anda dan informasikan kepada tim dan pemangku kepentingan. 

1.  Pustaka playbook ini akan tumbuh seiring dengan semakin banyaknya playbook yang Anda tambahkan. Setelah Anda memiliki beberapa playbook, mulailah mengotomatiskannya menggunakan alat seperti AWS Systems Manager Automation untuk terus menyinkronkan otomatisasi dan playbook. 

 **Tingkat upaya untuk rencana implementasi:** Rendah. Playbook Anda harus berupa dokumen teks yang disimpan di sebuah lokasi terpusat. Organisasi yang lebih matang akan beralih ke playbook otomatis. 

## Sumber daya
Sumber daya

 **Praktik-praktik terbaik terkait:** 
+  [OPS02-BP02 Proses dan Prosedur memiliki pemilik teridentifikasi](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_ops_model_def_proc_owners.html) 
+  [OPS07-BP03 Menggunakan runbook untuk menjalankan prosedur](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_ready_to_support_use_runbooks.html) 
+  [OPS10-BP01 Menggunakan proses untuk manajemen peristiwa, insiden, dan masalah](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_event_response_event_incident_problem_process.html) 
+  [OPS10-BP02 Menjalankan proses untuk setiap peringatan](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_event_response_process_per_alert.html) 
+  [OPS11-BP04 Menjalankan manajemen pengetahuan](https://docs.aws.amazon.com/wellarchitected/latest/operational-excellence-pillar/ops_evolve_ops_knowledge_management.html) 

 **Dokumen terkait:** 
+  [Mencapai Keunggulan Operasional menggunakan playbook dan runbook otomatis](https://aws.amazon.com/blogs/mt/achieving-operational-excellence-using-automated-playbook-and-runbook/) 
+  [AWS Systems Manager: Bekerja dengan runbook](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-documents.html) 
+  [Gunakan runbook AWS System Manager Automation untuk menyelesaikan tugas-tugas operasional](https://aws.amazon.com/blogs/mt/use-aws-systems-manager-automation-runbooks-to-resolve-operational-tasks/) 

 **Video terkait:** 
+  [AWS re:Invent 2019: Panduan mandiri untuk runbook, laporan insiden, dan respons insiden (SEC318-R1)](https://www.youtube.com/watch?v=E1NaYN_fJUo) 
+  [Incident Manager AWS Systems Manager - Lokakarya AWS Virtual](https://www.youtube.com/watch?v=KNOc0DxuBSY) 
+  [Integrasikan Skrip ke dalam AWS Systems Manager](https://www.youtube.com/watch?v=Seh1RbnF-uE) 

 **Contoh terkait:** 
+  [AWS Kerangka Kerja Playbook Pelanggan](https://github.com/aws-samples/aws-customer-playbook-framework) 
+  [AWS Systems Manager: Panduan otomatisasi](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-walk.html) 
+  [Membangun runbook respons insiden AWS dengan menggunakan notebook Jupyter dan CloudTrail Lake](https://catalog.workshops.aws/workshops/a5801f0c-7bd6-4282-91ae-4dfeb926a035/en-US) 
+  [Rubix – Pustaka Python untuk membuat runbook di Notebook Jupyter](https://github.com/Nurtch/rubix) 
+  [Menggunakan Document Builder untuk membuat runbook kustom](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-walk-document-builder.html) 

 **Layanan terkait:** 
+  [AWS Systems Manager Automation](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-automation.html) 
+  [AWS Peluncuran Systems Manager Incident Manager](https://docs.aws.amazon.com/incident-manager/latest/userguide/what-is-incident-manager.html) 

# OPS07-BP05 Membuat keputusan yang tepat untuk melakukan deployment sistem dan perubahan
OPS07-BP05 Membuat keputusan yang tepat untuk melakukan deployment sistem dan perubahan

Miliki proses untuk perubahan yang sukses dan tidak sukses pada beban kerja Anda. Pre-mortem adalah latihan simulasi tim terhadap terjadinya kegagalan untuk mengembangkan strategi mitigasi. Gunakan pre-mortem untuk mengantisipasi kegagalan dan menciptakan prosedur ketika diperlukan. Evaluasi manfaat dan risiko dari deployment perubahan ke beban kerja Anda. Pastikan apakah semua perubahan sudah mematuhi tata kelola atau tidak. 

 **Hasil yang diinginkan:** 
+  Anda mengambil keputusan yang tepat ketika melakukan deployment perubahan ke beban kerja Anda. 
+  Perubahan mematuhi tata kelola. 

 **Anti-pola umum:** 
+ Melakukan deployment perubahan ke beban kerja tanpa proses untuk menangani deployment yang gagal.
+ Membuat perubahan pada lingkungan produksi Anda yang tidak mematuhi persyaratan-persyaratan tata kelola.
+ Melakukan deployment versi beban kerja baru Anda tanpa menetapkan garis dasar untuk pemanfaatan sumber daya.

 **Manfaat menjalankan praktik terbaik ini:** 
+  Anda siap untuk menangani perubahan-perubahan yang tidak berhasil dilakukan pada beban kerja Anda. 
+  Perubahan pada beban kerja Anda mematuhi kebijakan-kebijakan tata kelola. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Rendah 

## Panduan implementasi
Panduan implementasi

 Gunakan pre-mortem untuk mengembangkan proses untuk perubahan yang tidak berhasil. Buatlah dokumentasi dari proses-proses Anda untuk perubahan yang tidak berhasil. Pastikan semua perubahan mematuhi tata kelola. Evaluasi manfaat dan risiko melakukan deployment perubahan ke beban kerja Anda. 

 **Contoh pelanggan** 

 AnyCompany Retail melakukan pre-mortem secara teratur untuk melakukan validasi terhadap proses-proses mereka untuk perubahan yang tidak berhasil. Mereka mendokumentasikan proses mereka di Wiki bersama dan sering kali memperbaruinya. Semua perubahan mematuhi persyaratan-persyaratan tata kelola. 

 **Langkah-langkah implementasi** 

1.  Ambil keputusan yang tepat ketika melakukan deployment perubahan ke beban kerja Anda. Tetapkan dan tinjau kriteria untuk deployment yang berhasil. Kembangkan skenario atau kriteria yang akan menginisiasi pengembalian perubahan ke versi sebelumnya. Pikirkan manfaat dari deployment perubahan dibandingkan dengan risiko perubahan yang tidak berhasil. 

1.  Pastikan bahwa semua perubahan mematuhi kebijakan tata kelola. 

1.  Gunakan pre-mortem guna membuat rencana untuk perubahan-perubahan yang tidak berhasil dan mendokumentasikan strategi mitigasi. Jalankan sesi latihan table-top untuk memperagakan perubahan yang tidak berhasil dan melakukan validasi terhadap prosedur pengembalian ke versi sebelumnya (roll-back). 

 **Tingkat upaya untuk rencana implementasi:** Sedang. Mengimplementasikan praktik pre-mortem memerlukan koordinasi dan upaya dari para pemangku kepentingan dalam seluruh organisasi Anda 

## Sumber daya
Sumber daya

 **Praktik-praktik terbaik terkait:** 
+  [OPS01-BP03 Mengevaluasi persyaratan tata kelola](ops_priorities_governance_reqs.md) - Persyaratan tata kelola merupakan faktor kunci dalam menentukan apakah akan melakukan deployment perubahan. 
+  [OPS06-BP01 Rencana untuk perubahan yang gagal](ops_mit_deploy_risks_plan_for_unsucessful_changes.md) - Buat rencana untuk memitigasi deployment yang gagal dan gunakan pre-mortem untuk memvalidasinya. 
+  [OPS06-BP02 Uji penerapan](ops_mit_deploy_risks_test_val_chg.md) - Setiap perubahan perangkat lunak harus diuji dengan tepat sebelum deployment untuk mengurangi kecacatan dalam produksi. 
+  [OPS07-BP01 Memastikan kemampuan personel](ops_ready_to_support_personnel_capability.md) - Memiliki cukup banyak personel yang terlatih untuk mendukung beban kerja sangat penting dalam mengambil keputusan yang tepat dalam hal deployment perubahan sistem. 

 **Dokumen terkait:** 
+ [ Amazon Web Services: Risiko dan Kepatuhan ](https://docs.aws.amazon.com/whitepapers/latest/aws-risk-and-compliance/welcome.html)
+ [Model Tanggung Jawab Bersama AWS](https://aws.amazon.com/compliance/shared-responsibility-model/)
+ [ Tata Kelola dalam AWS Cloud: Keseimbangan yang Tepat Antara Kelincahan dan Keamanan ](https://aws.amazon.com/blogs/apn/governance-in-the-aws-cloud-the-right-balance-between-agility-and-safety/)

# OPS07-BP06 Membuat rencana dukungan untuk beban kerja produksi
OPS07-BP06 Membuat rencana dukungan untuk beban kerja produksi

 Aktifkan dukungan untuk perangkat lunak dan layanan yang diandalkan beban kerja produksi Anda. Pilih tingkat dukungan yang sesuai untuk memenuhi kebutuhan tingkat layanan produksi Anda. Rencana dukungan untuk dependensi ini diperlukan untuk berjaga-jaga jika ada gangguan layanan atau masalah perangkat lunak yang terjadi. Buatlah dokumentasi dari rencana-rencana dukungan dan cara meminta dukungan untuk semua vendor perangkat lunak dan layanan. Implementasikan mekanisme yang memastikan bahwa titik kontak dukungan selalu yang terbaru. 

 **Hasil yang diinginkan:** 
+  Implementasikan rencana dukungan untuk perangkat lunak dan layanan yang diandalkan oleh beban kerja produksi. 
+  Pilih rencana dukungan yang sesuai berdasarkan kebutuhan tingkat layanan. 
+  Buatlah dokumentasi dari rencana dukungan, tingkat dukungan, dan cara meminta dukungan. 

 **Anti-pola umum:** 
+  Anda tidak memiliki rencana dukungan untuk vendor perangkat lunak yang penting. Beban kerja Anda terkena dampaknya dan Anda tidak dapat melakukan apa-apa untuk mempercepat perbaikan atau mendapatkan informasi terbaru dari vendor secara tepat waktu. 
+  Seorang pengembang yang merupakan titik utama kontak untuk vendor perangkat lunak tidak lagi bekerja di perusahaan. Anda tidak dapat menghubungi dukungan vendor secara langsung. Anda harus meluangkan waktu menelusuri dan mencari-cari dalam sistem kontak generik, sehingga menambah waktu yang diperlukan untuk memberikan respons ketika diperlukan. 
+  Penghentian (outage) produksi terjadi pada vendor perangkat lunak. Tidak ada dokumentasi tentang cara mengajukan kasus dukungan. 

 **Manfaat menjalankan praktik terbaik ini:** 
+  Dengan tingkat dukungan yang sesuai, Anda dapat memperoleh respons dalam kerangka waktu yang diperlukan untuk memenuhi kebutuhan-kebutuhan tingkat layanan. 
+  Sebagai pelanggan yang didukung, Anda dapat menyampaikan masalah, jika terjadi masalah produksi. 
+  Vendor layanan dan perangkat lunak dapat membantu menyelesaikan masalah saat terjadi insiden. 

 **Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan:** Rendah 

## Panduan implementasi
Panduan implementasi

 Aktifkan rencana dukungan untuk vendor perangkat lunak dan layanan yang diandalkan oleh beban kerja produksi Anda. Atur rencana dukungan yang sesuai untuk memenuhi kebutuhan-kebutuhan tingkat layanan Anda. Untuk pelanggan AWS, ini artinya Anda mengaktifkan Business Support AWS atau yang lebih tinggi pada setiap akun yang memiliki beban kerja produksi. Temui para vendor dukungan secara teratur untuk mendapatkan informasi terbaru mengenai penawaran dukungan, proses, dan kontak. Buatlah dokumentasi tentang cara meminta dukungan dari para vendor perangkat lunak dan layanan, termasuk cara menyampaikan masalah jika ada penghentian (outage). Implementasikan mekanisme-mekanisme untuk menjaga agar kontak selalu yang terbaru. 

 **Contoh pelanggan** 

 Di AnyCompany Retail, semua dependensi layanan dan perangkat lunak komersial memiliki rencana dukungan. Contohnya, mereka mengaktifkan Dukungan Perusahaan AWS di semua akun yang memiliki beban kerja produksi. Semua pengembang dapat membuka kasus dukungan bila ada masalah yang terjadi. Ada satu halaman wiki yang memuat informasi tentang cara meminta dukungan, siapa yang harus diberi tahu, dan praktik-praktik terbaik untuk mempercepat penanganan kasus. 

 **Langkah-langkah implementasi** 

1.  Bekerjasamalah dengan para pemangku kepentingan yang ada di organisasi Anda untuk mengidentifikasi para vendor perangkat lunak dan layanan yang diandalkan oleh beban kerja Anda. Buatlah dokumentasi mengenai dependensi ini. 

1.  Tentukan kebutuhan tingkat layanan untuk beban kerja Anda. Pilih rencana dukungan yang selaras dengannya. 

1.  Untuk layanan-layanan dan perangkat lunak komersial, tetapkan rencana dukungan dengan para vendornya. 

   1.  Dengan berlangganan AWS Business Support atau yang lebih tinggi untuk semua akun produksi, waktu respons AWS Dukungan akan lebih cepat dan hal ini sangat disarankan. Jika Anda tidak memiliki dukungan premium, Anda harus memiliki rencana tindakan untuk menangani masalah, yang memerlukan bantuan dari AWS Dukungan. AWS Dukungan memberikan kombinasi alat dan teknologi, orang, dan program yang dirancang untuk secara proaktif membantu Anda mengoptimalkan performa, menurunkan biaya, dan berinovasi dengan lebih cepat. Selain itu, AWS Business Support memberikan manfaat tambahan, termasuk akses API ke AWS Trusted Advisor dan AWS Health untuk integrasi programatis dengan sistem Anda, bersama metode akses lainnya seperti Konsol Manajemen AWS dan saluran Amazon EventBridge. 

1.  Buatlah dokumentasi tentang rencana dukungan di alat manajemen pengetahuan Anda. Sertakan cara untuk meminta dukungan, siapa yang harus diberi tahu jika ada kasus dukungan diajukan, dan cara untuk menyampaikan masalah saat terjadi insiden. Wiki bisa menjadi sebuah mekanisme yang bagus untuk memungkinkan semua orang membuat pembaruan yang diperlukan pada dokumentasi ketika mereka mengetahui tentang adanya perubahan yang dilakukan untuk mendukung proses atau perubahan kontak. 

 **Tingkat upaya untuk rencana implementasi:** Rendah. Sebagian besar vendor perangkat lunak dan layanan menawarkan pilihan penyertaan rencana dukungan. Mendokumentasikan dan berbagi praktik terbaik terkait dukungan di sistem manajemen pengetahuan Anda akan memastikan tim Anda mengetahui tindakan-tindakan yang harus dilakukan jika ada masalah produksi. 

## Sumber daya
Sumber daya

 **Praktik-praktik terbaik terkait:** 
+  [OPS02-BP02 Proses dan Prosedur memiliki pemilik teridentifikasi](ops_ops_model_def_proc_owners.md) 

 **Dokumen terkait:** 
+ [Rencana AWS Dukungan](https://docs.aws.amazon.com/awssupport/latest/user/aws-support-plans.html)

 **Layanan terkait:** 
+ [AWS Business Support](https://aws.amazon.com/premiumsupport/plans/business/)
+ [Dukungan Perusahaan AWS](https://aws.amazon.com/premiumsupport/plans/enterprise/)