

# OPS10-BP05 为影响服务的事件定义客户沟通计划
<a name="ops_event_response_push_notify"></a>

 在发生影响服务的事件时，为了维护客户的信任和进行开诚布公地交流，有效的沟通至关重要。在发生意外事件时，明确定义的沟通计划有助于组织以快速清晰的方式，在内部和外部分享信息。

 **期望结果：**
+  在发生影响服务的事件时，可靠的沟通计划可有效地通知客户和利益相关方。
+  开诚布公的交流可以建立信任关系，减少客户焦虑。
+  尽可能减少影响服务的事件对客户体验和业务运营的影响。

 **常见反模式：**
+  未能充分或及时地进行沟通，导致客户困惑和不满。
+  过于技术性或含糊不清的消息传递，无法传达对用户的实际影响。
+  没有预定义的沟通策略，导致被动地传达消息，且不能确保消息的一致性。

 **建立此最佳实践的好处：**
+  通过进行主动、清晰的沟通，增强客户的信任和满意度。
+  通过先行解决客户的问题，减轻支持团队的负担。
+  提高了有效管理意外事件和从中恢复的能力。

 **在未建立这种最佳实践的情况下暴露的风险等级：**中 

## 实施指导
<a name="implementation-guidance"></a>

 针对影响服务的事件，制定全面的沟通计划，这涉及从选择合适的渠道到精心撰写消息和使用合适的语气等多个方面。该计划应具有适应性、可扩展性，并能根据不同的中断场景进行调整。

### 实施步骤
<a name="implementation-steps"></a>

1.  **定义角色和职责：**
   +  指派一名重大意外事件经理，负责监管意外事件响应活动。
   +  指定一名沟通经理，负责协调所有内外部沟通。
   +  让支持经理参与进来，借助支持工单实现一致的沟通。

1.  **确定沟通渠道：**选择工作聊天工具、电子邮件、短信、社交媒体、应用程序内通知和状态页面等渠道。这些渠道应具有韧性，能够在发生影响服务的事件期间独立运行。

1.  **快速、清晰地与客户开展定期沟通：**
   +  针对各种服务受损场景开发模板，注重简化性和关键细节。提供有关服务受损、预期解决时间和影响的信息。
   +  使用 Amazon Pinpoint，通过推送通知、应用程序内通知、电子邮件、短信、语音消息以及自定义渠道消息，向客户发送提醒。
   +  使用 Amazon Simple Notiﬁcation Service（Amazon SNS），以编程方式或通过电子邮件、移动推送通知和短信提醒订阅用户。
   +  通过公开分享 Amazon CloudWatch 控制面板，使用控制面板传达状态信息。
   +  鼓励进行社交媒体互动：
     +  积极监控社交媒体，了解客户情绪。
     +  在社交媒体平台上发布内容，面向公众提供最新信息，并参与社区互动。
     +  编制模板，以便实现一致、清晰的社交媒体沟通。

1.  **协调内部沟通：**实施内部协议，使用聊天应用程序中的 Amazon Q 开发者版等工具进行团队协调和沟通。使用 CloudWatch 控制面板来传达状态信息。

1.  **使用专用工具和服务来协调沟通：**
   +  将 AWS Systems Manager Incident Manager 与聊天应用程序中的 Amazon Q 开发者版结合使用来设置专用的聊天频道，以便在发生事件时进行实时内部沟通和协调。
   +  发生意外事件时，使用 AWS Systems Manager Incident Manager 运行手册，通过 Amazon Pinpoint、Amazon SNS 或社交媒体平台等第三方工具，自动通知客户。
   +  将审批工作流程纳入运行手册，以便在所有外部通信渠道发送信息之前，进行审核和授权（如需要）。

1.  **练习和改进：**
   +  开展有关使用沟通工具和策略的培训。增强团队能力，以便在发生意外事件时及时作出决策。
   +  通过定期演习或 GameDay 活动来测试沟通计划。使用这些测试来完善消息传递流程，并评估渠道的有效性。
   +  实施反馈机制来评测发生意外事件时的沟通有效性。根据反馈和不断变化的需求，不断改进沟通计划。

 **实施计划的工作量级别：**高 

## 资源
<a name="resources"></a>

 **相关最佳实践：**
+  [OPS07-BP03 使用运行手册执行程序](ops_ready_to_support_use_runbooks.md) 
+  [OPS10-BP06 通过控制面板传达状态信息](ops_event_response_dashboards.md) 
+  [OPS11-BP02 在意外事件发生后执行分析](ops_evolve_ops_perform_rca_process.md) 

 **相关文档：**
+ [Atlassian - Incident communication best practices](https://www.atlassian.com/incident-management/incident-communication)
+ [Atlassian - How to write a good status update](https://www.atlassian.com/blog/statuspage/how-to-write-a-good-status-update)
+ [PagerDuty - A Guide to Incident Communications](https://www.pagerduty.com/resources/learn/a-guide-to-incident-communications/)

 **相关视频：**
+ [Atlassian - Create your own incident communication plan: Incident templates](https://www.youtube.com/watch?v=ZROVn6-K2qU)

 **相关示例：**
+  [AWS Health 控制面板](https://aws.amazon.com/premiumsupport/technology/aws-health-dashboard/) 