

# OPS10-BP04 Definición de rutas de escalado
<a name="ops_event_response_define_escalation_paths"></a>

Establezca rutas de escalado claras dentro de sus protocolos de respuesta a incidentes para facilitar una acción oportuna y eficaz. Esto incluye especificar las indicaciones para el escalado, detallar el proceso de escalado y aprobar previamente las acciones para acelerar la toma de decisiones y reducir el tiempo medio de resolución (MTTR).

 **Resultado deseado:** un proceso estructurado y eficiente que eleve los incidentes al personal apropiado, lo que reduce los tiempos de respuesta y el impacto. 

 **Patrones comunes de uso no recomendados:** 
+ La falta de claridad en los procedimientos de recuperación conduce a respuestas improvisadas durante los incidentes críticos.
+ La ausencia de permisos y propiedad definidos provoca retrasos cuando se necesita una acción urgente.
+  Las partes interesadas y los clientes no reciben información de acuerdo con las expectativas. 
+  Las decisiones importantes se retrasan. 

 **Beneficios de establecer esta práctica recomendada:** 
+  Respuesta simplificada a los incidentes mediante procedimientos de escalado predefinidos. 
+  Se ha reducido el tiempo de inactividad con acciones preaprobadas y una propiedad clara. 
+  Mejora de la asignación de recursos y los ajustes del nivel de soporte según la gravedad del incidente. 
+  Mejora de la comunicación con las partes interesadas y los clientes. 

 **Nivel de riesgo expuesto si no se establece esta práctica recomendada:** medio 

## Guía para la implementación
<a name="implementation-guidance"></a>

 Las rutas de escalado bien definidas son cruciales para una respuesta rápida a los incidentes. Administrador de incidentes de AWS Systems Manager permite establecer planes de escalado estructurados y programas de guardia, que alertan al personal adecuado para que esté preparado para actuar cuando se produzcan incidentes. 

### Pasos para la implementación
<a name="implementation-steps"></a>

1.  **Configuración de las indicaciones de escalado:** configure [alarmas de CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html#alarms-and-actions) para crear un incidente en [Administrador de incidentes de AWS Systems Manager](https://docs.aws.amazon.com//incident-manager/latest/userguide/incident-creation.html). 

1.  ** Configuración de programas de guardia:** cree [programas de guardia](https://docs.aws.amazon.com/incident-manager/latest/userguide/incident-manager-on-call-schedule-create.html) en el Administrador de incidentes que se ajusten a sus rutas de escalado. Proporcione al personal de guardia los permisos y las herramientas necesarios para actuar con rapidez. 

1.  **Detalle los procedimientos de escalado:** 
   +  Determine las condiciones específicas en las que se debe escalar un incidente. 
   +  Cree [planes de escalado](https://docs.aws.amazon.com/incident-manager/latest/userguide/escalation.html) en el Administrador de incidentes. 
   +  Los canales de escalado deben consistir en un contacto o un programa de guardia. 
   +  Defina las funciones y responsabilidades del equipo en cada nivel de escalado. 

1.  **Aprobación previa de las acciones de mitigación:** colabore con los responsables de la toma de decisiones para aprobar previamente las acciones para los escenarios previstos. Utilice los [manuales de procedimientos de Automatización de Systems Manager](https://docs.aws.amazon.com//incident-manager/latest/userguide/tutorials-runbooks.html) integrados con el Administrador de incidentes para acelerar la resolución de incidentes. 

1.  **Especificación de la propiedad:** identifique claramente a los propietarios internos de cada paso de la ruta de escalado. 

1.  **Detalle los escalados de terceros:** 
   +  Documente los acuerdos de nivel de servicio (SLA) de terceros y ajústelos a los objetivos internos. 
   +  Establezca protocolos claros para la comunicación con los proveedores durante los incidentes. 
   +  Integre los contactos de los proveedores en las herramientas de administración de incidentes para que se pueda acceder directamente a ellos. 
   +  Lleve a cabo simulacros periódicos que incluyan situaciones de respuesta de terceros. 
   +  Mantenga la información de escalado de proveedores bien documentada y accesible. 

1.  **Formación y práctica de los planes de escalado:** forme a su equipo en el proceso de escalado y lleve a cabo simulacros o días de juego de respuesta a incidentes con regularidad. Los clientes de Enterprise Support pueden solicitar un [taller de administración de incidentes](https://aws.amazon.com/premiumsupport/technology-and-programs/proactive-services/). 

1.  **Continuación de la mejora:** revise la eficacia de sus rutas de escalado con regularidad. Actualice sus procesos en función de las lecciones aprendidas a partir de los análisis posteriores a los incidentes y los comentarios continuos. 

 **Nivel de esfuerzo para el plan de implementación:** moderado 

## Recursos
<a name="resources"></a>

 **Prácticas recomendadas relacionadas:** 
+  [OPS08-BP04 Creación de alertas procesables](ops_workload_observability_create_alerts.md) 
+  [OPS10-BP02 Implementación de un proceso por alerta](ops_event_response_process_per_alert.md) 
+  [OPS11-BP02 Análisis después del incidente](ops_evolve_ops_perform_rca_process.md) 

 **Documentos relacionados:** 
+ [Administrador de incidentes de AWS Systems Manager Escalation Plans](https://docs.aws.amazon.com/incident-manager/latest/userguide/escalation.html)
+ [Working with on-call schedules in Incident Manager](https://docs.aws.amazon.com/incident-manager/latest/userguide/incident-manager-on-call-schedule.html)
+ [Creación y administración de manuales de procedimientos](https://docs.aws.amazon.com/systems-manager/latest/userguide/automation-documents.html)
+ [Temporary elevated access management with AWS IAM Identity Center](https://aws.amazon.com/blogs/security/temporary-elevated-access-management-with-iam-identity-center/)
+ [Atlassian - Escalation policies for effective incident management](https://www.atlassian.com/incident-management/on-call/escalation-policies)