# Processo e cultura
Processo e cultura

**Topics**
+ [

# PERF 5. Como suas práticas e cultura organizacionais contribuem para a eficiência de performance em sua workload?
](perf-05.md)

# PERF 5. Como suas práticas e cultura organizacionais contribuem para a eficiência de performance em sua workload?


 Ao arquitetar workloads, há princípios e práticas que você pode adotar para ajudar na melhor execução de workloads na nuvem eficientes e de alta performance. Para adotar uma cultura que promova a eficiência de performance das workloads na nuvem, considere estes princípios e práticas fundamentais: 

**Topics**
+ [

# PERF05-BP01 Estabelecer indicadores-chave de performance (KPIs) para medir a integridade e a performance da workload
](perf_process_culture_establish_key_performance_indicators.md)
+ [

# PERF05-BP02 Usar soluções de monitoramento para entender as áreas em que a performance é mais crítica
](perf_process_culture_use_monitoring_solutions.md)
+ [

# PERF05-BP03 Definir um processo para melhorar a performance da workload
](perf_process_culture_workload_performance.md)
+ [

# PERF05-BP04 Fazer o teste de carga da workload
](perf_process_culture_load_test.md)
+ [

# PERF05-BP05 Usar automação para corrigir proativamente problemas relacionados a performance
](perf_process_culture_automation_remediate_issues.md)
+ [

# PERF05-BP06 Manter a workload e os serviços atualizados
](perf_process_culture_keep_workload_and_services_up_to_date.md)
+ [

# PERF05-BP07 Revisar as métricas regularmente
](perf_process_culture_review_metrics.md)

# PERF05-BP01 Estabelecer indicadores-chave de performance (KPIs) para medir a integridade e a performance da workload
PERF05-BP01 Estabelecer indicadores-chave de performance (KPIs) para medir a integridade e a performance da workload

 Identifique os KPIs que medem a performance da workload de forma quantitativa e qualitativa. Os KPIs ajudam você a medir a integridade e a performance de uma workload relacionada a uma meta empresarial. 

 **Práticas comuns que devem ser evitadas:** 
+  Monitorar as métricas somente no nível do sistema para obter informações da workload e não compreende aos impactos dessas métricas nos negócios. 
+  Pressupor que os KPIs já estejam publicados e compartilhados como dados de métricas comuns. 
+  Não definir um KPI quantitativo e mensurável. 
+  Não alinhar os KPIs às metas ou estratégias empresariais. 

 **Benefícios de implementar esta prática recomendada:** identificar KPIs específicos que representam a integridade e a performance da workload ajuda a alinhar as equipes em suas prioridades e a definir resultados empresariais bem-sucedidos. O compartilhamento dessas métricas com todos os departamentos fornece visibilidade e alinhamento dos limites, das expectativas e do impacto nos negócios. 

 **Nível de risco exposto se esta prática recomendada não for estabelecida:** Alto 

## Orientação para implementação
Orientação para implementação

 Os KPIs permitem que as empresas e as equipes de engenharia alinhem a medição das metas e estratégias de como esses fatores são combinados para produzir resultados comerciais. Por exemplo, a workload de um site pode usar o tempo de carregamento da página como uma indicação da performance geral. Essa métrica seria um dos vários pontos de dados que medem a experiência do usuário. Além de identificar os limites do tempo de carregamento da página, documente o resultado esperado ou o risco da empresa se a performance ideal não for atingida. Um longo tempo de carregamento da página afeta diretamente os usuários finais, diminui a classificação da experiência do usuário e pode resultar em perda de clientes. Ao definir os limites dos KPIs, combine os testes comparativos do setor e as expectativas dos usuários finais. Por exemplo, se o teste comparativo do setor aplicável for o carregamento de uma página da Web em dois segundos, mas os usuários finais esperarem que uma página da Web seja carregada em um segundo, você deverá pensar nos dois pontos de dados ao estabelecer o KPI. 

 Sua equipe deve avaliar os KPIs da workload usando dados detalhados em tempo real e dados históricos para referência e criar painéis que calculem as métricas nos dados de KPI para derivar informações operacionais e de utilização. Os KPIs devem ser documentados e incluir limites que apoiem as metas e estratégias empresariais, bem como mapeados de acordo com as métricas que estão sendo monitoradas. Os KPIs devem ser revisitados quando as metas e as estratégias da empresa ou os requisitos dos usuários finais mudam.   

## Etapas de implementação
Etapas de implementação
+ **Identifique as partes interessadas:** identifique e documente as principais partes interessadas da empresa, incluindo as equipes de desenvolvimento e operações. 
+ **Defina objetivos:** trabalhe com essas partes interessadas para definir e documentar os objetivos da workload. Considere os aspectos críticos de performance das workloads, como throughput, tempo de resposta e custo, bem como as metas de negócios, como a satisfação dos usuários. 
+ **Revise as práticas recomendadas do setor:** revise as práticas recomendadas do setor para identificar KPIs relevantes alinhados aos objetivos da workload. 
+  **Identifique métricas:** identifique métricas que estejam alinhadas aos objetivos da sua workload e possam ajudar a medir a performance e as metas de negócios. Estabeleça KPIs com base nessas métricas. Exemplos de métricas são tempo médio de resposta, número de usuários simultâneos, entre outras. 
+ **Defina e documente KPIs:** use as práticas recomendadas do setor e os objetivos da workload para definir metas de KPI da workload. Use essas informações para definir limites de KPI no nível de gravidade ou de alarme. Identifique e documente o risco e o impacto no caso de um KPI não ser atendido. 
+ **Implemente monitoramento:** use ferramentas de monitoramento como o [Amazon CloudWatch](https://aws.amazon.com/cloudwatch/) ou o [AWS Config](https://aws.amazon.com/config/) para coletar métricas e medir KPIs. 
+ **Divulgar os KPIs visualmente:** use ferramentas de painel como o [Amazon Quick](https://aws.amazon.com/pm/quicksight/) para visualizar e divulgar os KPIs para as partes interessadas. 
+ **Analise e otimize:** revise e analise regularmente as métricas para identificar áreas da workload que precisam ser aprimoradas. Trabalhe com as partes interessadas para implementar essas melhorias. 
+ **Revise e refine:** revise regularmente as métricas e os KPIs para avaliar sua eficácia, especialmente quando as metas de negócios ou a performance da workload mudam. 

## Recursos
Recursos

 **Documentos relacionados:** 
+  [Documentação do CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) 
+  [AWS Partners de monitoramento, registro em log e performance](https://aws.amazon.com/devops/partner-solutions/#_Monitoring.2C_Logging.2C_and_Performance) 
+ [Ferramentas de observabilidade da AWS](https://docs.aws.amazon.com/wellarchitected/latest/management-and-governance-guide/aws-observability-tools.html)
+ [A importância dos indicadores-chave de performance (KPIs) para migrações para a nuvem em grande escala](https://aws.amazon.com/blogs/mt/the-importance-of-key-performance-indicators-kpis-for-large-scale-cloud-migrations/)
+ [Como rastrear KPIs de otimização de custos com o painel de KPI](https://aws.amazon.com/blogs/aws-cloud-financial-management/how-to-track-your-cost-optimization-kpis-with-the-kpi-dashboard/)
+  [Documentação do X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html) 
+  [Usar painéis do Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html?ref=wellarchitected) 
+  [KPIs do Quick](https://docs.aws.amazon.com/quicksight/latest/user/kpi.html) 

 **Vídeos relacionados:** 
+ [AWS re:Invent 2023: Otimizar custos e performance e rastrear o progresso rumo à mitigação](https://www.youtube.com/watch?v=keAfy8f84E0)
+ [AWS re:Invent 2023: Gerenciar eventos do ciclo de vida dos recursos em grande escala com o AWS Health](https://www.youtube.com/watch?v=VoLLNL5j9NA)
+ [AWS re:Invent 2023: Performance e eficiência no Pinterest: otimizando as instâncias mais recentes](https://www.youtube.com/watch?v=QSudpowE_Hs)
+ [AWS re:Invent 2022: Otimização da AWS: etapas acionáveis para resultados imediatos ](https://www.youtube.com/watch?v=0ifvNf2Tx3w)
+ [AWS re:Invent 2023: Criar uma estratégia efetiva de observabilidade ](https://www.youtube.com/watch?v=7PQv9eYCJW8)
+ [AWS Summit SF 2022: Observabilidade full-stack e monitoramento de aplicações com a AWS](https://www.youtube.com/watch?v=or7uFFyHIX0)
+ [AWS re:Invent 2023: Escalar na AWS para seus primeiros 10 milhões de usuários](https://www.youtube.com/watch?v=JzuNJ8OUht0)
+ [AWS re:Invent 2022: Como a Amazon usa métricas melhores para aprimorar a performance de sites ](https://www.youtube.com/watch?v=_uaaCiyJCFA)
+ [Criar uma estratégia de métricas eficaz para sua empresa \$1 Eventos da AWS](https://www.youtube.com/watch?v=zBO-K4RvbtM)

 **Exemplos relacionados:** 
+  [Criar um painel com o Quick](https://github.com/aws-samples/amazon-quicksight-sdk-proserve) 

# PERF05-BP02 Usar soluções de monitoramento para entender as áreas em que a performance é mais crítica
PERF05-BP02 Usar soluções de monitoramento para entender as áreas em que a performance é mais crítica

 Entenda e identifique áreas em que aumentar a performance de sua workload causará um impacto positivo sobre a eficiência ou a experiência do cliente. Por exemplo, um site que tenha muita interação com o cliente se beneficiaria do uso de serviços de borda para aproximar a entrega de conteúdo dos clientes. 

 **Práticas comuns que devem ser evitadas:** 
+  Você pressupõe que as métricas de computação padrão, como utilização de CPU ou pressão de memória, são suficientes para detectar problemas de performance. 
+  Você só usa as métricas comuns registradas pelo software de monitoramento selecionado. 
+  Você só revisa as métricas quando há um problema. 

 **Benefícios de implementar esta prática recomendada:** compreender áreas críticas de performance ajuda os proprietários de workloads a monitorar KPIs e priorizar melhorias de alto impacto. 

 **Nível de risco exposto se esta prática recomendada não for estabelecida:** Alto 

## Orientação para implementação
Orientação para implementação

 Configure um rastreamento completo para identificar padrões de tráfego, latência e áreas de performance críticas. Monitore os padrões de acesso aos dados para consultas lentas ou dados particionados e fragmentados incorretamente. Identifique as áreas de restrição da workload usando o teste ou monitoramento de carga. 

 Aumente a eficiência de performance entendendo sua arquitetura, os padrões de tráfego e os padrões de acesso aos dados, além de identificar os tempos de latência e processamento. Identifique possíveis gargalos que possam afetar a experiência do cliente com o crescimento da workload. Depois de investigar essas áreas, veja qual solução você pode implantar para eliminar esses problemas de performance. 

### Etapas de implementação
Etapas de implementação
+  Configure um monitoramento completo para capturar todos os componentes e as métricas da workload. Aqui estão alguns exemplos de soluções de monitoramento na AWS.     
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/pt_br/wellarchitected/latest/framework/perf_process_culture_use_monitoring_solutions.html)
+  Realize testes para gerar métricas, identificar padrões de tráfego, gargalos e áreas de performance críticas. Aqui estão alguns exemplos de como realizar testes: 
  +  Configure os [CloudWatch Synthetic Canaries](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html) para imitar programaticamente as atividades do usuário baseadas no navegador usando trabalhos cron do Linux ou expressões rate para gerar métricas consistentes ao longo do tempo. 
  +  Use a solução [AWS Distributed Load Testing](https://aws.amazon.com/solutions/implementations/distributed-load-testing-on-aws/) para gerar tráfego de pico ou testar a workload na taxa de crescimento esperada. 
+  Avalie as métricas e a telemetria para identificar as áreas de performance críticas. Avalie essas áreas com sua equipe para discutir sobre o monitoramento e as soluções visando evitar gargalos. 
+  Experimente com melhorias de performance e meça essas alterações com dados. Como exemplo, você pode usar o [CloudWatch Evidently](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-Evidently.html) para testar novas melhorias e impactos de performance em sua workload. 

## Recursos
Recursos

 **Documentos relacionados:** 
+ [Novidades no AWS Observability na re:Invent 2023](https://aws.amazon.com/blogs/mt/whats-new-in-aws-observability-at-reinvent-2023/)
+  [Amazon Builders' Library](https://aws.amazon.com/builders-library) 
+  [Documentação do X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html) 
+  [Amazon CloudWatch RUM](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-RUM.html) 
+  [Amazon DevOps Guru](https://aws.amazon.com/devops-guru/) 

 **Vídeos relacionados:** 
+ [AWS re:Invent 2023: [LANÇAMENTO] Monitoramento de aplicações para workloads modernas ](https://www.youtube.com/watch?v=T2TovTLje8w)
+ [AWS re:Invent 2023: Como implementar a observabilidade de aplicações ](https://www.youtube.com/watch?v=IcTcwUSwIs4)
+ [AWS re:Invent 2023: Criar uma estratégia efetiva de observabilidade ](https://www.youtube.com/watch?v=7PQv9eYCJW8)
+ [AWS Summit SF 2022: Observabilidade full-stack e monitoramento de aplicações com a AWS](https://www.youtube.com/watch?v=or7uFFyHIX0)
+ [AWS re:Invent 2022: Otimização da AWS: etapas acionáveis para resultados imediatos ](https://www.youtube.com/watch?v=0ifvNf2Tx3w)
+  [AWS re:Invent 2022: Amazon Builders' Library: 25 anos de excelência operacional da Amazon](https://www.youtube.com/watch?v=DSRhgBd_gtw) 
+ [AWS re:Invent 2022: Como a Amazon usa métricas melhores para aprimorar a performance de sites ](https://www.youtube.com/watch?v=_uaaCiyJCFA)
+  [Monitoramento visual de aplicações com o Amazon CloudWatch Synthetics](https://www.youtube.com/watch?v=_PCs-ucZz7E) 

 **Exemplos relacionados:** 
+  [Medir o tempo de carregamento da com o Amazon CloudWatch Synthetics](https://github.com/aws-samples/amazon-cloudwatch-synthetics-page-performance) 
+  [Cliente Web do Amazon CloudWatch RUM](https://github.com/aws-observability/aws-rum-web) 
+  [X-Ray SDK para Python](https://github.com/aws/aws-xray-sdk-python) 
+  [Teste de carga distribuída na AWS](https://aws.amazon.com/solutions/implementations/distributed-load-testing-on-aws/) 

# PERF05-BP03 Definir um processo para melhorar a performance da workload
PERF05-BP03 Definir um processo para melhorar a performance da workload

 Defina um processo para avaliar novos serviços, padrões de design, tipos de recursos e configurações à medida que eles se tornam disponíveis. Por exemplo, execute testes de performance existentes em novas ofertas de instância para determinar o potencial delas de aprimorar sua workload. 

 **Práticas comuns que devem ser evitadas:** 
+  Você pressupõe que sua arquitetura atual é estática e não será atualizada ao longo do tempo. 
+  Você apresenta alterações de arquitetura ao longo do tempo sem justificativa de métrica. 

 **Benefícios de implementar esta prática recomendada:** ao definir seu processo para fazer alterações de arquitetura, é possível usar os dados coletados para influenciar o projeto da workload ao longo do tempo. 

 **Nível de risco exposto se esta prática recomendada não for estabelecida:** Médio 

## Orientação para implementação
Orientação para implementação

 A performance da sua workload tem algumas restrições importantes. Guarde essas restrições para saber que tipos de inovação podem aumentar a performance da sua workload. Use essas informações enquanto estiver aprendendo sobre novos serviços ou tecnologias à medida que surgem e identificar maneiras de reduzir restrições ou gargalos. 

 Identifique as principais restrições de performance da workload. Documente suas restrições de performance da workload para que você saiba quais tipos de inovação podem aprimorar a performance da workload. 

### Etapas de implementação
Etapas de implementação
+ **Identifique os KPIs:** identifique os KPIs de performance da workload conforme descrito em [PERF05-BP01 Estabelecer indicadores-chave de performance (KPIs) para medir a integridade e a performance da workload](perf_process_culture_establish_key_performance_indicators.md) para definir sua workload. 
+ **Implemente monitoramento:** use [ferramentas de observabilidade da AWS](https://docs.aws.amazon.com/wellarchitected/latest/management-and-governance-guide/aws-observability-tools.html) para coletar métricas de performance e medir KPIs. 
+ **Analise:** faça uma análise aprofundada para identificar as áreas (como configuração e código da aplicação) na workload que apresentam baixa performance, conforme descrito em [PERF05-BP02 Usar soluções de monitoramento para entender as áreas em que a performance é mais crítica](perf_process_culture_use_monitoring_solutions.md). Use suas ferramentas de análise e performance para identificar as estratégias de melhoria de performance. 
+ **Valide as melhorias:** use ambientes de sandbox ou de pré-produção para validar a eficácia das estratégias de aperfeiçoamento. 
+ **Implemente mudanças:** implemente as mudanças na produção e monitore constantemente a performance da workload. Documente as melhorias e comunique as mudanças às partes interessadas. 
+ **Revise e refine:** revise regularmente seu processo de melhoria de performance para identificar áreas a serem aprimoradas. 

## Recursos
Recursos

 **Documentos relacionados:** 
+  [AWS Blog da](https://aws.amazon.com/blogs/) 
+  [Novidades da AWS](https://aws.amazon.com/new/?ref=wellarchitected) 
+  [AWS Skill Builder](https://explore.skillbuilder.aws/learn) 

 **Vídeos relacionados:** 
+ [AWS re:Invent 2022: Como entregar arquiteturas sustentáveis e de alta performance](https://www.youtube.com/watch?v=FBc9hXQfat0)
+ [AWS re:Invent 2023: Otimizar custos e performance e rastrear o progresso rumo à mitigação](https://www.youtube.com/watch?v=keAfy8f84E0)
+ [AWS re:Invent 2022: Otimização da AWS: etapas acionáveis para resultados imediatos ](https://www.youtube.com/watch?v=0ifvNf2Tx3w)
+ [AWS re:Invent 2022: Otimize suas workloads da AWS com a orientação de práticas recomendadas ](https://www.youtube.com/watch?v=t8yl1TrnuIk)

 **Exemplos relacionados:** 
+  [GitHub da AWS](https://github.com/aws) 

# PERF05-BP04 Fazer o teste de carga da workload
PERF05-BP04 Fazer o teste de carga da workload

 Teste sua workload para verificar se ela pode lidar com a carga de produção e identificar qualquer gargalo de performance. 

 **Práticas comuns que devem ser evitadas:** 
+  Você faz um teste de carga de partes individuais da workload, mas não de toda ela. 
+  Você faz um teste de carga em uma infraestrutura que não é igual ao seu ambiente de produção. 
+  Você só faz testes de carga para a carga esperada, mas para nada além dela, para ajudar a prever onde pode haver problemas futuros. 
+  Você faz testes de carga sem consultar a [política de testes do Amazon EC2](https://aws.amazon.com/ec2/testing/) e enviar um formulário de envio de eventos simulados. Isso faz com que o teste não seja executado, pois parece um evento de negação de serviço. 

 **Benefícios de implementar esta prática recomendada:** medir sua performance em um teste de carga mostrará onde você será afetado à medida que a carga aumentar. Com isso você terá a capacidade de antecipar as alterações necessárias antes que elas afetem sua workload. 

 **Nível de risco exposto se esta prática recomendada não for estabelecida:** Baixo 

## Orientação para implementação
Orientação para implementação

 O teste de carga na nuvem é um processo para medir a performance da workload na nuvem em condições realistas com a carga esperada do usuário. Esse processo envolve o provisionamento de um ambiente de nuvem semelhante ao de produção, o uso de ferramentas de teste de carga para gerar carga e a análise de métricas para avaliar a capacidade da workload de lidar com cargas realistas. Execute os testes de carga usando versões sintéticas ou limpas dos dados de produção (remova informações confidenciais ou de identificação). Realize testes de carga automaticamente como parte de seu pipeline de entrega e compare os resultados a KPIs e limites predefinidos. Esse processo ajuda você a continuar alcançando a performance necessária. 

### Etapas de implementação
Etapas de implementação
+ **Defina seus objetivos de teste:** identifique os aspectos de performance da workload que você deseja avaliar, como throughput e tempo de resposta. 
+ **Selecione uma ferramenta de teste:** escolha e configure a ferramenta de teste de carga adequada à workload. 
+ **Configure seu ambiente:** configure o ambiente de teste com base no ambiente de produção. É possível usar os serviços da AWS para executar ambientes em escala de produção para testar a arquitetura. 
+ **Implemente o monitoramento:** use ferramentas de monitoramento como o [Amazon CloudWatch](https://aws.amazon.com/cloudwatch/) para coletar métricas dos recursos em sua arquitetura. Você também pode coletar e publicar métricas personalizadas. 
+ **Defina cenários:** defina os cenários e parâmetros do teste de carga (como duração do teste e número de usuários). 
+ **Faça testes de carga:** realize cenários de teste em grande escala. Aproveite a Nuvem AWS para testar a workload e descobrir se há uma falha na escala ou se ela está com a escala reduzida horizontalmente de maneira não linear. Por exemplo, use instâncias spot para gerar cargas a um baixo custo e descobrir gargalos antes que eles ocorram em produção. 
+ **Analise os resultados do teste:** analise os resultados para identificar gargalos de performance e áreas para melhorias. 
+ **Documente e compartilhe descobertas:** documente e relate as descobertas e recomendações. Compartilhe essas informações com as partes interessadas para ajudá-las a tomar decisões embasadas sobre estratégias de otimização da performance. 
+ Faça **iterações contínuas:** o teste de carga deve ser realizado regularmente, especialmente após uma alteração ou atualização do sistema. 

## Recursos
Recursos

 **Documentos relacionados:** 
+  [Amazon CloudWatch RUM](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-RUM.html) 
+  [Amazon CloudWatch Synthetics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Synthetics_Canaries.html) 
+  [Teste de carga distribuída na AWS](https://docs.aws.amazon.com/solutions/latest/distributed-load-testing-on-aws/welcome.html) 

 **Vídeos relacionados:** 
+ [AWS Summit ANZ 2023: Acelere com confiança com o teste de carga distribuída da AWS](https://www.youtube.com/watch?v=4J6lVqa6Yh8)
+ [AWS re:Invent 2022: Escalar na AWS para seus primeiros 10 milhões de usuários ](https://www.youtube.com/watch?v=yrP3M4_13QM)
+  [Resolver com soluções da AWS: teste de carga distribuída](https://www.youtube.com/watch?v=Y-2rk0sSyOM) 
+ [AWS re:Invent 2021: Otimize aplicações com base em insights do usuário final com o Amazon CloudWatch RUM](https://www.youtube.com/watch?v=NMaeujY9A9Y)
+  [Demonstração do Amazon CloudWatch Synthetics](https://www.youtube.com/watch?v=hF3NM9j-u7I) 

 **Exemplos relacionados:** 
+  [Teste de carga distribuída na AWS](https://aws.amazon.com/solutions/implementations/distributed-load-testing-on-aws/) 

# PERF05-BP05 Usar automação para corrigir proativamente problemas relacionados a performance
PERF05-BP05 Usar automação para corrigir proativamente problemas relacionados a performance

 Use indicadores-chave de performance (KPIs), aliados a sistemas de monitoramento e alerta, para abordar proativamente problemas relacionados à performance. 

 **Práticas comuns que devem ser evitadas:** 
+  Você só permite que a equipe de operações faça alterações operacionais na workload. 
+  Você permite todos os filtros de alarmes para a equipe de operações, sem correção proativa. 

 **Benefícios de implementar esta prática recomendada:** a correção proativa de ações de alarme permite que a equipe de suporte se concentre nos itens que não são acionáveis automaticamente. Isso ajuda a equipe de operações a lidar com todos os alarmes sem ficar sobrecarregada e, em vez disso, se concentrar apenas nos alarmes críticos. 

 **Nível de risco exposto se esta prática recomendada não for estabelecida:** Baixo 

## Orientação para implementação
Orientação para implementação

 Sempre que possível, use alarmes para desencadear ações automatizadas visando corrigir problemas. Se a resposta automatizada não for possível, encaminhe o alarme para aqueles capazes de responder. Por exemplo, você pode ter um sistema capaz de prever os valores de indicadores-chave de performance (KPI) esperados e emitir um alarme quando eles ultrapassarem determinados limites, ou uma ferramenta capaz de interromper ou reverter automaticamente as implantações caso os KPIs estejam fora dos valores esperados. 

 Implemente processos que deem visibilidade à performance à medida que a workload estiver sendo executada. Para determinar se a performance da workload é ideal, crie painéis de monitoramento e estabeleça normas de linha de base para as expectativas de performance. 

### Etapas de implementação
Etapas de implementação
+ **Identifique o fluxo de trabalho de correção:** identifique e compreenda o problema de performance que pode ser corrigido automaticamente. Use soluções de monitoramento da AWS como o [Amazon CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) ou o AWS X-Ray para obter ajuda para entender melhor a causa-raiz do problema. 
+ **Defina o processo de automação:** crie um plano e um processo de correção detalhados que possam ser usados para corrigir automaticamente o problema. 
+ **Configure o evento de iniciação:** configure o evento para iniciar automaticamente o processo de correção. Por exemplo, você pode definir um acionador para reiniciar automaticamente uma instância quando ela atinge determinado limite de utilização da CPU. 
+ **Automatize a correção:** use serviços e tecnologias da AWS para automatizar o processo de correção. Por exemplo, o [AWS Systems Manager Automation](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-automation.html) fornece uma maneira segura e escalável de automatizar o processo de correção. Use a lógica de autocorreção para reverter as alterações se elas não conseguirem resolver o problema. 
+ **Teste o fluxo de trabalho:** teste o processo de correção automatizado em um ambiente de pré-produção. 
+ **Implemente o fluxo de trabalho:** implemente a correção automatizada no ambiente de produção. 
+ **Desenvolva um playbook:** desenvolva e documente um playbook que descreva as etapas do plano de correção, incluindo os eventos de iniciação, a lógica de correção e as ações tomadas. Treine as partes interessadas para ajudá-las a responder com eficácia aos eventos de correção automatizada. 
+ **Revise e refine:** avalie regularmente a eficácia do fluxo de trabalho automatizado de correção. Ajuste os eventos de iniciação e a lógica de correção, se necessário. 

## Recursos
Recursos

 **Documentos relacionados:** 
+  [Documentação do CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) 
+  [Parceiros de monitoramento, log e performance da AWS Partner Network](https://aws.amazon.com/devops/partner-solutions/#_Monitoring.2C_Logging.2C_and_Performance) 
+  [Documentação do X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html) 
+  [Usar alarmes e ações de alarme no CloudWatch](https://docs.aws.amazon.com/sdk-for-go/v1/developer-guide/cw-example-using-alarm-actions.html) 
+ [ Criar uma prática de automação de nuvem para excelência operacional: práticas recomendadas do AWS Managed Services](https://aws.amazon.com/blogs/mt/build-a-cloud-automation-practice-for-operational-excellence-best-practices-from-aws-managed-services/)
+ [Automatizar o ajuste de performance do Amazon Redshift com a otimização automática de tabelas](https://aws.amazon.com/blogs/big-data/automate-your-amazon-redshift-performance-tuning-with-automatic-table-optimization/)

 **Vídeos relacionados:** 
+ [AWS re:Invent 2023: Estratégias para escalação automatizada, correção e autocorreção inteligente](https://www.youtube.com/watch?v=nlGyIa3UQYU)
+ [AWS re:Invent 2023: [LANÇAMENTO] Monitoramento de aplicações para workloads modernas ](https://www.youtube.com/watch?v=T2TovTLje8w)
+ [AWS re:Invent 2023: Como implementar a observabilidade de aplicações ](https://www.youtube.com/watch?v=IcTcwUSwIs4)
+  [AWS re:Invent 2021: Automatizar de forma inteligente as operações na nuvem](https://www.youtube.com/watch?v=m0S8eAF0l54) 
+  [AWS re:Invent 2022: Configurar controles em escala em seu ambiente da AWS](https://www.youtube.com/watch?v=NkE9_okfPG8) 
+  [AWS re:Invent 2022: Automatizar o gerenciamento e a conformidade de patches usando a AWS](https://www.youtube.com/watch?v=gL3baXQJvc0) 
+  [AWS re:Invent 2022: Como a Amazon usa métricas melhores para aprimorar a performance de sites](https://www.youtube.com/watch?v=_uaaCiyJCFA&ab_channel=AWSEvents) 
+ [AWS re:Invent 2023: Relaxe: diagnostique e resolva problemas de performance com o Amazon RDS](https://www.youtube.com/watch?v=Ulj88e5Aqzg)
+ [AWS re:Invent 2021: \$1Novo lançamento\$1 Detecte e resolva problemas automaticamente com o Amazon DevOps Guru ](https://www.youtube.com/watch?v=iwQNQHwoXfk)
+ [AWS re:Invent 2023: Centralize suas operações](https://www.youtube.com/watch?v=9-RBjmhDdaM)

 **Exemplos relacionados:** 
+  [O CloudWatch Logs personaliza alarmes](https://github.com/awslabs/cloudwatch-logs-customize-alarms) 

# PERF05-BP06 Manter a workload e os serviços atualizados
PERF05-BP06 Manter a workload e os serviços atualizados

 Fique em dia com os novos serviços e atributos de nuvem para adotar recursos eficientes, remover problemas e melhorar a eficiência geral da performance da workload. 

 **Práticas comuns que devem ser evitadas:** 
+  Você pressupõe que sua arquitetura atual é estática e não será atualizada ao longo do tempo. 
+  Você não tem nenhum sistema ou ritmo regular para avaliar se software ou pacotes atualizados são compatíveis com sua workload. 

 **Benefícios de implementar esta prática recomendada:** ao estabelecer um processo para se atualizar sobre novos serviços e ofertas, você pode adotar novos atributos e recursos, resolver problemas e melhorar a performance da workload. 

 **Nível de risco exposto se esta prática recomendada não for estabelecida:** Baixo 

## Orientação para implementação
Orientação para implementação

 Avalie maneiras de melhorar a performance à medida que novos serviços, padrões de design e atributos de produtos são disponibilizados. Determine quais deles poderiam aprimorar a performance ou aumentar a eficiência da workload por meio de avaliações, discussões internas ou análises externas. Defina um processo para avaliar atualizações, novos recursos e serviços relevantes para sua workload. Por exemplo, crie uma prova de conceito que use novas tecnologias ou consulte um grupo interno. Ao testar novas ideias ou serviços, faça testes de performance para medir o impacto causado por eles na performance da workload. 

## Etapas de implementação
Etapas de implementação
+ **Faça o inventário da workload:** faça o inventário de software e arquitetura da workload e identifique os componentes que precisam ser atualizados. 
+ **Identifique fontes de atualizações:** identifique novidades e atualize fontes relacionadas aos componentes da workload. Como exemplo, você pode assinar [Novidades no blog da AWS](https://aws.amazon.com/new/) para ver os produtos que correspondem ao componente da sua workload. Você pode assinar o feed RSS ou gerenciar suas [assinaturas de e-mail](https://pages.awscloud.com/communication-preferences.html). 
+ **Defina um cronograma de atualizações:** defina um cronograma para avaliar novos serviços e atributos para a workload. 
  +  É possível usar o [AWS Systems Manager Inventory](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-inventory.html) para coletar metadados de sistema operacional (SO), aplicação e instância das instâncias do Amazon EC2 e entender rapidamente quais instâncias executam o software e as configurações exigidas pela política de software e quais instâncias precisam ser atualizadas. 
+ **Avalie a nova atualização:** entenda como atualizar os componentes da sua workload. Aproveite a agilidade da nuvem para testar rapidamente como novos recursos podem melhorar a workload com o intuito de obter eficiência de performance. 
+ **Use automação:** use automação no processo de atualização para reduzir o nível de esforço para implantar novos recursos e limitar erros causados por processos manuais. 
  +  É possível usar [CI/CD](https://aws.amazon.com/blogs/devops/complete-ci-cd-with-aws-codecommit-aws-codebuild-aws-codedeploy-and-aws-codepipeline/) para atualizar automaticamente AMIs, imagens de contêiner e outros artefatos relacionados à aplicação de nuvem. 
  +  Você pode usar ferramentas como o [AWS Systems Manager Patch Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-patch.html) para automatizar o processo de atualizações do sistema e agendar a atividade usando as [Janelas de Manutenção do AWS Systems Manager](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-maintenance.html). 
+ **Documente o processo:** documente seu processo para avaliar atualizações e novos serviços. Forneça aos proprietários o tempo e o espaço necessários para pesquisar, testar, experimentar e validar atualizações e novos serviços. Consulte novamente os KPIs e requisitos de negócios documentados para ajudar a priorizar qual atualização trará um impacto positivo à empresa. 

## Recursos
Recursos

 **Documentos relacionados:** 
+  [Blog da AWS](https://aws.amazon.com/blogs/) 
+  [Novidades da AWS](https://aws.amazon.com/new/?ref=wellarchitected) 
+ [ Implementar imagens atualizadas com pipelines automatizados do EC2 Image Builder ](https://aws.amazon.com/blogs/compute/implementing-up-to-date-images-with-automated-ec2-image-builder-pipelines/)

 **Vídeos relacionados:** 
+ [AWS re:Inforce 2022: Automatizar o gerenciamento e a conformidade de patches usando a AWS](https://www.youtube.com/watch?v=gL3baXQJvc0)
+ [ All Things Patch: AWS Systems Manager \$1 Eventos da AWS](https://www.youtube.com/watch?v=PhIiVsCEBu8)

 **Exemplos relacionados:** 
+ [ Gerenciamento de inventário e patches ](https://mng.workshop.aws/ssm/use-case-labs/inventory_patch_management.html)
+ [Workshop One Observability](https://catalog.workshops.aws/observability/en-US)

# PERF05-BP07 Revisar as métricas regularmente
PERF05-BP07 Revisar as métricas regularmente

 Como parte da manutenção de rotina, ou em resposta a eventos ou incidentes, revise quais métricas são coletadas. Use essas análises para identificar quais métricas foram essenciais para resolver problemas e quais métricas adicionais poderiam ajudar a identificar, resolver ou prevenir problemas se estivessem sendo acompanhadas. 

 **Práticas comuns que devem ser evitadas:** 
+  Você permite que as métricas permaneçam em um estado de alarme por um período prolongado. 
+  Você cria alarmes que não são acionáveis por um sistema de automação. 

 **Benefícios de implementar esta prática recomendada:** analise continuamente as métricas que estão sendo coletadas para garantir que identifiquem, resolvam ou evitem problemas corretamente. As métricas também podem se tornar obsoletas se você permitir que elas permaneçam em um estado de alarme por um período prolongado. 

 **Nível de risco exposto se esta prática recomendada não for estabelecida:** Médio 

## Orientação para implementação
Orientação para implementação

 Melhore constantemente a coleta e o monitoramento de métricas. Como parte da resposta a incidentes ou eventos, avalie as métricas que foram úteis para resolver o problema e quais poderiam ter ajudado, mas não estão sendo acompanhadas no momento. Use este método para aprimorar a qualidade das métricas coletadas para prevenir ou resolver incidentes futuros mais rapidamente. 

 Como parte da resposta a incidentes ou eventos, avalie as métricas que foram úteis para resolver o problema e quais poderiam ter ajudado, mas não estão sendo acompanhadas no momento. Use esses dados para aprimorar a qualidade das métricas coletadas para prevenir ou resolver incidentes futuros mais rapidamente. 

### Etapas de implementação
Etapas de implementação
+ **Defina métricas:** defina métricas críticas de performance para monitorar que estejam alinhadas aos objetivos da sua workload, incluindo métricas como tempo de resposta e utilização de recursos.
+ **Estabeleça linhas de base**: defina uma linha de base e um valor desejável para cada métrica. A linha de base deve fornecer pontos de referência para a identificação de desvios ou anomalias.
+ **Defina uma frequência:** defina uma frequência (como semanal ou mensal) para revisar as métricas essenciais. 
+ **Identifique problemas de performance:** durante cada revisão, avalie as tendências e o desvio dos valores base. Procure gargalos ou anomalias de performance. Para os problemas identificados, realize uma análise aprofundada da causa-raiz para entender o principal motivo do problema.
+ **Identifique ações corretivas:** use sua análise para identificar ações corretivas. Isso pode incluir ajuste de parâmetros, correção de bugs e ajustes na escala dos recursos.
+ **Documente as descobertas:** documente suas descobertas, incluindo problemas identificados, causas-raiz e ações corretivas.
+ **Itere e aprimore:** avalie e melhore constantemente o processo de revisão de métricas. Use a lição aprendida com a análise anterior para aprimorar o processo ao longo do tempo.

## Recursos
Recursos

 **Documentos relacionados:** 
+  [Documentação do CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/WhatIsCloudWatch.html) 
+  [Coletar métricas e logs de instâncias do Amazon EC2 e servidores on-premises com o CloudWatch Agent](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html?ref=wellarchitected) 
+ [Consultar métricas com o CloudWatch Metrics Insights](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/query_with_cloudwatch-metrics-insights.html)
+  [Parceiros de monitoramento, log e performance da AWS Partner Network](https://aws.amazon.com/devops/partner-solutions/#_Monitoring.2C_Logging.2C_and_Performance) 
+  [Documentação do X-Ray](https://docs.aws.amazon.com/xray/latest/devguide/aws-xray.html) 

 **Vídeos relacionados:** 
+  [AWS re:Invent 2022: Configurar controles em escala em seu ambiente da AWS](https://www.youtube.com/watch?v=NkE9_okfPG8) 
+  [AWS re:Invent 2022: Como a Amazon usa métricas melhores para aprimorar a performance de sites](https://www.youtube.com/watch?v=_uaaCiyJCFA&ab_channel=AWSEvents) 
+ [AWS re:Invent 2023: Criar uma estratégia efetiva de observabilidade ](https://www.youtube.com/watch?v=7PQv9eYCJW8)
+ [AWS Summit SF 2022: Observabilidade full-stack e monitoramento de aplicações com a AWS](https://www.youtube.com/watch?v=or7uFFyHIX0)
+ [AWS re:Invent 2023: Relaxe: diagnostique e resolva problemas de performance com o Amazon RDS](https://www.youtube.com/watch?v=Ulj88e5Aqzg)

 **Exemplos relacionados:** 
+  [Criar um painel com o Quick](https://github.com/aws-samples/amazon-quicksight-sdk-proserve) 
+ [ Painéis do CloudWatch ](https://catalog.us-east-1.prod.workshops.aws/workshops/a8e9c6a6-0ba9-48a7-a90d-378a440ab8ba/en-US/300-cloudwatch/340-cloudwatch-dashboards)