

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Solucione problemas do gerenciador de alertas com CloudWatch o Logs
<a name="Troubleshooting-alerting"></a>

Utilizando [Monitore eventos do Amazon Managed Service para Prometheus com registros CloudWatch](CW-logs.md), você pode solucionar problemas relacionados ao gerenciador de alertas e ao Ruler. Esta seção contém tópicos de solução de problemas relacionados ao gerenciador de alertas. 

**Topics**
+ [Aviso de alertas ativos](#Troubleshooting-alerting-active-alerts)
+ [Aviso de tamanho do grupo de agregação de alertas](#Troubleshooting-alerting-aggregation-group-size)
+ [Aviso de alerta muito grande](#Troubleshooting-alerting-size-too-big)
+ [Aviso de conteúdo vazio](#Troubleshooting-alerting-empty)
+ [Aviso de `key/value` inválido](#Troubleshooting-alerting-invalid-keyvalue)
+ [Aviso de limite de mensagens](#Troubleshooting-alerting-msg-limit)
+ [Nenhum erro da política baseada no recurso](#Troubleshooting-alerting-no-policy)
+ [Aviso não ASCII](#Troubleshooting-alerting-non-ASCII)
+ [Não autorizado a chamar o KMS](#Troubleshooting-alerting-no-access-kms)
+ [Erro de modelo](#Troubleshooting-template-error)

## Aviso de alertas ativos
<a name="Troubleshooting-alerting-active-alerts"></a>

**Quando o log contém o seguinte aviso**

```
{
    "workspaceId": "ws-efdc5b42-b051-11ec-b123-4567ac120002",
    "message": {
        "log": "too many alerts, limit: 1000",
        "level": "WARN"
    },
    "component": "alertmanager"
}
```

Isso significa que a cota de **alertas ativos** do gerenciador de alertas foi excedida.

**Medida a ser tomada**

Solicite um aumento da cota. Faça login Console de gerenciamento da AWS e abra o console Service Quotas em. [https://console.aws.amazon.com/servicequotas/](https://console.aws.amazon.com/servicequotas/)

## Aviso de tamanho do grupo de agregação de alertas
<a name="Troubleshooting-alerting-aggregation-group-size"></a>

**Quando o log contém o seguinte aviso**

```
{
    "workspaceId": "ws-efdc5b42-b051-11ec-b123-4567ac120002",
    "message": {
        "log": "Too many aggregation groups, cannot create new group for alert, groups=1000, limit=1000, alert=sample-alert",
        "level": "WARN"
    },
    "component": "alertmanager"
}
```

Isso significa que a cota de tamanho do grupo de agregação de alertas do gerenciador de alertas foi excedida.

**Medida a ser tomada**

Reduza o tamanho do grupo de agregação de alertas usando o parâmetro `group_by`. Para obter mais informações, consulte [Configurações relacionadas à rota](https://prometheus.io/docs/alerting/latest/configuration/) na *documentação do Prometheus*.

Também é possível solicitar um aumento da cota. Faça login Console de gerenciamento da AWS e abra o console Service Quotas em. [https://console.aws.amazon.com/servicequotas/](https://console.aws.amazon.com/servicequotas/)

## Aviso de alerta muito grande
<a name="Troubleshooting-alerting-size-too-big"></a>

**Quando o log contém o seguinte aviso**

```
{
    "workspaceId": "ws-efdc5b42-b051-11ec-b123-4567ac120002",
    "message": {
        "log": "alerts too big, total size limit: 20000000 bytes",
        "level": "WARN"
    },
    "component": "alertmanager"
}
```

Isso significa que a cota de alertas por espaço de trabalho do Alert Manager foi excedida.

**Medida a ser tomada**

Remova anotações e rótulos desnecessários para reduzir o tamanho do alerta.

## Aviso de conteúdo vazio
<a name="Troubleshooting-alerting-empty"></a>

**Quando o log contém o seguinte aviso**

```
{
   "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000",
   "message": {
       "log": "Message has been modified because the content was empty."
       "level": "WARN"
   },
   "component": "alertmanager"
}
```

Isso significa que o modelo do gerenciador de alertas resolveu o alerta de saída em uma mensagem vazia. 

**Medida a ser tomada**

Valide o seu modelo do gerenciador de alertas e garanta que você tenha um modelo válido para todos os caminhos do receptor. 

## Aviso de `key/value` inválido
<a name="Troubleshooting-alerting-invalid-keyvalue"></a>

**Quando o log contém o seguinte aviso**

```
{
   "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000",
   "message": {
       "log": "MessageAttributes has been removed because of invalid key/value, numberOfRemovedAttributes=1"
       "level": "WARN"
   },
   "component": "alertmanager"
}
```

Isso significa que alguns dos atributos da mensagem foram removidos por keys/values serem inválidos. 

**Medida a ser tomada**

Reavalie os modelos que você está usando para preencher os atributos da mensagem e certifique-se de que eles estão resultando em um atributo de mensagem do SNS válido. Para obter mais informações sobre como validar uma mensagem em um tópico do Amazon SNS, consulte o tópico [Validar SNS](https://docs.aws.amazon.com/sns/latest/api/API_Publish.html#API_Publish_RequestParameters)

## Aviso de limite de mensagens
<a name="Troubleshooting-alerting-msg-limit"></a>

**Quando o log contém o seguinte aviso**

```
{
   "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000",
   "message": {
       "log": "Message has been truncated because it exceeds size limit, originSize=266K, truncatedSize=12K"
       "level": "WARN"
   },
   "component": "alertmanager"
}
```

Isso significa que parte do tamanho da mensagem é muito grande. 

**Medida a ser tomada**

Veja o modelo de mensagem do receptor de alerta e reformule-o para caber dentro do limite de tamanho.

## Nenhum erro da política baseada no recurso
<a name="Troubleshooting-alerting-no-policy"></a>

**Quando o log contém o seguinte erro**

```
{
   "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000",
   "message": {
       "log": "Notify for alerts failed, AMP is not authorized to perform: SNS:Publish on resource: arn:aws:sns:us-west-2:12345:testSnsReceiver because no resource-based policy allows the SNS:Publish action"
       "level": "ERROR"
   },
   "component": "alertmanager"
}
```

Isso significa que o Amazon Managed Service for Prometheus não tem as permissões para enviar o alerta para o tópico do SNS especificado. 

**Medida a ser tomada**

Verifique se a política de acesso no tópico do Amazon SNS concede ao Amazon Managed Service for Prometheus a capacidade de enviar mensagens do SNS para o tópico. Crie uma política de acesso do SNS para que o serviço `aps.amazonaws.com` (Amazon Managed Service for Prometheus) acesse seu tópico do Amazon SNS. Para obter mais informações sobre políticas de acesso do SNS, consulte [Como usar a linguagem de políticas de acesso](https://docs.aws.amazon.com/sns/latest/dg/sns-access-policy-language-using.html) e [Casos de exemplo para o controle de acesso do Amazon SNS](https://docs.aws.amazon.com/sns/latest/dg/sns-access-policy-use-cases.html) no *Guia do desenvolvedor do Amazon Simple Notification Service*.

## Aviso não ASCII
<a name="Troubleshooting-alerting-non-ASCII"></a>

**Quando o log contém o seguinte aviso**

```
{
   "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000",
   "message": {
       "log": "Subject has been modified because it contains control or non-ASCII characters."
       "level": "WARN"
   },
   "component": "alertmanager"
}
```

Isso significa que o assunto tem caracteres não ASCII. 

**Medida a ser tomada**

Remova as referências no campo de assunto do seu modelo dos rótulos que possam conter caracteres não ASCII.

## Não autorizado a chamar o KMS
<a name="Troubleshooting-alerting-no-access-kms"></a>

**Quando o log contém o seguinte erro do AWS KMS **

```
{
   "workspaceId": "ws-abcd1234-ef56-78ab-cd90-1234abcd0000",
   "message": {
       "log": "Notify for alerts failed, AMP is not authorized to call KMS",
       "level": "ERROR"
   },
   "component": "alertmanager"
}
```

**Medida a ser tomada**

Valide se a política de chave da chave usada para criptografar o tópico do Amazon SNS permite que a entidade principal do serviço do Amazon Managed Service for Prometheus `aps.amazonaws.com` execute as seguintes ações: `kms:GenerateDataKey*` e `kms:Decrypt`. Para obter mais informações, consulte o tópico [Permissões do AWS KMS para SNS](https://docs.aws.amazon.com/sns/latest/dg/sns-key-management.html#sns-what-permissions-for-sse).

## Erro de modelo
<a name="Troubleshooting-template-error"></a>

**Quando o log contém o seguinte erro**

```
               {
   "workspaceId": "ws-efdc5b42-b051-11ec-b123-4567ac120002",
   "message": {
       "log": "Notify for alerts failed. There is an error in a receiver that is using templates in the AlertManager definition. Make sure that the syntax is correct and only template functions and variables that exist are used in the receiver 'default', sns_configs position #2, section 'attributes'"
       "level": "ERROR"
   },
   "component": "alertmanager"
}
```

Isso significa que há um erro em um modelo sendo usado na AlertManager definição. A entrada de erro contém instruções sobre qual receptor, a posição no sns\_configs e a propriedade que contém erros.

**Medida a ser tomada**

Valide sua definição do Alert Manager. Verifique se a sintaxe está correta e se você faz referência às variáveis e funções do modelo que existem. Para obter mais informações, consulte [Notification Template Reference](https://prometheus.io/docs/alerting/latest/notifications/) na documentação de código aberto do *Prometheus*.