View a markdown version of this page

Solução de problemas do métricas do Metrics Insights - Amazon CloudWatch

Solução de problemas do métricas do Metrics Insights

Os resultados incluem “Outros”, mas não tenho esse valor como uma dimensão

Isso significa que a consulta inclui uma cláusula GROUP BY que especifica uma chave de rótulo que não está sendo usada em algumas das métricas retornadas pela consulta. Nesse caso, um grupo nulo denominado Other é retornado. As métricas que não incluem essa chave de rótulo provavelmente são métricas agregadas que retornam valores agregados em todos os valores dessa chave de rótulo.

Por exemplo, suponha que tenhamos a seguinte consulta:

SELECT AVG(Faults) FROM MyCustomNamespace GROUP BY Operation, ServiceName

Se algumas das métricas retornadas não incluírem ServiceName como uma dimensão, elas são exibidas tendo Other como o valor para ServiceName.

Para evitar ver “Outros” em seus resultados, use SCHEMA na sua cláusula FROM, como no seguinte exemplo:

SELECT AVG(Faults) FROM SCHEMA(MyCustomNamespace, Operation) GROUP BY Operation, ServiceName

Isso limita os resultados retornados apenas às métricas que têm ambas as dimensões Operation e ServiceName.

O timestamp mais antigo no meu gráfico tem um valor de métrica menor do que os outros

O CloudWatch Metrics Insights oferece suporte a até duas semanas de dados históricos. Quando você faz um gráfico com um período maior que um minuto, pode haver casos em que o ponto de dados mais antigo difere do valor esperado. Isso ocorre porque as consultas do CloudWatch Metrics Insights retornam somente dados dentro do período de retenção de duas semanas. Nesse caso, o ponto de dados mais antigo na consulta retorna somente as observações que foram mensuradas no período de duas semanas, em vez de retornar todas as observações no período desse ponto de dados.

Valores inconsistentes de métricas em diferentes períodos de tempo ao usar consultas baseadas em tags

Ao usar as cláusulas WHERE ou GROUP BY com tags nas consultas do CloudWatch Metrics Insights, você pode ver valores diferentes de métricas, dependendo do período de tempo selecionado. Por exemplo, um período de 6 horas pode mostrar um valor de pico de 20, enquanto um período de 1 hora mostra apenas 2 para a mesma janela de tempo.

Isso ocorre porque os carimbos de data e hora das tags são armazenados com resolução de segundo nível, enquanto os pontos de dados de métricas são alinhados aos limites do período (por exemplo, o início de cada minuto ou hora). Para determinar quais pontos de dados correspondem a um intervalo de tempo de tags, o CloudWatch ajusta o início do intervalo subtraindo um período. Com períodos maiores, esse ajuste cria uma lacuna maior entre o carimbo de data e hora de tags e o primeiro ponto de dados incluído, o que pode fazer com que pontos de dados próximos ao início do intervalo sejam excluídos.

O exemplo a seguir mostra como isso afeta os resultados da consulta. Uma métrica tem dois valores de tag: env=beta (de 00:00 a 01:30) e env=gamma (de 01:30 a 03:00). Cada tag abrange 90 minutos de dados com um SUM de 270.

Dois grafos de métricas do CloudWatch comparando os resultados de consultas baseadas em tags com períodos de 1 minuto e 3 horas.
env=beta com período de 1 minuto
Estatística Esperados Returned Diferença
SUM270271+1
AVG3.03.00
MIN110
MAX550
SAMPLE_COUNT9091+1
env=gamma com período de 1 minuto
Estatística Esperados Returned Diferença
SUM2702755+
AVG3.03.00
MIN110
MAX550
SAMPLE_COUNT9091+1

Com um período de 1 minuto, o ajuste do alinhamento é pequeno (1 minuto), portanto, apenas 1 ponto de dados extra é incluído por tag. Com um período de 3 horas, o ajuste abrange todo o intervalo de consultas:

env=beta com período de 3 horas
Estatística Esperados Returned Diferença
SUM270540+270
AVG3.03.00
MIN110
MAX550
SAMPLE_COUNT90180+90
env=gamma com período de 3 horas
Estatística Esperados Returned Diferença
SUM270540+270
AVG3.03.00
MIN110
MAX550
SAMPLE_COUNT90180+90

Com o período de 3 horas, as duas tags retornam o conjunto de dados inteiro (SUM=540, SAMPLE_COUNT=180) porque o carimbo de data e hora do único ponto de dados agregado está dentro dos dois intervalos ajustados. O limite de tags é efetivamente apagado.

Para reduzir o impacto desse comportamento, tente as seguintes abordagens:

  • Use períodos de agregação menores. Períodos menores (como 1 minuto ou 5 minutos) alinham-se melhor à resolução de segundo nível dos carimbos de data e hora de tags, o que minimiza a lacuna de alinhamento e aumenta a probabilidade de que todos os pontos de dados relevantes sejam incluídos.

  • Use filtragem baseada em dimensões em vez de tags. Se seu caso de uso permitir, filtre por dimensões em vez de por tags. As consultas baseadas em dimensões não são afetadas por esse comportamento. Por exemplo, use WHERE InstanceId = 'i-1234567890abcdef0' em vez de WHERE tag."my-tag" = 'my-value'.

  • Consulte com uma granularidade consistente. Ao comparar dados de métricas em diferentes janelas de tempo, use o mesmo período para evitar diferenças inesperadas causadas pelo ajuste de alinhamento.