

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Crie um trabalho de AutoML para previsão de séries temporais com a API
<a name="autopilot-create-experiment-timeseries-forecasting"></a>

A previsão em machine learning se refere ao processo de prever resultados ou tendências futuras com base em dados e padrões históricos. Ao analisar dados de séries temporais anteriores e identificar padrões subjacentes, os algoritmos de machine learning podem fazer predições e fornecer informações valiosas sobre o comportamento futuro. Na previsão, o objetivo é desenvolver modelos que possam capturar com precisão a relação entre as variáveis de entrada e a variável alvo ao longo do tempo. Isso envolve examinar vários fatores, como tendências, sazonalidade e outros padrões relevantes nos dados. As informações coletadas são então usadas para treinar um modelo de Machine Learning. O modelo treinado é capaz de gerar predições pegando novos dados de entrada e aplicando os padrões e relacionamentos aprendidos. Ele pode fornecer previsões para uma ampla variedade de casos de uso, como projeções de vendas, tendências do mercado de ações, previsões meteorológicas, previsão de demanda e muito mais.

[As instruções a seguir mostram como criar um trabalho do Amazon SageMaker Autopilot como um experimento piloto para tipos de problemas de previsão de séries temporais usando SageMaker o API Reference.](https://docs.aws.amazon.com/sagemaker/latest/dg/autopilot-reference.html)

**nota**  
Tarefas como classificação de texto e imagem, previsão de séries temporais e ajuste de grandes modelos de linguagem estão disponíveis exclusivamente na versão 2 da [API REST do AutoML](autopilot-reference.md). Se sua linguagem preferida for Python, você pode se referir diretamente ao [AWS SDK para Python (Boto3) MLV2 ](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/sagemaker/client/create_auto_ml_job_v2.html)[objeto Auto](https://sagemaker.readthedocs.io/en/stable/api/training/automlv2.html#sagemaker.automl.automlv2.AutoMLV2) do Amazon SageMaker Python SDK.  
Os usuários que preferem a conveniência de uma interface de usuário podem usar o [Amazon SageMaker Canvas](https://docs.aws.amazon.com/sagemaker/latest/dg/canvas-getting-started.html) para acessar modelos pré-treinados e modelos básicos de IA generativos, ou criar modelos personalizados para textos específicos, classificação de imagens, necessidades de previsão ou IA generativa.

Você pode criar programaticamente um experimento de previsão de séries temporais do Autopilot chamando a [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJobV2.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJobV2.html)API em qualquer linguagem suportada pelo Amazon Autopilot ou pelo. SageMaker AWS CLI

Para obter informações sobre como essa ação da API se traduz em uma função no idioma de sua escolha, consulte a seção [Consulte também](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJobV2.html#API_CreateAutoMLJobV2_SeeAlso) de `CreateAutoMLJobV2` e escolha um SDK. Como exemplo, para usuários do Python, veja a sintaxe completa da solicitação de `[create\$1auto\$1ml\$1job\$1v2](https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/sagemaker.html#SageMaker.Client.create_auto_ml_job_v2)` em AWS SDK para Python (Boto3).

O Autopilot treina vários candidatos a modelo com sua série temporal alvo e, em seguida, seleciona um modelo de previsão ideal para uma determinada métrica objetiva. Depois que seus candidatos modelo forem treinados, você poderá encontrar as melhores métricas de candidatos na resposta a `[DescribeAutoMLJobV2](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeAutoMLJobV2.html)` em `[BestCandidate](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CandidateProperties.html#sagemaker-Type-CandidateProperties-CandidateMetrics)`.

As seções a seguir definem os parâmetros de solicitação de entrada obrigatórios e opcionais para a API `CreateAutoMLJobV2` usada na previsão de séries temporais.

**nota**  
Consulte o caderno [Time-Series Forecasting with Amazon SageMaker Autopilot](https://github.com/aws/amazon-sagemaker-examples/blob/main/autopilot/autopilot_time_series.ipynb) para ver um exemplo prático e prático de previsão de séries temporais. Neste notebook, você usa o Amazon SageMaker Autopilot para treinar um modelo de séries temporais e produzir previsões usando o modelo treinado. O caderno fornece instruções para recuperar um conjunto de dados pronto de dados históricos tabulares no Amazon S3.

## Pré-requisitos
<a name="autopilot-timeseries-forecasting-prerequisites"></a>

Antes de usar o piloto automático para criar um experimento de previsão de séries temporais em SageMaker IA, certifique-se de:
+ Preparar seu conjunto de dados de séries temporais. A preparação do conjunto de dados envolve coletar dados relevantes de várias fontes, limpá-los e filtrá-los para remover ruídos e inconsistências e organizá-los em um formato estruturado. Consulte [Formato de conjuntos de dados de séries temporais e métodos de preenchimento de valores ausentes](timeseries-forecasting-data-format.md) para saber mais sobre os requisitos de formatos de séries temporais no Autopilot. Opcionalmente, você pode complementar seu conjunto de dados com o calendário de feriados públicos do país de sua escolha para capturar os padrões associados. Para obter mais informações sobre calendários de feriados, consulte [Calendários de feriados nacionais](autopilot-timeseries-forecasting-holiday-calendars.md).
**nota**  
Recomendamos fornecer pelo menos 3 a 5 pontos de dados históricos para cada 1 ponto de dados futuro que você deseja prever. Por exemplo, para prever 7 dias à frente (horizonte de 1 semana) com base em dados diários, treine seu modelo com um mínimo de 21 a 35 dias de dados históricos. Certifique-se de fornecer dados suficientes para capturar padrões sazonais e recorrentes. 
+ Colocar seus dados de séries temporais em um bucket do Amazon S3.
+ Conceda acesso total ao bucket do Amazon S3 contendo seus dados de entrada para a função de execução de SageMaker IA usada para executar seu experimento. Feito isso, você pode usar o ARN desse perfil de execução nas solicitações da API do Autopilot.
  + Para obter informações sobre como recuperar sua função de execução de SageMaker IA, consulte[Obtenha um perfil de execução](sagemaker-roles.md#sagemaker-roles-get-execution-role).
  + Para obter informações sobre como conceder permissões de função de execução de SageMaker IA para acessar um ou mais buckets específicos no Amazon S3, *consulte Adicionar permissões adicionais do Amazon S3* a uma função de execução de IA em. SageMaker [Criar perfil de execução](sagemaker-roles.md#sagemaker-roles-create-execution-role)

## Parâmetros necessários
<a name="timeseries-forecasting-api-required-params"></a>

Ao chamar `[CreateAutoMLJobV2](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJobV2.html)` para criar um experimento de Autopilot para previsão de séries temporais, você deve fornecer os seguintes valores:
+ Um `[AutoMLJobName](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJobV2.html#API_CreateAutoMLJobV2_RequestSyntax)` para especificar o nome do seu trabalho. O nome deve ser do tipo `string` e ter um comprimento mínimo de 1 caractere e um comprimento máximo de 32.
+ Pelo menos um `[AutoMLJobChannel](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLJobChannel.html)` em `[AutoMLJobInputDataConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJobV2.html#sagemaker-CreateAutoMLJobV2-request-AutoMLJobInputDataConfig)` no qual você especifica o nome do bucket do Amazon S3 que contém seus dados. Opcionalmente, você pode especificar o conteúdo (arquivos CSV ou Parquet) e os tipos de compactação (GZip).
+ Um `[AutoMLProblemTypeConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJobV2.html#sagemaker-CreateAutoMLJobV2-request-AutoMLProblemTypeConfig)` dos tipos `[TimeSeriesForecastingJobConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TimeSeriesForecastingJobConfig.html)` para definir as configurações do seu trabalho de previsão de séries temporais. Em particular, você deve especificar:
  + A **frequência** das predições, que se refere à granularidade desejada (por hora, diariamente, mensalmente etc.) de sua predição.

    Os intervalos válidos são um número inteiro seguido de `Y` (ano), `M` (mês), `W` (semana), `D` (dia), `H` (hora) e `min` (minuto). Por exemplo, `1D` indica todos os dias e `15min` indica a cada 15 minutos. O valor de uma frequência não deve se sobrepor à próxima frequência maior. Por exemplo, você deve usar uma frequência de `1H` em vez de `60min`.

    Os valores válidos para cada frequência são os seguintes:
    + Minuto: 1 a 59
    + Hora: 1 a 23
    + Dia: 1 a 6
    + Semana: 1 a 4
    + Mês: 1 a 11
    + Ano: 1
  + O **horizonte** das predições em sua predição, que se refere ao número de etapas de tempo que o modelo prevê. O horizonte de predição também é chamado de comprimento da predição. O horizonte máximo de previsão é o menor de 500 intervalos de tempo ou 1/4 dos intervalos de tempo no conjunto de dados.
  + Um [TimeSeriesConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TimeSeriesConfig.html)no qual você define o esquema do seu conjunto de dados para mapear os cabeçalhos das colunas de acordo com sua previsão especificando:
    + R `TargetAttributeName`: A coluna que contém dados históricos do campo de destino a serem previstos.
    + R `TimestampAttributeName`: A coluna que contém um momento no qual o valor alvo de um determinado item é registrado.
    + R `ItemIdentifierAttributeName`: A coluna que contém os identificadores do item para o qual você deseja prever o valor alvo.

  Veja a seguir um exemplo desses parâmetros de solicitação. Neste exemplo, você está configurando uma previsão diária para a quantidade esperada ou o nível de demanda de itens específicos em um período de 20 dias.

  ```
  "AutoMLProblemTypeConfig": { 
          "ForecastFrequency": "D",
          "ForecastHorizon": 20,
          "TimeSeriesConfig": {
              "TargetAttributeName": "demand",
              "TimestampAttributeName": "timestamp",
              "ItemIdentifierAttributeName": "item_id"
          },
  ```
+ Um `[OutputDataConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLOutputDataConfig.html)` para especificar o caminho de saída do Amazon S3 para armazenar os artefatos do seu trabalho do AutoML.
+ Um `[RoleArn](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJob.html#sagemaker-CreateAutoMLJob-request-RoleArn)` para especificar o ARN da função usada para acessar seus dados. Você pode usar o ARN da função de execução à qual concedeu acesso aos seus dados.

Todos os outros parâmetros são opcionais. Por exemplo, você pode definir quantis de previsão específicos, escolher um método de preenchimento para valores ausentes no conjunto de dados ou definir como agregar dados que não estejam alinhados com a frequência da previsão. Para aprender como definir esses parâmetros adicionais, consulte [Parâmetros opcionais](#timeseries-forecasting-api-optional-params).

## Parâmetros opcionais
<a name="timeseries-forecasting-api-optional-params"></a>

As seções a seguir fornecem detalhes de alguns parâmetros opcionais que você pode passar para seu trabalho AutoML de previsão de séries temporais.

### Como especificar algoritmos
<a name="timeseries-forecasting-algorithms-selection"></a>

Por padrão, seu trabalho de Autopilot treina uma lista predefinida de algoritmos em seu conjunto de dados. Entretanto, você pode fornecer um subconjunto da seleção padrão de algoritmos.

Para a previsão de séries temporais, você deve escolher `[TimeSeriesForecastingJobConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TimeSeriesForecastingJobConfig.html)` como o tipo de `[AutoMLProblemTypeConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJobV2.html#sagemaker-CreateAutoMLJobV2-request-AutoMLProblemTypeConfig)`.

Em seguida, você pode especificar uma matriz de selecionados `AutoMLAlgorithms` no `AlgorithmsConfig` atributo de [CandidateGenerationConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CandidateGenerationConfig.html).

Veja a seguir um exemplo de um atributo da `AlgorithmsConfig` listando exatamente três algoritmos (“cnn-qr”, “prophet”, “arima”) em seu campo `AutoMLAlgorithms`.

```
{
   "[AutoMLProblemTypeConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJobV2.html#sagemaker-CreateAutoMLJobV2-request-AutoMLProblemTypeConfig)": {
        "[TimeSeriesForecastingJobConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TimeSeriesForecastingJobConfig.html)": {
          "[CandidateGenerationConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CandidateGenerationConfig.html)": {
            "[AlgorithmsConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CandidateGenerationConfig.html#sagemaker-Type-CandidateGenerationConfig-AlgorithmsConfig)":[
               {"[AutoMLAlgorithms](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLAlgorithmConfig.html)":["cnn-qr", "prophet", "arima"]}
            ]
         },
       },
     },
  }
```

Para ver a lista de algoritmos disponíveis para previsão de séries temporais, consulte [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLAlgorithmConfig.html#sagemaker-Type-AutoMLAlgorithmConfig-AutoMLAlgorithms](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLAlgorithmConfig.html#sagemaker-Type-AutoMLAlgorithmConfig-AutoMLAlgorithms). Para obter detalhes sobre cada algoritmo, consulte [Compatibilidade com algoritmos para previsão de séries temporais](timeseries-forecasting-algorithms.md).

### Como especificar quantis personalizados
<a name="timeseries-forecasting-custom-quantiles"></a>

O Autopilot treina 6 candidatos a modelos com sua série temporal alvo e, em seguida, combina esses modelos usando um método de conjunto de empilhamento para criar um modelo de previsão ideal para uma determinada métrica objetiva. Cada modelo de previsão do Autopilot gera uma previsão probabilística produzindo previsões em quantis entre P1 e P99. Esses quantis são usados para contabilizar a incerteza da previsão. Por padrão, as previsões serão geradas para 0,1 (`p10`), 0,5 (`p50`) e 0,9 (`p90`). Você pode optar por especificar seus próprios quantis. 

No piloto automático, você pode especificar até cinco quantis de previsão de 0,01 (`p1`) a 0,99 (`p99`), por incrementos de 0,01 ou mais no atributo de. `ForecastQuantiles` [TimeSeriesForecastingJobConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TimeSeriesForecastingJobConfig.html)

Neste exemplo, você está configurando uma previsão diária das porcentagens 10, 25, 50, 75 e 90 para a quantidade ou nível de demanda esperado de itens específicos durante um período de 20 dias.

```
"AutoMLProblemTypeConfig": { 
        "ForecastFrequency": "D",
        "ForecastHorizon": 20,
        "ForecastQuantiles": ["p10", "p25", "p50", "p75", "p90"],
        "TimeSeriesConfig": {
            "TargetAttributeName": "demand",
            "TimestampAttributeName": "timestamp",
            "ItemIdentifierAttributeName": "item_id"
        },
```

### Como agregar dados para diferentes frequências de previsão
<a name="timeseries-forecasting-aggregation"></a>

Para criar um modelo de previsão (também conhecido como o melhor candidato de seu experimento), você deve especificar uma frequência de previsão. A frequência da predição determina a frequência das predições em suas predições. Por exemplo, previsões mensais de vendas. O melhor modelo do Autopilot pode gerar previsões para frequências de dados maiores do que a frequência na qual seus dados são registrados.

Durante o treinamento, o Autopilot agrega todos os dados que não estão alinhados com a frequência de previsão que você especifica. Por exemplo, você pode ter alguns dados diários, mas especificar uma frequência de previsão semanal. O Autopilot alinha os dados diários com base na semana em que eles pertencem. O Autopilot então o combina em um único registro para cada semana.

Durante a agregação, o método de transformação padrão é somar os dados. Você pode configurar a agregação ao criar sua tarefa AutoML no atributo `Transformations` de. [TimeSeriesForecastingJobConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TimeSeriesForecastingJobConfig.html) Os métodos de agregação compatíveis são `sum` (padrão), `avg`, `first`, `min`, `max`. A agregação só é compatível com a coluna de destino.

No exemplo a seguir, você configura a agregação para calcular a média das previsões promocionais individuais para fornecer os valores finais agregados da previsão.

```
"Transformations": {
            "Aggregation": {
                "promo": "avg"
            }
        }
```

### Como processar valores ausentes em seus conjuntos de dados de origem
<a name="timeseries-forecasting-fill-missing-values"></a>

O Autopilot fornece vários métodos de preenchimento para processar valores ausentes no alvo e em outras colunas numéricas de seus conjuntos de dados de séries temporais. Para obter informações sobre a lista de métodos de preenchimento compatíveis e sua lógica de preenchimento disponível, consulte [Processamento de valores ausentes](timeseries-forecasting-data-format.md#timeseries-missing-values).

Você configura sua estratégia de preenchimento no `Transformations` atributo de [TimeSeriesForecastingJobConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TimeSeriesForecastingJobConfig.html)ao criar sua tarefa de AutoML.

Para definir um método de preenchimento, você precisa fornecer um par de valores-chave:
+ A chave é o nome da coluna para a qual você deseja especificar o método de preenchimento.
+ O valor associado à chave é um objeto que define a estratégia de preenchimento dessa coluna.

Você pode especificar vários métodos de preenchimento para uma única coluna.

Para definir um valor específico para o método de preenchimento, você deve definir o parâmetro de preenchimento para o valor do método de preenchimento desejado (por exemplo `"backfill" : "value"`) e definir o valor real de preenchimento em um parâmetro adicional com o sufixo “\$1value”. Por exemplo, para definir `backfill` com o valor de `2`, você deve incluir dois parâmetros: `"backfill": "value"` e `"backfill_value":"2"`.

No seguinte exemplo, você especifica a estratégia de preenchimento para a coluna de dados incompleta, “preço”, da seguinte forma: Todos os valores ausentes entre o primeiro ponto de dados de um item e o último são definidos para `0` após o qual todos os valores ausentes são preenchidos com o valor `2` até a data final do conjunto de dados.

```
"Transformations": {
            "Filling": {
                "price": {
                        "middlefill" : "zero",
                        "backfill" : "value",
                        "backfill_value": "2"
                }
            }
        }
```

### Como especificar uma métrica objetiva
<a name="timeseries-forecasting-set-objective-metric"></a>

O Autopilot produz métricas de precisão para avaliar os candidatos ao modelo e ajudar você a escolher quais usar para gerar previsões. Ao realizar um experimento de previsão de séries temporais, você pode escolher o AutoML para permitir que o Autopilot otimize o preditor para você ou pode escolher manualmente um algoritmo para seu preditor.

Por padrão, o Autopilot usa a perda quantílica ponderada média. No entanto, você pode configurar a métrica do objetivo ao criar sua tarefa AutoML no `MetricName` atributo [MLJobAuto](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLJobObjective.html) Objective.

Para ver a lista de algoritmos disponíveis, consulte [Compatibilidade com algoritmos para previsão de séries temporais](timeseries-forecasting-algorithms.md).

### Como incorporar informações de feriados nacionais ao seu conjunto de dados
<a name="timeseries-forecasting-add-holiday-calendar"></a>

No Autopilot, você pode incorporar um conjunto de dados projetado por atributos de informações de feriados nacionais à sua série temporal. O Autopilot fornece apoio nativo para os calendários de feriados de mais de 250 países. Depois de escolher um país, o Autopilot aplica o calendário de feriados desse país a cada item do seu conjunto de dados durante o treinamento. Isso permite que o modelo identifique padrões associados a feriados específicos.

Você pode ativar a caracterização de férias ao criar sua tarefa AutoML passando um [HolidayConfigAttributes](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_HolidayConfigAttributes.html)objeto para o atributo de. `HolidayConfig` [TimeSeriesForecastingJobConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_TimeSeriesForecastingJobConfig.html) O objeto `HolidayConfigAttributes` contém o atributo `CountryCode` de duas letras que determina o país do calendário público de feriados nacionais usado para aumentar seu conjunto de dados de séries temporais.

Consulte [Código do país](autopilot-timeseries-forecasting-holiday-calendars.md#holiday-country-codes) para obter a lista de calendários compatíveis e o código do país correspondente.

### Como habilitar a implantação automática
<a name="timeseries-forecasting-auto-model-deployment"></a>

O Autopilot permite que você implante automaticamente seu modelo de previsão em um endpoint. Para habilitar a implantação automática para o melhor candidato a modelo de um trabalho do AutoML, inclua um `[ModelDeployConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateAutoMLJobV2.html#sagemaker-CreateAutoMLJobV2-request-ModelDeployConfig)` na solicitação de trabalho do AutoML. Isso permite a implantação do melhor modelo em um endpoint de SageMaker IA. Abaixo estão as configurações disponíveis para personalização.
+ Para permitir que o Autopilot gere o nome do endpoint, defina `[AutoGenerateEndpointName](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ModelDeployConfig.html#API_ModelDeployConfig_Contents)` como `True`.
+ Para fornecer seu próprio nome para o endpoint, defina `[AutoGenerateEndpointName](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ModelDeployConfig.html#API_ModelDeployConfig_Contents) to False and provide a name of your choice in [EndpointName](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ModelDeployConfig.html#API_ModelDeployConfig_Contents)`.

### Como configurar o AutoML para iniciar um trabalho remoto no EMR Sem Servidor para grandes conjuntos de dados
<a name="autopilot-set-emr-serverless-api-forecasting"></a>

Você pode configurar o seu trabalho AutoML V2 para iniciar automaticamente um trabalho remoto no Amazon EMR Sem Servidor quando recursos computacionais adicionais forem necessários para processar grandes conjuntos de dados. Ao fazer a transição perfeita para o EMR Sem Servidor quando necessário, o trabalho do AutoML pode lidar com conjuntos de dados que, de outra forma, excederiam os recursos inicialmente provisionados, sem nenhuma intervenção manual de sua parte. O EMR Sem Servidor está disponível para os tipos de problemas tabulares e de séries temporais. Recomendamos configurar essa opção para conjuntos de dados de séries temporais maiores que 30 GB.

Para permitir que o seu trabalho de AutoML V2 faça a transição automática para o EMR Sem Servidor de um grande conjunto de dados, você precisa fornecer um objeto `EmrServerlessComputeConfig`, que inclua um campo `ExecutionRoleARN`, para a `AutoMLComputeConfig` da solicitação de entrada do trabalho de AutoML V2.

Esse `ExecutionRoleARN` é o ARN do perfil do IAM que concede ao trabalho de AutoML V2 as permissões necessárias para executar trabalhos do EMR Sem Servidor.

Esse perfil deve ter a seguinte relação de confiança:

------
#### [ JSON ]

****  

```
{
    "Version":"2012-10-17",		 	 	 
    "Statement": [
        {
            "Effect": "Allow",
            "Principal": {
                "Service": "emr-serverless.amazonaws.com"
            },
            "Action": "sts:AssumeRole"
        }
    ]
}
```

------

E conceder as permissões para:
+ Criar, listar e atualizar aplicações do EMR Sem Servidor.
+ Iniciar, listar, obter ou cancelar execuções de trabalhos em uma aplicação do EMR Sem Servidor.
+ Marcar os recursos do EMR Sem Servidor.
+ Passar um perfil do IAM para o serviço do EMR Sem Servidor para execução.

  Ao conceder a permissão `iam:PassRole`, o trabalho de AutoML V2 pode assumir temporariamente o perfil `EMRServerlessRuntimeRole-*` e passá-lo para o serviço EMR Sem Servidor. Essas são as funções do IAM usadas pelos ambientes de execução de tarefas do EMR Serverless para acessar outros AWS serviços e recursos necessários durante o tempo de execução, como o Amazon S3 para acesso a dados, registro em log, CloudWatch acesso ao catálogo de dados ou outros serviços com base em AWS Glue seus requisitos de carga de trabalho.

  Consulte [Perfis de runtime do trabalho para o Amazon EMR Sem Servidor](https://docs.aws.amazon.com/emr/latest/EMR-Serverless-UserGuide/security-iam-runtime-role.html) para obter detalhes sobre as permissões deste perfil.

A política do IAM definida no documento JSON fornecido concede essas permissões:

------
#### [ JSON ]

****  

```
{
    "Version":"2012-10-17",		 	 	 
    "Statement": [{
           "Sid": "EMRServerlessCreateApplicationOperation",
           "Effect": "Allow",
           "Action": "emr-serverless:CreateApplication",
           "Resource": "arn:aws:emr-serverless:*:*:/*",
            "Condition": {
                "StringEquals": {
                    "aws:RequestTag/sagemaker:is-canvas-resource": "True",
                    "aws:ResourceAccount": "${aws:PrincipalAccount}"
                }
            }
        },
        {
            "Sid": "EMRServerlessListApplicationOperation",
            "Effect": "Allow",
            "Action": "emr-serverless:ListApplications",
            "Resource": "arn:aws:emr-serverless:*:*:/*",
            "Condition": {
                "StringEquals": {
                    "aws:ResourceAccount": "${aws:PrincipalAccount}"
                }
            }
        },
        {
            "Sid": "EMRServerlessApplicationOperations",
            "Effect": "Allow",
            "Action": [
                "emr-serverless:UpdateApplication",
                "emr-serverless:GetApplication"
            ],
            "Resource": "arn:aws:emr-serverless:*:*:/applications/*",
            "Condition": {
                "StringEquals": {
                    "aws:ResourceTag/sagemaker:is-canvas-resource": "True",
                    "aws:ResourceAccount": "${aws:PrincipalAccount}"
                }
            }
        },
        {
            "Sid": "EMRServerlessStartJobRunOperation",
            "Effect": "Allow",
            "Action": "emr-serverless:StartJobRun",
            "Resource": "arn:aws:emr-serverless:*:*:/applications/*",
            "Condition": {
                "StringEquals": {
                    "aws:RequestTag/sagemaker:is-canvas-resource": "True",
                    "aws:ResourceAccount": "${aws:PrincipalAccount}"
                }
            }
        },
        {
            "Sid": "EMRServerlessListJobRunOperation",
            "Effect": "Allow",
            "Action": "emr-serverless:ListJobRuns",
            "Resource": "arn:aws:emr-serverless:*:*:/applications/*",
            "Condition": {
                "StringEquals": {
                    "aws:ResourceTag/sagemaker:is-canvas-resource": "True",
                    "aws:ResourceAccount": "${aws:PrincipalAccount}"
                }
            }
        },
        {
            "Sid": "EMRServerlessJobRunOperations",
            "Effect": "Allow",
            "Action": [
                "emr-serverless:GetJobRun",
                "emr-serverless:CancelJobRun"
            ],
            "Resource": "arn:aws:emr-serverless:*:*:/applications/*/jobruns/*",
            "Condition": {
                "StringEquals": {
                    "aws:ResourceTag/sagemaker:is-canvas-resource": "True",
                    "aws:ResourceAccount": "${aws:PrincipalAccount}"
                }
            }
        },
        {
            "Sid": "EMRServerlessTagResourceOperation",
            "Effect": "Allow",
            "Action": "emr-serverless:TagResource",
            "Resource": "arn:aws:emr-serverless:*:*:/*",
            "Condition": {
                "StringEquals": {
                    "aws:RequestTag/sagemaker:is-canvas-resource": "True",
                    "aws:ResourceAccount": "${aws:PrincipalAccount}"
                }
            }
        },
        {
            "Sid": "IAMPassOperationForEMRServerless",
            "Effect": "Allow",
            "Action": "iam:PassRole",
            "Resource": "arn:aws:iam::*:role/EMRServerlessRuntimeRole-*",
            "Condition": {
                "StringEquals": {
                    "iam:PassedToService": "emr-serverless.amazonaws.com",
                    "aws:ResourceAccount": "${aws:PrincipalAccount}"
                }
            }
         }
    ]
}
```

------

# Formato de conjuntos de dados de séries temporais e métodos de preenchimento de valores ausentes
<a name="timeseries-forecasting-data-format"></a>

Dados de séries temporais referem-se a uma coleção de observações ou medições registradas em intervalos regulares de tempo. Nesse tipo de dado, cada observação é associada a um registro de data e hora específico ou período de tempo, criando uma sequência de pontos de dados ordenados cronologicamente.

As colunas específicas que você inclui em seu conjunto de dados de séries temporais dependem dos objetivos de sua análise e dos dados disponíveis para você. No mínimo, os dados de séries temporais são compostos por uma tabela de 3 colunas em que:
+ Uma coluna contém identificadores exclusivos atribuídos a itens individuais para se referir ao seu valor em um momento específico.
+ Outra coluna representa o point-in-time valor ou a **meta** para registrar o valor de um determinado item em um momento específico. Depois que o modelo é treinado nesses valores-alvo, essa coluna de destino contém os valores que o modelo prevê em uma frequência especificada dentro de um horizonte definido.
+ E uma coluna de carimbo de data/hora é incluída para registrar a data e a hora em que o valor foi medido.
+ Colunas adicionais podem conter outros fatores que podem influenciar o desempenho da previsão. Por exemplo, em um conjunto de dados de série temporal para varejo em que a meta são as vendas ou a receita, você pode incluir atributos que forneçam informações sobre unidades vendidas, ID do produto, localização da loja, contagem de clientes, níveis de estoque, bem como indicadores covariáveis, como dados meteorológicos ou informações demográficas.

**nota**  
Você pode adicionar um conjunto de dados projetado por atributos de informações sobre feriados nacionais à sua série temporal. Ao incluir feriados em seu modelo de séries temporais, você pode capturar os padrões periódicos que os feriados criam. Isso ajuda suas previsões a refletir melhor a sazonalidade subjacente de seus dados. Para obter informações sobre os calendários disponíveis por país, consulte [Calendários de feriados nacionais](autopilot-timeseries-forecasting-holiday-calendars.md)

## Formato de conjuntos de dados para previsão de séries temporais
<a name="timeseries-format"></a>

O Autopilot é compatível com tipos de dados numéricos, categóricos, de texto e de data e hora. O tipo de dados da coluna de destino deve ser numérico.

O Autopilot é compatível com dados de séries temporais formatados como arquivos CSV (padrão) ou como arquivos Parquet.
+ **CSV** (comma-separated-values) é um formato de arquivo baseado em linhas que armazena dados em texto simples legível por humanos, o que é uma escolha popular para troca de dados, pois são suportados por uma ampla variedade de aplicativos.
+ O **Parquet** é um formato de arquivo baseado em colunas em que os dados são armazenados e processados com mais eficiência do que os formatos de arquivo baseados em linhas. Isso os torna uma opção melhor para problemas de big data.

Para obter mais informações sobre os limites de recursos em conjuntos de dados de séries temporais para previsão no Autopilot, consulte [Limites de recursos de previsão de séries temporais do Autopilot](timeseries-forecasting-limits.md).

## Processamento de valores ausentes
<a name="timeseries-missing-values"></a>

Um problema comum nos dados de previsão de séries temporais é a presença de valores ausentes. Seus dados podem conter valores ausentes por vários motivos, incluindo falhas de medição, problemas de formatação, erros humanos ou falta de informações para registro. Por exemplo, se você estiver prevendo a demanda de produtos para uma loja de varejo e um item estiver esgotado ou indisponível, não haverá dados de vendas para registrar enquanto esse item estiver esgotado. Se prevalentes o suficiente, os valores ausentes podem afetar significativamente a precisão de um modelo.

O Autopilot fornece vários métodos de preenchimento para processar valores ausentes, com abordagens distintas para a coluna de destino e outras colunas adicionais. Preenchimento é o processo de adicionar valores padronizados a entradas ausentes em seu conjunto de dados.

Consulte [Como processar valores ausentes em seus conjuntos de dados de origem](autopilot-create-experiment-timeseries-forecasting.md#timeseries-forecasting-fill-missing-values) para saber como definir o método para preencher valores ausentes em seu conjunto de dados de séries temporais.

O Autopilot é compatível com os seguintes métodos de preenchimento:
+ **Preenchimento frontal**: preenche todos os valores ausentes entre o primeiro ponto de dados registrado entre todos os itens e o ponto inicial de cada item (cada item pode começar em um horário diferente). Isso garante que os dados de cada item estejam completos e se estendam desde o primeiro ponto de dados registrado até o respectivo ponto de partida.
+ **Preenchimento intermediário:** preenche todos os valores faltantes entre as datas de início e término dos itens no conjunto de dados.
+ **Preenchimento posterior**: preenche todos os valores ausentes entre o último ponto de dados de cada item (cada item pode parar em um horário diferente) e o último ponto de dados registrado entre todos os itens.
+ **Preenchimento futuro**: preenche todos os valores faltantes entre o último ponto de dados registrado entre todos os itens e o final do horizonte de previsão.

A imagem a seguir fornece uma representação visual dos diferentes métodos de preenchimento.

![\[Os diferentes métodos de preenchimento para previsão de séries temporais no Amazon SageMaker Autopilot.\]](http://docs.aws.amazon.com/pt_br/sagemaker/latest/dg/images/autopilot/autopilot-forecast-filling-methods.png)


### Escolha uma lógica de preenchimento
<a name="filling-logic"></a>

Ao escolher uma lógica de preenchimento, você deve considerar como a lógica será interpretada por seu modelo. Por exemplo, em um cenário de varejo, registrar 0 vendas de um item disponível é diferente de registrar 0 vendas de um item indisponível, pois esse último não implica em uma falta de interesse do cliente no item. Por isso, o preenchimento `0` na coluna da série temporal de destino pode fazer com que o previsor seja subtendencioso em suas predições, enquanto o preenchimento `NaN` pode ignorar ocorrências reais de 0 itens disponíveis que estão sendo vendidos e fazer com que o previsor seja excessivamente tendencioso.

### Lógica de preenchimento
<a name="filling-restrictions"></a>

Você pode realizar o preenchimento da coluna de destino e de outras colunas numéricas em seus conjuntos de dados. As colunas de destino têm diretrizes e restrições de preenchimento diferentes das demais colunas numéricas.

Diretrizes de preenchimento


| Tipo de coluna | Preencher por padrão? | Métodos de preenchimento compatíveis | Lógica de preenchimento padrão | Lógica de preenchimento aceita | 
| --- | --- | --- | --- | --- | 
| Coluna de destino | Sim | Preenchimento intermediário e retroativo | 0 |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/pt_br/sagemaker/latest/dg/timeseries-forecasting-data-format.html)  | 
| Outras colunas numéricas | Não | Preenchimento intermediário, retroativo e futuro | Sem padrão |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/pt_br/sagemaker/latest/dg/timeseries-forecasting-data-format.html)  | 

**nota**  
Para as colunas de destino e outras colunas numéricas, `mean`, `median`, `min` e `max` são calculados com base em uma janela contínua das 64 entradas de dados mais recentes antes dos valores ausentes.

# Calendários de feriados nacionais
<a name="autopilot-timeseries-forecasting-holiday-calendars"></a>

O Autopilot oferece apoio a um conjunto de dados projetado por atributos de informações de feriados nacionais que fornece acesso aos calendários de feriados de mais de 250 países. Os atributos do calendário de feriados são especialmente úteis no domínio do varejo, onde os feriados podem afetar significativamente a demanda. A seção a seguir lista os códigos de país que você pode usar para acessar os calendários de feriados de cada país compatível.

Consulte [Como incorporar informações de feriados nacionais ao seu conjunto de dados](autopilot-create-experiment-timeseries-forecasting.md#timeseries-forecasting-add-holiday-calendar) para saber como adicionar um calendário ao seu conjunto de dados.

## Código do país
<a name="holiday-country-codes"></a>

O Autopilot fornece apoio nativo para os calendários de feriados públicos dos seguintes países: Use o **Código do País** ao especificar um país com a API.


| País | Código do país | 
| --- | --- | 
|   Afeganistão   |   AF   | 
|   Ilhas Åland   |   AX   | 
|   Albânia   |   AL   | 
|   Argélia   |   DZ   | 
|   Samoa Americana   |   AS   | 
|   Andorra   |   AD   | 
|   Angola   |   AO   | 
|   Anguila   |   AI   | 
|   Antártica   |   AQ   | 
|   Antígua e Barbuda   |   AG   | 
|   Argentina   |   AR   | 
|   Armênia   |   AM   | 
|   Aruba   |   AW   | 
|   Austrália   |   AU   | 
|   Áustria   |   AT   | 
|   Azerbaijão   |   AZ   | 
|   Bahamas   |   BS   | 
|   Bahrein   |   BH   | 
|   Bangladesh   |   BD   | 
|   Barbados   |   BB   | 
|   Bielorrússia   |   BY   | 
|   Bélgica   |   BE   | 
|   Belize   |   BZ   | 
|   Benin   |   BJ   | 
|   Bermudas   |   BM   | 
|   Butão   |   BT   | 
|   Bolívia   |   BO   | 
|   Bósnia e Herzegovina   |   BA   | 
|   Botsuana   |   BW   | 
|   Ilha Bouvet   |   BV   | 
|   Brasil   |   BR   | 
|   Território Britânico do Oceano Índico   |   IO   | 
|   Ilhas Virgens Britânicas   |   VG   | 
|   Brunei Darussalam   |   BN   | 
|   Bulgária   |   BG   | 
|   Burkina Faso   |   BF   | 
|   Burundi   |   BI   | 
|   Camboja   |   KH   | 
|   Camarões   |   CM   | 
|   Canadá   |   CA   | 
|   Cabo Verde   |   CV   | 
|   Países Baixos Caribenhos   |   BQ   | 
|   Ilhas Cayman   |   KY   | 
|   República Centro-Africana   |   CF   | 
|   Chade   |   TD   | 
|   Chile   |   CL   | 
|   China   |   CN   | 
|   Ilha Christmas   |   CX   | 
|   Ilhas Cocos (Keeling)   |   CC   | 
|   Colômbia   |   CO   | 
|   Comores   |   KM   | 
|   Ilhas Cook   |   CK   | 
|   Costa Rica   |   CR   | 
|   Croácia   |   HR   | 
|   Cuba   |   CU   | 
|   Curaçau   |   CW   | 
|   Chipre   |   CY   | 
|   Tchéquia   |   CZ   | 
|   República Democrática do Congo   |   CD   | 
|   Dinamarca   |   DK   | 
|   Djibuti   |   DJ   | 
|   Dominica   |   DM   | 
|   República Dominicana   |   DO   | 
|   Equador   |   EC   | 
|   Egito   |   EG   | 
|   El Salvador   |   SV   | 
|   Guiné Equatorial   |   GQ   | 
|   Eritreia   |   ER   | 
|   Estônia   |   EE   | 
|   Essuatíni   |   SZ   | 
|   Etiópia   |   ET   | 
|   Ilhas Falkland   |   FK   | 
|   Ilhas Faroe   |   FO   | 
|   Fiji   |   FJ   | 
|   Finlândia   |   FI   | 
|   França   |   FR   | 
|   Guiana Francesa   |   GF   | 
|   Polinésia Francesa   |   PF   | 
|   Territórios Franceses do Sul   |   TF   | 
|   Gabão   |   GA   | 
|   Gâmbia   |   GM   | 
|   Geórgia   |   GE   | 
|   Alemanha   |   DE   | 
|   Gana   |   GH   | 
|   Gibraltar   |   GI   | 
|   Grécia   |   GR   | 
|   Groenlândia   |   GL   | 
|   Granada   |   GD   | 
|   Guadalupe   |   GP   | 
|   Guam   |   GU   | 
|   Guatemala   |   GT   | 
|   Guernsey   |   GG   | 
|   Guiné   |   GN   | 
|   Guiné-Bissau   |   GW   | 
|   Guiana   |   GY   | 
|   Haiti   |   HT   | 
|   Ilha Heard e McDonald Ilhas   |   HM   | 
|   Honduras   |   HN   | 
|   Hong Kong   |   HK   | 
|   Hungria   |   HU   | 
|   Islândia   |   IS   | 
|   Índia   |   IN   | 
|   Indonésia   |   ID   | 
|   Irã   |   IR   | 
|   Iraque   |   IQ   | 
|   Irlanda   |   IE   | 
|   Ilha de Man   |   IM   | 
|   Israel   |   IL   | 
|   Itália   |   IT   | 
|   Costa do Marfim   |   CI   | 
|   Jamaica   |   JM   | 
|   Japão   |   JP   | 
|   Jérsei   |   JE   | 
|   Jordânia   |   JO   | 
|   Cazaquistão   |   KZ   | 
|   Quênia   |   KE   | 
|   Quiribati   |   KI   | 
|   Kosovo   |   XK   | 
|   Kuwait   |   KW   | 
|   Quirguistão   |   KG   | 
|   Laos   |   LA   | 
|   Letônia   |   LV   | 
|   Líbano   |   LB   | 
|   Lesoto   |   LS   | 
|   Libéria   |   LR   | 
|   Líbia   |   LY   | 
|   Liechtenstein   |   LI   | 
|   Lituânia   |   LT   | 
|   Luxemburgo   |   LU   | 
|   Macau   |   MO   | 
|   Madagascar   |   MG   | 
|   Malawi   |   MW   | 
|   Malásia   |   MY   | 
|   Ilhas Maldivas   |   MV   | 
|   Mali   |   ML   | 
|   Malta   |   MT   | 
|   Ilhas Marshall   |   MH   | 
|   Martinica   |   MQ   | 
|   Mauritânia   |   MR   | 
|   Ilhas Maurício   |   MU   | 
|   Mayotte   |   YT   | 
|   México   |   MX   | 
|   Micronésia   |   FM   | 
|   Moldávia   |   MD   | 
|   Mônaco   |   MC   | 
|   Mongólia   |   MN   | 
|   Montenegro   |   ME   | 
|   Montserrat   |   MS   | 
|   Marrocos   |   MA   | 
|   Moçambique   |   MZ   | 
|   Mianmar   |   MM   | 
|   Namíbia   |   NA   | 
|   Nauru   |   NR   | 
|   Nepal   |   NP   | 
|   Holanda   |   NL   | 
|   Nova Caledônia   |   NC   | 
|   Nova Zelândia   |   NZ   | 
|   Nicarágua   |   NI   | 
|   Níger   |   NE   | 
|   Nigéria   |   NG   | 
|   Niue   |   NU   | 
|   Ilha Norfolk   |   NF   | 
|   Coreia do Norte   |   KP   | 
|   Macedônia do Norte   |   MK   | 
|   Ilhas Marianas do Norte   |   MP   | 
|   Noruega   |   NO   | 
|   Omã   |   OM   | 
|   Paquistão   |   PK   | 
|   Palau   |   PW   | 
|   Palestina   |   PS   | 
|   Panamá   |   PA   | 
|   Papua Nova Guiné   |   PG   | 
|   Paraguai   |   PY   | 
|   Peru   |   PE   | 
|   Filipinas   |   PH   | 
|   Ilhas Pitcairn   |   PN   | 
|   Polônia   |   PL   | 
|   Portugal   |   PT   | 
|   Porto Rico   |   PR   | 
|   Catar   |   QA   | 
|   República do Congo   |   CG   | 
|   Reunião   |   RE   | 
|   Romênia   |   RO   | 
|   Federação Russa   |   RU   | 
|   Ruanda   |   RW   | 
|   São Bartolomeu   |   BL   | 
|   "Santa Helena, Ascensão e Tristão da Cunha"   |   SH   | 
|   São Cristóvão e Nevis   |   KN   | 
|   Santa Lúcia   |   LC   | 
|   São Martinho   |   MF   | 
|   Saint Pierre e Miquelon   |   PM   | 
|   São Vicente e Granadinas   |   VC   | 
|   Samoa   |   WS   | 
|   São Marinho   |   SM   | 
|   São Tomé e Príncipe   |   ST   | 
|   Arábia Saudita   |   SA   | 
|   Senegal   |   SN   | 
|   Sérvia   |   RS   | 
|   Seichelles   |   SC   | 
|   Serra Leoa   |   SL   | 
|   Cingapura   |   SG   | 
|   Sint Maarten   |   SX   | 
|   Eslováquia   |   SK   | 
|   Eslovênia   |   SI   | 
|   Ilhas Salomão   |   SB   | 
|   Somália   |   SO   | 
|   África do Sul   |   ZA   | 
|   Ilhas Geórgia do Sul e Sandwich do Sul   |   GS   | 
|   Coreia do Sul   |   KR   | 
|   Sudão do Sul   |   SS   | 
|   Espanha   |   ES   | 
|   Sri Lanka   |   LK   | 
|   Sudão   |   SD   | 
|   Suriname   |   SR   | 
|   Svalbard e Jan Mayen   |   SJ   | 
|   Suécia   |   SE   | 
|   Suíça   |   CH   | 
|   República Árabe da Síria   |   SY   | 
|   Taiwan   |   TW   | 
|   Tajiquistão   |   TJ   | 
|   Tanzânia   |   TZ   | 
|   Tailândia   |   TH   | 
|   Timor-Leste   |   TL   | 
|   Togo   |   TG   | 
|   Toquelau   |   TK   | 
|   Tonga   |   TO   | 
|   Trinidad e Tobago   |   TT   | 
|   Tunísia   |   TN   | 
|   Turquia   |   TR   | 
|   Turcomenistão   |   TM   | 
|   Ilhas Turcas e Caicos   |   TC   | 
|   Tuvalu   |   TV   | 
|   Uganda   |   UG   | 
|   Ucrânia   |   UA   | 
|   Emirados Árabes Unidos   |   AE   | 
|   Reino Unido   |   UK   | 
|   Nações Unidas   |   UN   | 
|   Estados Unidos   |   US   | 
|   Ilhas Menores Distantes dos Estados Unidos   |   UM   | 
|   Ilhas Virgens Americanas   |   VI   | 
|   Uruguai   |   UY   | 
|   Uzbequistão   |   UZ   | 
|   Vanuatu   |   VU   | 
|   Cidade do Vaticano   |   VA   | 
|   Venezuela   |   VE   | 
|   Vietnã   |   VN   | 
|   Wallis e Futuna   |   WF   | 
|   Saara Ocidental   |   EH   | 
|   Iêmen   |   YE   | 
|   Zâmbia   |   ZM   | 
|   Zimbábue   |   ZW   | 

# Métricas objetivas
<a name="timeseries-objective-metric"></a>

O Autopilot produz métricas de precisão para avaliar os candidatos ao modelo e ajudar você a escolher quais usar para gerar previsões. Você pode deixar que o Autopilot otimize o preditor para você ou pode escolher manualmente um algoritmo para seu preditor. Por padrão, o Autopilot usa a perda quantílica ponderada média.

A lista a seguir contém os nomes das métricas atualmente disponíveis para medir o desempenho dos modelos para previsão de séries temporais.

**`RMSE`**  
Erro quadrático médio (RMSE): Mede a raiz quadrada da diferença quadrada entre os valores previstos e reais. É calculado como a média de todos os valores. É uma métrica importante para indicar a presença de grandes erros e valores atípicos no modelo. Os valores variam de zero (0) ao infinito, com números menores indicando um melhor ajuste do modelo aos dados. O RMSE depende da escala e não deve ser usado para comparar conjuntos de dados de tamanhos diferentes.

**`wQL`**  
Perda quantil ponderada (wQL): Avalia a precisão da previsão medindo as diferenças absolutas ponderadas entre os quantis P10, P50 e P90 previstos e reais, com valores mais baixos indicando melhor desempenho.

**`Average wQL (default)`**  
Média da perda quantil ponderada (wQL médio): Avalia a previsão calculando a média da precisão nos quantis P10, P50 e P90. Um valor mais baixo indica um modelo mais preciso.

**`MASE`**  
Erro médio absoluto em escala (MASE): O erro médio absoluto da previsão normalizado pelo erro médio absoluto de um método simples de previsão de linha de base. Um valor mais baixo indica um modelo mais preciso, onde MASE < 1 é estimado como melhor do que a linha de base e MASE > 1 é estimado como pior do que a linha de base.

**`MAPE`**  
Erro percentual absoluto médio (MAPE): O erro percentual (diferença percentual do valor médio previsto versus o valor real) calculado em média em todos os pontos temporais. Um valor menor indica um modelo mais preciso, onde MAPE = 0 é um modelo sem erros.

**`WAPE`**  
Erro percentual absoluto ponderado (WAPE): A soma do erro absoluto normalizado pela soma da meta absoluta, que mede o desvio geral dos valores previstos dos valores observados. Um valor mais baixo indica um modelo mais preciso.

# Compatibilidade com algoritmos para previsão de séries temporais
<a name="timeseries-forecasting-algorithms"></a>

O Autopilot treina os seis algoritmos integrados a seguir com sua série temporal alvo. Em seguida, usando um método de conjunto de empilhamento, ele combina esses candidatos a modelos para criar um modelo de previsão ideal para uma determinada métrica objetiva.
+ **Rede Neural Convolucional - Regressão Quantílica (CNN-QR) - CNN-QR** é um algoritmo de aprendizado de máquina proprietário para prever séries temporais usando redes neurais convolucionais causais (). CNNs O CNN-QR funciona melhor com grandes conjuntos de dados contendo centenas de séries temporais.
+ **DeepAr\$1** — O DeepAr\$1 é um algoritmo de aprendizado de máquina proprietário para prever séries temporais usando redes neurais recorrentes (). RNNs O DeepAR\$1 funciona melhor com grandes conjuntos de dados contendo centenas de séries temporais de atributos.
+ **Prophet**: [Prophet](https://facebook.github.io/prophet/) é um conhecido modelo local de séries temporais estruturais bayesianas baseado em um modelo aditivo em que as tendências não lineares se ajustam à sazonalidade anual, semanal e diária. O algoritmo Prophet do Autopilot usa a [classe Prophet](https://facebook.github.io/prophet/docs/quick_start.html#python-ap) da implementação do Python de Prophet. Funciona melhor com séries temporais com fortes efeitos sazonais e várias temporadas de dados históricos. 
+ **Non-Parametric Time Series (NPTS)**: O algoritmo proprietário do NPTS é um previsor de linha de base probabilístico e escalável. Ele prevê a distribuição de um valor futuro de uma determinada série temporal por amostragem de observações passadas. O NPTS é especialmente útil quando se trabalha com séries temporais esparsas ou intermitentes. 
+ **Autoregressive Integrated Moving Average (ARIMA)**: O ARIMA é um algoritmo de estatísticas locais comumente usado para previsões de série temporais. O algoritmo captura várias estruturas temporais padrão (organizações com padrão de tempo) no conjunto de dados de entrada. É especialmente útil para conjuntos de dados simples com menos de 100 séries temporais. 
+ **Exponential Smoothing (ETS)**: O ETS é um algoritmo de estatísticas locais comumente usado para previsão de séries temporais. O algoritmo é especialmente útil para conjuntos de dados simples com menos de 100 séries temporais e conjuntos de dados com padrões de sazonalidade. O ETS calcula uma média ponderada sobre todas as observações no conjunto de dados de séries temporais como sua predição, com ponderações que diminuem exponencialmente ao longo do tempo.

# Previsão de um modelo de Autopilot implantado
<a name="timeseries-forecasting-deploy-models"></a>

Depois de treinar os modelos com a API do AutoML, você pode implantá-los para previsões em tempo real ou baseadas em lotes. 

O API AutoML treina vários candidatos a modelo com os dados de séries temporais e seleciona um modelo de previsão ideal para uma determinada métrica objetiva. Depois que seus candidatos modelo forem treinados, você poderá encontrar o melhor candidato na resposta [DescribeAutoMLJobV2](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeAutoMLJobV2.html) em [BestCandidate](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLCandidate.html#sagemaker-Type-AutoMLCandidate-CandidateName).

Para obter predições usando esse modelo de melhor desempenho, você pode configurar um endpoint para obter predições de forma interativa ou usar a predição em lote para fazer predições em um lote das observações.

**Considerações**
+ Ao fornecer dados de entrada para previsão, o esquema de seus dados deve permanecer o mesmo usado para treinar seu modelo, incluindo o número de colunas, cabeçalhos de colunas e tipos de dados. Você pode prever um item novo ou existente IDs dentro do mesmo intervalo de timestamp ou de um intervalo de data e hora diferente para prever um período de tempo diferente.
+ Os modelos de previsão preveem os pontos do horizonte de previsão no futuro especificados na solicitação de entrada no treinamento, que vão da *data final alvo* até a *data final alvo \$1 horizonte de previsão*. Para usar o modelo para prever datas específicas, você deve fornecer os dados no mesmo formato dos dados de entrada originais, estendendo-se até uma *data final específica*. Nesse cenário, o modelo começará a prever a partir da nova data de término prevista.

  Por exemplo, se seu conjunto de dados tivesse dados mensais de janeiro a junho com um horizonte de previsão de 2, o modelo preveria o valor alvo para os próximos 2 meses, que seriam julho e agosto. Se em agosto você quiser prever para os próximos 2 meses, desta vez seus dados de entrada devem ser de janeiro a agosto e o modelo fará a previsão para os próximos 2 meses (setembro, outubro).
+ Ao prever pontos de dados futuros, não há um mínimo definido para a quantidade de dados históricos. Inclua dados suficientes para capturar padrões sazonais e recorrentes em suas séries temporais.

**Topics**
+ [Previsão em tempo real](timeseries-forecasting-realtime.md)
+ [Previsão em lote](timeseries-forecasting-batch.md)

# Previsão em tempo real
<a name="timeseries-forecasting-realtime"></a>

A previsão em tempo real é útil quando você precisa gerar previsões on-the-fly, como para aplicativos que exigem respostas imediatas ou ao fazer previsões para pontos de dados individuais.

Ao implantar o modelo AutoML como um endpoint em tempo real, você pode gerar predições sob demanda e minimizar a latência entre o recebimento de novos dados e a obtenção de predições. Isso torna a previsão em tempo real adequada para aplicações que exigem recursos de previsão imediatos, personalizados ou orientados por eventos.

Para previsão em tempo real, o conjunto de dados deve ser um subconjunto do conjunto de dados de entrada. O endpoint em tempo real tem um tamanho de dados de entrada de aproximadamente 6 MB e uma limitação de tempo limite de resposta de 60 segundos. Recomendamos trazer um ou alguns itens por vez.

Você pode usar SageMaker APIs para recuperar o melhor candidato de um trabalho do AutoML e, em seguida, criar SageMaker um endpoint de IA usando esse candidato.

Como alternativa, você pode escolher a opção de implantação automática ao criar seu experimento de Autopilot. Para obter informações sobre como configurar a implantação automática de modelos, consulte [Como habilitar a implantação automática](autopilot-create-experiment-timeseries-forecasting.md#timeseries-forecasting-auto-model-deployment).

**Para criar um endpoint de SageMaker IA usando seu melhor candidato a modelo:**

1. 

**Recupere os detalhes do trabalho de AutoML.**

   O exemplo de AWS CLI comando a seguir usa a API [DescribeAutoMLJobV2](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeAutoMLJobV2.html) para obter detalhes da tarefa do AutoML, incluindo as informações sobre o melhor candidato a modelo.

   ```
   aws sagemaker describe-auto-ml-job-v2 --auto-ml-job-name job-name --region region
   ```

1. 

**Extraia a definição do contêiner [InferenceContainers](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLCandidate.html#sagemaker-Type-AutoMLCandidate-InferenceContainers)para o melhor candidato a modelo.**

   Uma definição de contêiner é o ambiente em contêiner usado para hospedar o modelo de SageMaker IA treinado para fazer previsões.

   ```
   BEST_CANDIDATE=$(aws sagemaker describe-auto-ml-job-v2 \
     --auto-ml-job-name job-name 
     --region region \
     --query 'BestCandidate.InferenceContainers[0]' \
     --output json
   ```

   Esse comando extrai a definição do contêiner para o melhor candidato a modelo e a armazena na variável `BEST_CANDIDATE`.

1. 

**Crie um modelo de SageMaker IA usando a melhor definição de contêiner candidato.**

   Use as definições de contêiner das etapas anteriores para criar um modelo de SageMaker IA usando a [CreateModel](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateModel.html)API.

   ```
   aws sagemaker create-model \
               --model-name 'your-candidate-name>' \
               --primary-container "$BEST_CANDIDATE"
               --execution-role-arn 'execution-role-arn>' \
               --region 'region>
   ```

   O `--execution-role-arn` parâmetro especifica a função do IAM que a SageMaker IA assume ao usar o modelo para inferência. Para obter detalhes sobre as permissões necessárias para essa função, consulte [CreateModel API: Permissões da função de execução](https://docs.aws.amazon.com/).

1. 

**Crie uma configuração de endpoint de SageMaker IA usando o modelo.**

   O AWS CLI comando a seguir usa a [CreateEndpointConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateEndpointConfig.html)API para criar uma configuração de endpoint.

   ```
   aws sagemaker create-endpoint-config \
     --production-variants file://production-variants.json \
     --region 'region'
   ```

   Onde o arquivo `production-variants.json` contém a configuração do modelo, incluindo o nome do modelo e o tipo de instância.
**nota**  
Recomendamos usar instâncias [m5.12xlarge](https://aws.amazon.com/ec2/instance-types/m5/) para previsão em tempo real.

   ```
   [
       {
         "VariantName": "variant-name",
         "ModelName": "model-name",
         "InitialInstanceCount": 1,
         "InstanceType": "m5.12xlarge"
       }
     ]
   }
   ```

1. 

**Crie o endpoint de SageMaker IA usando a configuração do endpoint.**

   O AWS CLI exemplo a seguir usa a [CreateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateEndpoint.html)API para criar o endpoint.

   ```
   aws sagemaker create-endpoint \
               --endpoint-name 'endpoint-name>' \
               --endpoint-config-name 'endpoint-config-name' \
               --region 'region'
   ```

   Verifique o progresso da implantação do endpoint de inferência em tempo real usando a [DescribeEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeEndpoint.html)API. Veja o AWS CLI comando a seguir como exemplo.

   ```
   aws sagemaker describe-endpoint \
               --endpoint-name 'endpoint-name' \
               --region 'region'
   ```

   Depois que `EndpointStatus` muda para `InService`, o endpoint está pronto para ser usado para inferência em tempo real.

1. 

**Invoque o endpoint de SageMaker IA para fazer previsões.**

   ```
   aws sagemaker invoke-endpoint \
               --endpoint-name 'endpoint-name' \ 
               --region 'region' \
               --body file://input-data-in-bytes.json \
               --content-type 'application/json' outfile
   ```

   Onde o arquivo `input-data-in-bytes.json` contém os dados de entrada para a predição.

# Previsão em lote
<a name="timeseries-forecasting-batch"></a>

A predição em lote, também conhecida como inferência offline, gera predições de modelo em um lote de observações. A inferência em lote é uma boa opção para grandes conjuntos de dados ou se você não precisar de uma resposta imediata a uma solicitação de predição de modelo.

Por outro lado, a inferência online (inferência em tempo real) gera predições em tempo real. 

Você pode usar SageMaker APIs para recuperar o melhor candidato de um trabalho do AutoML e, em seguida, enviar um lote de dados de entrada para inferência usando esse candidato.

1. 

**Recupere os detalhes do trabalho de AutoML.**

   O exemplo de AWS CLI comando a seguir usa a API [DescribeAutoMLJobV2](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeAutoMLJobV2.html) para obter detalhes da tarefa do AutoML, incluindo as informações sobre o melhor candidato a modelo.

   ```
   aws sagemaker describe-auto-ml-job-v2 --auto-ml-job-name job-name --region region
   ```

1. 

**Extraia a definição do contêiner [InferenceContainers](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_AutoMLCandidate.html#sagemaker-Type-AutoMLCandidate-InferenceContainers)para o melhor candidato a modelo.**

   Uma definição de contêiner é o ambiente em contêiner usado para hospedar o modelo de SageMaker IA treinado para fazer previsões.

   ```
   BEST_CANDIDATE=$(aws sagemaker describe-auto-ml-job-v2 \
         --auto-ml-job-name job-name 
         --region region \
         --query 'BestCandidate.InferenceContainers[0]' \
         --output json
   ```

   Esse comando extrai a definição do contêiner para o melhor candidato a modelo e a armazena na variável `BEST_CANDIDATE`.

1. 

**Crie um modelo de SageMaker IA usando a melhor definição de contêiner candidato.**

   Use as definições de contêiner das etapas anteriores para criar um modelo de SageMaker IA usando a [CreateModel](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateModel.html)API.

   ```
   aws sagemaker create-model \
         --model-name 'model-name' \
         --primary-container "$BEST_CANDIDATE"
         --execution-role-arn 'execution-role-arn>' \
         --region 'region>
   ```

   O `--execution-role-arn` parâmetro especifica a função do IAM que a SageMaker IA assume ao usar o modelo para inferência. Para obter detalhes sobre as permissões necessárias para essa função, consulte [CreateModel API: Permissões da função de execução](https://docs.aws.amazon.com/).

1. 

**Crie um trabalho transformador em lote.**

   O exemplo a seguir cria um trabalho de transformação usando a [CreateTransformJob](https://docs.aws.amazon.com/cli/latest/reference/sagemaker/create-transform-job.html)API. 

   ```
   aws sagemaker create-transform-job \ 
          --transform-job-name 'transform-job-name' \
          --model-name 'model-name'\
          --transform-input file://transform-input.json \
          --transform-output file://transform-output.json \
          --transform-resources file://transform-resources.json \
          --region 'region'
   ```

   Os detalhes de entrada, saída e recursos são definidos em arquivos JSON separados:
   + `transform-input.json`:

     ```
     {
       "DataSource": {
         "S3DataSource": {
           "S3DataType": "S3Prefix",
           "S3Uri": "s3://my-input-data-bucket/path/to/input/data"
         }
       },
       "ContentType": "text/csv",
       "SplitType": "None"
     }
     ```
   + `transform-output.json`:

     ```
     {
       "S3OutputPath": "s3://my-output-bucket/path/to/output",
       "AssembleWith": "Line"
     }
     ```
   + `transform-resources.json`:
**nota**  
Para previsão em lote, use instâncias [m5.12xlarge](https://aws.amazon.com/ec2/instance-types/m5/) para workloads de uso geral e instâncias `m5.24xlarge` para tarefas de previsão de big data.

     ```
     {
       "InstanceType": "instance-type",
       "InstanceCount": 1
     }
     ```

1. 

**Monitore o progresso do seu trabalho de transformação usando a [DescribeTransformJob](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTransformJob.html)API.**

   Veja o AWS CLI comando a seguir como exemplo.

   ```
   aws sagemaker describe-transform-job \
         --transform-job-name 'transform-job-name' \
         --region region
   ```

1. 

**Recuperação da saída da transformação em lote.**

   Depois de concluído o trabalho, o resultado previsto estará disponível em `S3OutputPath`. 

   O nome do arquivo resultante tem o seguinte formato: `input_data_file_name.out`. Por exemplo, se seu arquivo de entrada for `text_x.csv`, o nome de saída será `text_x.csv.out`.

   ```
   aws s3 ls s3://my-output-bucket/path/to/output/
   ```

Os exemplos de código a seguir ilustram o uso do AWS SDK para Python (boto3) e do SDK para previsão em lote. AWS CLI 

------
#### [ AWS SDK for Python (boto3) ]

 O exemplo a seguir usa o **AWS SDK para Python (boto3)** para fazer predições em lotes.

```
import sagemaker 
import boto3

session = sagemaker.session.Session()

sm_client = boto3.client('sagemaker', region_name='us-west-2')
role = 'arn:aws:iam::1234567890:role/sagemaker-execution-role'
output_path = 's3://test-auto-ml-job/output'
input_data = 's3://test-auto-ml-job/test_X.csv'

best_candidate = sm_client.describe_auto_ml_job_v2(AutoMLJobName=job_name)['BestCandidate']
best_candidate_containers = best_candidate['InferenceContainers']
best_candidate_name = best_candidate['CandidateName']

# create model
reponse = sm_client.create_model(
    ModelName = best_candidate_name,
    ExecutionRoleArn = role,
    Containers = best_candidate_containers 
)

# Lauch Transform Job
response = sm_client.create_transform_job(
    TransformJobName=f'{best_candidate_name}-transform-job',
    ModelName=model_name,
    TransformInput={
        'DataSource': {
            'S3DataSource': {
                'S3DataType': 'S3Prefix',
                'S3Uri': input_data
            }
        },
        'ContentType': "text/csv",
        'SplitType': 'None'
    },
    TransformOutput={
        'S3OutputPath': output_path,
        'AssembleWith': 'Line',
    },
    TransformResources={
        'InstanceType': 'ml.m5.2xlarge',
        'InstanceCount': 1,
    },
)
```

O trabalho de inferência em lote retorna uma resposta no formato a seguir.

```
{'TransformJobArn': 'arn:aws:sagemaker:us-west-2:1234567890:transform-job/test-transform-job',
 'ResponseMetadata': {'RequestId': '659f97fc-28c4-440b-b957-a49733f7c2f2',
  'HTTPStatusCode': 200,
  'HTTPHeaders': {'x-amzn-requestid': '659f97fc-28c4-440b-b957-a49733f7c2f2',
   'content-type': 'application/x-amz-json-1.1',
   'content-length': '96',
   'date': 'Thu, 11 Aug 2022 22:23:49 GMT'},
  'RetryAttempts': 0}}
```

------
#### [ AWS Command Line Interface (AWS CLI) ]

1. **Obtenha as definições do melhor contêiner candidato**.

   ```
   aws sagemaker describe-auto-ml-job-v2 --auto-ml-job-name 'test-automl-job' --region us-west-2
   ```

1. **Crie o modelo**.

   ```
   aws sagemaker create-model --model-name 'test-sagemaker-model'
   --containers '[{
       "Image": "348316444620.dkr.ecr.us-west-2.amazonaws.com/sagemaker-sklearn-automl:2.5-1-cpu-py3",
       "ModelDataUrl": "s3://amzn-s3-demo-bucket/out/test-job1/data-processor-models/test-job1-dpp0-1-e569ff7ad77f4e55a7e549a/output/model.tar.gz",
       "Environment": {
           "AUTOML_SPARSE_ENCODE_RECORDIO_PROTOBUF": "1",
           "AUTOML_TRANSFORM_MODE": "feature-transform",
           "SAGEMAKER_DEFAULT_INVOCATIONS_ACCEPT": "application/x-recordio-protobuf",
           "SAGEMAKER_PROGRAM": "sagemaker_serve",
           "SAGEMAKER_SUBMIT_DIRECTORY": "/opt/ml/model/code"
       }
   }, {
       "Image": "348316444620.dkr.ecr.us-west-2.amazonaws.com/sagemaker-xgboost:1.3-1-cpu-py3",
       "ModelDataUrl": "s3://amzn-s3-demo-bucket/out/test-job1/tuning/flicdf10v2-dpp0-xgb/test-job1E9-244-7490a1c0/output/model.tar.gz",
       "Environment": {
           "MAX_CONTENT_LENGTH": "20971520",
           "SAGEMAKER_DEFAULT_INVOCATIONS_ACCEPT": "text/csv",
           "SAGEMAKER_INFERENCE_OUTPUT": "predicted_label", 
           "SAGEMAKER_INFERENCE_SUPPORTED": "predicted_label,probability,probabilities" 
       }
   }, {
       "Image": "348316444620.dkr.ecr.us-west-2.amazonaws.com/sagemaker-sklearn-automl:2.5-1-cpu-py3", 
       "ModelDataUrl": "s3://amzn-s3-demo-bucket/out/test-job1/data-processor-models/test-job1-dpp0-1-e569ff7ad77f4e55a7e549a/output/model.tar.gz", 
       "Environment": { 
           "AUTOML_TRANSFORM_MODE": "inverse-label-transform", 
           "SAGEMAKER_DEFAULT_INVOCATIONS_ACCEPT": "text/csv", 
           "SAGEMAKER_INFERENCE_INPUT": "predicted_label", 
           "SAGEMAKER_INFERENCE_OUTPUT": "predicted_label", 
           "SAGEMAKER_INFERENCE_SUPPORTED": "predicted_label,probability,labels,probabilities", 
           "SAGEMAKER_PROGRAM": "sagemaker_serve", 
           "SAGEMAKER_SUBMIT_DIRECTORY": "/opt/ml/model/code" 
       } 
   }]' \
   --execution-role-arn 'arn:aws:iam::1234567890:role/sagemaker-execution-role' \
   --region 'us-west-2'
   ```

1. **Criação de um trabalho de transformação**.

   ```
   aws sagemaker create-transform-job --transform-job-name 'test-tranform-job'\
    --model-name 'test-sagemaker-model'\
    --transform-input '{
           "DataSource": {
               "S3DataSource": {
                   "S3DataType": "S3Prefix",
                   "S3Uri": "s3://amzn-s3-demo-bucket/data.csv"
               }
           },
           "ContentType": "text/csv",
           "SplitType": "None"
       }'\
   --transform-output '{
           "S3OutputPath": "s3://amzn-s3-demo-bucket/output/",
           "AssembleWith": "Line"
       }'\
   --transform-resources '{
           "InstanceType": "ml.m5.2xlarge",
           "InstanceCount": 1
       }'\
   --region 'us-west-2'
   ```

1. **Verificação do progresso do trabalho de transformação**. 

   ```
   aws sagemaker describe-transform-job --transform-job-name  'test-tranform-job' --region us-west-2
   ```

   A seguir está a resposta do trabalho de transformação.

   ```
   {
       "TransformJobName": "test-tranform-job",
       "TransformJobArn": "arn:aws:sagemaker:us-west-2:1234567890:transform-job/test-tranform-job",
       "TransformJobStatus": "InProgress",
       "ModelName": "test-model",
       "TransformInput": {
           "DataSource": {
               "S3DataSource": {
                   "S3DataType": "S3Prefix",
                   "S3Uri": "s3://amzn-s3-demo-bucket/data.csv"
               }
           },
           "ContentType": "text/csv",
           "CompressionType": "None",
           "SplitType": "None"
       },
       "TransformOutput": {
           "S3OutputPath": "s3://amzn-s3-demo-bucket/output/",
           "AssembleWith": "Line",
           "KmsKeyId": ""
       },
       "TransformResources": {
           "InstanceType": "ml.m5.2xlarge",
           "InstanceCount": 1
       },
       "CreationTime": 1662495635.679,
       "TransformStartTime": 1662495847.496,
       "DataProcessing": {
           "InputFilter": "$",
           "OutputFilter": "$",
           "JoinSource": "None"
       }
   }
   ```

   Depois de `TransformJobStatus` ser alterado para `Completed`, você pode verificar o resultado da inferência no `S3OutputPath`.

------

# Notebook de exploração de dados Amazon SageMaker Autopilot
<a name="timeseries-forecasting-data-exploration-notebook"></a>

O Amazon SageMaker Autopilot limpa e pré-processa automaticamente seu conjunto de dados. Para ajudar os usuários a entender seus dados, descobrir padrões, relacionamentos e anomalias sobre a série temporal, o SageMaker Amazon Autopilot gera **um relatório estático de exploração de dados na forma de um** caderno para referência dos usuários.

O caderno de exploração de dados é gerado para cada trabalho do Autopilot. O relatório é armazenado em um bucket do Amazon S3 e pode ser acessado pelo caminho de saída do trabalho.

Você pode encontrar o prefixo Amazon S3 para o caderno de exploração de dados na resposta a `[DescribeAutoMLJobV2](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeAutoMLJobV2.html)` em `[AutoMLJobArtifacts.DataExplorationNotebookLocation](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeAutoMLJobV2.html#sagemaker-DescribeAutoMLJobV2-response-AutoMLJobArtifacts)`.

# Relatórios gerados pelo Amazon SageMaker Autopilot
<a name="timeseries-forecasting-reports"></a>

Além do caderno de exploração de dados, o Autopilot gera vários relatórios para o melhor candidato a modelo de cada experimento.
+ Um relatório de explicabilidade fornece informações sobre como o modelo faz previsões. 
+ Um relatório de desempenho fornece uma avaliação quantitativa das capacidades de predição de modelo.
+ Um relatório dos resultados do backtest é gerado após testar o desempenho do modelo em dados históricos. 

## Relatório de explicabilidade
<a name="timeseries-forecasting-explainability-report"></a>

O relatório de explicabilidade do Autopilot ajuda você a entender melhor como os atributos em seus conjuntos de dados afetam as previsões para séries temporais específicas (combinações de itens e dimensões) e pontos temporais. O Autopilot usa uma métrica chamada *Pontuações de impacto* para quantificar o impacto relativo de cada atributo e determinar se eles aumentam ou diminuem os valores previstos.

Por exemplo, considere um cenário de previsão em que o alvo é `sales` e há dois atributos relacionados: `price` e `color`. O Autopilot pode descobrir que a cor do item tem um alto impacto nas vendas de determinados itens, mas um efeito insignificante em outros itens. Também pode descobrir que uma promoção no verão tem um alto impacto nas vendas, mas uma promoção no inverno tem pouco efeito.

O relatório de explicabilidade é gerado somente quando:
+ O conjunto de dados da série temporal inclui colunas de atributos adicionais ou está associado a um calendário de feriados.
+ Os modelos básicos CNN-QR e DeepAR\$1 estão incluídos no conjunto final.

### Interpretar as pontuações de impacto
<a name="timeseries-forecasting-explainability-impact-scores"></a>

As pontuações de impacto medem o impacto relativo que os atributos têm nos valores previstos. Por exemplo, se o `price` atributo tiver uma pontuação de impacto duas vezes maior que o `store location` atributo, você poderá concluir que o preço de um item tem o dobro do impacto nos valores previstos do que a localização da loja.

As pontuações de impacto também fornecem informações sobre se os atributos aumentam ou diminuem os valores previstos.

As pontuações de impacto variam de -1 a 1, onde o sinal indica a direção do impacto. Uma pontuação de 0 indica nenhum impacto, enquanto pontuações próximas a 1 ou -1 indicam um impacto significativo.

É importante observar que as pontuações de impacto medem o impacto relativo dos atributos, não o impacto absoluto. Portanto, as pontuações de impacto não podem ser usadas para determinar se atributos específicos melhoram a precisão do modelo. Se um atributo tiver uma pontuação de impacto baixa, isso não significa necessariamente que ele tenha um baixo impacto nos valores previstos; significa que ele tem um impacto menor nos valores previstos do que outros atributos usados pelo preditor.

### Encontre o relatório de explicabilidade
<a name="timeseries-forecasting-explainability-report-location"></a>

Você pode encontrar o prefixo Amazon S3 para os artefatos de explicabilidade gerados para o melhor candidato na resposta a `[DescribeAutoMLJobV2](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeAutoMLJobV2.html)` em `[BestCandidate.CandidateProperties.CandidateArtifactLocations.Explainability](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CandidateArtifactLocations.html#sagemaker-Type-CandidateArtifactLocations-Explainability)`.

## Relatório de desempenho do modelo
<a name="timeseries-forecasting-model-performance-report"></a>

O relatório de qualidade do modelo do Autopilot (também conhecido como relatório de desempenho) fornece insights e informações de qualidade para o melhor candidato a modelo (melhor preditor) gerado por um trabalho do AutoML. Isso inclui informações sobre os detalhes do trabalho, a função objetiva e as métricas de precisão (`wQL`, `MAPE`, `WAPE`, `RMSE`, `MASE`).

Você pode encontrar o prefixo Amazon S3 para os artefatos do relatório de qualidade do modelo gerados para o melhor candidato na resposta a `[DescribeAutoMLJobV2](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeAutoMLJobV2.html)` em `[BestCandidate.CandidateProperties.CandidateArtifactLocations.ModelInsights](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CandidateArtifactLocations.html#sagemaker-Type-CandidateArtifactLocations-ModelInsights)`.

## Relatório de resultados de backtests
<a name="timeseries-forecasting-model-backtest-report"></a>

Os resultados dos backtests fornecem informações sobre o desempenho de um modelo de previsão de séries temporais, avaliando sua precisão e confiabilidade preditivas. Ele ajuda analistas e cientistas de dados a avaliar seu desempenho em dados históricos e ajuda a entender seu desempenho potencial em dados futuros e invisíveis.

O Autopilot usa backtesting para ajustar parâmetros e produzir métricas de precisão. Durante o backtesting, o Autopilot divide automaticamente seus dados de séries temporais em dois conjuntos, um conjunto de treinamento e um conjunto de testes. O conjunto de treinamento é usado para treinar um modelo que é então usado para gerar previsões para pontos de dados no conjunto de testes. O Autopilot usa esse conjunto de dados de teste para avaliar a precisão do modelo comparando os valores previstos com os valores observados no conjunto de testes.

Você pode encontrar o prefixo Amazon S3 para os artefatos do relatório de qualidade do modelo gerados para o melhor candidato na resposta a `[DescribeAutoMLJobV2](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeAutoMLJobV2.html)` em `[BestCandidate.CandidateProperties.CandidateArtifactLocations.BacktestResults](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CandidateArtifactLocations.html#sagemaker-Type-CandidateArtifactLocations-BacktestResults)`.

# Limites de recursos de previsão de séries temporais do Autopilot
<a name="timeseries-forecasting-limits"></a>

A tabela a seguir lista os limites de recursos para trabalhos de previsão de séries temporais no Amazon SageMaker Autopilot e se você pode ou não ajustar cada limite.


| **Limites de recurso** | **Limite padrão** | **Ajustável** | 
| --- | --- | --- | 
|  Tamanho do conjunto de dados de entrada  |  30 GB  |  Sim  | 
|  Tamanho de um único arquivo do Parquet  |  2 GB  |  Não  | 
|  O número máximo de linhas em um conjunto de dados  |  3 bilhões  |  Sim  | 
|  Número máximo de colunas de agrupamento  |  5  |  Não  | 
|  Número máximo de atributos numéricos  |  13  |  Não  | 
|  Número máximo de atributos categóricos  |  10  |  Não  | 
|  Número máximo de séries temporais (combinações exclusivas de itens e colunas de agrupamento) por conjunto de dados  |  5,000,000  |  Sim  | 
|  Horizonte de Maximum Forecast  |  500  |  Sim  | 