

 Amazon Forecast ya no está disponible para nuevos clientes. Los clientes actuales de Amazon Forecast pueden seguir utilizando el servicio con normalidad. [Más información](https://aws.amazon.com/blogs/machine-learning/transition-your-amazon-forecast-usage-to-amazon-sagemaker-canvas/)

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Importación de conjuntos de datos
<a name="howitworks-datasets-groups"></a>

Los*conjuntos* de datos contienen los datos utilizados para entrenar un [predictor](howitworks-predictor.md). Debe crear uno o más conjuntos de datos de Amazon Forecast y, a continuación, importar en ellos los datos de entrenamiento. Un *grupo de conjuntos de datos* es una colección de conjuntos de datos complementarios que detallan un conjunto de parámetros cambiantes durante un período de tiempo. Después de crear un grupo de conjuntos de datos, puede utilizarlo para entrenar un predictor. 

Cada grupo de conjuntos de datos puede tener hasta tres conjuntos de datos, uno de cada tipo de [conjunto de datos](#howitworks-dataset-domainstypes): serie temporal de destino, serie temporal relacionada y metadatos de artículo.

Para crear y administrar conjuntos de datos y grupos de conjuntos de datos de Forecast, puede usar la consola Forecast, AWS Command Line Interface (AWS CLI) o el AWS SDK.

Para ver, por ejemplo, conjuntos de datos de Forecast, consulte el [ GitHubrepositorio de muestras de Amazon Forecast](https://github.com/aws-samples/amazon-forecast-samples).

**Topics**
+ [Conjuntos de datos](#howitworks-dataset)
+ [Grupos de conjuntos de datos](#howitworks-datasetgroup)
+ [Resolución de conflictos en la frecuencia de recopilación de datos](#howitworks-data-alignment)
+ [Uso de conjuntos de datos de serie temporal relacionada](related-time-series-datasets.md)
+ [Uso de conjuntos de datos de metadatos de artículos](item-metadata-datasets.md)
+ [Tipos de conjunto de datos y dominios de conjunto de datos predefinidos](howitworks-domains-ds-types.md)
+ [Actualización de datos](updating-data.md)
+ [Gestión de valores faltantes](howitworks-missing-values.md)
+ [Directrices de conjuntos de datos para Forecast](dataset-import-guidelines-troubleshooting.md)

## Conjuntos de datos
<a name="howitworks-dataset"></a>

Para crear y gestionar conjuntos de datos de Forecast, puede utilizar Forecast APIs, incluidas las [DescribeDataset](API_DescribeDataset.md) operaciones [CreateDataset](API_CreateDataset.md) y. Para obtener una lista completa de Forecast APIs, consulte[referencia de la API](api-reference.md).

Al crear un conjunto de datos, debe proporcionar información, como la siguiente:
+ El frequency/interval lugar en el que registró sus datos. Por ejemplo, podría agregar y registrar las ventas de artículos al por menor cada semana. En el ejercicio [Introducción](getting-started.md), utilice la electricidad media utilizada por hora.
+ El formato de predicción (el *dominio*) y el tipo de conjunto de datos (dentro del dominio). Un dominio de conjunto de datos especifica qué tipo de previsión desea realizar, mientras que un tipo de conjunto de datos le ayuda a organizar los datos de entrenamiento en categorías compatibles con Forecast.
+ *Esquema* de conjunto de datos Un esquema asigna los encabezados de columna del conjunto de datos. Por ejemplo, al supervisar la demanda, es posible que haya recopilado datos por hora sobre las ventas de un artículo en varias tiendas. En este caso, el esquema definiría el orden, de izquierda a derecha, en el que aparecerán la marca temporal, la ubicación y las ventas por hora en el archivo de datos de capacitación. Los esquemas también definen el tipo de datos de cada columna, como `string` o `integer`.
+ Información de geolocalización y zona horaria. El atributo de geolocalización se define en el esquema con el tipo de atributo `geolocation`. La información de la zona horaria se define con la [ CreateDatasetImportJob](API_CreateDatasetImportJob.md)operación. Se deben incluir tanto los datos de geolocalización como los de zona horaria para habilitar el [índice meteorológico.](weather.md)

Cada columna del conjunto de datos de Forecast representa una *dimensión* o una *característica* de previsión. Las dimensiones de previsión describen los aspectos de los datos que no cambian con el tiempo, como `store` o `location`. Las funciones de previsión incluyen cualquier parámetro de los datos que varía con el tiempo, como `price` o `promotion`. Algunas dimensiones, como `timestamp` o `itemId`, son necesarias en los conjuntos de datos de serie temporal de destino y serie temporal relacionada.

### Dominios de conjunto de datos y tipos de conjunto de datos
<a name="howitworks-dataset-domainstypes"></a>

Cuando crea un conjunto de datos de Forecast, elige un dominio y un tipo de conjunto de datos. Forecast proporciona dominios para una serie de casos de uso, como la previsión de la demanda minorista o el tráfico web. También puede crear un dominio personalizado. Para obtener una lista completa de dominios de Forecast, consulte [Tipos de conjunto de datos y dominios de conjunto de datos predefinidos](howitworks-domains-ds-types.md).

Dentro de cada dominio, los usuarios de Forecast pueden especificar los siguientes tipos de conjuntos de datos:
+ Conjunto de datos de series temporales objetivo (obligatorio): use este tipo de conjunto de datos cuando los datos de entrenamiento sean una serie temporal *e* incluyan el campo para el que desea generar una previsión. Este campo se denomina *campo de destino*.
+ Conjunto de datos de series temporales relacionadas (opcional): elije este tipo de conjunto de datos cuando los datos de entrenamiento sean una serie temporal, pero *no* incluyan el campo de destino. Por ejemplo, si está haciendo una previsión sobre la demanda de artículos, el conjunto de datos de serie temporal relacionada podría tener `price` como campo, pero no `demand`.
+ Conjunto de datos de metadatos de artículos (opcional): elija este tipo de conjunto de datos si sus datos de entrenamiento *no son* datos de series temporales, sino que incluyen información de metadatos sobre los artículos de la serie temporal de destino o conjuntos de datos de series temporales relacionadas. Por ejemplo, si realiza una previsión de la demanda de artículos, es posible que un conjunto de datos de metadatos de artículos tenga `color` o `brand` como dimensiones. 

  Forecast solo tiene en cuenta los datos proporcionados por un tipo de conjunto de datos de metadatos de artículos cuando se utiliza el algoritmo [CNN-QR](aws-forecast-algo-cnnqr.md) o [DeepAR\$1](aws-forecast-recipe-deeparplus.md).

  Los metadatos de artículos son especialmente útiles en escenarios de previsión de inicio de arranque en frío, en los que se dispone de pocos datos históricos directos con los que realizar predicciones, pero sí disponen de datos históricos sobre artículos con atributos de metadatos similares. Al incluir los metadatos de los artículos, Forecast crea previsiones de arranque en frío basadas en series temporales similares, lo que puede generar una previsión más precisa. 

En función de la información de los datos de entrenamiento y de lo que desee prever, es posible que cree más de un conjunto de datos. 

Por ejemplo, supongamos que desea generar una previsión de la demanda de artículos de venta al por menor, como, por ejemplo, zapatos y calcetines. Es posible crear los siguientes conjuntos de datos en el dominio RETAIL:
+ Conjunto de datos de series temporales de destino: incluye los datos de la demanda de los artículos minoristas (`item_id`, `timestamp` y el campo de destino `demand`) en series temporales históricas. Dado que designa el campo de destino del que desea realizar una previsión, debe tener al menos un conjunto de datos de serie temporal de destino en un grupo de conjuntos de datos.

  También puede añadir hasta diez dimensiones adicionales a un conjunto de datos de serie temporal de destino. Si solo incluye un conjunto de datos de serie temporal de destino en su grupo de conjuntos de datos, puede crear previsiones en el nivel de artículo o en el nivel de detalle de la dimensión de previsión únicamente. Para obtener más información, consulte [CreatePredictor](API_CreatePredictor.md).
+ Conjunto de datos de series temporales relacionadas: incluye datos históricos de series temporales distintos del campo de destino, como `price` o `revenue`. Dado que los datos de series temporales relacionadas deben asignarse a datos de series temporales de destino, cada conjunto de datos de series temporales relacionadas debe contener los mismos campos de identificación. En el dominio RETAIL, serían `item_id` y `timestamp`.

  Los conjuntos de datos de las series temporales relacionadas pueden contener datos que refinen las previsiones realizadas con el conjunto de datos de series temporales de destino. Por ejemplo, puede incluir datos `price` en el conjunto de datos de serie temporal relacionada en las fechas futuras para las que desea generar una previsión. De esta manera, Forecast podrá realizar predicciones con una dimensión contextual adicional. Para obtener más información, consulte [Uso de conjuntos de datos de serie temporal relacionada](related-time-series-datasets.md).
+ Conjunto de datos de metadatos de artículos: incluye los metadatos de los artículos de venta minorista. Otros ejemplos de metadatos son `brand`, `category`, `color` y `genre`.

**Conjunto de datos de ejemplo con una dimensión de previsión**

Siguiendo con el ejemplo anterior, imagine que desea prever la demanda de zapatos y calcetines en función de las ventas anteriores de una tienda. En el siguiente conjunto de datos de serie temporal de destino, `store` es una dimensión de previsión de serie temporal, mientras que `demand` es el campo de destino. Los calcetines se venden en dos ubicaciones de tiendas (NYC y SFO), y los zapatos solo se venden en ORD.

Las tres primeras filas de esta tabla contienen los primeros datos de ventas disponibles para los almacenes de NYC, SFO y ORD. Las tres últimas filas contienen los últimos datos de ventas registrados para cada tienda. La fila `...` representa todos los datos de ventas de artículos registrados entre la primera y la última entrada.


| `timestamp` | `item_id` | `store` | `demand` | 
| --- | --- | --- | --- | 
| 2019-01-01 | socks | NYC |  25  | 
| 2019-01-05 | socks | SFO | 45 | 
| 2019-02-01 | shoes | ORD | 10 | 
| ... | 
| 2019-06-01 | socks | NYC | 100 | 
| 2019-06-05 | socks | SFO | 5 | 
| 2019-07-01 | shoes | ORD | 50 | 

### Esquema de conjunto de datos
<a name="howitworks-dataset-schema"></a>

Todos los conjuntos de datos necesitan un esquema, una correspondencia proporcionada por el usuario en formato JSON de los campos de los datos de entrenamiento. Aquí es donde indica las dimensiones y funciones, tanto obligatorias como opcionales, que desea incluir en el conjunto de datos.

Si su conjunto de datos incluye un atributo de geolocalización, defina el atributo dentro del esquema con el tipo de atributo `geolocation`. Para obtener más información, consulte [Cómo añadir información de geolocalización.](weather.md#adding-geolocation) Para aplicar el [índice meteorológico](weather.md), debe incluir un atributo de geolocalización en su serie temporal de destino y en cualquier conjunto de datos de series temporales relacionadas.

Algunos dominios tienen dimensiones opcionales que recomendamos incluir. Las dimensiones opcionales se enumeran en las descripciones de cada dominio más adelante en esta guía. Para ver un ejemplo, consulta [Dominio RETAIL](retail-domain.md). Todas las dimensiones opcionales toman el tipo de datos `string`.

Se requiere un esquema para cada conjunto de datos. A continuación, se muestra el esquema asociado al conjunto de datos de series temporales de destino del ejemplo anterior.

```
{
     "attributes": [
        {
           "AttributeName": "timestamp",
           "AttributeType": "timestamp"
        },
        {
           "AttributeName": "item_id",
           "AttributeType": "string"
        },
        {
           "AttributeName": "store",
           "AttributeType": "string"
        },
        {
           "AttributeName": "demand",
           "AttributeType": "float"
        }
    ]
}
```

Cuando carga los datos de entrenamiento en el conjunto de datos que utiliza este esquema, Forecast presupone que el campo `timestamp` es la columna 1, que el campo `item_id` es la columna 2, que el campo `store` es la columna 3 y que el campo `demand`, el campo de *destino*, es la columna 4.

Para el tipo de conjunto de datos de serie temporal relacionada, todas las características relacionadas deben tener un tipo de atributo de valor flotante o entero. Para el tipo de conjunto de datos de metadatos de artículo, todas las características deben tener un tipo de atributo de cadena. Para obtener más información, consulte [SchemaAttribute](API_SchemaAttribute.md).

**nota**  
Se requiere un par `attributeName` y `attributeType` para cada columna del conjunto de datos. Forecast reserva una serie de nombres que no se pueden usar como nombre de un atributo de esquema. Para ver la lista de los nombres reservados, consulte [Nombres de campo reservados](reserved-field-names.md).

## Grupos de conjuntos de datos
<a name="howitworks-datasetgroup"></a>

Un *grupo de conjuntos de datos* es una colección de uno a tres conjuntos de datos complementarios, uno de cada tipo. Puede importar conjuntos de datos a un grupo de conjuntos de datos y, a continuación, utilizar el grupo de conjuntos de datos para entrenar un predictor.

Forecast incluye las siguientes operaciones para crear grupos de conjuntos de datos y añadirles conjuntos de datos:
+ [CreateDatasetGroup](API_CreateDatasetGroup.md)
+ [UpdateDatasetGroup](API_UpdateDatasetGroup.md)

## Resolución de conflictos en la frecuencia de recopilación de datos
<a name="howitworks-data-alignment"></a>

Forecast puede entrenar predictores con datos que no se alinean con la frecuencia de datos que especifique en la operación [CreateDataset](API_CreateDataset.md). Por ejemplo, puede importar los datos registrados en intervalos de una hora aunque algunos de los datos no tengan una marca de tiempo al principio de la hora (02:20, 02:45). Forecast usa la frecuencia de datos que especifique para obtener información sobre sus datos. A continuación, Forecast agrega los datos durante el entrenamiento del predictor. Para obtener más información, consulte [Agregación de datos para distintas frecuencias de previsión](data-aggregation.md). 

# Uso de conjuntos de datos de serie temporal relacionada
<a name="related-time-series-datasets"></a>

Un conjunto de datos de serie temporal relacionada incluye datos de serie temporal que no se incluyen en un conjunto de datos de serie temporal de destino y que podría mejorar la precisión del predictor.

Por ejemplo, en el dominio de previsión de la demanda, un conjunto de datos de serie temporal de destino podría incluir las dimensiones `timestamp` y `item_id`, mientras que un conjunto de datos de serie temporal relacionada complementario también incluiría las siguientes características suplementarias: `item price`, `promotion` y `weather`.

Los conjuntos de datos de serie temporal relacionada pueden tener hasta 10 dimensiones de previsión (las mismas del conjunto de datos de serie temporal de destino) y hasta 13 entidades de serie temporal relacionada.

**Cuadernos de Python**  
Para obtener una step-by-step guía sobre el uso de conjuntos de datos de series temporales relacionadas, consulte [Incorporación de series temporales relacionadas](https://github.com/aws-samples/amazon-forecast-samples/blob/master/notebooks/advanced/Incorporating_Related_Time_Series_dataset_to_your_Predictor/Incorporating_Related_Time_Series_dataset_to_your_Predictor.ipynb).

**Topics**
+ [Series temporales relacionadas históricas y prospectivas](#related-time-series-historical-futurelooking)
+ [Validación de conjuntos de datos de serie temporal relacionada](#related-time-series-dataset-validation)
+ [Ejemplo: archivo de series temporales relacionadas prospectivas](#related-time-series-example)
+ [Ejemplo: granularidad de la previsión](#related-time-series-granularity)
+ [Predictores heredados y series temporales relacionadas](#related-time-series-legacy)

## Series temporales relacionadas históricas y prospectivas
<a name="related-time-series-historical-futurelooking"></a>

**nota**  
 Una serie temporal relacionada que contiene cualquier valor dentro del horizonte de previsión se considera una serie temporal prospectiva. 

 Las series temporales relacionadas se presentan de dos formas: 
+  **Series temporales históricas:** series temporales *sin* puntos de datos dentro del horizonte de previsión. 
+  **Series temporales prospectivas:** series temporales *con* puntos de datos dentro del horizonte de previsión. 

Las series temporales históricas relacionadas contienen puntos de datos hasta el horizonte de previsión y no contienen ningún punto de datos dentro del horizonte de previsión. Las series temporales relacionadas prospectivas contienen puntos de datos hasta *y* dentro del horizonte de previsión. 

![\[Time series graph showing target, forward-looking, and historical related data with forecast window.\]](http://docs.aws.amazon.com/es_es/forecast/latest/dg/images/short-long-rts.png)


## Validación de conjuntos de datos de serie temporal relacionada
<a name="related-time-series-dataset-validation"></a>

Un conjunto de datos de serie temporal relacionada tiene las siguientes restricciones:
+ No puede incluir el valor de destino de la serie temporal de destino.
+ Debe incluir las dimensiones `item_id` y `timestamp`, y al menos una característica relacionada (por ejemplo, `price`).
+ Los datos de la característica de serie temporal relacionada deben ser del tipo `int` o `float`.
+ Para utilizar la serie temporal de destino completa, todos los artículos del conjunto de datos de series temporales de destino también deben incluirse en el conjunto de datos de series temporales relacionadas. Si una serie temporal relacionada solo contiene un subconjunto de artículos de la serie temporal de destino, la creación del modelo y la generación de previsiones se limitarán a ese subconjunto específico de artículos.

   Por ejemplo, si la serie temporal de destino contiene 1000 artículos y el conjunto de datos de series temporales relacionadas solo contiene 100 artículos, el modelo y las previsiones se basarán únicamente en esos 100 artículos. 
+ La frecuencia con la que se registran los datos en el conjunto de datos de serie temporal relacionado debe coincidir con el intervalo en el que desea generar las previsiones (la *granularidad*de la previsión).

  Por ejemplo, si desea generar previsiones con una granularidad semanal, la frecuencia con la que se registren los datos en las series temporales relacionadas también deberá ser semanal, incluso aunque loa datos se registren en la serie temporal de destino con una frecuencia diaria.
+ Los datos de cada artículo en el conjunto de datos de serie temporal relacionada deben tener una fecha de inicio igual o anterior al comienzo del `timestamp` del `item_id` correspondiente en el conjunto de datos de serie temporal de destino.

  Por ejemplo, si los datos de la serie temporal de destino de `socks` comienzan el 01-01-2019 y los datos de la serie temporal relacionada para `shoes` comienzan el 01-02-2019, los datos de la serie temporal relacionada para `socks` deben comenzar el 01-01-2019 o antes y los datos de `shoes` deben comenzar el 01-02-2019 o antes.
+ En el caso de los conjuntos de datos de series temporales relacionadas prospectivas, la última marca temporal de cada artículo debe coincidir con la última marca temporal del periodo de previsión designado por el usuario (denominado *horizonte de previsión*).

  En el archivo de serie temporal relacionada de ejemplo siguiente, los datos `timestamp` de los calcetines y los zapatos deben terminar el 01-07-2019 (la última marca temporal registrada) *más* el horizonte de previsión. Si la frecuencia de los datos en la serie temporal de destino es diaria y el horizonte de previsión es de 10 días, se deben proporcionar puntos de datos diarios en el archivo de la serie temporal relacionada prospectiva hasta el 11-07-2019.
+ En el caso de los conjuntos de datos de series temporales relacionadas históricas, la última marca temporal de cada artículo debe coincidir con la última marca temporal de la serie temporal de destino.

  En el archivo de serie temporal relacionada de ejemplo siguiente, los datos de `timestamp` de los calcetines y los zapatos deben terminar el 01/07/2019 (la última marca temporal registrada).
+ Las dimensiones de Forecast proporcionadas en el conjunto de datos de la serie temporal relacionada deben ser iguales o un subconjunto de las dimensiones designadas en el conjunto de datos de la serie temporal de destino.
+  No pueden faltar valores en las series temporales relacionadas. Para obtener más información sobre los valores faltantes en un conjunto de datos de series temporales relacionadas, consulte [Gestión de valores faltantes](howitworks-missing-values.md). 

## Ejemplo: archivo de series temporales relacionadas prospectivas
<a name="related-time-series-example"></a>

En la siguiente tabla se muestra un archivo de conjunto de datos de serie temporal relacionada correctamente configurado. En este ejemplo, suponga lo siguiente:
+ El último punto de datos se registró en el conjunto de datos de serie temporal de destino el 01-07-2019.
+  El horizonte de previsión es de 10 días. 
+ La granularidad de la previsión es diaria (`D`). 

Una fila"`…`"indica todos los puntos de datos entre las filas anteriores y posteriores.


| `timestamp` | `item_id` | `store` | `price` | 
| --- | --- | --- | --- | 
| 2019-01-01 | calcetines | NYC | 10 | 
| 2019-01-02 | calcetines | NYC | 10 | 
| 2019-01-03 | calcetines | NYC | 15 | 
| ... | 
| 2019-06-01 | calcetines | NYC | 10 | 
| ... | 
| 2019-07-01 | calcetines | NYC | 10 | 
| ... | 
| 2019-07-11 | calcetines | NYC | 20 | 
| 2019-01-05 | calcetines | SFO | 45 | 
| ... | 
| 2019-06-05 | calcetines | SFO | 10 | 
| ... | 
| 2019-07-01 | calcetines | SFO | 10 | 
| ... | 
| 2019-07-11 | calcetines | SFO | 30 | 
| 2019-02-01 | zapatos | ORD | 50 | 
| ... | 
| 2019-07-01 | zapatos | ORD | 75 | 
| ... | 
| 2019-07-11 | zapatos | ORD | 60 | 

## Ejemplo: granularidad de la previsión
<a name="related-time-series-granularity"></a>

En la tabla siguiente, se muestran las frecuencias de registro de datos compatibles con las series temporales de destino y las series temporales relacionadas para realizar previsiones con una granularidad semanal. Dado que los datos de un conjunto de datos de serie temporal relacionada no se pueden agregar, Forecast solo acepta una frecuencia de datos de serie temporal relacionada que sea la misma que la granularidad de la previsión elegida.


| Frecuencia de los datos de entrada de destino | Frecuencia de las series temporales relacionadas | Granularidad de la previsión | ¿Compatible con Forecast? | 
| --- | --- | --- | --- | 
| Por día | Weekly | Weekly | Sí | 
| Weekly | Weekly | Weekly | Sí | 
| N/A | Weekly | Weekly | Sí | 
| Por día | Por día | Weekly | No | 

## Predictores heredados y series temporales relacionadas
<a name="related-time-series-legacy"></a>

**nota**  
Para actualizar un predictor existente a, consulte AutoPredictor [Actualizando a AutoPredictor](howitworks-predictor.md#upgrading-autopredictor)

Al usar un predictor heredado, puede utilizar un conjunto de datos de serie temporal relacionada al entrenar un predictor con los algoritmos [CNN-QR](aws-forecast-algo-cnnqr.md), [DeepAR\$1](aws-forecast-recipe-deeparplus.md) y [Prophet](aws-forecast-recipe-prophet.md). [NPTS](aws-forecast-recipe-npts.md), [ARIMA](aws-forecast-recipe-arima.md) y [ETS](aws-forecast-recipe-ets.md) no aceptan datos de series temporales relacionadas.

En la siguiente tabla se muestran los tipos de series temporales relacionadas que acepta cada algoritmo de Amazon Forecast. 


|  | CNN-QR | DeepAR\$1 | Prophet | NPTS | ARIMA | ETS | 
| --- | --- | --- | --- | --- | --- | --- | 
|  Series temporales relacionadas históricas  | ![\[Yes\]](http://docs.aws.amazon.com/es_es/forecast/latest/dg/images/icon-yes.png)  | ![\[No\]](http://docs.aws.amazon.com/es_es/forecast/latest/dg/images/icon-no.png)  | ![\[No\]](http://docs.aws.amazon.com/es_es/forecast/latest/dg/images/icon-no.png)  | ![\[No\]](http://docs.aws.amazon.com/es_es/forecast/latest/dg/images/icon-no.png)  | ![\[No\]](http://docs.aws.amazon.com/es_es/forecast/latest/dg/images/icon-no.png)  | ![\[No\]](http://docs.aws.amazon.com/es_es/forecast/latest/dg/images/icon-no.png)  | 
|  Series temporales relacionadas prospectivas  | ![\[Yes\]](http://docs.aws.amazon.com/es_es/forecast/latest/dg/images/icon-yes.png)  | ![\[Yes\]](http://docs.aws.amazon.com/es_es/forecast/latest/dg/images/icon-yes.png)  | ![\[Yes\]](http://docs.aws.amazon.com/es_es/forecast/latest/dg/images/icon-yes.png)  | ![\[No\]](http://docs.aws.amazon.com/es_es/forecast/latest/dg/images/icon-no.png)  | ![\[No\]](http://docs.aws.amazon.com/es_es/forecast/latest/dg/images/icon-no.png)  | ![\[No\]](http://docs.aws.amazon.com/es_es/forecast/latest/dg/images/icon-no.png)  | 

 Al utilizar AutoML, puede proporcionar datos de series temporales relacionadas tanto históricas como prospectivas, y Forecast solo utilizará esas series temporales cuando proceda. 

 Si proporciona datos de series temporales relacionadas *prospectivas*, Forecast utilizará los datos relacionados con CNN-QR, DeepAR\$1 y Prophet, y no utilizará los datos relacionados con NPTS, ARIMA y ETS. Si proporciona datos de series temporales relacionadas *históricas*, Forecast utilizará los datos relacionados con CNN-QR y no utilizará los datos relacionados con DeepAR\$1, Prophet, NPTS, ARIMA y ETS. 

# Uso de conjuntos de datos de metadatos de artículos
<a name="item-metadata-datasets"></a>

Un *conjunto de datos de metadatos de artículos* contiene datos categóricos que proporcionan contexto valioso para artículos en un conjunto de datos de serie temporal de destino. A diferencia de los conjuntos de datos de series temporales relacionadas, los conjuntos de datos de metadatos de artículos proporcionan información estática. Es decir, los valores de datos se mantienen constantes a lo largo del tiempo, como el color o la marca de un artículo. Los conjuntos de datos de metadatos de los artículos son adiciones opcionales a sus grupos de conjuntos de datos. Solo puede utilizar los metadatos de artículos si cada uno de los artículos del conjunto de datos de serie temporal de destino está presente en el conjunto de datos de metadatos de artículos correspondiente.

Los metadatos del artículo pueden incluir la marca, el color, el modelo, la categoría, el lugar de origen u otra característica complementaria de un artículo en particular. Por ejemplo, un conjunto de datos de metadatos de artículos puede proporcionar el contexto de algunos de los datos de demanda encontrados en un conjunto de datos de serie temporal de destino que representa las ventas de e-readers de Amazon de color negro con 32 GB de almacenamiento. Porque estas características no cambian de un conjunto de datos de metadatos de elementos day-to-day ni hour-to-hour pertenecen a él.

Los metadatos de artículos son útiles para descubrir y realizar un seguimiento de patrones descriptivos a través de los datos de series temporales. Si se incluye un conjunto de datos de metadatos de artículos en un grupo de conjuntos de datos, puede entrenar el modelo para que realice predicciones más acertadas basándose en las similitudes entre los artículos. Por ejemplo, es posible predecir que los productos de asistente virtual fabricados por Amazon se agotarán más rápidamente que los creados por otras empresas y planificar la cadena de suministro en consecuencia.

Los metadatos de artículos son especialmente útiles en escenarios de previsión de inicio de arranque en frío, en los que no se dispone de datos históricos con los que realizar predicciones, pero sí disponen de datos históricos sobre artículos con atributos de metadatos similares. Los metadatos de los artículos permiten a Forecast aprovechar artículos similares a los de arranque en frío para generar una previsión.

Al incluir los metadatos de los artículos, Forecast crea previsiones de arranque en frío basadas en series temporales similares, lo que puede generar una previsión más precisa. Las previsiones de arranque en frío se generan para los artículos que se encuentran en el conjunto de datos de metadatos de los artículos, pero no en la serie temporal final. En primer lugar, Forecast genera previsiones para los artículos que no son de arranque en frío, que son artículos con datos históricos de las series temporales finales. A continuación, para cada artículo de arranque en frío, sus vecinos más cercanos se encuentran utilizando el conjunto de datos de metadatos del artículo. A continuación, estos vecinos más cercanos se utilizan para crear una previsión de arranque en frío.

Cada fila de un conjunto de datos de metadatos de artículos puede contener hasta 10 campos de metadatos, uno de los cuales debe ser un campo de identificación para hacer coincidir los metadatos con un artículo de la serie temporal de destino. Al igual que sucede con todos los tipos de conjunto de datos, los valores de cada campo se designan mediante un esquema de conjunto de datos.

**Cuadernos de Python**  
Para obtener una step-by-step guía sobre el uso de los metadatos de los elementos, consulte [Incorporar los metadatos de los elementos](https://github.com/aws-samples/amazon-forecast-samples/blob/master/notebooks/advanced/Incorporating_Item_Metadata_Dataset_to_your_Predictor/Incorporating_Item_Metadata_Dataset_to_your_Predictor.ipynb).

**Topics**
+ [Ejemplo: Archivo de metadatos de artículos y esquema](#item-metadata-example)
+ [Predictores heredados y metadatos de artículos](#item-metadata-legacy)
+ [Véase también](#item-metadata-see-also)

## Ejemplo: Archivo de metadatos de artículos y esquema
<a name="item-metadata-example"></a>

En la siguiente tabla se muestra una sección de un archivo de conjunto de datos de metadatos de artículos configurado correctamente que describe los e-readers de Amazon. En este ejemplo, suponga que la fila de encabezado representa el esquema del conjunto de datos y que cada artículo de la lista está en un conjunto de datos de la serie temporal de destino correspondiente.


| `item_id` | `brand` | `model` | `color` | `waterproof` | 
| --- | --- | --- | --- | --- | 
| 1 | amazon | paperwhite | black | yes | 
| 2 | amazon | paperwhite | blue | yes | 
| 3 | amazon | base\$1model | black | no | 
| 4 | amazon | base\$1model | white | no | 
| ... | 

A continuación aparece la misma información representada en formato CSV.

```
1,amazon,paperwhite,black,yes
2,amazon,paperwhite,blue,yes
3,amazon,base_model,black,no
4,amazon,base_model,white,no
...
```

A continuación se muestra el esquema de este conjunto de datos de ejemplo.

```
{
     "attributes": [
        {
           "AttributeName": "item_id",
           "AttributeType": "string"
        },
        {
           "AttributeName": "brand",
           "AttributeType": "string"
        },
        {
           "AttributeName": "model",
           "AttributeType": "string"
        },
        {
           "AttributeName": "color",
           "AttributeType": "string"
        },
        {
           "AttributeName": "waterproof",
           "AttributeType": "string"
        }
    ]
}
```

## Predictores heredados y metadatos de artículos
<a name="item-metadata-legacy"></a>

**nota**  
Para actualizar un predictor existente a AutoPredictor, consulte [Actualizando a AutoPredictor](howitworks-predictor.md#upgrading-autopredictor)

Al utilizar un predictor heredado, puede utilizar los metadatos de los artículos al entrenar un predictor con los algoritmos [CNN-QR](aws-forecast-algo-cnnqr.md) o [DeepAR\$1](aws-forecast-recipe-deeparplus.md). Al usar AutoML, puede proporcionar metadatos de artículo y Forecast solo usará esas series temporales cuando corresponda.

## Véase también
<a name="item-metadata-see-also"></a>

[Para obtener un recorrido detallado sobre el uso de conjuntos de datos de metadatos de artículos, consulte [Incorporar conjuntos de datos de metadatos de artículos a su predictor en](https://github.com/aws-samples/amazon-forecast-samples/blob/master/notebooks/advanced/Incorporating_Item_Metadata_Dataset_to_your_Predictor/Incorporating_Item_Metadata_Dataset_to_your_Predictor.ipynb) el repositorio de muestras de Amazon Forecast. GitHub ](https://github.com/aws-samples/amazon-forecast-samples)

# Tipos de conjunto de datos y dominios de conjunto de datos predefinidos
<a name="howitworks-domains-ds-types"></a>

Para entrenar un predictor, debe crear uno o más conjuntos de datos para añadirlos a un grupo de conjunto de datos y proporcionar el grupo de conjuntos de datos para el entrenamiento.

A cada conjunto de datos que se crea, se le asocia un dominio y un tipo de conjunto de datos. Un *dominio de conjunto de datos* especifica un esquema de conjunto de datos predefinido para un caso de uso común y no afecta a los algoritmos de modelo ni a los hiperparámetros.

Amazon Forecast admite los siguientes dominios de conjunto de datos:
+ [Dominio RETAIL](retail-domain.md): para prever la demanda minorista
+ [Dominio INVENTORY\$1PLANNING](inv-planning-domain.md): para la planificación de la cadena de suministro y el inventario
+ [Dominio EC2 CAPACITY](ec2-capacity-domain.md): para prever la capacidad de Amazon Elastic Compute Cloud (Amazon EC2) 
+ [Dominio WORK\$1FORCE](workforce-domain.md): para la planificación del personal 
+ [Dominio WEB\$1TRAFFIC](webtraffic-domain.md): para estimar el tráfico web futuro 
+ [Dominio METRICS](metrics-domain.md): para prever métricas, como los ingresos y el flujo de caja
+ [Dominio CUSTOM](custom-domain.md): para todos los demás tipos de previsión de series temporales

Cada dominio puede tener entre uno y tres *tipos de conjuntos de datos*. Los tipos de conjuntos de datos que crea para un dominio se basan en el tipo de datos que tenga y lo que desee incluir en el entrenamiento.

Cada dominio requiere un conjunto de datos de serie temporal de destino y, opcionalmente, admite los tipos de conjuntos de datos de metadatos de artículo y serie temporal relacionada.

Los tipos de conjuntos de datos incluyen:
+ Serie temporal de destino: el único tipo de conjunto de datos obligatorio. Este tipo define el campo de *destino* sobre el que desea crear previsiones. Por ejemplo, si desea prever las ventas para un conjunto de productos, debe crear un conjunto de datos de series temporales históricos para cada uno de los productos sobre los que desea realizar la previsión. Del mismo modo, puede crear un conjunto de datos de serie temporal de destino para métricas como, por ejemplo, ingresos, flujo de caja y ventas, sobre los que tal vez desee realizar una previsión.
+ Serie temporal relacionada: datos de series temporales que están relacionados con los datos de la serie temporal de destino. Por ejemplo, el precio está relacionado con los datos de ventas de un producto, por lo que podría proporcionarse como una serie temporal relacionada.
+ Metadatos del artículo: metadatos que se aplican a los datos de la serie temporal de destino. Por ejemplo, si está realizando la previsión de ventas de un producto determinado, los atributos del producto (como marca, color y género) van a formar parte de los metadatos del artículo. Al realizar una previsión de la capacidad de EC2 para instancias EC2, los metadatos podrían incluir la CPU y la memoria de los tipos de instancia.

Para cada tipo de conjunto de datos, los datos de entrada deben contener determinados campos obligatorios. También puede incluir campos opcionales que Amazon Forecast sugiere incluir.

Los siguientes ejemplos muestran cómo elegir un dominio de conjunto de datos y los tipos de conjuntos de datos correspondientes.

**Example Ejemplo 1: tipos de conjunto de datos en el dominio RETAIL**  
Si es un vendedor minorista interesado en la previsión de demanda de artículos, puede crear los siguientes conjuntos de datos en la dominio RETAIL:  
+ La serie temporal de destino es el conjunto de datos de la demanda de la serie temporal histórica (ventas) necesario para cada artículo (cada producto que vende un minorista). En el dominio RETAIL, este tipo de conjunto de datos exige que el conjunto de datos incluya los campos `item_id`, `timestamp` y `demand`. El campo `demand` es el objetivo de la previsión y normalmente es el número de artículos vendidos por el minorista en una semana o día concreto.
+ Opcionalmente, un conjunto de datos del tipo de serie temporal relacionada. En el dominio RETAIL, este tipo puede incluir información de series temporales opcionales, pero sugeridas como `price`, `inventory_onhand` y `webpage_hits`.
+ Opcionalmente, un conjunto de datos del tipo de metadatos de artículo. En el dominio RETAIL, Amazon Forecast sugiere proporcionar información de metadatos relacionados con los artículos proporcionados en la serie temporal de destino, como `brand`, `color`, `category` y `genre`.

**Example Ejemplo 2: tipos de conjunto de datos en el dominio METRICS**  
Si desea realizar una previsión de las principales métricas para su organización como, por ejemplo, los ingresos, las ventas y el flujo de caja, puede proporcionar a Amazon Forecast los siguientes conjuntos de datos:  
+ El conjunto de datos de la serie temporal de destino que proporciona datos históricos de serie temporal para la métrica para la que desea realizar la previsión. Si su objetivo es realizar la previsión de los ingresos de todas las unidades de negocio de su organización, puede crear un conjunto de datos `target time series` con los campos `metric`, `business unit` y `metric_value`.
+ Si tiene algún metadato para cada métrica que no sea necesario, como `category` o `location`, podría proporcionar conjuntos de datos del tipo de serie temporal relacionada y metadatos de artículo.
Como mínimo, debe proporcionar un conjunto de datos de serie temporal de destino para que Forecast pueda generar las previsiones de las métricas de destino.

**Example Ejemplo 3: tipos de conjunto de datos en el dominio CUSTOM**  
Los datos de entrenamiento para su aplicación de previsión no encajan en ningún dominio de Amazon Forecast. Si ese es el caso, elija el dominio CUSTOM. Debe proporcionar el conjunto de datos de serie temporal de destino, pero puede añadir sus propios campos personalizados.  
El ejercicio [Introducción](getting-started.md) realiza una previsión del uso de electricidad para un cliente. Los datos de entrenamiento del uso de electricidad no encajan en ninguno de los dominios de conjuntos de datos, por lo que hemos usado el dominio CUSTOM. En el ejercicio, solo utilizamos un único tipo de conjunto de datos, el tipo de serie temporal de destino. Asignamos los campos de datos a los campos mínimos requeridos por el tipo de conjunto de datos.

# Dominio RETAIL
<a name="retail-domain"></a>

El dominio RETAIL admite los siguientes tipos de conjuntos de datos. Para cada tipo de conjunto de datos, incluimos los campos obligatorios y opcionales. Para obtener más información acerca de cómo asignar los campos a columnas en los datos de entrenamiento, consulte [Dominios de conjunto de datos y tipos de conjunto de datos](howitworks-datasets-groups.md#howitworks-dataset-domainstypes).

**Topics**
+ [Tipo de conjuntos de datos de serie temporal de destino](#target-time-series-type-retail-domain)
+ [Tipo de conjunto de datos de serie temporal relacionada](#related-time-series-type-retail-domain)
+ [Tipo de conjunto de datos de metadatos de artículo](#item-metadata-type-retail-domain)

## Tipo de conjuntos de datos de serie temporal de destino
<a name="target-time-series-type-retail-domain"></a>

La serie temporal objetivo son los datos de la serie temporal de cada artículo o producto vendido por la organización de venta al por menor. Los siguientes campos son obligatorios: 
+ `item_id ` (cadena): identificador único del artículo o producto del que desea predecir la demanda.
+ `timestamp` (marca temporal)
+ `demand` (flotante): el número de ventas de ese artículo en la marca temporal. Este también es el campo *objetivo* para el que Amazon Forecast genera una previsión.

La dimensión siguiente es opcional y se puede utilizar para cambiar la granularidad de la previsión:
+ `location` (cadena): la ubicación de la tienda en la que se vendió el artículo. Solo debe usarse si hay varias tiendas o ubicaciones.

Lo ideal es que solo se incluyan los campos obligatorios y las dimensiones opcionales. El resto de los datos de serie temporal adicionales debería incluirse en un conjunto de datos de serie temporal relacionada.

## Tipo de conjunto de datos de serie temporal relacionada
<a name="related-time-series-type-retail-domain"></a>

Puede proporcionar a Amazon Forecast conjuntos de datos de series temporales relacionadas, como, por ejemplo, el precio o el número de visitas web que este artículo recibió en una fecha determinada. Cuanta más información proporcione, más precisa será la previsión. Los siguientes campos son obligatorios: 
+ `item_id ` (cadena)
+ `timestamp ` (marca temporal)

Los siguientes campos son opcionales y pueden ser útiles para mejorar los resultados de las previsiones:
+ `price` (flotante): el precio del artículo en el momento de la marca temporal.
+ `promotion_applied` (entero; 1=verdadero, 0=falso): indicador que especifica si había una promoción de marketing para ese artículo en la marca temporal.

Además de los campos obligatorios y opcionales sugeridos, los datos de entrenamiento pueden incluir otros campos. Para incluir otros campos en el conjunto de datos, proporcione los campos en un esquema al crear el conjunto de datos.

## Tipo de conjunto de datos de metadatos de artículo
<a name="item-metadata-type-retail-domain"></a>

Este conjunto de datos proporciona a Amazon Forecast información sobre metadatos (atributos) de los artículos de cuya demanda se está realizando la previsión. Los siguientes campos son obligatorios:
+ `item_id ` (cadena)

Los siguientes campos son opcionales y pueden ser útiles para mejorar los resultados de las previsiones:
+ `category` (cadena)
+ `brand` (cadena)
+ `color` (cadena)
+ `genre` (cadena)

Además de los campos obligatorios y opcionales sugeridos, los datos de entrenamiento pueden incluir otros campos. Para incluir otros campos en el conjunto de datos, proporcione los campos en un esquema al crear el conjunto de datos.

# Dominio CUSTOM
<a name="custom-domain"></a>

El dominio CUSTOM admite los siguientes tipos de conjuntos de datos. Para cada tipo de conjunto de datos, incluimos los campos obligatorios y opcionales. Para obtener más información acerca de cómo asignar los campos a columnas en los datos de entrenamiento, consulte [Dominios de conjunto de datos y tipos de conjunto de datos](howitworks-datasets-groups.md#howitworks-dataset-domainstypes).

**Topics**
+ [Tipo de conjuntos de datos de serie temporal de destino](#target-time-series-type-custom-domain)
+ [Tipo de conjunto de datos de serie temporal relacionada](#related-time-series-type-custom-domain)
+ [Tipo de conjunto de datos de metadatos de artículo](#item-metadata-type-custom-domain)

## Tipo de conjuntos de datos de serie temporal de destino
<a name="target-time-series-type-custom-domain"></a>

Los siguientes campos son obligatorios:
+ `item_id ` (cadena)
+ `timestamp` (marca temporal)
+ `target_value` (entero de punto flotante): este también es el campo `target` para el que Amazon Forecast genera una previsión.

Idealmente, solo se deberían incluir estos campos obligatorios. El resto de los datos de serie temporal adicionales debería incluirse en un conjunto de datos de serie temporal relacionada.

## Tipo de conjunto de datos de serie temporal relacionada
<a name="related-time-series-type-custom-domain"></a>

Los siguientes campos son obligatorios:
+ `item_id` (cadena)
+ `timestamp` (marca temporal)

Además de los campos obligatorios, los datos de entrenamiento pueden incluir otros campos. Para incluir otros campos en el conjunto de datos, proporcione los campos en un esquema al crear el conjunto de datos.

## Tipo de conjunto de datos de metadatos de artículo
<a name="item-metadata-type-custom-domain"></a>

El campo siguiente es obligatorio:
+ `item_id` (cadena)

El siguiente campo es opcional y puede ser útil para mejorar los resultados de las previsiones:
+ `category` (cadena)

Además de los campos obligatorios y opcionales sugeridos, los datos de entrenamiento pueden incluir otros campos. Para incluir otros campos en el conjunto de datos, proporcione los campos en un esquema al crear el conjunto de datos.

# Dominio INVENTORY\$1PLANNING
<a name="inv-planning-domain"></a>

Utilice el dominio INVENTORY\$1PLANNING para la previsión de la demanda de materias primas y para determinar la cantidad de inventario de un determinado artículo en existencias. Admite los tipos de conjunto de datos siguientes: Para cada tipo de conjunto de datos, incluimos los campos obligatorios y opcionales. Para obtener más información acerca de cómo asignar los campos a columnas en los datos de entrenamiento, consulte [Dominios de conjunto de datos y tipos de conjunto de datos](howitworks-datasets-groups.md#howitworks-dataset-domainstypes).

**Topics**
+ [Tipo de conjuntos de datos de serie temporal de destino](#target-time-series-type-inv-planning-domain)
+ [Tipo de conjunto de datos de serie temporal relacionada](#related-time-series-type-related-time-series-domain)
+ [Tipo de conjunto de datos de metadatos de artículo](#item-metadata-type-related-time-series-domain)

## Tipo de conjuntos de datos de serie temporal de destino
<a name="target-time-series-type-inv-planning-domain"></a>

Los siguientes campos son obligatorios: 
+ `item_id` (cadena)
+ `timestamp` (marca temporal)
+ `demand` (flotante): este también es el campo `target` para el que Amazon Forecast genera una previsión.

La dimensión siguiente es opcional y se puede utilizar para cambiar la granularidad de la previsión:
+ `location` (cadena): la ubicación del centro de distribución donde se encuentra almacenado el artículo. Solo debe usarse si hay varias tiendas o ubicaciones.

Lo ideal es que solo se incluyan los campos obligatorios y las dimensiones opcionales. El resto de los datos de serie temporal adicionales debería incluirse en un conjunto de datos de serie temporal relacionada.

## Tipo de conjunto de datos de serie temporal relacionada
<a name="related-time-series-type-related-time-series-domain"></a>

Los siguientes campos son obligatorios: 
+ `item_id` (cadena)
+ `timestamp` (marca temporal)

Los siguientes campos son opcionales y pueden ser útiles para mejorar los resultados de las previsiones:
+ `price` (flotante): el precio del artículo 

Además de los campos obligatorios y opcionales sugeridos, los datos de entrenamiento pueden incluir otros campos. Para incluir otros campos en el conjunto de datos, proporcione los campos en un esquema al crear el conjunto de datos.

## Tipo de conjunto de datos de metadatos de artículo
<a name="item-metadata-type-related-time-series-domain"></a>

Los siguientes campos son obligatorios: 
+ `item_id` (cadena)

Los siguientes campos son opcionales y pueden ser útiles para mejorar los resultados de las previsiones:
+ `category` (cadena): la categoría del artículo.
+ `brand` (cadena): la marca del artículo.
+ `lead_time` (cadena): el plazo, en días, para fabricar el artículo.
+ `order_cycle` (cadena): el ciclo de pedidos comienza cuando comienza el trabajo y finaliza cuando el artículo está listo para su entrega.
+ `safety_stock` (cadena): la cantidad mínima de existencias que hay que tener a mano para ese artículo.

Además de los campos obligatorios y opcionales sugeridos, los datos de entrenamiento pueden incluir otros campos. Para incluir otros campos en el conjunto de datos, proporcione los campos en un esquema al crear el conjunto de datos.

# Dominio EC2 CAPACITY
<a name="ec2-capacity-domain"></a>

Utilice el dominio EC2 CAPACITY para prever la capacidad de Amazon EC2. Admite los tipos de conjunto de datos siguientes: Para cada tipo de conjunto de datos, incluimos los campos obligatorios y opcionales. Para obtener más información acerca de cómo asignar los campos a columnas en los datos de entrenamiento, consulte [Dominios de conjunto de datos y tipos de conjunto de datos](howitworks-datasets-groups.md#howitworks-dataset-domainstypes).

## Tipo de conjuntos de datos de serie temporal de destino
<a name="target-time-series-type-ec2-capacity-domain"></a>

Los siguientes campos son obligatorios:
+ `instance_type` (cadena): el tipo de instancia (por ejemplo, c5.xlarge).
+ `timestamp` (marca temporal)
+ `number_of_instances` (entero): el número de instancias de ese tipo de instancia concreto que se consumieron en la marca temporal. Este también es el campo `target` para el que Amazon Forecast genera una previsión.

La dimensión siguiente es opcional y se puede utilizar para cambiar la granularidad de la previsión:
+ `location`(cadena): puedes proporcionar un Región de AWS, como us-west-2 o us-east-1. Solo debe utilizarse si se están modelando varias regiones.

Idealmente, solo se deberían incluir estos campos opcionales obligatorios y sugeridos. El resto de los datos de serie temporal adicionales debería incluirse en un conjunto de datos de serie temporal relacionada.

## Tipo de conjunto de datos de serie temporal relacionada
<a name="related-time-series-type-ec2-capacity-domain"></a>

Los siguientes campos son obligatorios: 
+ `instance_type` (cadena)
+ `timestamp` (marca temporal)

Además de los campos obligatorios, los datos de entrenamiento pueden incluir otros campos. Para incluir otros campos en el conjunto de datos, proporcione los campos en un esquema al crear el conjunto de datos.

# Dominio WORK\$1FORCE
<a name="workforce-domain"></a>

Utilice el dominio WORK\$1FORCE para realizar la previsión de demanda de personal. Admite los tipos de conjunto de datos siguientes: Para cada tipo de conjunto de datos, incluimos los campos obligatorios y opcionales. Para obtener más información acerca de cómo asignar los campos a columnas en los datos de entrenamiento, consulte [Dominios de conjunto de datos y tipos de conjunto de datos](howitworks-datasets-groups.md#howitworks-dataset-domainstypes).

**Topics**
+ [Tipo de conjuntos de datos de serie temporal de destino](#target-time-series-type-workforce-domain)
+ [Tipo de conjunto de datos de serie temporal relacionada](#related-time-series-type-workforce-domain)
+ [Tipo de conjunto de datos de metadatos de artículo](#item-metadata-type-workforce-domain)

## Tipo de conjuntos de datos de serie temporal de destino
<a name="target-time-series-type-workforce-domain"></a>

Los siguientes campos son obligatorios: 
+ `workforce_type` (cadena): el tipo de personal que se prevé. Por ejemplo, la demanda del centro de llamadas o la demanda de mano de obra en el centro logístico.
+ `timestamp` (marca temporal)
+ `workforce_demand` (entero de punto flotante): este también es el campo `target` para el que Amazon Forecast genera una previsión.

La dimensión siguiente es opcional y se puede utilizar para cambiar la granularidad de la previsión:
+ `location` (cadena): la ubicación en la que se buscan los recursos de personal. Debe utilizarse si hay varias tiendas o ubicaciones.

Lo ideal es que solo se incluyan los campos obligatorios y las dimensiones opcionales. El resto de los datos de serie temporal adicionales debería incluirse en un conjunto de datos de serie temporal relacionada.

## Tipo de conjunto de datos de serie temporal relacionada
<a name="related-time-series-type-workforce-domain"></a>

Los siguientes campos son obligatorios: 
+ `workforce_type` (cadena)
+ `timestamp` (marca temporal)

Además de los campos obligatorios, los datos de entrenamiento pueden incluir otros campos. Para incluir otros campos en el conjunto de datos, proporcione los campos en un esquema al crear el conjunto de datos.

## Tipo de conjunto de datos de metadatos de artículo
<a name="item-metadata-type-workforce-domain"></a>

El campo siguiente es obligatorio: 
+ `workforce_type` (cadena)

Los siguientes campos son opcionales y pueden ser útiles para mejorar los resultados de las previsiones:
+ `wages` (flotante): el salario promedio de ese tipo de personal en particular.
+ `shift_length` (cadena): la duración del turno.
+ `location` (cadena): la ubicación del personal.

Además de los campos obligatorios y opcionales sugeridos, los datos de entrenamiento pueden incluir otros campos. Para incluir otros campos en el conjunto de datos, proporcione los campos en un esquema al crear el conjunto de datos.

# Dominio WEB\$1TRAFFIC
<a name="webtraffic-domain"></a>

Utilice el dominio WEB\$1TRAFFIC para realizar una previsión del tráfico web a una propiedad web o un conjunto de propiedades web. Admite los tipos de conjunto de datos siguientes: Los temas relevantes describen los campos obligatorios y opcionales que admite el tipo del conjunto de datos. Para obtener más información sobre cómo asignar estos campos a columnas en los datos de entrenamiento, consulte [Dominios de conjunto de datos y tipos de conjunto de datos](howitworks-datasets-groups.md#howitworks-dataset-domainstypes).

**Topics**
+ [Tipo de conjuntos de datos de serie temporal de destino](#target-time-series-type-webtraffic-domain)
+ [Tipo de conjunto de datos de serie temporal relacionada](#related-time-series-type-webtraffic-domain)

## Tipo de conjuntos de datos de serie temporal de destino
<a name="target-time-series-type-webtraffic-domain"></a>

Los siguientes campos son obligatorios: 
+ `item_id` (cadena): el identificador único para cada propiedad web que se vaya a prevenir.
+ `timestamp` (marca temporal)
+ `value` (flotante): este también es el campo `target` para el que Amazon Forecast genera una previsión.

Idealmente, solo se deberían incluir estos campos obligatorios. El resto de los datos de serie temporal adicionales debería incluirse en un conjunto de datos de serie temporal relacionada.

## Tipo de conjunto de datos de serie temporal relacionada
<a name="related-time-series-type-webtraffic-domain"></a>

Los siguientes campos son obligatorios: 
+ `item_id` (cadena)
+ `timestamp` (marca temporal)

Además de los campos obligatorios, los datos de entrenamiento pueden incluir otros campos. Para incluir otros campos en el conjunto de datos, proporcione los campos en un esquema al crear el conjunto de datos.

### Tipo de conjunto de datos de metadatos de artículo
<a name="idem-metadata-type-webtraffic-domain"></a>

El campo siguiente es obligatorio: 
+ `item_id` (cadena)

El siguiente campo es opcional y puede ser útil para mejorar los resultados de las previsiones:
+ `category` (cadena)

Además de los campos obligatorios y opcionales sugeridos, los datos de entrenamiento pueden incluir otros campos. Para incluir otros campos en el conjunto de datos, proporcione los campos en un esquema al crear el conjunto de datos.

# Dominio METRICS
<a name="metrics-domain"></a>

Utilice el dominio METRICS para realizar una previsión de las métricas, como, por ejemplo, ingresos, ventas y flujo de caja. Admite los tipos de conjunto de datos siguientes: Para cada tipo de conjunto de datos, incluimos los campos obligatorios y opcionales. Para obtener más información acerca de cómo asignar los campos a columnas en los datos de entrenamiento, consulte [Dominios de conjunto de datos y tipos de conjunto de datos](howitworks-datasets-groups.md#howitworks-dataset-domainstypes).

**Topics**
+ [Tipo de conjuntos de datos de serie temporal de destino](#target-time-series-type-metrics-domain)
+ [Tipo de conjunto de datos de serie temporal relacionada](#related-time-series-type-metrics-domain)
+ [Tipo de conjunto de datos de metadatos de artículo](#item-metadata-type-metrics-domain)

## Tipo de conjuntos de datos de serie temporal de destino
<a name="target-time-series-type-metrics-domain"></a>

Los siguientes campos son obligatorios: 
+ `metric_name` (cadena)
+ `timestamp` (marca temporal)
+ `metric_value` (entero de punto flotante): este es el campo `target` para el que Amazon Forecast genera una previsión (por ejemplo, la cantidad de ingresos generados en un día concreto).

Idealmente, solo se deberían incluir estos campos obligatorios. El resto de los datos de serie temporal adicionales debería incluirse en un conjunto de datos de serie temporal relacionada.

## Tipo de conjunto de datos de serie temporal relacionada
<a name="related-time-series-type-metrics-domain"></a>

Los siguientes campos son obligatorios: 
+ `metric_name` (cadena)
+ `timestamp` (marca temporal)

Además de los campos obligatorios, los datos de entrenamiento pueden incluir otros campos. Para incluir otros campos en el conjunto de datos, proporcione los campos en un esquema al crear el conjunto de datos.

## Tipo de conjunto de datos de metadatos de artículo
<a name="item-metadata-type-metrics-domain"></a>

El campo siguiente es obligatorio: 
+ `metric_name` (cadena)

El siguiente campo es opcional y puede ser útil para mejorar los resultados de las previsiones:
+ `category` (cadena)

Además de los campos obligatorios y opcionales sugeridos, los datos de entrenamiento pueden incluir otros campos. Para incluir otros campos en el conjunto de datos, proporcione los campos en un esquema al crear el conjunto de datos.

# Actualización de datos
<a name="updating-data"></a>

A medida que recopile nuevos datos, querrá importarlos a Forecast. Para ello, tiene dos opciones: actualizaciones de reemplazo y actualizaciones incrementales. Un trabajo de importación de un conjunto de datos de reemplazo sobrescribirá todos los datos existentes con los datos recién importados. Una actualización incremental añadirá los datos recién importados al conjunto de datos.

Después de importar los nuevos datos, puede usar un predictor existente para generar una previsión para esos datos.

**Topics**
+ [Modos de importación](#idsi)
+ [Actualización de conjuntos de datos existentes](#idsi-console)
+ [Actualización de las previsiones](#update-data-new-forecasts)

## Modos de importación
<a name="idsi"></a>

Para configurar la forma en que Amazon Forecast añade nuevos datos al conjunto de datos existente, debe especificar el modo de importación del trabajo de importación del conjunto de datos. El modo de importación predeterminado es `FULL`. Solo puede configurar el modo de importación mediante la API de Amazon Forecast.
+ Para sobrescribir todos los datos existentes del conjunto de datos, especifique `FULL` en la operación de la API [CreateDatasetImportJob](API_CreateDatasetImportJob.md).
+ Para añadir los registros a los datos existentes del conjunto de datos, especifique `INCREMENTAL` en la operación de la API [CreateDatasetImportJob](API_CreateDatasetImportJob.md). Si un registro existente y un registro importado tienen el mismo ID de serie temporal (ID de articulo, dimensión y marca temporal), el registro existente se sustituye por el registro recién importado. Amazon Forecast siempre utiliza el registro con la marca temporal más reciente.

Si no ha importado un conjunto de datos, la opción incremental no estará disponible. El modo de importación predeterminado es un reemplazo completo.

### Directrices sobre el modo de importación incremental
<a name="idsi-incremental"></a>

Al realizar una importación incremental de un conjunto de datos, no puede cambiar el formato de la marca temporal, el formato de los datos ni los datos de geolocalización. Para cambiar cualquiera de estos artículos, debe realizar una importación completa del conjunto de datos.

## Actualización de conjuntos de datos existentes
<a name="idsi-console"></a>

**importante**  
De forma predeterminada, un trabajo de importación de conjuntos de datos reemplaza cualquier dato existente en el conjunto de datos que haya importado. Puede cambiarlo especificando el trabajo de importación del conjunto de datos [Modos de importación](#idsi).

Para actualizar un conjunto de datos, cree un trabajo de importación del conjunto de datos para el conjunto de datos y especifique el modo de importación.

------
#### [ CLI ]

Para actualizar un conjunto de datos, utilice el comando `create-dataset-import-job`. Para el `import-mode`, especifique `FULL` para reemplazar los datos existentes o `INCREMENTAL` para agregarlos. Para obtener más información, consulte [Modos de importación](#idsi).

El siguiente código muestra cómo crear un trabajo de importación de conjuntos de datos que importe datos nuevos a un conjunto de datos de forma incremental.

```
aws forecast create-dataset-import-job \
                        --dataset-import-job-name dataset import job name \
                        --dataset-arn dataset arn \
                        --data-source "S3Config":{"KMSKeyArn":"string", "Path":"string", "RoleArn":"string"} \
                        --import-mode INCREMENTAL
```

------
#### [ Python ]

Para actualizar un conjunto de datos, utilice el método `create_dataset_import_job`. Para el `import-mode`, especifique `FULL` para reemplazar los datos existentes o `INCREMENTAL` para agregarlos. Para obtener más información, consulte [Modos de importación](#idsi).

```
import boto3

forecast = boto3.client('forecast')

response = forecast.create_dataset_import_job(
    datasetImportJobName = 'YourImportJob',
    datasetArn = 'dataset_arn',
    dataSource = {"S3Config":{"KMSKeyArn":"string", "Path":"string", "RoleArn":"string"}},
    importMode = 'INCREMENTAL'
)
```

------

## Actualización de las previsiones
<a name="update-data-new-forecasts"></a>

A medida que recopile nuevos datos, es posible que desee utilizarlos para generar nuevas previsiones. Forecast no reentrena automáticamente un predictor al importar un conjunto de datos actualizado, pero puede reentrenar manualmente un predictor para generar una nueva previsión con los datos actualizados. Por ejemplo, si recopila datos de las ventas diarias y desea incluir nuevos puntos de datos en la previsión, puede importar los datos actualizados y utilizarlos para generar una previsión sin entrenar a un nuevo predictor. Para que los datos recién importados tengan un impacto en sus previsiones, debe volver a entrenar el predictor.

**Para generar una previsión a partir de datos nuevos:**

1. Cargue los datos nuevos en el bucket de Amazon S3. Los nuevos datos deben contener solo los datos agregados desde la última importación del conjunto de datos.

1. Cree un trabajo de importación de conjunto de datos **incremental** con los nuevos datos. Los nuevos datos se adjuntan a los datos existentes y la previsión se genera a partir de los datos actualizados. Si el nuevo archivo de datos contiene datos importados anteriormente y datos nuevos, cree un trabajo de importación del conjunto de datos **completo**.

1. Cree una nueva previsión utilizando el predictor existente.

1. Recupere la previsión de la forma habitual.

# Gestión de valores faltantes
<a name="howitworks-missing-values"></a>

Un problema habitual en los datos de predicción de series temporales es la presencia de valores faltantes. Es posible que sus datos contengan valores faltantes por varias razones, como fallos de medición, problemas de formato, errores humanos o falta de información para registrar. Por ejemplo, si pronostica la demanda de productos para una tienda minorista y un artículo está agotado o no está disponible, no habría datos de ventas que registrar mientras ese artículo estuviera agotado. Si están suficientemente extendidos, los valores faltantes pueden afectar de manera significativa a la precisión de un modelo.

Amazon Forecast proporciona una serie de métodos de llenado para gestionar los valores que faltan en las series temporales de destino y los conjuntos de datos de series temporales relacionadas. El llenado es el proceso de añadir valores estandarizados a las entradas que faltan en su conjunto de datos.

Forecast admite los siguientes métodos de llenado:
+ **Llenado intermedio**: rellena los valores que falten entre las fechas de inicio y finalización de los artículos del conjunto de datos.
+ **Llenado inverso**: rellena los valores que falten entre el último punto de datos registrado y la fecha de finalización global de un conjunto de datos.
+ **Llenado futuro (solo series temporales relacionadas)**: rellena los valores que falten entre la fecha de finalización global y el final del horizonte de previsión.

La siguiente imagen proporciona una representación visual de diferentes métodos de llenado.

![\[Timeline showing three items with varying durations and fill methods between global start and end dates.\]](http://docs.aws.amazon.com/es_es/forecast/latest/dg/images/Filling_types.PNG)


## Elección de la lógica de llenado
<a name="choosing-missing-values"></a>

Al elegir una lógica de llenado, debe considerar cómo interpretará su modelo la lógica. Por ejemplo, en un caso comercial, registrar 0 ventas de un artículo disponible es diferente de registrar 0 ventas de un artículo no disponible, ya que este último no implica una falta de interés del cliente en el artículo. Debido a esto, el llenado de `0` en la serie temporal de destino podría causar que el predictor sea poco sesgado en sus predicciones, mientras que el llenado `NaN` podría pasar por alto las ocurrencias reales de 0 artículos disponibles que se venden y hacer que el predictor sea excesivamente sesgado.

Los siguientes gráficos de series temporales ilustran cómo elegir un valor de llenado incorrecto puede afectar significativamente a la precisión del modelo. Los gráficos A y B representan la demanda de un artículo de forma parcial out-of-stock, y las líneas negras representan los datos de ventas reales. Los valores que faltan en A1 se llenan con `0`, lo que lleva a predicciones relativamente poco sesgadas (representadas por las líneas punteadas) en A2. Del mismo modo, los valores que faltan en B1 se llenan con `NaN`, lo que lleva a predicciones que son más exactas en B2.

![\[Time-series graphs comparing item demand predictions with different filling values for missing data.\]](http://docs.aws.amazon.com/es_es/forecast/latest/dg/images/filling_values.PNG)


Para obtener una lista de la lógica de llenado admitida, consulte la siguiente sección.

## Lógica de llenado de series temporales de destino y series temporales relacionadas
<a name="filling-restrictions"></a>

Puede realizar el llenado tanto en series temporales de destino como en conjuntos de datos de series temporales relacionadas. Cada tipo de conjunto de datos tiene diferentes directrices y restricciones de llenado.


**Directrices de llenado**  

| Tipo de conjunto de datos | ¿Llenado por defecto? | Métodos de llenado admitidos | Lógica de llenado predeterminada | Lógica de llenado aceptada | 
| --- | --- | --- | --- | --- | 
| Serie temporal objetivo | Sí | Llenado medio y final | 0 |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/forecast/latest/dg/howitworks-missing-values.html)  | 
| Serie temporal relacionada | No | Llenado medio, final y futuro | No hay valor predeterminado |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/forecast/latest/dg/howitworks-missing-values.html)  | 

**importante**  
Para los conjuntos de datos de series temporales de destino y relacionadas `mean`, `median`, `min` y `max` se calculan en función de una ventana sucesiva de las 64 entradas de datos más recientes antes de los valores faltantes.

## Sintaxis de valores faltantes
<a name="filling-syntax"></a>

Para rellenar los valores faltantes, especifique los tipos de llenado que se van a implementar cuando llame a la [CreatePredictor](API_CreatePredictor.md)operación. La lógica de llenado se especifica en [FeaturizationMethod](API_FeaturizationMethod.md)los objetos.

En el siguiente extracto se muestra un objeto de `FeaturizationMethod` con el formato correcto para un atributo de serie de tiempo de destino y un atributo de serie de tiempo relacionado (`target_value` y `price` respectivamente).

 Para establecer un método de llenado en un valor específico, defina el parámetro de llenado en `_value` y defina el valor en un parámetro `value` correspondiente. Como se muestra a continuación, la reposición de la serie temporal relacionada se establece en un valor de 2 con lo siguiente: `"backfill": "value"` y `"backfill_value":"2"`. 

```
[
    {
        "AttributeName": "target_value",
        "FeaturizationPipeline": [
            {
                "FeaturizationMethodName": "filling",
                "FeaturizationMethodParameters": {
                    "aggregation": "sum",
                    "middlefill": "zero",
                    "backfill": "zero"
                }
            }
        ]
    },
    {
        "AttributeName": "price",
        "FeaturizationPipeline": [
            {
                "FeaturizationMethodName": "filling",
                "FeaturizationMethodParameters": {
                    "middlefill": "median",
                    "backfill": "value",
                    "backfill_value": "2",
                    "futurefill": "max"               
                    }
            }
        ]
    }
]
```

# Directrices de conjuntos de datos para Forecast
<a name="dataset-import-guidelines-troubleshooting"></a>

Consulte las siguientes directrices si Amazon Forecast no puede importar el conjunto de datos o si el conjunto de datos no funciona como se esperaba.

**Formato de la marca temporal**  
Para las frecuencias de recopilación anual (`Y`), mensual (`M`), semanal (`W`), y diaria (`D`), Forecast admite el formato de marca temporal `yyyy-MM-dd` (por ejemplo, `2019-08-21`) y, de forma opcional, el formato `HH:mm:ss` (por ejemplo, `2019-08-21 15:00:00`).  
Para las frecuencias de hora (`H`) y minuto (`M`), Forecast admite solo el formato `yyyy-MM-dd HH:mm:ss` (por ejemplo, `2019-08-21 15:00:00`).  
Directriz: cambie el formato de marca temporal de la frecuencia de recopilación del conjunto de datos al formato admitido.

**Archivo o bucket de Amazon S3**  
Al importar un conjunto de datos, puede especificar la ruta a un archivo CSV o Parquet en su bucket de Amazon Simple Storage Service (Amazon S3) que contiene los datos o el nombre del bucket de S3 que contiene los datos. Si especifica un archivo CSV o Parquet, Forecast importará solo ese archivo. Si especifica un bucket de S3, Forecast importa todos los archivos CSV o Parquet del bucket hasta 10 000 archivos. Si importa varios archivos especificando un nombre de bucket, todos los archivos CSV o Parquet deben ajustarse al esquema especificado.  
Instrucciones: especifique un archivo específico o un bucket de S3 con la siguiente sintaxis:  
`s3://bucket-name/example-object.csv`  
`s3://bucket-name/example-object.parquet`  
`s3://bucket-name/prefix/`  
`s3://bucket-name`  
Los archivos de Parquet pueden tener la extensión .parquet, .parq, .pqt o no tener ninguna extensión.

**Actualizaciones completas del conjunto de datos**  
La primera importación de un conjunto de datos es siempre una importación completa, las importaciones posteriores pueden ser actualizaciones completas o incrementales. Debe usar la API de Forecast para especificar el modo de importación.  
Con una actualización completa, todos los datos existentes se sustituyen por los datos recién importados. Como los trabajos de importación de conjuntos de datos completos no se agregan, la importación de conjuntos de datos más reciente es la que se utiliza para entrenar al predictor o generar una previsión.  
Instrucciones: cree una actualización incremental del conjunto de datos para añadir los nuevos datos a los datos existentes. Si no, asegúrese de que la importación de conjunto de datos más reciente contenga todos los datos que desee utilizar para el modelado y no solo los datos nuevos que se recopilaron desde la importación anterior.

**Actualizaciones incrementales de los conjuntos de datos**  
Los campos como la marca temporal, el formato de datos, la geolocalización, etc., se leen a partir del conjunto de datos actualmente activo. No es necesario incluir esta información en una importación incremental de conjuntos de datos. Si se incluyen, deben coincidir con los valores proporcionados originalmente.   
Instrucciones: realice una importación completa del conjunto de datos para cambiar cualquiera de estos valores.

**Orden de los atributos**  
El orden de los atributos especificado en la definición del esquema debe coincidir con el orden de las columnas del archivo CSV o Parquet que está importando. Por ejemplo, si definió `timestamp` como el primer atributo, `timestamp` deberá ser también la primera columna del archivo de entrada.   
Instrucciones: verifique que las columnas del archivo de entrada están en el mismo orden que los atributos del esquema que ha creado. 

**Índice meteorológico**  
Para aplicar el índice meteorológico, debe incluir un [atributo de geolocalización](weather.md#adding-geolocation) en su serie temporal de destino y en cualquier conjunto de datos de series temporales relacionadas. También debe especificar las [zonas horarias](weather.md#specifying-timezones) para las marcas temporales de sus series temporales de destino.  
Instrucciones: asegúrese de que sus conjuntos de datos incluyan un atributo de geolocalización y de que sus marcas temporales tengan una zona horaria asignada. Para obtener más información, consulta las [condiciones y restricciones](weather.md#weather-conditions-restrictions) del índice meteorológico.

**Encabezado del conjunto de datos**  
Los encabezados del conjunto de datos del CSV de entrada pueden causar errores de validación. Es recomendable omitir los encabezados para archivos CSV.  
Instrucciones: elimine el encabezado del conjunto de datos e intente realizar de nuevo la importación.  
Se requiere un encabezado de conjunto de datos para los archivos de Parquet. 

**Estado del conjunto de datos**  
Para poder importar datos de entrenamiento con la operación [CreateDatasetImportJob](API_CreateDatasetImportJob.md), el `Status` del conjunto de datos debe ser `ACTIVE`.   
Directriz: utilice la operación [DescribeDataset](API_DescribeDataset.md) para obtener el estado del conjunto de datos. Si no se pudo crear o actualizar el conjunto de datos, compruebe el formato del archivo del conjunto de datos e intente crearlo de nuevo.

**Formato de registro predeterminado**  
El formato de archivo predeterminado es CSV. 

**Formato y delimitador de archivos**  
Forecast solo admite el formato de archivo de valores separados por comas (CSV) y Parquet. Los valores no se pueden separar mediante tabulaciones, espacios, dos puntos ni ningún otro carácter.  
Instrucciones: convierta el conjunto de datos al formato CSV (utilizando solo comas como delimitador) o Parquet e intente volver a importar el archivo. 

**Nombre de archivo**  
Los nombres de archivo deben contener al menos un caracter alfabético. Los archivos con nombres que solo son numéricos no se pueden importar.  
Instrucciones: cambie el nombre del archivo de datos de entrada para incluir al menos un carácter alfabético e intente volver a importar el archivo. 

**Datos de Parquet particionados**  
Forecast no lee archivos Parquet particionados.

**Análisis condicional: requisitos del conjunto de datos**  
Los análisis condicionales requieren conjuntos de datos CSV. El TimeSeriesSelector funcionamiento de la [CreateWhatIfAnalysis](API_CreateWhatIfAnalysis.md) acción y el TimeSeriesReplacementDataSource funcionamiento de [CreateWhatIfForecast](API_CreateWhatIfForecast.md) no aceptar archivos Parquet.