Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Preparar datos de entrada
Formatee los datos de entrada como archivos de Apache Parquet
Descripción general del esquema de entrada
Los datos de entrada deben ajustarse al esquema del tipo de acción de trabajo específico que desee ejecutar. Cada tipo de acción define su propio conjunto de campos obligatorios y opcionales.
Todos los esquemas de entrada admiten un Id campo opcional. Utilice este campo para asignar un identificador a cada registro de entrada. Si proporciona un Id valor, aparece como Input_Id en la salida, lo que le permite correlacionar los registros de salida con sus entradas correspondientes.
Para ver los detalles del esquema de entrada de validación de direcciones, consulte Esquema de entrada de validación de direcciones.
Límites de tamaño de archivo
Los archivos de entrada tienen las siguientes limitaciones:
-
Tamaño máximo de archivo: 10 GB por archivo
-
Tamaño máximo del grupo de filas de Parquet: 1 GB
-
Número máximo de archivos por prefijo de entrada: 1000