

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 准备输入数据
<a name="preparing-input-data"></a>

按照要执行的作业操作类型所需的架构，将输入数据格式化为 [Apache Parq](https://parquet.apache.org/docs/overview/) uet 文件。每种操作类型都有自己的架构要求，这些要求定义了您的输入数据必须包含的字段。

## 输入架构概述
<a name="input-schema-overview"></a>

您的输入数据必须符合您要运行的特定作业操作类型的架构。每种操作类型都定义了自己的一组必填字段和可选字段。

所有输入架构都支持可选`Id`字段。使用此字段为每条输入记录分配一个标识符。如果您提供一个`Id`值，则该值将显示`Input_Id`在输出中，从而允许您将输出记录与其对应的输入关联起来。

有关地址验证输入架构的详细信息，请参阅[地址验证输入架构](address-validation-concepts.md#address-validation-input-schema)。

## 文件大小限制
<a name="input-file-limits"></a>

输入文件有以下限制：
+ 最大文件大小：每个文件 10 GB
+ Parquet 行组最大大小：1 GB
+ 每个输入前缀的最大文件数：1000