

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 首次上传文件
<a name="uploading_files"></a>

您可以使用 AWS Supply Chain 自动关联功能上传原始数据，并自动将原始数据与 AWS Supply Chain 数据模型相关联。您还可以查看 AWS Supply Chain Web 应用程序中每个 AWS Supply Chain 模块*所需的*列和表。

要简要演示自动关联的工作原理，请观看以下视频：




**注意**  
使用自动关联时，您只能将 CSV 文件上传到 Amazon S3。

将数据集中的源列与目标列关联后， AWS Supply Chain 将自动生成 SQL 配方。

**注意**  
AWS Supply Chain 使用 Amazon Bedrock 进行自动关联，但并非所有可用的和AWS 区域 AWS Supply Chain 都支持自动关联。因此， AWS Supply Chain 将从最近的可用区域调用 Amazon Bedrock 终端节点，即欧洲（爱尔兰）区域 — 欧洲（法兰克福）和亚太地区（悉尼）区域 — 美国西部（俄勒冈）。

**注意**  
仅当通过 Amazon S3 摄取数据时，才支持使用大型语言模型 (LLM) 进行自动关联。

1. 在 AWS Supply Chain 控制面板的左侧导航窗格中，选择**数据湖**，然后选择**数据摄取**选项卡。

   将出**现 “数据摄取” 页面。**

1. 选择 “**添加新来源**”。

   将出现 **“选择您的数据源**” 页面。

1. 在 **“选择您的数据源**” 页面上，选择 “**上传文件**”。

1. 选择**继续**。  
![\[上传您的源文件\]](http://docs.aws.amazon.com/zh_cn/aws-supply-chain/latest/userguide/images/data_lake.png)

1. 在 “**要运行哪些功能**” 页面上，选择要使用的 AWS Supply Chain 模块。您可以选择多个模块。

1. 在 “**上传您的源文件**” 部分下，为**源系统名称**添加后缀。例如，oracle\$1test。

1. 要上传源数据集，请选择**文件**或拖放文件。

   将显示带有名称和状态的源表。

1. 选择 “**上传到 S3**”。*上传状态*将更改为显示状态。

1. 在 “**查看数据要求**” 下，查看所选 AWS Supply Chain 要素的所有必需数据实体和列。将显示所有必需的主键和外键。

1. 选择**继续**。

1. 在 “**管理您的源表**” 下，以下源表和列出的列将自动关联并导入到数据湖中。

   选择 **Delete table** 可在导入数据湖之前删除任何源表。  
![\[管理您的源文件\]](http://docs.aws.amazon.com/zh_cn/aws-supply-chain/latest/userguide/images/data_lake1.png)

1. 选择 “**全部接受” 并继续**。

   屏幕上会显示一条关于将您的表自动关联到 AWS Supply Chain 数据湖的消息。  
![\[管理目标流\]](http://docs.aws.amazon.com/zh_cn/aws-supply-chain/latest/userguide/images/data_lake3.png)

1. 在 “**管理目标流程**” 下，您可以查看每个自动关联的表。

   默认情况下，**自动关联**处于启用状态，并且源列与目标列自动关联。要更新自动关联的列，您可以更新 SQL 配方以创建您的自定义配方。

1. 在 “**源列” 下，列**出了所有未关联的源列。将未关联的列拖放到右侧的**目标列**中。

1. 对每个自动关联的表执行上述步骤。

1. 选择**提交**。

1. 选择**退出并查看目标流程**。

# 将后续文件上传到现有来源
<a name="incremental_file_upload"></a>

有两种方法可以将后续数据集上传到现有源。您可以在 “**源流程**” 选项卡下显示的 Amazon S3 路径上上传数据集，也可以在 “**操作**” 选项卡下选择 “**上传文件**”。

如果您使用自动连接器、执行脚本或使用中间件解决方案将数据集提取到其中 AWS Supply Chain，则必须使用**源流程**选项卡下显示的 Amazon S3 路径来更新 Amazon S3 路径。

**注意**  
如果将具有相同文件名的现有文件重新上传到 Amazon S3，则 AWS Supply Chain 会覆盖 Amazon S3 上的该文件。

![\[为后续文件上传采集数据\]](http://docs.aws.amazon.com/zh_cn/aws-supply-chain/latest/userguide/images/Data_lake_upload.png)
