

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 以培训数据提供者的身份创建 AWS Clean Rooms 机器学习模型
<a name="working-with-machine-learning-tdp"></a>

*相似模型* 是训练数据提供者的数据的模型，它允许种子数据提供者创建训练数据提供者数据的相似细分，该细分与其种子数据最相似。要创建可以在协作中使用的相似模型，您必须导入训练数据，创建相似模型，配置该相似模型，然后将其与一个协作相关联。

使用相似模型需要两方，即训练数据提供者和种子数据提供者，按顺序合作，将他们的数据整合到协作中 AWS Clean Rooms 。以下是训练数据提供者必须先完成的工作流程：

1. 训练数据提供者的数据必须存储在用户-项目交互 AWS Glue 的数据目录表中。训练数据必须至少包含用户 ID 列、交互 ID 列和时间戳列。

1. 训练数据提供者向注册训练数据 AWS Clean Rooms。

1. 训练数据提供者创建一个相似模型，可以将其与多个种子数据提供者共享。相似模型是一种深度神经网络，训练时间可能长达 24 小时。它不会自动重新训练，我们建议您每周重新训练一次。

1. 训练数据提供者配置相似模型，包括是否共享相关性指标以及输出细分的 Amazon S3 位置。训练数据提供者可以通过单个相似模型创建多个配置的相似模型。

1. 训练数据提供者将配置的受众模型关联到与某个种子数据提供者共享的协作。

训练数据提供者创建 ML 模型后，[种子数据提供者可以创建和导出相似的区段。](working-with-machine-learning-sdp.md)

**Topics**
+ [导入训练数据](create-ml-model-training-data.md)
+ [创建外观相似的模型](create-ml-model-create-model.md)
+ [配置外观相似的模型](create-ml-model-configure-model.md)
+ [关联已配置的相似模型](create-ml-model-associate-model.md)
+ [更新已配置的相似模型](update-ml-model-configured-model.md)

# 导入训练数据
<a name="create-ml-model-training-data"></a>

**注意**  
您只能提供训练数据集，以便在数据存储在 Amazon S3 中的 Clean Rooms ML 相似模型中使用。但是，您可以使用 SQL 为相似模型提供种子数据，该模型跨存储在任何支持的数据源中的数据运行。

在创建相似模型之前，必须指定包含训练数据的 AWS Glue 表。Clean Rooms ML 不存储该数据的副本，仅存储允许其访问该数据的元数据。

**要在中导入训练数据 AWS Clean Rooms**

1. 登录 AWS 管理控制台 并使用您的[AWS Clean Rooms 主机](https://console.aws.amazon.com/cleanrooms/home)打开主机 AWS 账户 （如果您尚未这样做）。

1. 在左侧导航窗格中，选择 **AWS ML 模型**。

1. 在**训练数据集**选项卡上，选择**创建训练数据集**。

1. 在**创建训练数据集**页面上，对于**训练数据集详细信息**，请输入**名称**，以及**描述**（可选）。

1. 通过从下拉列表中选择要配置的**数据库**和**表**来选择**训练数据来源**。
**注意**  
要验证是否是正确的表，请执行以下任一操作：  
选择 “**查看方式” AWS Glue**。
打开**查看架构**以查看架构。

1. 对于**训练详细信息**，请从下拉列表中选择**用户标识符列**、**项目标识符列**和**时间戳列**。训练数据必须包含这三个列。您也可以选择要在训练数据中包含的任何其他列。

   **时间戳列**中的数据必须采用 Unix 纪元时间格式，以秒为单位。

1. （可选）如果您还有**要训练的其他列**，请从下拉列表中选择**列名称**和**类型**。

1. 在**服务访问**中，您必须指定可以访问您数据的服务角色，如果您的数据已加密，则必须提供 KMS 密钥。选择**创建并使用新的服务角色**，Clean Rooms ML 将自动创建服务角色并添加必要的权限策略。如果您要使用特定的服务角色，请选择**使用现有服务角色**，并将其输入到**服务角色名称**字段中。

   如果您的数据已加密，请在 **AWS KMS key**字段中输入您的 KMS 密钥，或者单击**创建 AWS KMS key**以生成新的 KMS 密钥。

1. 如果要为训练数据集启用**标签**，请选择**添加新标签**，然后输入**键**和**值**对。

1. 选择**创建训练数据集**。

有关相应的 API 操作，请参阅[CreateTrainingDataset](https://docs.aws.amazon.com/cleanrooms-ml/latest/APIReference/API_CreateTrainingDataset.html)。

# 创建外观相似的模型
<a name="create-ml-model-create-model"></a>

在创建训练数据集后，您就可以创建相似模型了。您可以通过单个训练数据集创建很多相似模型。

您必须在中创建默认数据库， AWS Glue Data Catalog 或者在提供的角色中包含该`glue:createDatabase`权限。

**要在中创建外观相似的模型 AWS Clean Rooms**

1. 登录 AWS 管理控制台 并使用您的[AWS Clean Rooms 主机](https://console.aws.amazon.com/cleanrooms/home)打开主机 AWS 账户 （如果您尚未这样做）。

1. 在左侧导航窗格中，选择 **AWS ML 模型**。

1. 在**相似模型**选项卡上，选择**创建相似模型**。

1. 在**创建相似模型**页面上，对于**相似模型详细信息**，请输入**名称**，以及**描述**（可选）。

   1. 从下拉列表中选择要建模的**训练数据集**。
**注意**  
要验证这是否是正确的训练数据集，请打开**显示训练数据集详细信息**以查看详细信息。  
要创建新训练数据集，请选择**创建训练数据集**。

   1. （可选）输入**训练窗口**。

1. 如果要为相似模型启用自定义加密设置，请选择**自定义加密设置**，然后输入 KMS 密钥。

1. 如果要为相似模型启用**标签**，请选择**添加新标签**，然后输入**键**和**值**对。

1. 选择**创建相似模型**。
**注意**  
模型训练可能需要几个小时到 2 天。

有关相应的 API 操作，请参阅[CreateAudienceModel](https://docs.aws.amazon.com/cleanrooms-ml/latest/APIReference/API_CreateAudienceModel.html)。

# 配置外观相似的模型
<a name="create-ml-model-configure-model"></a>

在创建相似模型后，您就可以对其进行配置以在协作中使用。您可以通过单个相似模型创建多个配置的相似模型。

**要在中配置外观相似的模型 AWS Clean Rooms**

1. 登录 AWS 管理控制台 并使用您的[AWS Clean Rooms 主机](https://console.aws.amazon.com/cleanrooms/home)打开主机 AWS 账户 （如果您尚未这样做）。

1. 在左侧导航窗格中，选择 **AWS ML 模型**。

1. 在**配置的相似模型**选项卡上，选择**配置相似模型**。

1. 在**配置相似模型**页面上，对于**配置相似模型详细信息**，请输入**名称**，以及**描述**（可选）。

   1. 从下拉列表中选择您要配置的**相似模型**。
**注意**  
要验证这是否是正确的相似模型，请打开**显示相似模型详细信息**以查看详细信息。  
要创建新的相似模型，请选择**创建相似模型**。

   1. 选择您希望的**最小匹配种子大小**。这是种子数据提供者数据中与训练数据中的用户重叠的最小用户数。该值必须大于 0。

1. 对于**与其他成员共享的指标**，选择您是否希望协作中的种子数据提供者接收模型指标，包括相关性分数。

1. 对于**相似区段目标位置**，请输入导出相似区段的 Amazon S3 存储桶。此存储桶必须与您的其他资源位于同一区域。

1. 对于**服务访问**，选择将用于访问该表的**现有服务角色名称**。

1. 对于**高级素材箱大小配置**，请将**受众大小类型**指定为**绝对**数字或**百分比**。

1. 如果要为已配置的表资源启用**标签**，请选择**添加新标签**，然后输入**键**和**值**对。

1. 选择**配置相似模型**。

有关相应的 API 操作，请参阅[CreateConfiguredAudienceModel](https://docs.aws.amazon.com/cleanrooms-ml/latest/APIReference/API_CreateConfiguredAudienceModel.html)。

# 关联已配置的相似模型
<a name="create-ml-model-associate-model"></a>

在配置相似模型后，您可以将其与一个协作相关联。

**将配置的相似模型关联到 AWS Clean Rooms**

1. 登录 AWS 管理控制台 并使用您的[AWS Clean Rooms 主机](https://console.aws.amazon.com/cleanrooms/home)打开主机 AWS 账户 （如果您尚未这样做）。

1. 在左侧导航窗格中，选择**协作**。

1. 在**具有活跃成员身份**选项卡上，选择一个协作。

1. 在 “**机器学习模型**” 选项卡上的 “**R eady-to-use 相似模型**” 下，选择 “**关联相似**模型”。

1. 在**关联配置的相似模型**页面上，对于**配置的相似模型关联详细信息**：

   1. 输入关联的配置受众模型的**名称**。

   1. 输入表的**描述**。

      该描述有助于区分具有相似名称的其他关联的配置受众模型。

1. 对于**配置的相似模型**，从下拉列表中选择一个配置的相似模型。

1. 选择**关联 **。

有关相应的 API 操作，请参阅[CreateConfiguredAudienceModelAssociation](https://docs.aws.amazon.com/clean-rooms/latest/apireference/API_CreateConfiguredAudienceModelAssociation.html)。

# 更新已配置的相似模型
<a name="update-ml-model-configured-model"></a>

关联已配置的相似模型后，您可以对其进行更新以更改诸如名称、要共享的指标或输出 Amazon S3 位置之类的信息。

**要在中更新相关配置的相似模型 AWS Clean Rooms**

1. 登录 AWS 管理控制台 并使用您的[AWS Clean Rooms 主机](https://console.aws.amazon.com/cleanrooms/home)打开主机 AWS 账户 （如果您尚未这样做）。

1. 在左侧导航窗格中，选择 **AWS ML 模型**。

1. **在**配置的相似模型**选项卡上，在**Ready-to-use 相似模型**下，选择已配置的相似模型，然后选择编辑。**

1. 在**编辑**页面上，对于**配置的相似模型关联详细信息**：

   1. 更新**名称**以及（可选）**描述**。

   1. 从下拉列表中选择您要配置的**相似模型**。

   1. 选择您希望的**最小匹配种子大小**。这是种子数据提供者数据中与训练数据中的用户重叠的最小用户数。该值必须大于 0。

1. 对于**与其他成员共享的指标**，选择您是否希望协作中的种子数据提供者接收模型指标，包括相关性分数。

1. 对于**相似细分目标位置**，输入将相似细分导出到的 Amazon S3 存储桶。此存储桶必须与您的其他资源位于同一区域。

1. 对于**服务访问**，选择将用于访问该表的**现有服务角色名称**。

1. 对于**高级桶大小配置**，请选择要如何配置受众桶大小。

1. 选择**保存更改**。

有关相应的 API 操作，请参阅[UpdateConfiguredAudienceModel](https://docs.aws.amazon.com/clean-rooms/latest/apireference/API_UpdateConfiguredAudienceModel.html)。