

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 以种子数据提供者的身份创建 AWS Clean Rooms 机器学习模型
<a name="working-with-machine-learning-sdp"></a>

训练数据提供者创建 ML 模型后，种子数据提供者可以创建和导出相似的区段。相似区段是训练数据的一个子集，与种子数据最为相似。

这是种子数据提供者必须完成的工作流程：

1. 种子数据提供者的数据可以存储在 Amazon S3 存储桶中，也可以来自查询结果。

1. 种子数据提供者开启与训练数据提供者共享的协作。

1. 种子数据提供者从协作页面的“Clean Rooms ML”选项卡中创建一个相似细分。

1. 种子数据提供者可以评估相关性指标（如果已共享），并导出相似细分以在 AWS Clean Rooms外部使用。

**Topics**
+ [创建长相相似的区段](create-ml-segment-create.md)
+ [导出相似的区段](create-ml-segment-export.md)

# 创建长相相似的区段
<a name="create-ml-segment-create"></a>

**注意**  
您只能提供训练数据集，以便在数据存储在 Amazon S3 中的 Clean Rooms ML 相似模型中使用。但是，您可以使用 SQL 为相似模型提供种子数据，该模型跨存储在任何支持的数据源中的数据运行。

相似细分是与种子数据最相似的训练数据子集。

**要在中创建相似的区段 AWS Clean Rooms**

1. 登录 AWS 管理控制台 并使用您的[AWS Clean Rooms 主机](https://console.aws.amazon.com/cleanrooms/home)打开主机 AWS 账户 （如果您尚未这样做）。

1. 在左侧导航窗格中，选择**协作**。

1. 在**具有活跃成员身份**选项卡上，选择一个协作。

1. 在 “**机器学习模型**” 选项卡上，选择 “**创建相似区段**”。

1. 在 “**创建相似区段**” 页面上，对于**关联的配置相似模型**，选择要用于此相似区段的关联配置相似模型。

   

1. 对于**相似细分详细信息**，输入**名称**以及（可选）**描述**。

   

1. 对于**种子配置文件**，请选择一个选项，然后采取建议的操作来选择**种子方法**。    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/clean-rooms/latest/userguide/create-ml-segment-create.html)

1. 选择创建此数据源时要使用**的工作器类型**。默认的工作器类型为 **CR.1X。**指定要使用的**员工人数**。默认为工作人员编号为 **16**。要指定**火花属性，请执行**以下操作：

   1. 展开 **Spark 属性**。

   1. 选择 “**添加 Spark 属性**”。

   1. 在 **Spark 属性**对话框中，从下拉列表中选择一个**属性名称**并输入**值**。

   下表提供了每个属性的定义。

   有关 Spark 属性的更多信息，请参阅 Apache [Spark 文档中的 Spark 属性](https://spark.apache.org/docs/latest/configuration.html#spark-properties)。    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/clean-rooms/latest/userguide/create-ml-segment-create.html)

1. 对于**服务访问**，选择将用于访问该表的**现有服务角色名称**。

1. 如果要为训练数据集启用**标签**，请选择**添加新标签**，然后输入**键**和**值**对。

1. 选择**创建相似细分**。

有关相应的 API 操作，请参阅[StartAudienceGenerationJob](https://docs.aws.amazon.com/cleanrooms-ml/latest/APIReference/API_StartAudienceGenerationJob.html)。

# 导出相似的区段
<a name="create-ml-segment-export"></a>

在创建相似细分后，您可以将该数据导出到一个 Amazon S3 存储桶。

**要在中导出相似的区段 AWS Clean Rooms**

1. 登录 AWS 管理控制台 并使用您的[AWS Clean Rooms 主机](https://console.aws.amazon.com/cleanrooms/home)打开主机 AWS 账户 （如果您尚未这样做）。

1. 在左侧导航窗格中，选择**协作**。

1. 在**具有活跃成员身份**选项卡上，选择一个协作。

1. 在 “**机器学习模型**” 选项卡上，选择一个相似的区段，然后选择**导出**。

1. 对于**导出相似模型**，为**导出相似模型详细信息**输入**名称**和可选**描述**。

1. 对于**细分大小**，选择导出的细分所需的大小。

1. 选择**导出**。

有关相应的 API 操作，请参阅[StartAudienceExportJob](https://docs.aws.amazon.com/cleanrooms-ml/latest/APIReference/API_StartAudienceExportJob.html)。