

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 创建基于提供商服务的匹配工作流程
<a name="create-matching-workflow-provider"></a>

*[基于提供商服务的匹配](glossary.md#provider-service-matching)*使您能够将已知标识符与首选数据服务提供商进行匹配。

AWS Entity Resolution 数据匹配服务 目前支持以下数据提供商服务：
+ LiveRamp
+ TransUnion
+ 统一身份证 2.0

有关支持的提供商服务的更多信息，请参阅[准备第三方输入数据](prepare-third-party-input-data.md)。

您可以对这些提供商使用公开订阅， AWS Data Exchange 也可以直接与数据提供商协商私人报价。有关创建新订阅或重复使用提供商服务的现有订阅的更多信息，请参阅[步骤 1：在上订阅提供商服务 AWS Data Exchange](prepare-third-party-input-data.md#subscribe-provider-service)。

以下各节介绍如何创建基于提供者的匹配工作流程。

**Topics**
+ [使用创建匹配的工作流程 LiveRamp](#create-mw-liveramp)
+ [使用创建匹配的工作流程 TransUnion](#create-mw-transunion)
+ [使用 UID 2.0 创建匹配的工作流程](#create-mw-uid)

## 使用创建匹配的工作流程 LiveRamp
<a name="create-mw-liveramp"></a>

该 LiveRamp 服务提供了一个名为 rampID 的标识符。RamPid是需求方平台中最常用的ID之一，用于为广告活动吸引受众。使用与匹配的工作流程 LiveRamp，您可以将经过哈希处理的电子邮件地址解析为 rampID。

**注意**  
AWS Entity Resolution 数据匹配服务 支持 PII-based rampID 赋值。

**先决条件**

在使用创建匹配的工作流程之前 LiveRamp，您必须：

1. 创建架构映射。有关更多信息，请参阅 [创建架构映射](create-schema-mapping.md)。

1. 订阅该 LiveRamp 服务

1. 为 Amazon S3 数据暂存存储桶配置适当的权限，以便在其中临时写入匹配的工作流程输出

在使用创建 ID 映射工作流程之前 LiveRamp，请向 S3 数据暂存存储桶添加以下权限。

------
#### [ JSON ]

****  

```
{
    "Version":"2012-10-17",		 	 	 
    "Statement": [
        {
            "Effect": "Allow",
            "Principal": {
                "AWS": "arn:aws:iam::715724997226:root"
      
            },
            "Action": [
                "s3:PutObject",
                "s3:GetObject",
                "s3:GetObjectVersion",
                "s3:DeleteObject"
            ],
            "Resource": [
                "arn:aws:s3:::{{<staging-bucket>}}",
                "arn:aws:s3:::{{<staging-bucket>}}/*"
            ]
        },
        {
            "Effect": "Allow",
            "Principal": {
                "AWS": "arn:aws:iam::715724997226:root"
            },
            "Action": [
                "s3:ListBucket",
                "s3:GetBucketLocation",
                "s3:GetBucketPolicy",
                "s3:ListBucketVersions",
                "s3:GetBucketAcl"
            ],
            "Resource": [
                "arn:aws:s3:::{{<staging-bucket>}}",
                "arn:aws:s3:::{{<staging-bucket>}}/*"
            ]
        }
    ]
}
```

------

将每个 {{<user input placeholder>}} 替换为您自己的信息。


|  |  | 
| --- |--- |
| {{staging-bucket}} | Amazon S3 存储桶，用于在运行基于提供商服务的工作流程时临时存储您的数据。 | 

**要创建匹配的工作流程，请执行 LiveRamp以下操作：**

1. 登录 AWS 管理控制台 并打开 AWS Entity Resolution 数据匹配服务 控制台，网址为[https://console.aws.amazon.com/entityresolution/](https://console.aws.amazon.com/entityresolution/)。

1. 在左侧导航窗格的 “**工作流程**” 下，选择 “**匹配**”。

1. 在**匹配工作流程**页面的右上角，选择**创建匹配工作流程**。

1. 对于 “**步骤 1：指定匹配的工作流程详细信息**”，请执行以下操作：

   1. 输入**匹配的工作流程名称**和可选的**描述**。

   1. 对于**数据输入 **AWS 区域****，选择**AWS Glue 数据库**、**AWS Glue 表**，然后选择相应的**架构映射**。

      您最多可以添加 20 个数据输入。

   1. 默认情况下，“**标准化数据**” 选项处于选中状态，以便在匹配之前对数据输入进行标准化。
**注意**  
**创建架构映射**中仅支持以下场景的标准化：  
如果将以下 “**名称**” 子类型分组：**名字**、**中间名、姓****氏**。
如果将以下**地址**子类型分组：**街道地址 1**、**街道地址 2**：**街道地址 3 名称**、**城市名称**、**州**、**国家**、**邮政编码**。
如果将以下**电话**子类型分组：**电话号码**、**电话国家/地区代码**。

      如果您使用的是仅限电子邮件的解析流程，请取消选择 “**标准化数据**” 选项，因为只有经过哈希处理的电子邮件才用于输入数据。

   1. 要指定**服务访问**权限，请选择一个选项并采取建议的操作。    
[See the AWS documentation website for more details](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/create-matching-workflow-provider.html)

   1. （可选）要为资源启用**标签**，请选择**添加新标签**，然后输入**密钥**和**值**对。

   1. 选择**下一步**。

1. 对于**步骤 2：选择匹配技术**：

   1. 在 “**匹配方法**” 中，选择 “**提供者服务**”。

   1. 对于**提供商服务**，请选择**LiveRamp**。
**注意**  
确保您的数据输入文件格式和标准化符合提供商服务的指南。  
有关匹配工作流程的输入文件格式指南的更多信息，请参阅 LiveRamp 文档中的[通过 ADX 执行身份解析](https://docs.liveramp.com/identity/en/perform-identity-resolution-through-adx.html)。

   1. 对于**LiveRamp 产品**，请从下拉列表中选择产品。  
![选择提供者服务的 LiveRamp 提供者服务选项。](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/images/choose-matching-method-liveramp.png)
**注意**  
如果您选择**赋值 PII，**则在执行实体解析时必须至少提供一个非标识符列。例如，性别。

   1. 要进行**LiveRamp 配置**，请输入**客户端 ID 管理器 ARN** 和**客户机密管理器 AR** N。  
![LiveRamp 配置表单，其中包含客户端 ID 管理器 ARN 和客户机密管理器 ARN 字段。](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/images/choose-matching-method-liveramp-config.png)

   1. 对于**数据暂**存，请选择 **Amazon S3 位置**，以便在处理数据时临时存储数据。

      您必须拥有访问 **Amazon S3 数据暂存位置**的权限。有关更多信息，请参阅 [为创建工作流程工作角色 AWS Entity Resolution 数据匹配服务](create-workflow-job-role.md)。

   1. 选择**下一步**。

1. 对于**步骤 3：指定数据输出**：

   1. 对于**数据输出目标和格式**，选择数据输出的 **Amazon S3 位置**，以及**数据格式**是**标准化数据**还是**原始数据**。

   1. 对于**加密**，如果您选择**自定义加密设置**，请输入**AWS KMS 密钥** ARN。

   1. 查看**LiveRamp 生成的输出**。

      这是由生成的其他信息 LiveRamp。

   1. 对于**数据输出**，请决定要包含、隐藏或掩盖哪些字段，然后根据目标采取建议的操作。
**注意**  
如果您已选择 **LiveRamp**，则由于 LiveRamp 隐私过滤器会删除个人身份信息 (PII)，某些字段将显示 “**不可用**” 的**输出**状态。    
[See the AWS documentation website for more details](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/create-matching-workflow-provider.html)  
![AWS Entity Resolution 数据匹配服务 ID 映射工作流程创建界面，带有用于指定数据输出位置的选项。](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/images/specify-data-output.PNG)

   1. 选择**下一步**。

1. 对于**步骤 4：查看并创建**：

   1. 查看您在之前的步骤中所做的选择，并在必要时进行编辑。

   1. 选择**创建并运行**。

      将出现一条消息，表示匹配的工作流程已创建且作业已启动。

1. 在匹配的工作流程详细信息页面的**指标**选项卡上，在 “**上次作业指标**” 下查看以下内容：
   + 作**业 ID**。
   + **匹配工作流作业的**状态**：已**排队**、进行**中**、**已完成、失**败** 
   + 工作流作业的**完成时间**。
   + 已**处理的记录**数。
   + **未处理的记录**数。
   + **生成的唯一匹配 ID**。
   + **输入记录**的数量。

   您还可以查看任务**历史记录下先前运行过的匹配工作流程作业的作业**指标。

1. 匹配的工作流程任务完成（**状态**为**已完成**）后，您可以转到**数据输出**选项卡，然后选择您的 **Amazon S3 位置**以查看结果。

## 使用创建匹配的工作流程 TransUnion
<a name="create-mw-transunion"></a>

如果您订阅了该 TransUnion 服务，则可以通过使用 TransUnion 个人和家庭电子密钥以及200多个数据属性链接、匹配和增强存储在不同渠道上的客户相关记录来提高对客户的理解。

该 TransUnion 服务提供被称为 TransUnion 个人和家庭身份证的标识符。 TransUnion 提供已知标识符（例如姓名、地址、电话号码和电子邮件地址）的 ID 分配（也称为编码）。

**先决条件**

在使用创建匹配的工作流程之前 LiveRamp，您必须：

1. 创建架构映射。有关更多信息，请参阅 [创建架构映射](create-schema-mapping.md)。

1. 订阅该 TransUnion 服务

1. 为 Amazon S3 数据暂存存储桶配置适当的权限，以便在其中临时写入匹配的工作流程输出

在使用创建匹配的工作流程之前 TransUnion，请向 S3 数据暂存存储桶添加以下权限。

------
#### [ JSON ]

****  

```
{
    "Version":"2012-10-17",		 	 	 
    "Statement": [
        {
            "Effect": "Allow",
            "Principal": {
                "AWS": "arn:aws:iam::381491956555:root"
      
            },
            "Action": [
                "s3:PutObject",
                "s3:GetObject",
                "s3:GetObjectVersion",
                "s3:DeleteObject"
            ],
            "Resource": [
                "arn:aws:s3:::{{<staging-bucket>}}",
                "arn:aws:s3:::{{<staging-bucket>}}/*"
            ]
        },
        {
            "Effect": "Allow",
            "Principal": {
                "AWS": "arn:aws:iam::381491956555:root"
            },
            "Action": [
                "s3:ListBucket",
                "s3:GetBucketLocation",
                "s3:GetBucketPolicy",
                "s3:ListBucketVersions",
                "s3:GetBucketAcl"
            ],
            "Resource": [
                "arn:aws:s3:::{{<staging-bucket>}}",
                "arn:aws:s3:::{{<staging-bucket>}}/*"
            ]
        }
    ]
}
```

------

将每个 {{<user input placeholder>}} 替换为您自己的信息。


|  |  | 
| --- |--- |
| {{staging-bucket}} | Amazon S3 存储桶，用于在运行基于提供商服务的工作流程时临时存储您的数据。 | 

**要创建匹配的工作流程，请执行 TransUnion以下操作：**

1. 登录 AWS 管理控制台 并打开 AWS Entity Resolution 数据匹配服务 控制台，网址为[https://console.aws.amazon.com/entityresolution/](https://console.aws.amazon.com/entityresolution/)。

1. 在左侧导航窗格的 “**工作流程**” 下，选择 “**匹配**”。

1. 在**匹配工作流程**页面的右上角，选择**创建匹配工作流程**。

1. 对于 “**步骤 1：指定匹配的工作流程详细信息**”，请执行以下操作：

   1. 输入**匹配的工作流程名称**和可选的**描述**。

   1. 对于**数据输入 **AWS 区域****，选择**AWS Glue 数据库**、**AWS Glue 表**，然后选择相应的**架构映射**。

      您最多可以添加 20 个数据输入。

   1. 默认情况下，“**标准化数据**” 选项处于选中状态，以便在匹配之前对数据输入进行标准化。如果您不想对数据进行标准化处理，请取消选择 “**标准化**数据” 选项。
**注意**  
**创建架构映射**中仅支持以下场景的标准化：  
如果将以下 “**名称**” 子类型分组：**名字**、**中间名、姓****氏**。
如果将以下**地址**子类型分组：**街道地址 1**、**街道地址 2**：**街道地址 3 名称**、**城市名称**、**州**、**国家**、**邮政编码**。
如果将以下**电话**子类型分组：**电话号码**、**电话国家/地区代码**。

   1. 要指定**服务访问**权限，请选择一个选项并采取建议的操作。    
[See the AWS documentation website for more details](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/create-matching-workflow-provider.html)

   1. （可选）要为资源启用**标签**，请选择**添加新标签**，然后输入**密钥**和**值**对。

   1. 选择**下一步**。

1. 对于**步骤 2：选择匹配技术**：

   1. 在 “**匹配方法**” 中，选择 “**提供者服务**”。

   1. 对于**提供商服务**，请选择**TransUnion**。
**注意**  
确保您的数据输入文件格式和标准化符合提供商服务的指南。  
![选择提供者服务的 TransUnion 提供者服务选项。](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/images/choose-matching-method-transunion.PNG)

   1. 对于**数据暂**存，请选择 **Amazon S3 位置**，以便在处理数据时临时存储数据。

      您必须拥有访问 **Amazon S3 数据暂存位置**的权限。有关更多信息，请参阅 [为创建工作流程工作角色 AWS Entity Resolution 数据匹配服务](create-workflow-job-role.md)。

1. 选择**下一步**。

1. 对于**步骤 3：指定数据输出**：

   1. 对于**数据输出目标和格式**，选择数据输出的 **Amazon S3 位置**，以及**数据格式**是**标准化数据**还是**原始数据**。

   1. 对于**加密**，如果您选择**自定义加密设置**，请输入**AWS KMS 密钥** ARN。

   1. 查看**TransUnion 生成的输出**。

      这是由生成的其他信息 TransUnion。

   1. 对于**数据输出**，请决定要包含、隐藏或掩盖哪些字段，然后根据目标采取建议的操作。    
[See the AWS documentation website for more details](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/create-matching-workflow-provider.html)

   1. 对于**系统生成的输出**，请查看包含的所有字段。

   1. 选择**下一步**。

1. 对于**步骤 4：查看并创建**：

   1. 查看您在之前的步骤中所做的选择，并在必要时进行编辑。

   1. 选择**创建并运行**。

      将出现一条消息，表示匹配的工作流程已创建且作业已启动。

1. 在匹配的工作流程详细信息页面的**指标**选项卡上，在 “**上次作业指标**” 下查看以下内容：
   + 作**业 ID**。
   + **匹配工作流作业的**状态**：已**排队**、进行**中**、**已完成、失**败** 
   + 工作流作业的**完成时间**。
   + 已**处理的记录**数。
   + **未处理的记录**数。
   + **生成的唯一匹配 ID**。
   + **输入记录**的数量。

   您还可以查看任务**历史记录下先前运行过的匹配工作流程作业的作业**指标。

1. 匹配的工作流程任务完成（**状态**为**已完成**）后，您可以转到**数据输出**选项卡，然后选择您的 **Amazon S3 位置**以查看结果。

## 使用 UID 2.0 创建匹配的工作流程
<a name="create-mw-uid"></a>

如果您订阅了 Unified ID 2.0 服务，则可以激活具有确定性身份的广告活动，并依靠与广告生态系统中许多 UID2-enabled参与者的互操作性。有关更多信息，请参阅 [Unified ID 2.0 概述]( https://unifiedid.com/docs/intro)。

Unified ID 2.0 服务提供原始的 UID 2，用于在 The Trade Desk 平台中制作广告活动。UID 2.0 是使用开源框架生成的。

在一个工作流程中，您可以使用**Email Address**或**Phone number**生成原始 UID2，但不能同时使用两者。如果两者都存在于架构映射中，则工作流程将选择，**Email Address**然后**Phone number**将是直通字段。要同时支持这两者，请创建一个新的架构映射**Phone number**，其中已映射但**Email Address**未映射。然后，使用这个新的架构映射创建第二个工作流程。

**注意**  
未加工的 UID2 是通过添加盐桶中的盐来创建的，这些盐桶大约每年轮换一次，从而使原始 UID2 也随之旋转。因此，建议您每天刷新原始 UID2。有关更多信息，请参阅 [https://unifiedid.com/docs/getting-started/gs-faqs\#how-often-should-uid2s-be-refreshed-for 增量更新。](https://unifiedid.com/docs/getting-started/gs-faqs#how-often-should-uid2s-be-refreshed-for-incremental-updates)

**先决条件**

在使用 UID 2.0 创建匹配的工作流程之前，您必须：

1. 创建架构映射。有关更多信息，请参阅 [创建架构映射](create-schema-mapping.md)。

1. 订阅 UID 2.0 服务

**要使用 UID 2.0 创建匹配的工作流程，请执行以下操作：**

1. 登录 AWS 管理控制台 并打开 AWS Entity Resolution 数据匹配服务 控制台，网址为[https://console.aws.amazon.com/entityresolution/](https://console.aws.amazon.com/entityresolution/)。

1. 在左侧导航窗格的 “**工作流程**” 下，选择 “**匹配**”。

1. 在**匹配工作流程**页面的右上角，选择**创建匹配工作流程**。

1. 对于 “**步骤 1：指定匹配的工作流程详细信息**”，请执行以下操作：

   1. 输入**匹配的工作流程名称**和可选的**描述**。

   1. 对于**数据输入 **AWS 区域****，选择**AWS Glue 数据库**、**AWS Glue 表**，然后选择相应的**架构映射**。

      您最多可以添加 20 个数据输入。

   1. 保持 “**标准化数据**” 选项处于选中状态，以便在匹配之前对数据输入（**Email Address**或**Phone number**）进行标准化。

      有关**Email Address**标准化的更多信息，请参阅 UID 2.0 文档中的[电子邮件地址标准化](https://unifiedid.com/docs/getting-started/gs-normalization-encoding#email-address-normalization)。

      有关**Phone number**标准化的更多信息，请参阅 UID 2.0 文档中的[电话号码标准化](https://unifiedid.com/docs/getting-started/gs-normalization-encoding#phone-number-normalization)。

   1. 要指定**服务访问**权限，请选择一个选项并采取建议的操作。    
[See the AWS documentation website for more details](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/create-matching-workflow-provider.html)

   1. （可选）要为资源启用**标签**，请选择**添加新标签**，然后输入**密钥**和**值**对。

   1. 选择**下一步**。

1. 对于**步骤 2：选择匹配技术**：

   1. 在 “**匹配方法**” 中，选择 “**提供者服务**”。

   1. 对于**提供商服务**，请选择**统一 ID 2.0**。  
![选择了 Unified ID 提供商服务的提供商服务选项。](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/images/choose-matching-method-uid.PNG)

   1. 选择**下一步**。

1. 对于**步骤 3：指定数据输出**：

   1. 对于**数据输出目标和格式**，选择数据输出的 **Amazon S3 位置**，以及**数据格式**是**标准化数据**还是**原始数据**。

   1. 对于**加密**，如果您选择**自定义加密设置**，请输入**AWS KMS 密钥** ARN。

   1. 查看 **Unified ID 2.0 生成的输出**。

      这是 UID 2.0 生成的所有其他信息的列表

   1. 对于**数据输出**，请决定要包含、隐藏或掩盖哪些字段，然后根据目标采取建议的操作。    
[See the AWS documentation website for more details](http://docs.aws.amazon.com/zh_cn/entityresolution/latest/userguide/create-matching-workflow-provider.html)

   1. 对于**系统生成的输出**，请查看包含的所有字段。

   1. 选择**下一步**。

1. 对于**步骤 4：查看并创建**：

   1. 查看您在之前的步骤中所做的选择，并在必要时进行编辑。

   1. 选择**创建并运行**。

      将出现一条消息，表示匹配的工作流程已创建且作业已启动。

1. 在匹配的工作流程详细信息页面的**指标**选项卡上，在 “**上次作业指标**” 下查看以下内容：
   + 作**业 ID**。
   + **匹配工作流作业的**状态**：已**排队**、进行**中**、**已完成、失**败** 
   + 工作流作业的**完成时间**。
   + 已**处理的记录**数。
   + **未处理的记录**数。
   + **生成的唯一匹配 ID**。
   + **输入记录**的数量。

   您还可以查看任务**历史记录下先前运行过的匹配工作流程作业的作业**指标。

1. 匹配的工作流程任务完成（**状态**为**已完成**）后，您可以转到**数据输出**选项卡，然后选择您的 **Amazon S3 位置**以查看结果。