

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 正在运行的 PySpark 作业
<a name="run-jobs"></a>

作为[可以查询的成员](glossary.md#glossary-member-who-can-query)，您可以使用已批准的 PySpark [分析模板](create-analysis-template.md)在已配置的表上运行 PySpark 作业。

**先决条件**

 在运行 PySpark 作业之前，你必须：
+  AWS Clean Rooms 合作中的活跃会员
+ 在协作中至少访问一个分析模板
+ 访问协作中至少一个已配置的表
+ 将 PySpark 任务结果写入指定 S3 存储桶的权限

  有关创建所需服务角色的信息，请参阅[创建服务角色以写入 PySpark 作业结果](setting-up-roles.md#create-role-pyspark-job)。
+ 负责支付计算费用的成员已作为活跃成员加入协作

有关如何通过直接调用 AWS Clean Rooms `StartProtectedJob` API 操作或使用来查询数据或查看查询的信息 AWS SDKs，请参阅 [AWS Clean Rooms API 参考](https://docs.aws.amazon.com/clean-rooms/latest/apireference/Welcome.html)。

有关作业记录的信息，请参阅[分析登录 AWS Clean Rooms](query-logs.md)。

有关接收作业结果的信息，请参阅[接收和使用分析结果](receive-query-results.md)。

以下主题说明了如何使用 AWS Clean Rooms 控制台在协作中对已配置的表运行 PySpark 作业。

**Topics**
+ [使用 PySpark 分析模板在已配置的表上运行 PySpark 作业](run-jobs-with-analysis-template.md)
+ [查看最近的工作](view-recent-jobs.md)
+ [查看任务详细信息](view-job-details.md)

# 使用 PySpark 分析模板在已配置的表上运行 PySpark 作业
<a name="run-jobs-with-analysis-template"></a>

此过程演示如何使用 AWS Clean Rooms 控制台中的 PySpark 分析模板通过**自定义**分析规则分析已配置的表。

**使用 PySpark 分析模板在已配置的表上运行 PySpark 作业**

登录 AWS 管理控制台 并在 [https://console.aws.amazon.com/clean](https://console.aws.amazon.com/cleanrooms/home) room AWS Clean Rooms s 上打开控制台。

1. 在左侧导航窗格中，选择**协作**。

1. 选择处于 “**您的成员**权限” 状态为 “**运行作业**” 的协作。

1. 在**分析**选项卡的**表格**部分下，查看表格及其关联的分析规则类型（**自定义分析规则**）。
**注意**  
如果您没有在列表中看到所期望的表，可能是由于以下原因：  
这些表尚未[关联](associate-configured-table.md)。
这些表没有[配置分析规则](add-analysis-rule.md)。

1. 在 “**分析**” 部分下，在 “**分析” 模式下**，选择 “**运行分析模板**”。

1. 从 “ PySpark 分析模板” 下拉列表中选择**分析模板**。

    PySpark 分析模板中的参数将自动填充到**定义**中。

1. 如果分析模板定义了参数，请在 “**参数**” 下提供参数值：

   1. 查看每个参数的**参数名称**和**默认值**（如果已配置）。

   1. 为要覆盖的每个参数输入一个**值**。
**注意**  
如果您未提供值但存在默认值，则将使用默认值。
**重要**  
参数值最多可包含 1,000 个字符，并且支持 UTF-8 编码。所有参数值都被视为字符串，并通过上下文对象传递给您的用户脚本。  
确保您的用户脚本能够安全地验证和处理参数值。有关安全参数处理的更多信息，请参阅[使用 PySpark 分析模板中的参数](pyspark-parameter-handling.md)。

1. 指定支持**的工作器类型**和**工作人员人数**。

   使用下表来确定您的用例所需的工作人员类型和人数。    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/clean-rooms/latest/userguide/run-jobs-with-analysis-template.html)
**注意**  
不同的工作人员类型和人数会产生相关成本。要了解有关定价的更多信息，请参阅[AWS Clean Rooms 定价](https://aws.amazon.com/clean-rooms/pricing/)。

1. 选择**运行**。
**注意**  
如果可以接收结果的成员尚未配置作业结果设置，则无法运行作业。

1. 继续调整参数并重新运行作业，或者选择 **\$1** 按钮在新选项卡中开始新作业。

# 查看最近的工作
<a name="view-recent-jobs"></a>

您可以在**分析**选项卡上查看过去 90 天内运行的作业。

**注意**  
如果您唯一的成员权限是 Contrib **ute 数据**，而您不是[支付工作计算费用的会员](glossary.md#glossary-member-paying-for-query-compute)，则控制台上不会显示 “**分析**” 选项卡。

**查看最近的工作**

1. 登录 AWS 管理控制台 并在 [https://console.aws.amazon.com/clean](https://console.aws.amazon.com/cleanrooms/home) room AWS Clean Rooms s 上打开控制台。

1. 在左侧导航窗格中，选择**协作**。

1. 选择协作。

1. 在 “**分析**” 选项卡的 “**分析**” 下，从下拉列表中选择 “**所有**作业”，然后查看过去 90 天内运行的作业。

1. 要按**状态**对最近的作业进行排序，请从 “**所有状态” 下拉列表中选择一个状态**。

   状态为：**已提交**、**已开始**、**已取消**、**成功**、**失败**和**超时**。

# 查看任务详细信息
<a name="view-job-details"></a>

您可以以可以运行作业的成员或可以接收结果的成员的身份查看作业详细信息。

**查看任务的详细信息**

1. 登录 AWS 管理控制台 并在 [https://console.aws.amazon.com/clean](https://console.aws.amazon.com/cleanrooms/home) room AWS Clean Rooms s 上打开控制台。

1. 在左侧导航窗格中，选择**协作**。

1. 选择协作。

1. 在 “**分析**” 选项卡的 “**分析**” 下，从下拉列表中选择 “**所有作业**”，然后执行以下操作之一：
   + 选择要查看的特定作业的选项按钮，然后选择 “**查看详细信息**”。
   + 选择**受保护的作业 ID**。

1. 在 **Job 详情**页面上，
   + 如果您是可以运行作业的成员，请查看 **Job 详细信息**、**Job** 和**结果**。

     您会看到一条消息，确认工作结果已发送给可以接收结果的成员。
   + 如果您是可以接收结果的成员，请查看 **Job 详情**和**结果**。