

# 连接到 Instagram Ads
<a name="connecting-to-data-instagram-ads"></a>

Instagram 是一款流行的照片分享应用程序，可让您与品牌、名人、思想领袖、朋友、家人等建立联系。它是一项照片分享和社交网络服务。用户可以拍摄照片或短视频，并与其关注者分享。Instagram 广告是企业可以付费向 Instagram 用户投放的帖子。

**Topics**
+ [AWS Glue 对 Instagram Ads 的支持](instagram-ads-support.md)
+ [包含创建和使用连接的 API 操作的策略](instagram-ads-configuring-iam-permissions.md)
+ [配置 Instagram Ads](instagram-ads-configuring.md)
+ [配置 Instagram Ads 连接](instagram-ads-configuring-connections.md)
+ [从 Instagram Ads 实体中读取](instagram-ads-reading-from-entities.md)
+ [Instagram Ads 连接选项](instagram-ads-connection-options.md)
+ [Instagram Ads 连接器的限制和说明](instagram-ads-connector-limitations.md)

# AWS Glue 对 Instagram Ads 的支持
<a name="instagram-ads-support"></a>

AWS Glue 对 Instagram Ads 的支持如下：

**是否支持作为来源？**  
是。您可以使用 AWS Glue ETL 作业查询 Instagram Ads 中的数据。

**是否支持作为目标？**  
否。

**支持的 Instagram Ads API 版本**  
支持以下 Instagram Ads API 版本：
+ v17.0
+ v18.0
+ v19.0
+ v20.0

# 包含创建和使用连接的 API 操作的策略
<a name="instagram-ads-configuring-iam-permissions"></a>

以下示例策略描述了创建和使用连接所需的 AWS IAM 权限。如果您要创建新角色，请创建包含以下内容的策略：

------
#### [ JSON ]

****  

```
{
  "Version":"2012-10-17",		 	 	 
  "Statement": [
    {
      "Effect": "Allow",
      "Action": [
        "glue:ListConnectionTypes",
        "glue:DescribeConnectionType",
        "glue:RefreshOAuth2Tokens",
        "glue:ListEntities",
        "glue:DescribeEntity"
      ],
      "Resource": "*"
    }
  ]
}
```

------

如果您不想使用上述方法，也可以使用以下托管 IAM 策略：
+ [AWSGlueServiceRole](https://console.aws.amazon.com/iam/home#policies/arn:aws:iam::aws:policy/service-role/AWSGlueServiceRole) – 授予对各种 AWS Glue 进程代表您运行所需的资源的访问权限。这些资源包括 AWS Glue、Amazon S3、IAM、CloudWatch Logs 和 Amazon EC2。如果您遵循此策略中指定的资源的命名约定，则 AWS Glue 进程具有所需的权限。此策略通常附加到在定义爬网程序、作业和开发终端节点时指定的角色。
+ [AWSGlueConsoleFullAccess](https://console.aws.amazon.com/iam/home#policies/arn:aws:iam::aws:policy/AWSGlueConsoleFullAccess)：当策略所附加到的身份使用 AWS 管理控制台时，授予对 AWS Glue 资源的完全访问权限。如果遵循此策略中指定的资源的命名约定，则用户具有完全控制台功能。此策略通常附加到 AWS Glue 控制台的用户。

# 配置 Instagram Ads
<a name="instagram-ads-configuring"></a>

您必须满足以下要求，才能使用 AWS Glue 从 Instagram Ads 传输数据：

## 最低要求
<a name="instagram-ads-configuring-min-requirements"></a>

以下是最低要求：
+ 可通过 Facebook 间接访问 Instagram 标准账户。
+ 需要进行用户身份验证才能生成访问令牌。
+ Instagram Ads SDK 连接器将实现*用户访问令牌 OAuth* 流程。
+ 我们使用 OAuth2.0 对 Instagram Ads 的 API 请求进行身份验证。这种基于 Web 的身份验证属于多重身份验证（MFA）架构，是 2FA 的超集。
+ 用户需要授予访问端点的权限。为了访问用户的数据，端点授权是通过[权限](https://developers.facebook.com/docs/permissions)和[功能](https://developers.facebook.com/docs/features-reference)来处理的。

## 获取 OAuth 2.0 凭证
<a name="instagram-ads-configuring-creating-instagram-ads-oauth2-credentials"></a>

要获取 API 凭证以便可对实例进行经过身份验证的调用，请参阅 [Graph API](https://developers.facebook.com/docs/graph-api/)。

# 配置 Instagram Ads 连接
<a name="instagram-ads-configuring-connections"></a>

Instagram Ads 支持 OAuth2 的 AUTHIZATION\$1CODE 授权类型。
+ 此授权类型被视为三足型 OAuth，因为它依赖于将用户重定向到第三方授权服务器来对用户进行身份验证。它用于通过 AWS Glue 控制台创建连接。
+ 用户可以选择在 Instagram Ads 中创建自己的关联应用程序，并在通过 AWS Glue 控制台创建连接时提供自己的客户端 ID 和客户端密钥。在这种情况下，他们仍会重定向到 Instagram Ads，以便登录并授权 AWS Glue 访问其资源。
+ 此授权类型会生成访问令牌。即将到期的系统用户令牌自生成或刷新之日起 60 天内有效。为保持连续性，开发者应在 60 天内刷新访问令牌。否则访问令牌将失效，并且需要开发者获取新访问令牌才能重新获得 API 访问权限。请参阅 [Refresh Access Token](https://developers.facebook.com/docs/marketing-api/system-users/install-apps-and-generate-tokens/)。

要配置 Instagram Ads 连接：

1. 在 AWS Glue Glue Studio 中，按照以下步骤在**数据连接**下创建连接：

   1. 选择**连接类型**时，请选择 Instagram Ads。

   1. 选择 AWS Glue 可以代入并有权执行以下操作的 AWS IAM 角色：

------
#### [ JSON ]

****  

      ```
      {
        "Version":"2012-10-17",		 	 	 
        "Statement": [
          {
            "Effect": "Allow",
            "Action": [
              "secretsmanager:DescribeSecret",
              "secretsmanager:GetSecretValue",
              "secretsmanager:PutSecretValue",
              "ec2:CreateNetworkInterface",
              "ec2:DescribeNetworkInterfaces",
              "ec2:DeleteNetworkInterface"
            ],
            "Resource": "*"
          }
        ]
      }
      ```

------

   1. 提供用户托管客户端应用程序的客户端 ID。

   1. 在 AWS Glue 中选择您要用于此连接的 `secretName`，然后放置令牌。所选密钥需要有一个键 `USER_MANAGED_CLIENT_APPLICATION_CLIENT_SECRET`，其值为关联应用程序的客户端密钥。

   1. 如果要使用网络，请选择网络选项。

1. 向与您的 AWS Glue 作业关联的 IAM 角色授予读取 `secretName` 的权限。

# 从 Instagram Ads 实体中读取
<a name="instagram-ads-reading-from-entities"></a>

**先决条件**

您要从中读取内容的 Instagram Ads 对象。您将需要对象名称。下表显示支持的实体。

**源支持的实体**：


| 实体 | 可以筛选 | 支持限制 | 支持排序依据 | 支持 Select \$1 | 支持分区 | 
| --- | --- | --- | --- | --- | --- | 
| 活动 | 支持 | 是 | 否 | 是 | 是 | 
| 广告集 | 支持 | 是 | 否 | 是 | 是 | 
| 广告 | 支持 | 是 | 否 | 是 | 是 | 
| 广告创意 | 否 | 是 | 否 | 是 | 否 | 
| 洞察 – 账户 | 否 | 是 | 否 | 是 | 否 | 
| 广告图片 | 支持 | 是 | 否 | 是 | 否 | 
| 洞察 – 广告 | 支持 | 是 | 否 | 是 | 是 | 
| 洞察 – 广告组 | 支持 | 是 | 否 | 是 | 是 | 
| 洞察 – 活动 | 支持 | 是 | 否 | 是 | 是 | 

**示例：**

```
instagramAds_read = glueContext.create_dynamic_frame.from_options(
    connection_type="instagramads",
    connection_options={
        "connectionName": "connectionName",
        "ENTITY_NAME": "entityName",
        "API_VERSION": "v20.0"
    }
```

## Instagram Ads 实体和字段详细信息
<a name="instagram-ads-reading-entity-and-field-details"></a>

有关实体和字段详细信息的更多信息，请参阅：
+ [活动](https://developers.facebook.com/docs/marketing-api/reference/ad-campaign-group)
+ [广告集](https://developers.facebook.com/docs/marketing-api/reference/ad-campaign)
+ [广告](https://developers.facebook.com/docs/marketing-api/reference/adgroup)
+ [广告创意](https://developers.facebook.com/docs/marketing-api/reference/ad-creative)
+ [广告账户洞察](https://developers.facebook.com/docs/marketing-api/reference/ad-account/insights)
+ [广告图片](https://developers.facebook.com/docs/marketing-api/reference/ad-image)
+ [广告洞察](https://developers.facebook.com/docs/marketing-api/reference/adgroup/insights/)
+ [广告组洞察](https://developers.facebook.com/docs/marketing-api/reference/ad-campaign/insights)
+ [活动洞察](https://developers.facebook.com/docs/marketing-api/reference/ad-campaign-group/insights)

有关更多信息，请参阅 [Marketing API](https://developers.facebook.com/docs/marketing-api/reference/v21.0)。

**注意**  
在连接器的响应中，结构和列表数据类型将转换为字符串数据类型。

## 对查询进行分区
<a name="instagram-ads-reading-partitioning-queries"></a>

如果您想在 Spark 中利用并发，可以提供其他 Spark 选项：`PARTITION_FIELD`、`LOWER_BOUND`、`UPPER_BOUND` 和 `NUM_PARTITIONS`。使用这些参数，原始查询将被拆分为 `NUM_PARTITIONS` 个子查询，这些子查询可以由 Spark 任务同时执行。
+ `PARTITION_FIELD`：用于对查询进行分区的字段的名称。
+ `LOWER_BOUND`：所选分区字段的**包含**下限值。

  对于日期时间字段，我们接受 Spark SQL 查询中使用的 Spark 时间戳格式。

  有效值示例：

  ```
  "2022-01-01T00:00:00.000Z"
  ```
+ `UPPER_BOUND`：所选分区字段的**排除**上限值。

  有效值示例：

  ```
  "2024-01-02T00:00:00.000Z"
  ```
+ `NUM_PARTITIONS`：分区的数量。

示例：

```
instagramADs_read = glueContext.create_dynamic_frame.from_options(
    connection_type="instagramads",
    connection_options={
        "connectionName": "connectionName",
        "ENTITY_NAME": "entityName",
        "API_VERSION": "v20.0",
        "PARTITION_FIELD": "created_time"
        "LOWER_BOUND": "2022-01-01T00:00:00.000Z"
        "UPPER_BOUND": "2024-01-02T00:00:00.000Z"
        "NUM_PARTITIONS": "10"
    }
```

# Instagram Ads 连接选项
<a name="instagram-ads-connection-options"></a>

以下是 Instagram Ads 的连接选项：
+ `ENTITY_NAME`（字符串）：（必填）用于读取。Instagram Ads 中对象的名称。
+ `API_VERSION`（字符串）：（必填）用于读取。您想要使用的 Instagram Ads Graph API 版本。例如：v21。
+ `SELECTED_FIELDS`（列表<字符串>）–默认：empty(SELECT \$1)。用于读取。您想要为对象选择的列。
+ `FILTER_PREDICATE`（字符串）– 默认：空。用于读取。应采用 Spark SQL 格式。
+ `QUERY`（字符串）– 默认：空。用于读取。完整的 Spark SQL 查询。
+ `PARTITION_FIELD`（字符串）：用于读取。用于分区查询的字段。
+ `LOWER_BOUND`（字符串）：用于读取。所选分区字段的包含下限值。
+ `UPPER_BOUND`（字符串）：用于读取。所选分区字段的排除上限值。
+ `NUM_PARTITIONS`（整数）– 默认：1。用于读取。要读取的分区数。

# Instagram Ads 连接器的限制和说明
<a name="instagram-ads-connector-limitations"></a>

以下是 Instagram Ads 连接器的限制或说明：
+ 应用程序的调用次数是用户在滚动的一小时窗口内可以调用次数 200 乘以用户数。有关速率限制的详细信息，请参阅 [Rate Limits](https://developers.facebook.com/docs/graph-api/overview/rate-limiting/) 和 [Business Use Case Rate Limits](https://developers.facebook.com/docs/graph-api/overview/rate-limiting/#buc-rate-limits)。