

终止支持通知： AWS 将于 2025 年 12 月 15 日终止对的支持 AWS IoT Analytics。2025 年 12 月 15 日之后，您将无法再访问 AWS IoT Analytics 控制台或 AWS IoT Analytics 资源。有关更多信息，请参阅[AWS IoT Analytics 终止支持](https://docs.aws.amazon.com/iotanalytics/latest/userguide/iotanalytics-end-of-support.html)。

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 文件格式
<a name="iotanalytics-schema"></a>

AWS IoT Analytics 数据存储目前支持 JSON 和 Parquet 文件格式。默认文件格式为 JSON。
+ [JSON（JavaScript 对象表示法）](https://www.json.org/json-en.html)-一种支持名称-值对和有序值列表的文本格式。
+ [Apache Parquet](https://parquet.apache.org/documentation/latest/) - 一种列式存储格式，用于高效存储和查询大量数据。

要配置 AWS IoT Analytics 数据存储的文件格式，可以在创建数据存储时使用该`FileFormatConfiguration`对象。

`fileFormatConfiguration`  
包含文件格式的配置信息。 AWS IoT Analytics 数据存储支持 JSON 和 Parquet。  
默认文件格式为 JSON。只能指定一种格式。创建数据存储后，无法更改文件格式。    
`jsonConfiguration`  
包含 JSON 格式的配置信息。  
`parquetConfiguration`  
包含 Parquet 格式的配置信息。    
`schemaDefinition`  
定义架构所需的信息。    
`columns`  
指定存储数据的一个或多个列。  
每个架构最多可有 100 列。每列最多可有 100 种嵌套类型。    
`name`  
列的名称。  
长度限制：1-255 个字符。  
`type`  
数据的类型。有关受支持的数据类型的更多信息，请参阅《AWS Glue 开发人员指南》**中的[常见数据类型](https://docs.aws.amazon.com/glue/latest/dg/aws-glue-api-common.html)。  
长度限制：1-131072 个字符。

AWS IoT Analytics 支持 [Amazon Athena 数据类型](https://docs.aws.amazon.com/athena/latest/ug/data-types.html)页面上列出的所有数据类型，但-除外。`DECIMAL(precision, scale)` `precision`

## 创建数据存储（控制台）
<a name="create-datastore-console"></a>

以下步骤说明如何创建以 Parquet 格式保存数据的数据存储。

**创建数据存储**

1. 登录到 [https://console.aws.amazon.com/iotanalytics/](https://console.aws.amazon.com/iotanalytics/)。

1. 在导航窗格中，选择**数据存储**。

1. 在 **数据存储** 页面上，选择 **创建数据存储**。

1. 在**指定数据存储详细信息**页面上，输入数据存储相关的基本信息。

   1. 在**数据存储 ID** 中，输入唯一的数据存储 ID。该 ID 在创建后无法更改。

   1. （可选）对于**标签**，选择**添加新标签**，将一个或多个自定义标签（键值对）添加到数据存储中。标签有助于标识您为 AWS IoT Analytics创建的资源。

   1. 选择**下一步**。

1. 在**配置存储类型**页面上，指定如何存储数据。

   1. 对于**存储类型**，选择**服务托管存储**。

   1. 对于**配置要保留已处理数据的时间**，选择**无限期**。

   1. 选择 **下一步**。

1. 在**配置数据格式**页面上，定义数据记录的结构和格式。

   1. 对于 **分类**，选择 **Parquet**。创建数据存储后，无法更改该格式。

   1. 对于**推理源**，请为您的数据存储选择 **JSON 字符串**。

   1. 对于**字符串**，请以 JSON 格式输入您的架构，如下例所示。

      ```
      {
          "device_id": "0001",
          "temperature": 26,
          "humidity": 29,
          "datetime": "2018-01-26T07:06:01"
      }
      ```

   1. 选择**推断架构**。

   1. 在**配置 Parquet 架构**下，确认格式与 JSON 示例相匹配。如果格式不匹配，请手动更新 Parquet 架构。
      + 如果希望架构显示更多列，请选择**添加新列**，输入列名，然后选择数据类型。
**注意**  
默认情况下，您的架构可以有 100 列。有关更多信息，请参阅 [AWS IoT Analytics 配额](https://docs.aws.amazon.com/iotanalytics/latest/userguide/limits.html)。
      + 您可以更改现有列的数据类型。有关受支持的数据类型的更多信息，请参阅《AWS Glue 开发人员指南》**中的[常见数据类型](https://docs.aws.amazon.com/glue/latest/dg/aws-glue-api-common.html)。
**注意**  
创建数据存储后，无法更改现有列的数据类型。
      + 要删除现有列，请选择**移除列**。

   1. 选择**下一步**。

1. （可选） AWS IoT Analytics 支持数据存储中的自定义分区，因此您可以查询已修剪的数据以缩短延迟。有关支持的自定义分区的更多信息，请参阅[自定义分区](custom-partitioning.md)。

   选择 **下一步**。

1. 在 **查看和创建** 页面上，查看您的选择，然后选择 **创建数据存储**。
**重要**  
创建数据存储后，无法更改列的数据存储 ID、文件格式或数据类型。

1. 确认新数据存储显示在**数据存储**页面上。