View a markdown version of this page

工作术语 - Amazon Location Service

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

工作术语

本节提供了基本定义,用于理解 Amazon Location Service Jobs 中的核心概念,例如任务状态、数据格式和处理功能。

任务

对存储在 Amazon S3 中的大型数据集执行特定操作的批处理操作。作业异步处理数据并将结果返回到指定的输出位置。

作业生命周期

任务从创建到完成的状态顺序,包括 “待处理”、“正在运行”、“已完成”、“失败”、“正在取消” 和 “已取消” 状态。

执行角色

一个 IAM 角色,它授予亚马逊位置代表您访问您的 Amazon S3 存储桶的权限。该角色必须具有输入存储桶的读取权限和输出存储桶的写入权限。

Apache Parquet

一种用于在作业中输入和输出数据的列式存储文件格式。Parquet 提供了高效的数据压缩和编码方案,用于批量处理复杂数据。

输入架构

输入数据文件所需的结构和字段定义。每种作业操作类型都有输入文件必须符合的特定架构。

记录级别错误

影响作业中各个记录的错误。这些错误包含在带有ErrorTypeErrorMessage字段的输出文件中,允许在处理有效记录的同时识别有问题的记录。