

# 查看爬网程序结果和详细信息
<a name="console-crawlers-details"></a>

 爬网程序成功运行后，它会在数据目录中创建表定义。在导航窗格中选择 **Tables (表)** 来查看爬网程序在您指定的数据库中创建的表。

 您可以按如下方式查看与爬网程序本身相关的信息：
+ AWS Glue 控制台上的 **Crawlers (爬网程序)** 页面显示爬网程序的以下属性：    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/glue/latest/dg/console-crawlers-details.html)
+  要查看爬网程序的历史记录，请在导航窗格中选择 **Crawlers**（爬网程序）以查看您创建的爬网程序。从可用爬网程序列表中选择一个爬网程序。您可以在 **Crawler runs**（爬网程序运行）选项卡中查看爬网程序属性和爬网程序历史记录。

   “Crawler runs”（爬网程序运行）显示每次爬网程序运行时的相关信息，包括 **Start time (UTC)** [开始时间（UTC）]、**End time (UTC)** [结束时间（UTC）]、**Duration**（持续时间）、**Status**（状态）、**DPU hours**（DPU 小时）和 **Table changes**（表格变更）。

  “爬网程序运行”选项卡将仅显示自爬网程序历史记录功能启动之日以来发生的爬取操作，并且最长仅保留 12 个月的爬取操作。较早的爬取结果将不会被返回。
+ 要查看其他信息，请在爬网程序详细信息页面中选择一个选项卡。每个选项卡都将显示与爬网程序相关的信息。
  +  **Schedule**（计划）：为爬网程序创建的所有计划都将在此处显示。
  +  **Data sources**（数据来源）：爬网程序扫描的所有数据来源都将在此处显示。
  +  **Classifiers**（分类器）：分配给爬网程序的所有分类器都将在此处显示。
  +  **Tags**（标记）：创建并分配给 AWS 资源的所有标记都将在此处显示。

# 爬网程序在数据目录表上设置的参数
<a name="table-properties-crawler"></a>

 这些表属性由 AWS Glue 爬网程序设置。我们希望用户使用 `classification` 和 `compressionType` 属性。其他属性（包括估算表大小）用于内部计算，我们无法保证其准确性或客户使用案例适用性。更改这些参数可能会改变爬网程序的行为，我们不支持此工作流程。


| 属性键 | 属性值 | 
| --- | --- | 
| UPDATED\$1BY\$1CRAWLER | 执行更新的爬网程序的名称。 | 
| connectionName | 用于连接到数据存储的爬网程序在“数据目录”中的连接名称。 | 
| recordCount | 根据文件大小和标题估算表中记录的数量。 | 
| skip.header.line.count | 跳过行以跳过标题。在被归类为 CSV 的表上设置。 | 
| CrawlerSchemaSerializerVersion | 供内部使用 | 
| classification | 由爬网程序推断数据格式。更多有关 AWS Glue 爬网程序支持的数据格式的信息，请参阅 [内置分类器](add-classifier.md#classifier-built-in)。 | 
| CrawlerSchemaDeserializerVersion | 供内部使用 | 
| sizeKey | 已爬取的表中文件的组合大小。 | 
| averageRecordSize | 表中行的平均大小（字节）。 | 
| compressionType | 对表中的数据使用的压缩类型。更多有关 AWS Glue 爬网程序支持的压缩类型的信息，请参阅 [内置分类器](add-classifier.md#classifier-built-in)。 | 
| typeOfData | `file`、`table` 或 `view`。 | 
| objectCount | Amazon S3 表路径下的对象数量。 | 

 这些额外的表属性是由 AWS Glue 爬网程序为 Snowflake 数据存储设置的。


| 属性键 | 属性值 | 
| --- | --- | 
| aws:RawTableLastAltered | 记录 Snowflake 表上次修改的时间戳。 | 
| ViewOriginalText | 查看 SQL 语句。 | 
| ViewExpandedText | 查看以 Base64 格式编码的 SQL 语句。 | 
| ExternalTable:S3Location | Snowflake 外部表的 Amazon S3 位置。 | 
| ExternalTable:FileFormat | Snowflake 外部表的 Amazon S3 文件格式。 | 

 这些额外的表属性是由 AWS Glue 爬网程序为 Amazon Redshift、Microsoft SQL Server、MySQL、PostgreSQL 和 Oracle 等 JDBC 类型的数据存储设置的。


| 属性键 | 属性值 | 
| --- | --- | 
| aws:RawType | 当爬网程序将数据存储在数据目录中时，它会将数据类型转换为与 Hive 兼容的类型，这往往会导致有关本机数据类型的信息丢失。爬网程序输出 `aws:RawType` 参数，以提供原生级别的数据类型。 | 
| aws:RawColumnComment | 如果注释与数据库中的列相关联，则爬网程序会在目录表中输出相应的注释。注释字符串被截断为 255 个字节。 Microsoft SQL Server 不支持注释。  | 
| aws:RawTableComment | 如果注释与数据库中的列相关联，则爬网程序会在目录表中输出相应的注释。注释字符串被截断为 255 个字节。 Microsoft SQL Server 不支持注释。 | 