

# 查看列统计数据
<a name="view-column-stats"></a>

成功生成统计数据后，Data Catalog 会存储这一信息，以便 Amazon Athena 和 Amazon Redshift 中基于成本的优化器在运行查询时做出最佳选择。统计数据因列的类型而异。

------
#### [ AWS 管理控制台 ]

**查看表的列统计数据**
+ 运行列统计数据任务后，**表详细信息**页面上的**列统计数据**选项卡将显示表的统计数据。  
![\[屏幕截图显示了最近一次运行生成的列。\]](http://docs.aws.amazon.com/zh_cn/glue/latest/dg/images/view-column-stats.png)

  将会提供以下统计数据：
  + 列名：用于生成统计数据的列名
  + 上次更新时间：生成统计数据的日期和时间
  + 平均长度：列中值的平均长度
  + 不重复值数：列中不重复的值总数。我们估算列中不重复的值的数量，相对误差为 5%。
  + 最大值：列中最大的值。
  + 最小值：列中最小的值。
  + 最大长度：列中最大值的长度。
  + 空值数：列中空值的总数。
  + True 值数：列中 True 值的总数。
  + False 值数：列中 False 值的总数。
  + numFiles：表中的文件总数。该值在**高级属性**选项卡下可用。

------
#### [ AWS CLI ]

以下示例演示了如何使用 AWS CLI 检索列统计数据。

```
aws glue get-column-statistics-for-table \
    --database-name database_name \
    --table-name table_name \
    --column-names <column_name>
```

 您还可以使用 [GetColumnStatisticsForTable](https://docs.aws.amazon.com/glue/latest/webapi/API_GetColumnStatisticsForTable.html) API 操作来查看列统计数据。

------