本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 统计数据的架构（statistics.json 文件）
<a name="model-monitor-interpreting-statistics"></a>

Amazon SageMaker 模型监控器预建容器根据统计数据进行计算。 column/feature 将为基准数据集以及正在分析的当前数据集计算统计数据。

```
{
    "version": 0,
    # dataset level stats
    "dataset": {
        "item_count": number
    },
    # feature level stats
    "features": [
        {
            "name": "feature-name",
            "inferred_type": "Fractional" | "Integral",
            "numerical_statistics": {
                "common": {
                    "num_present": number,
                    "num_missing": number
                },
                "mean": number,
                "sum": number,
                "std_dev": number,
                "min": number,
                "max": number,
                "distribution": {
                    "kll": {
                        "buckets": [
                            {
                                "lower_bound": number,
                                "upper_bound": number,
                                "count": number
                            }
                        ],
                        "sketch": {
                            "parameters": {
                                "c": number,
                                "k": number
                            },
                            "data": [
                                [
                                    num,
                                    num,
                                    num,
                                    num
                                ],
                                [
                                    num,
                                    num
                                ][
                                    num,
                                    num
                                ]
                            ]
                        }#sketch
                    }#KLL
                }#distribution
            }#num_stats
        },
        {
            "name": "feature-name",
            "inferred_type": "String",
            "string_statistics": {
                "common": {
                    "num_present": number,
                    "num_missing": number
                },
                "distinct_count": number,
                "distribution": {
                    "categorical": {
                         "buckets": [
                                {
                                    "value": "string",
                                    "count": number
                                }
                          ]
                     }
                }
            },
            #provision for custom stats
        }
    ]
}
```

注意以下几点：
+ 预构建的容器将计算 [KLL 草图](https://datasketches.apache.org/docs/KLL/KLLSketch.html)，这是一个紧凑的分位数草图。
+ 默认情况下，我们将分配具体化到 10 个存储桶中。目前，这是不可配置的。