

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# REPLACE\$1OUTLIERS
<a name="recipe-actions.REPLACE_OUTLIERS"></a>

根据参数中的设置，更新分类为异常值的数据点值。

**参数**
+ `sourceColumn`：指定可能包含异常值的现有数值列的名称。
+ `outlierStrategy`：指定用于检测异常值的方法。有效值包括：
  + `Z_SCORE`：当一个值与均值的偏差超过标准差阈值时，将其标识为异常值。
  + `MODIFIED_Z_SCORE`：当一个值与中位数的偏差超过中位数绝对偏差阈值时，将其标识为异常值。
  + `IQR`：当一个值超过列数据的第一和第三分位数时，将其标识为异常值。四分位间距（IQR）衡量中间 50% 数据点所在的位置。
+ `threshold`：指定要在检测异常值时使用的阈值。如果使用 `outlierStrategy` 计算的分数超过此数字，则将 `sourceColumn` 值标识为异常值。默认值为 3。
+ `replaceType`：指定替换异常值时要使用的方法。有效值包括：
  + `WINSORIZE_VALUES`：指定使用最小和最大百分位数来限制值。
  + `REPLACE_WITH_CUSTOM` 
  + `REPLACE_WITH_EMPTY` 
  + `REPLACE_WITH_NULL`
  + `REPLACE_WITH_MODE`
  + `REPLACE_WITH_AVERAGE`
  + `REPLACE_WITH_MEDIAN`
  + `REPLACE_WITH_SUM`
  + `REPLACE_WITH_MAX`
+ `modeType`：指示当 `replaceType` 为 `REPLACE_WITH_MODE` 时要使用的模态函数的类型。有效值包括：`MIN`、`MAX` 和 `AVERAGE`。
+ `minValue`：指示使用 `trimValue` 时要应用的异常值范围的最小百分位数值。有效范围为 0–100。
+ `maxValue`：指示使用 `trimValue` 时要应用的异常值范围的最大百分位数值。有效范围为 0–100。
+ `value`：指定使用 `REPLACE_WITH_CUSTOM` 时要插入的值。
+  `trimValue`：指定是删除全部异常值还是部分异常值。当 `replaceType` 为 `REPLACE_WITH_NULL`、`REPLACE_WITH_MODE` 或 `WINSORIZE_VALUES` 时，此布尔值设置为 `TRUE`。所有其他则默认为 `FALSE`。
  + `FALSE`：删除所有异常值
  +  `TRUE`：删除排名超出 `minValue` 和 `maxValue` 中指定的百分位数上下限阈值的异常值。

以下示例显示了单个 [https://docs.aws.amazon.com/databrew/latest/dg/API_RecipeAction.html](https://docs.aws.amazon.com/databrew/latest/dg/API_RecipeAction.html) 操作的语法。一个*配方*至少包含一个 [https://docs.aws.amazon.com/databrew/latest/dg/API_RecipeStep.html](https://docs.aws.amazon.com/databrew/latest/dg/API_RecipeStep.html) 操作，一个配方步骤至少包含一个配方操作。*配方操作*运行您指定的数据转换。一组配方操作按顺序运行以创建最终数据集。

------
#### [ JSON ]

下面使用 JSON 语法显示了一个用作 DataBrew [配方](https://docs.aws.amazon.com/databrew/latest/dg/API_Recipe.html)的示例 `RecipeStep` 的成员的示例 `RecipeAction`。如需显示配方操作列表的语法示例，请参阅[定义配方结构](recipes.md#recipes.structure)。

**Example JSON 示例**  

```
{
    "Action": {
        "Operation": "REPLACE_OUTLIERS",
        "Parameters": {
            "maxValue": "95",
            "minValue": "5",
            "modeType": "AVERAGE",
            "outlierStrategy": "Z_SCORE",
            "replaceType": "REPLACE_WITH_MODE",
            "sourceColumn": "name-of-existing-column",
            "threshold": "3",
            "trimValue": "TRUE"
        }
    }
}
```

有关在 API 操作中使用此配方操作的更多信息，请参阅 [https://docs.aws.amazon.com/databrew/latest/dg/API_CreateRecipe.html](https://docs.aws.amazon.com/databrew/latest/dg/API_CreateRecipe.html) 或 [https://docs.aws.amazon.com/databrew/latest/dg/API_UpdateRecipe.html](https://docs.aws.amazon.com/databrew/latest/dg/API_UpdateRecipe.html)。您可以在自己的代码中使用这些和其他 API 操作。

------
#### [ YAML ]

下面使用 YAML 语法显示了一个用作 DataBrew [配方](https://docs.aws.amazon.com/databrew/latest/dg/API_Recipe.html)的示例 `RecipeStep` 的成员的示例 `RecipeAction`。如需显示配方操作列表的语法示例，请参阅[定义配方结构](recipes.md#recipes.structure)。

**Example YAML 示例**  

```
- Action:
  Operation: REMOVE_OUTLIERS
  Parameters:
    sourceColumn: name-of-existing-column
    outlierStrategy: Z_SCORE
    threshold: '3'
    replaceType: REPLACE_WITH_MODE
    modeType: AVERAGE
    minValue: '5'
    maxValue: '95'
    trimValue: 'TRUE'
```

有关在 API 操作中使用此配方操作的更多信息，请参阅 [https://docs.aws.amazon.com/databrew/latest/dg/API_CreateRecipe.html](https://docs.aws.amazon.com/databrew/latest/dg/API_CreateRecipe.html) 或 [https://docs.aws.amazon.com/databrew/latest/dg/API_UpdateRecipe.html](https://docs.aws.amazon.com/databrew/latest/dg/API_UpdateRecipe.html)。您可以在自己的代码中使用这些和其他 API 操作。

------