

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 在 Glue ETL AWS 任務中設定異常偵測
<a name="data-quality-configuring-anomaly-detection-etl-jobs"></a>

 若要從 Glue Studio AWS 中的異常偵測開始，請開啟 AWS Glue Studio 任務，然後按一下**評估資料品質轉換**。

 透過啟用此功能， AWS Glue Data Quality 會分析一段時間內的資料，以偵測異常。其可提供有關資料的寶貴資料統計資料和觀察，可讓您對任何已識別的異常採取行動。

 檢閱[異常偵測](data-quality-anomaly-detection.md)文件，以了解此功能的內部運作。

## 啟用異常偵測
<a name="data-quality-enabling-anomaly-detection"></a>

**若要在 AWS Glue Studio 中啟用異常偵測功能：**

1.  選擇作業中的 **Data Quality** 節點，然後選擇**異常偵測**索引標籤。切換以開啟**啟用異常偵測**。  
![\[螢幕擷取畫面顯示「啟用異常偵測」切換成開啟。這可以開啟或關閉。\]](http://docs.aws.amazon.com/zh_tw/glue/latest/dg/images/data-quality-enable-anomaly-detection.png)

1.  選擇**新增分析器**，定義要監視異常的資料。您可以填入的欄位有兩個：「統計資料」和「資料」。
   +  **統計資料**是有關資料形狀和其他屬性的資訊。您可以一次選擇一或多個統計資料，或選擇**所有統計資料**。統計資料包括：Completeness、Uniqueness、Mean、Sum、StandardDeviation、Entropy、DistinctValuesCount、UniqueValueRatio 等。如需詳細資訊，請參閱[分析器](dqdl.md#dqdl-analyzers)文件。
   +  **資料**是資料集中的資料欄。您可以選擇所有資料欄或個別資料欄。  
![\[螢幕擷取畫面顯示「統計資料」欄位和「資料」欄位。您可以選擇要套用至資料集的統計資料，以及要在哪些資料欄上進行。\]](http://docs.aws.amazon.com/zh_tw/glue/latest/dg/images/data-quality-add-analyzer.png)

1.  選擇**新增異常偵測範圍**來儲存變更。新增分析器後，您可以在**異常偵測範圍**區段中看到這些分析器。

    您也可以使用**動作**功能表來編輯分析器，或選擇**規則集編輯器**索引標籤，然後直接在規則集編輯器記事本中編輯分析器。您會在建立的任何規則下看到所儲存的分析器。

   ```
   Rules = [
   
   ]
   
   Analyzers = [
       Completeness “id”
   ]
   ```

 設定更新的規則集和分析器後， AWS Glue Data Quality 會持續監控傳入的資料串流。其可以透過提醒或任務停止發出潛在異常訊號，具體取決於您的設定。此主動監控有助於確保整個資料管道的資料品質和完整性。

 在下一節中，您將了解如何有效地監控系統識別的異常。您也將了解如何檢視和分析 Glue Data Quality AWS 收集的資料統計資料。此外，您將了解如何提供意見回饋給支援異常偵測功能的機器學習模型。此回饋迴圈對於改善模型的準確性，並確保其可以有效地偵測符合您特定業務需求和資料模式的異常至關重要。