

我們不再更新 Amazon Machine Learning 服務或接受新使用者。本文件可供現有使用者使用，但我們不再更新。如需詳細資訊，請參閱[什麼是 Amazon Machine Learning](https://docs.aws.amazon.com/machine-learning/latest/dg/what-is-amazon-machine-learning.html)。

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 二元模型的深入解析
<a name="binary-model-insights"></a>

## 解譯預測
<a name="interpreting-the-predictions"></a>

許多二元分類演算法的實際輸出是一種預測*「分數」*。此分數指出系統確定指定的觀察屬於正確類別 (真實目標值為 1)。Amazon ML 中的二進位分類模型會輸出 0 到 1 的分數。此分數的取用者可以決定應將觀察分類為 1 或 0。您可以挑選分類閾值或*「分界值」*做為分數的比較依據，從而解譯分數。所有分數高於此分界值的觀察，都會將其目標預測為 1；所有分數低於此分界值的觀察，都會將其目標預測為 0。

在 Amazon ML 中，預設分數截止值為 0.5。您可以依據您的業務需求，選擇更新此分界值。您可以利用主控台中的視覺效果，了解分界值選擇對於您應用程式的影響。

### 衡量 ML 模型準確性
<a name="measuring-ml-model-accuracy"></a>

Amazon ML 為稱為「 （接收者操作特性） 曲線下「面積」(AUC) 的二進位分類模型提供業界標準的準確性指標。AUC 會測量模型在預測較高分數之正確範例與錯誤範例上的能力，並將兩者相比較。因為這無關乎分界分數，所以您無須選取閾值，就能從 AUC 指標得知模型的預測正確性。

AUC 指標會傳回介於 0 至 1 的小數值。接近 1 的 AUC 值代表 ML 模型準確性很高。值接近 0.5 表示 ML 模型與隨機猜測差異不大。接近 0 的值並不常見，通常表示資料有問題。基本上，若 AUC 接近 0，表示 ML 模型已學會正確模式，但使用這些模式進行的預測會與現實相反 (將 '0' 預測為 '1'，反之亦然)。如需 AUC 的詳細資訊，請參閱 Wikipedia 上的[接收者操作特性](http://en.wikipedia.org/wiki/Receiver_operating_characteristic)頁面。

二元模型的基準 AUC 指標為 0.5，這是 ML 假設模型的值，會隨機預測 1 或 0 的答案。您二元 ML 模型的執行效果應優於此值，此模型才有價值。

### 使用效能視覺化
<a name="using-the-performance-visualization"></a>

若要探索 ML 模型的準確性，您可以在 Amazon ML 主控台的評估****頁面上檢閱圖形。此頁面顯示兩個色階分佈圖：a) 評估資料中真實正確 (目標為 1) 之分數的色階分佈圖，以及 b) 評估資料中真實錯誤 (目標為 0) 之分數的色階分佈圖。

具備良好正確性預測的 ML 模型，會將高分預測真實的 1，並將低分預測為真實的 0。完美的模型在 X 軸兩端各有一個色階分佈圖，分別顯示所有得到高分的真實正確，以及所有得到低分的真實錯誤。但 ML 模型會犯錯，而且常見圖表的這兩個色階分佈圖會在特定分數重疊。效能極差的模型無法區分正確與錯誤的類別，而且這兩個類別的色階分佈圖大部分會重疊。

![\[image49\]](http://docs.aws.amazon.com/zh_tw/machine-learning/latest/dg/images/image48b.png)


透過視覺效果，您可以得出落入兩種正確預測類型與兩種錯誤預測類型的預測數量。

 **正確預測** 
+ 真陽性 (TP)：Amazon ML 預測值為 1，而真值為 1。
+ True negative (TN)：Amazon ML 預測值為 0，而 true 值為 0。

 **錯誤預測** 
+ 偽陽性 (FP)：Amazon ML 預測值為 1，但真實值為 0。
+ False negative (FN)：Amazon ML 預測值為 0，但 true 值為 1。

**注意**  
TP、TN、FP 與 FN 的數量取決於選取的分數閾值，而最佳化其中任何一個數量意味著其他數量也會受到影響。TP 數量高通常會導致 FP 的數量高及 TN 數量低。

### 調整分界分數
<a name="adjusting-the-score-cut-off"></a>

ML 模型的運作方式是先產生數值預測分數，然後再套用分界值，將這些分數轉換成二元的 0/1 標籤。只要變更分界分數，就能在模型犯錯時調整其行為。在 Amazon ML 主控台**的評估**頁面上，您可以檢閱各種分數分界點的影響，也可以儲存您想要用於模型的分數分界點。

當您調整分界分數的閾值時，請觀察這兩種誤差類型之間的交互影響。將分界值向左移會得到比較多真正的正確，但代價是錯誤的錯誤數量會增加。將此值向右移會得到比較少錯誤的錯誤，但代價是會漏失一些真正的正確。您可以為您自己的預測應用程式選取適當的分界分數，決定比較能容忍的誤差種類。

### 檢閱進階指標
<a name="reviewing-advanced-metrics"></a>

Amazon ML 提供下列其他指標來測量 ML 模型的預測準確性：準確性、精確度、召回和誤報率。

#### 準確性
<a name="accuracy"></a>

*「正確性」*(ACC) 會測量正確預測的分數。範圍介於 0 至 1 之間。值越大，表示預測準確性越高：

![\[image50\]](http://docs.aws.amazon.com/zh_tw/machine-learning/latest/dg/images/image49.png)


#### 精確度
<a name="precision"></a>

*「精確度」*會測量真實正確占這些預測為正確之範例的分數。範圍介於 0 至 1 之間。值越大，表示預測準確性越高：

![\[image51\]](http://docs.aws.amazon.com/zh_tw/machine-learning/latest/dg/images/image50.png)


#### 取回
<a name="recall"></a>

*「取回」*會測量被預測為正確的真實正確分數。範圍介於 0 至 1 之間。值越大，表示預測準確性越高：

![\[image52\]](http://docs.aws.amazon.com/zh_tw/machine-learning/latest/dg/images/image51.png)


#### 錯誤的正確率
<a name="false-positive-rate"></a>

*「錯誤的正確率」*(FPR) 會測量被預測為正確的誤報率或真實錯誤分數。範圍介於 0 至 1 之間。值愈小表示預測正確性愈佳：

![\[image53\]](http://docs.aws.amazon.com/zh_tw/machine-learning/latest/dg/images/image52.png)


根據您的業務問題，您可能對特定指標子集執行效果良好的模型更感興趣。舉例來說，兩個商務應用程式的 ML 模型在需求上可能截然不同：
+ 其中一個應用程式可能需要相當確定正確預測實際上為正確 (高精確度)，並能容忍將一些正確的範例分類為錯誤 (中度取回)。
+ 另一個應用程式可能只需要盡可能地正確預測正確的範例 (高度取回)，而且能夠接受將一些錯誤的範例不正確地分類為正確 (中精確度)。

Amazon ML 可讓您選擇與上述任何進階指標的特定值對應的分數分界。此外，它也會顯示最佳化任何一個指標所帶來的相互影響。例如，若您選取的分界值對應到了高精確度，通常帶來的相互影響就是較低的取回數量。

**注意**  
您必須儲存截止分數，才能有效地分類 ML 模型未來所做的任何預測。