

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 推理模型評估
<a name="nova-reasoning-model-evaluation"></a>

## 概觀
<a name="nova-reasoning-overview"></a>

推理模型支援可使用推理能力的 Nova 模型進行評估，這些模型在產生最終回應之前執行明確的內部推理。此功能會透過 `reasoning_effort` 參數使用 API 層級控制來動態啟用或停用推理功能，進而改善複雜分析任務的回應品質。

**支援的模型**
+ amazon.nova-2-lite-v1：0：256k

## 配方組態
<a name="nova-reasoning-recipe"></a>

將 `reasoning_effort` 參數新增至配方的 `inference`區段，以啟用推理：

```
run:  
  name: reasoning-eval-job-name                          # [MODIFIABLE] Unique identifier for your evaluation job  
  model_type: amazon.nova-2-lite-v1:0:256k               # [FIXED] Must be a reasoning-supported model  
  model_name_or_path: nova-lite-2/prod                   # [FIXED] Path to model checkpoint or identifier  
  replicas: 1                                            # [MODIFIABLE] Number of replicas for SageMaker Training job  
  data_s3_path: ""                                       # [MODIFIABLE] Leave empty for SageMaker Training job; optional for SageMaker HyperPod job  
  output_s3_path: ""                                     # [MODIFIABLE] Output path for SageMaker HyperPod job (not compatible with SageMaker Training jobs)  
  
evaluation:  
  task: mmlu                                             # [MODIFIABLE] Evaluation task  
  strategy: zs_cot                                       # [MODIFIABLE] Evaluation strategy  
  metric: accuracy                                       # [MODIFIABLE] Metric calculation method  
  
inference:  
  reasoning_effort: high                                 # [MODIFIABLE] Enables reasoning mode; options: low/high or null to disable  
  max_new_tokens: 32768                                  # [MODIFIABLE] Maximum tokens to generate, recommended value when reasoning_effort set to high  
  top_k: -1                                              # [MODIFIABLE] Top-k sampling parameter  
  top_p: 1.0                                             # [MODIFIABLE] Nucleus sampling parameter  
  temperature: 0                                         # [MODIFIABLE] Sampling temperature (0 = deterministic)
```

## 使用 reasoning\_effort 參數
<a name="nova-reasoning-parameter"></a>

`reasoning_effort` 參數控制可推理模型的推理行為。

### 先決條件
<a name="nova-reasoning-prerequisites"></a>
+ **模型相容性** – `reasoning_effort`僅在`model_type`指定可推理的模型時設定 （目前為 `amazon.nova-2-lite-v1:0:256k`)
+ **錯誤處理** – 使用 `reasoning_effort`搭配不支援的模型會失敗 `ConfigValidationError: "Reasoning mode is enabled but model '{model_type}' does not support reasoning. Please use a reasoning-capable model or disable reasoning mode."`

### 可用選項
<a name="nova-reasoning-options"></a>


| 選項 | Behavior (行為) | 字符限制 | 使用案例 | 
| --- | --- | --- | --- | 
| null （預設） | 停用推理模式 | N/A | 無推理額外負荷的標準評估 | 
| low | 啟用具有限制條件的推理 | 用於內部推理的 4，000 個字符 | 需要簡潔推理的案例；針對速度和成本進行最佳化 | 
| high | 啟用無限制的推理 | 內部推理沒有字符限制 | 需要廣泛分析和step-by-step推理的複雜問題 | 


| 訓練模式 | 可用選項 | 如何設定 | 
| --- | --- | --- | 
| SFT （受監督的微調） | 僅限高或關 | 使用 reasoning\_enabled： true （高） 或 reasoning\_enabled： false （關閉） | 
| RFT （強化微調） | 低、高或關閉 | 使用 reasoning\_effort：低或 reasoning\_effort：高。省略要停用的欄位。 | 
| 評估 | 低、高或關閉 | 使用 reasoning\_effort：低或 reasoning\_effort：高。使用 null 來停用。 | 

### 何時啟用推理
<a name="nova-reasoning-when-to-enable"></a>

**使用 的推理模式 (`low` 或 `high`)**
+ 複雜的問題解決任務 （數學、邏輯拼圖、編碼）
+ 需要中繼推理的多步驟分析問題
+ 詳細說明或step-by-step思考可提高準確性的任務
+ 回應品質優先於速度的情況

**針對 使用非原因模式 (`null` 或 省略參數）**
+ 簡單問答或事實查詢
+ 創意撰寫任務
+ 當更快的回應時間至關重要時
+ 應排除推理開銷的績效基準
+ 推理無法改善任務效能時的成本最佳化

### 疑難排解
<a name="nova-reasoning-troubleshooting"></a>

**錯誤：「啟用原因模式，但模型不支援推理」**

**原因**： `reasoning_effort` 參數設定為非空值，但指定的 `model_type` 不支援推理。

**解決方法：**
+ 確認您的模型類型為 `amazon.nova-2-lite-v1:0:256k`
+ 如果使用不同的模型，請切換到具有推理功能的模型，或從配方中移除 `reasoning_effort` 參數