

# 內容領域 3： 基礎模型的應用
<a name="ai-practitioner-01-domain3"></a>

領域 3 涵蓋基礎模型的應用，佔考試計分內容的 28%。

**Topics**
+ [任務説明 3.1： 描述使用基礎模型 (FM) 的應用程式設計考量。](#ai-practitioner-01-task3.1)
+ [任務説明 3.2： 選擇有效的提示詞工程技術。](#ai-practitioner-01-task3.2)
+ [任務説明 3.3： 描述 FM 的訓練和微調流程。](#ai-practitioner-01-task3.3)
+ [任務説明 3.4： 描述評估 FM 效能的方法。](#ai-practitioner-01-task3.4)

## 任務説明 3.1： 描述使用基礎模型 (FM) 的應用程式設計考量。
<a name="ai-practitioner-01-task3.1"></a>

目標：
+ 識別選擇 FM 的準則（例如：成本、模態、延遲、多語言支持、模型大小、模型複雜度、自定義能力、輸入/輸出長度、提示詞快取）。
+ 描述推論參數對模型回應的影響 (例如：溫度、輸入/輸出長度)。解釋各種 FM 自定義方式的成本權衡（例如：預訓練、微調、情境學習、RAG、模型蒸餾）。
+ 定義檢索增強生成 (RAG)，並描述其商業應用程式 (例如：Amazon Bedrock 知識庫)。
+ 識別協助在向量資料庫中儲存嵌入項目的 AWS 服務 (例如：Amazon OpenSearch Service、Amazon Aurora、Amazon Neptune、Amazon RDS for PostgreSQL)。
+ 說明各種 FM 自定義方式的成本權衡（例如：預訓練、微調、上下文學習、RAG、模型蒸餾）。
+ 定義 AI 代理程式的角色，並描述 AI 代理程式的商業應用。

## 任務説明 3.2： 選擇有效的提示詞工程技術。
<a name="ai-practitioner-01-task3.2"></a>

目標：
+ 定義提示詞工程的概念和結構 (例如：上下文、指令、負面提示)。
+ 定義提示詞工程技術 (例如：思路鏈、零樣本、單一樣本、少樣本、提示範本)。
+ 識別並描述提示詞工程的好處和最佳實務 (例如：回應品質改進、實驗、防護機制、發現、特異性和簡潔性、使用多評論)。
+ 定義提示詞工程的潛在風險和限制 (例如：曝險、中毒、劫持、越獄)。
+ 描述使用 Amazon Bedrock Prompt Management 的提示詞版本控制與管理策略。

## 任務説明 3.3： 描述 FM 的訓練和微調流程。
<a name="ai-practitioner-01-task3.3"></a>

目標：
+ 描述訓練 FM 的關鍵要素 (例如：預先訓練、微調、持續預先訓練、蒸餾)。
+ 定義微調 FM 的方法 (例如：指令調校、適應特定領域的模型、轉移學習、持續預先訓練)。
+ 描述如何準備資料以微調 FM (例如：資料策管、管控、大小、標記、代表性、人類回饋的強化學習 [RLHF])。

## 任務説明 3.4： 描述評估 FM 效能的方法。
<a name="ai-practitioner-01-task3.4"></a>

目標：
+ 確定評估 FM 效能的方法（例如：真人參與 [human-in-the-loop] 評估、基準測試數據集、Amazon Bedrock Model Evaluation）。
+ 識別評估 FM 效能的相關指標 (例如：召回率導向的摘要評估 [ROUGE]、雙語替換評測 [BLEU]、BERTScore、以 LLM 作為評審)。
+ 判定 FM 是否有效達成業務目標（例如：生產力、使用者參與度、任務工程）。
+ 識別評估基於 FM 構建之應用程式效能的方法（例如：RAG、代理程式、工作流）。
+ 識別 AI 應用程式與業務目標對齊的指標（例如：任務完成率、使用者滿意度、每次互動成本）。