

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 使用 AWS DeepRacer 探索強化學習
<a name="deepracer-is-a-learning-environment-for-reinforcement-learning"></a>

強化學習，特別是深度強化學習，已證明在解決廣範圍的自動決策問題中相當有效。它的應用範圍涉及金融交易、資料中心冷卻、機群邏輯和自動競賽等。

強化學習具有解決現實世界問題的潛力。不過，由於其廣泛的技術範圍和深度，它具有陡峭的學習曲線。真實世界實驗需要您建構實體代理程式，例如自動賽車。它還要求您保護實體環境，例如駕駛賽道或公有道路。這使得環境可能相當昂貴、危險和耗時。這些需求遠超過僅只是為了了解強化學習的範圍。

為了協助減少學習曲線，AWS DeepRacer 以三種方式簡化程序：
+ 在訓練和評估強化學習模型時step-by-step指引。本指南包含預先定義的環境、狀態和動作，以及可自訂的獎勵函數。
+ 提供模擬器來模擬虛擬[代理](deepracer-basic-concept.md#term-model-vehicle)程式與虛擬環境之間的互動。
+ 使用 AWS DeepRacer 車輛做為實體代理程式。使用車輛，來在實體環境中評估訓練模型。這非常類似於現實世界的使用案例。



如果您是經驗豐富的機器學習從業人員，您會發現 AWS DeepRacer 是為虛擬和實體環境中的自動競賽建置強化學習模型的歡迎機會。總結來說，使用 AWS DeepRacer 建立強化學習模型，以進行自動競賽，步驟如下：

1. 針對自動競賽訓練自訂強化學習模型。使用與 SageMaker AI 整合的 AWS DeepRacer 主控台來執行此操作。 SageMaker 

1. 使用 AWS DeepRacer 模擬器來評估模型，並在虛擬環境中測試自動賽車。

1. 將訓練過的模型部署到 AWS DeepRacer 模型車輛，以在實體環境中測試自動賽車。

