

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 進階設定
<a name="cluster-specific-configurations-advanced-settings"></a>

SageMaker HyperPod 配方轉接器建置在 Nvidia Nemo 和 Pytorch-lightning 架構之上。如果您已經使用這些架構，則將您的自訂模型或功能整合到 SageMaker HyperPod 配方轉接器是一個類似的程序。除了修改配方轉接器之外，您還可以變更自己的預先訓練或微調指令碼。如需撰寫自訂訓練指令碼的指引，請參閱[範例](https://github.com/aws/sagemaker-hyperpod-training-adapter-for-nemo/tree/main/examples)。

## 使用 SageMaker HyperPod 轉接器建立您自己的模型
<a name="cluster-specific-configurations-use-hyperpod-adapter-create-model"></a>

在配方轉接器內，您可以在下列位置自訂下列檔案：

1. `collections/data`：包含負責載入資料集的模組。目前，它僅支援來自 HuggingFace 的資料集。如果您有更進階的要求，程式碼結構可讓您在相同的資料夾內新增自訂資料模組。

1. `collections/model`：包括各種語言模型的定義。目前，它支援常見的大型語言模型，例如 Llama、Mixtral 和 Mistral。您可以靈活地在此資料夾內引入自己的模型定義。

1. `collections/parts`：此資料夾包含以分散式方式訓練模型的策略。其中一個範例是全碎片資料平行 (FSDP) 策略，允許跨多個加速器將大型語言模型碎片化。此外，這些策略支援各種形式的模型平行化。您也可以選擇引入自己的自訂訓練策略進行模型訓練。

1. `utils`：包含旨在協助管理訓練任務的各種公用程式。它可以做為您自己工具的儲存庫。您可以將自己的工具用於故障診斷或基準測試等任務。您也可以在此資料夾內新增自己的個人化 PyTorch Lightning 回呼。您可以使用 PyTorch Lightning 回呼，將特定功能或操作無縫整合到訓練生命週期。

1. `conf`：包含用於驗證訓練任務中特定參數的組態結構描述定義。如果引入新的參數或組態，您可以將自訂的結構描述新增至此資料夾。您可以使用自訂的結構描述來定義驗證規則。您可以驗證資料類型、範圍或任何其他參數限制條件。您也可以定義自己的自訂結構描述來驗證參數。