为开放式权重模型准备数据

当您使用 OpenAI-compatible API 对开放权重模型进行微调并进行强化微调时，请使用自己的 JSONL 格式提示来提供训练数据。fine-tune

训练数据格式和要求

训练数据必须遵循 OpenAI 聊天完成格式，并附有 100-2 万个示例。每个训练示例都包含：

messages：在此字段中，包括包含向模型提供的输入提示的用户、系统或助手角色。
reference_answer：在此字段中，它应包含您的奖励函数用来对模型的响应进行评分的预期输出或评估标准。它不仅限于结构化输出，还可以包含任何有助于您的奖励功能评估质量的格式。
[可选] 您可以添加评分者 Lambda 用于评分的字段。

要求：

您可以使用 OpenAI-compatible 文件 api 上传训练数据以进行微调作业。文件安全地存储在 Amazon Bedrock 中，用于创建微调任务。有关 API 的完整详细信息，请参阅OpenAI文件文档。

要上传训练文件，请选择首选方法的选项卡，然后按照以下步骤操作：

要检索有关特定文件的详细信息，请选择首选方法的选项卡，然后按照以下步骤操作：

要列出上传的文件，请选择首选方法对应的选项卡，然后按照以下步骤操作：

要删除文件，请选择首选方法的选项卡，然后按照以下步骤操作：

有效的 RFT 训练数据需要三个关键特征：

RFT 数据格式支持核心架构要求（messages 和 reference_answer）之外的自定义字段。这种灵活性使您可以添加奖励功能所需的任何其他数据，以便进行适当的评估。

您无需在食谱中对此进行配置。数据格式本质上支持其他字段。只需将其包含在训练数据的 JSON 中，即可通过 metadata 字段传递给奖励函数。

常见附加属性

这些附加字段将在评测期间传递给奖励函数，从而实现针对特定使用案例量身定制的复杂评分逻辑。

带有其他属性的示例

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

访问和安全

设置奖励功能