Ejemplos de formato de datos Razonamiento del contenido Directrices de preparación de conjuntos de datos

Fine-tune Amazon Nova modelos con ajuste de precisión supervisado

Amazon NovaLos datos de la SFT 2.0 utilizan el mismo formato de la API de Converse que la Amazon Nova versión 1.0, con la adición de campos de contenido de razonamiento opcionales. Para ver las especificaciones de formato completas, consulte el esquema de la ReasoningContentBlockAPI de Converse.

Funciones compatibles:

Tipos de entrada: texto, imagen o video en bloques de contenido del usuario
Contenido auxiliar: contenido de Text-only respuestas y razonamientos
Composición del conjunto de datos: debe ser homogéneo. Elige una de las siguientes opciones: turnos de solo texto, turnos de texto con imagen o turnos de texto con vídeo

importante

No se pueden mezclar imágenes y videos en el mismo conjunto de datos ni en turnos diferentes.

Limitaciones actuales:

Uso de herramientas: aunque el formato de entrada admite el uso de herramientas, actualmente no lo admite Amazon Nova 2.0 SFT. Añadir secciones de herramientas puede provocar un error en el trabajo.
Contenido de razonamiento multimodal: aunque el formato Converse admite contenido de razonamiento basado en imágenes, la SFT 2.0 no lo admite. Amazon Nova
Conjuntos de validación: es posible que la interfaz de usuario admita proporcionar un conjunto de validación, pero no se admitirá durante el entrenamiento de SFT.

Formatos multimedia compatibles:

Imágenes: PNG, JPEG, GIF
Videos: MOV, MKV, MP4

Ejemplos de formato de datos

Text-only

En este ejemplo se muestra un formato básico de solo texto compatible con Amazon Nova la versión 1.0.


{
  "schemaVersion": "bedrock-conversation-2024",
  "system": [
    {
      "text": "You are a digital assistant with a friendly personality"
    }
  ],
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "text": "What country is right next to Australia?"
        }
      ]
    },
    {
      "role": "assistant",
      "content": [
        {
          "text": "The closest country is New Zealand"
        }
      ]
    }
  ]
}

Text with reasoning

En este ejemplo, se muestra texto con contenido de razonamiento opcional para Amazon Nova la versión 2.0.


{
  "schemaVersion": "bedrock-conversation-2024",
  "system": [
    {
      "text": "You are a digital assistant with a friendly personality"
    }
  ],
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "text": "What country is right next to Australia?"
        }
      ]
    },
    {
      "role": "assistant",
      "content": [
        {
          "reasoningContent": {
            "reasoningText": {
              "text": "I need to use my world knowledge of geography to answer this question"
            }
          }
        },
        {
          "text": "The closest country to Australia is New Zealand, located to the southeast across the Tasman Sea."
        }
      ]
    }
  ]
}

nota

Actualmente, solo reasoningText es compatible con la versión internareasoningContent. El contenido de razonamiento multimodal aún no está disponible.

Image + text

En este ejemplo se muestra cómo incluir la entrada de imágenes con el texto.


{
  "schemaVersion": "bedrock-conversation-2024",
  "system": [
    {
      "text": "You are a helpful assistant."
    }
  ],
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "image": {
            "format": "jpeg",
            "source": {
              "s3Location": {
                "uri": "s3://your-bucket/your-path/your-image.jpg",
                "bucketOwner": "your-aws-account-id"
              }
            }
          }
        },
        {
          "text": "Which country is highlighted in the image?"
        }
      ]
    },
    {
      "role": "assistant",
      "content": [
        {
          "reasoningContent": {
            "reasoningText": {
              "text": "I will determine the highlighted country by examining its location on the map and using my geographical knowledge"
            }
          }
        },
        {
          "text": "The highlighted country is New Zealand"
        }
      ]
    }
  ]
}

Video + text

En este ejemplo se muestra cómo incluir la entrada de vídeo con el texto.


{
  "schemaVersion": "bedrock-conversation-2024",
  "system": [
    {
      "text": "You are a helpful assistant."
    }
  ],
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "video": {
            "format": "mp4",
            "source": {
              "s3Location": {
                "uri": "s3://your-bucket/your-path/your-video.mp4",
                "bucketOwner": "your-aws-account-id"
              }
            }
          }
        },
        {
          "text": "What is shown in this video?"
        }
      ]
    },
    {
      "role": "assistant",
      "content": [
        {
          "reasoningContent": {
            "reasoningText": {
              "text": "I will analyze the video content to identify key elements"
            }
          }
        },
        {
          "text": "The video shows a map with New Zealand highlighted"
        }
      ]
    }
  ]
}

Razonamiento del contenido

El contenido de razonamiento (conocido también como cadena de pensamiento) captura los pasos de pensamiento intermedios del modelo antes de generar una respuesta final. En el turno del assistant, use el campo reasoningContent para incluir estos rastros de razonamiento.

Cómo se calcula la pérdida:

Con contenido de razonamiento: la pérdida de entrenamiento incluye tanto los tokens de razonamiento como los de salida final.
Sin contenido de razonamiento: la pérdida de entrenamiento se calcula solo en los tokens de salida final.

Cuándo activar el modo de razonamiento: reasoning_enabled: true Configúrelo en su configuración de entrenamiento cuando desee que el modelo genere señales de reflexión antes de producir los resultados finales o necesite mejorar el rendimiento en tareas de razonamiento complejas. reasoning_enabled: falseEstablézcalo cuando estés entrenando para realizar tareas sencillas que no se beneficien de pasos de razonamiento explícitos.

nota

Puedes activar el modo de razonamiento independientemente de si los datos de entrenamiento contienen contenido de razonamiento. Sin embargo, se recomienda incluir trazas de razonamiento en los datos de entrenamiento para que el modelo pueda aprender de estos ejemplos y mejorar la calidad del razonamiento.

Pautas de formato:

Usa texto plano para razonar el contenido.
Evita las etiquetas de marcado como <thinking> y </thinking> a menos que tu tarea lo requiera específicamente.
Asegúrese de que el contenido del razonamiento sea claro y relevante para el proceso de resolución de problemas.

El contenido de razonamiento efectivo debe incluir:

Pensamientos y análisis intermedios
Deducciones lógicas y pasos de inferencia
Step-by-step enfoques de resolución de problemas
Conexiones explícitas entre los pasos y las conclusiones

Si el conjunto de datos carece de rastros de razonamiento, puede crearlos con un modelo con capacidad de razonamiento como Nova Premier. Proporcione los pares de entrada y salida al modelo y capture el proceso de razonamiento para crear un conjunto de datos con razonamiento aumentado.

Directrices de preparación de conjuntos de datos

En la siguiente tabla se proporcionan pautas para preparar el conjunto de datos de entrenamiento.

Directrices de preparación de conjuntos de datos
Directriz	Description (Descripción)
Tamaño y calidad	Tamaño recomendado: 2.000-10.000 muestras Muestras mínimas: 200 Priorice la calidad sobre la cantidad. Asegúrese de que los ejemplos sean precisos y estén bien anotados. El conjunto de datos debe reflejar de cerca sus casos de uso de producción.
Diversidad	Incluya diversos ejemplos que hagan lo siguiente: Cubran la gama completa de entradas esperadas. Representen diferentes niveles de dificultad. Incluyan casos extremos y variantes. Eviten el sobreajuste a patrones estrechos.
Formato de salida	Especifique claramente el formato de salida deseado en las respuestas del asistente. Los ejemplos incluyen estructuras JSON, tablas, formato CSV o formatos personalizados específicos de su aplicación.
Multi-turn conversaciones	La pérdida se calcula solo en los turnos del asistente, no en los turnos del usuario. La respuesta de cada asistente debe tener el formato correcto. Mantenga la coherencia en todos los turnos de conversación.
Lista de control de calidad	Tamaño de conjunto de datos suficiente (entre 2000 y 10 000 muestras) Varios ejemplos que cubren todos los casos de uso Formato de salida claro y coherente Etiquetas y anotaciones precisas Representación de escenarios de producción Sin contradicciones ni ambigüedades

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Prepare los datos para ajustar sus modelos

Hiperparámetros de los modelos personalizados