

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Ajuste Amazon Nova modelos com ajuste fino supervisionado
<a name="nova-2-sft-data-prep"></a>

Amazon NovaOs dados 2.0 SFT usam o mesmo formato de API Converse da Amazon Nova 1.0, com a adição de campos de conteúdo de raciocínio opcionais. Para obter as especificações completas do formato, consulte [ReasoningContentBlock](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ReasoningContentBlock.html)o [esquema da API Converse](https://docs.aws.amazon.com/bedrock/latest/userguide/conversation-inference-call.html).

**Funcionalidades suportadas:**
+ **Tipos de entrada** — texto, imagem ou vídeo em blocos de conteúdo do usuário
+ **Conteúdo do Assistente** — respostas somente em texto e conteúdo de raciocínio
+ **Composição do conjunto** de dados — deve ser homogênea. Escolha uma das seguintes opções: curvas somente de texto, curvas de texto\$1imagem ou curvas de texto\$1vídeo

**Importante**  
Você não pode misturar imagens e vídeos no mesmo conjunto de dados ou em turnos diferentes.

**Limitações atuais:**
+ **Uso da ferramenta** — Embora o uso da ferramenta seja suportado no formato de entrada, atualmente não é suportado pelo Amazon Nova 2.0 SFT. Adicionar seções de ferramentas pode fazer com que seu trabalho falhe.
+ Conteúdo de **raciocínio multimodal — Embora o formato Converse ofereça suporte a conteúdo** de raciocínio baseado em imagem, isso não é suportado pelo 2.0 SFT. Amazon Nova
+ **Conjuntos de validação** — O fornecimento de um conjunto de validação pode ser suportado por meio da interface do usuário, mas não será suportado durante o treinamento do SFT.

**Formatos de mídia compatíveis:**
+ **Imagens** — PNG, JPEG, GIF
+ **Vídeos** — MOV, MKV, MP4

## Exemplos de formato de dados
<a name="nova-2-sft-data-examples"></a>

------
#### [ Text-only ]

Este exemplo mostra um formato básico somente de texto compatível com Amazon Nova 1.0.

```
{
  "schemaVersion": "bedrock-conversation-2024",
  "system": [
    {
      "text": "You are a digital assistant with a friendly personality"
    }
  ],
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "text": "What country is right next to Australia?"
        }
      ]
    },
    {
      "role": "assistant",
      "content": [
        {
          "text": "The closest country is New Zealand"
        }
      ]
    }
  ]
}
```

------
#### [ Text with reasoning ]

Este exemplo mostra texto com conteúdo de raciocínio opcional para Amazon Nova 2.0.

```
{
  "schemaVersion": "bedrock-conversation-2024",
  "system": [
    {
      "text": "You are a digital assistant with a friendly personality"
    }
  ],
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "text": "What country is right next to Australia?"
        }
      ]
    },
    {
      "role": "assistant",
      "content": [
        {
          "reasoningContent": {
            "reasoningText": {
              "text": "I need to use my world knowledge of geography to answer this question"
            }
          }
        },
        {
          "text": "The closest country to Australia is New Zealand, located to the southeast across the Tasman Sea."
        }
      ]
    }
  ]
}
```

**nota**  
Atualmente, só `reasoningText` é suportado no`reasoningContent`. O conteúdo de raciocínio multimodal ainda não está disponível.

------
#### [ Image \$1 text ]

Este exemplo mostra como incluir entrada de imagem com texto.

```
{
  "schemaVersion": "bedrock-conversation-2024",
  "system": [
    {
      "text": "You are a helpful assistant."
    }
  ],
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "image": {
            "format": "jpeg",
            "source": {
              "s3Location": {
                "uri": "s3://your-bucket/your-path/your-image.jpg",
                "bucketOwner": "your-aws-account-id"
              }
            }
          }
        },
        {
          "text": "Which country is highlighted in the image?"
        }
      ]
    },
    {
      "role": "assistant",
      "content": [
        {
          "reasoningContent": {
            "reasoningText": {
              "text": "I will determine the highlighted country by examining its location on the map and using my geographical knowledge"
            }
          }
        },
        {
          "text": "The highlighted country is New Zealand"
        }
      ]
    }
  ]
}
```

------
#### [ Video \$1 text ]

Este exemplo mostra como incluir entrada de vídeo com texto.

```
{
  "schemaVersion": "bedrock-conversation-2024",
  "system": [
    {
      "text": "You are a helpful assistant."
    }
  ],
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "video": {
            "format": "mp4",
            "source": {
              "s3Location": {
                "uri": "s3://your-bucket/your-path/your-video.mp4",
                "bucketOwner": "your-aws-account-id"
              }
            }
          }
        },
        {
          "text": "What is shown in this video?"
        }
      ]
    },
    {
      "role": "assistant",
      "content": [
        {
          "reasoningContent": {
            "reasoningText": {
              "text": "I will analyze the video content to identify key elements"
            }
          }
        },
        {
          "text": "The video shows a map with New Zealand highlighted"
        }
      ]
    }
  ]
}
```

------

## Conteúdo de raciocínio
<a name="nova-2-reasoning-modes"></a>

O conteúdo de raciocínio (também chamado chain-of-thought) captura as etapas intermediárias do pensamento do modelo antes de gerar uma resposta final. `assistant`Por sua vez, use o `reasoningContent` campo para incluir esses traços de raciocínio.

**Como a perda é calculada:**
+ **Com conteúdo de raciocínio** — a perda de treinamento inclui tokens de raciocínio e tokens de saída final
+ **Conteúdo sem raciocínio** — a perda de treinamento é calculada apenas com base nos tokens de saída finais

**Quando ativar o modo de raciocínio:** defina `reasoning_enabled: true` em sua configuração de treinamento quando você deseja que o modelo gere tokens de raciocínio antes de produzir resultados finais ou precise de um desempenho aprimorado em tarefas complexas de raciocínio. Defina `reasoning_enabled: false` quando você está treinando em tarefas simples que não se beneficiam de etapas explícitas de raciocínio.

**nota**  
Você pode ativar o modo de raciocínio independentemente de seus dados de treinamento conterem conteúdo de raciocínio. No entanto, é recomendável incluir traços de raciocínio em seus dados de treinamento para que o modelo possa aprender com esses exemplos e melhorar a qualidade do raciocínio.

**Diretrizes de formatação:**
+ Use texto simples para raciocinar o conteúdo.
+ Evite tags de marcação como `<thinking>` e, `</thinking>` a menos que sejam especificamente exigidas por sua tarefa.
+ Garanta que o conteúdo do raciocínio seja claro e relevante para o processo de solução de problemas.

**O conteúdo de raciocínio eficaz deve incluir:**
+ Pensamentos e análises intermediários
+ Deduções lógicas e etapas de inferência
+ Step-by-step abordagens de resolução de problemas
+ Conexões explícitas entre etapas e conclusões

Se seu conjunto de dados não tiver traços de raciocínio, você poderá criá-los usando um modelo capaz de raciocinar, como o Nova Premier. Forneça seus pares de entrada e saída ao modelo e capture seu processo de raciocínio para criar um conjunto de dados com raciocínio aumentado.

## Diretrizes de preparação de conjuntos de dados
<a name="nova-2-dataset-preparation"></a>

A tabela a seguir fornece diretrizes para preparar seu conjunto de dados de treinamento.


**Diretrizes de preparação de conjuntos de dados**  

| Diretriz | Description | 
| --- | --- | 
| Tamanho e qualidade |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/nova-2-sft-data-prep.html)  | 
| Diversidade |  Inclua diversos exemplos que façam o seguinte: [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/nova-2-sft-data-prep.html)  | 
| Formatação de saída |  Especifique claramente o formato de saída desejado nas respostas do assistente. Os exemplos incluem estruturas JSON, tabelas, formato CSV ou formatos personalizados específicos para seu aplicativo.  | 
| Conversas em vários turnos |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/nova-2-sft-data-prep.html)  | 
| Lista de verificação de qualidade |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/nova-2-sft-data-prep.html)  | 