

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Fine-tune Amazon Nova modèles avec réglage précis supervisé
<a name="nova-2-sft-data-prep"></a>

Amazon NovaLes données SFT 2.0 utilisent le même format d'API Converse que la Amazon Nova version 1.0, avec l'ajout de champs de contenu de raisonnement facultatifs. Pour les spécifications de format complètes, voir le [schéma [ReasoningContentBlock](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ReasoningContentBlock.html)de l'API Converse](https://docs.aws.amazon.com/bedrock/latest/userguide/conversation-inference-call.html).

**Fonctionnalités prises en charge :**
+ **Types de saisie** : texte, image ou vidéo dans les blocs de contenu utilisateur
+ **Contenu de l'assistant** : Text-only réponses et contenu du raisonnement
+ **Composition du jeu** de données — Doit être homogène. Choisissez l'une des options suivantes : virages textuels uniquement, tournages texte\+image ou texte\+vidéo

**Important**  
Vous ne pouvez pas mélanger des images et des vidéos dans le même jeu de données ou sur différents tours.

**Limitations actuelles :**
+ **Utilisation des outils** — Bien que l'utilisation des outils soit prise en charge dans le format d'entrée, elle n'est actuellement pas prise en charge par Amazon Nova 2.0 SFT. L'ajout de sections d'outils peut entraîner l'échec de votre tâche.
+ **Contenu de raisonnement multimodal** — Bien que le format Converse prenne en charge le contenu de raisonnement basé sur des images, celui-ci n'est pas pris en charge par Amazon Nova 2.0 SFT.
+ **Ensembles de validation** — La fourniture d'un ensemble de validation peut être prise en charge via l'interface utilisateur mais ne le sera pas pendant la formation SFT.

**Formats multimédia pris en charge :**
+ **Images** — PNG, JPEG, GIF
+ **Vidéos** — MOV, MKV, MP4

## Exemples de formats de données
<a name="nova-2-sft-data-examples"></a>

------
#### [ Text-only ]

Cet exemple montre un format texte de base compatible avec Amazon Nova la version 1.0.

```
{
  "schemaVersion": "bedrock-conversation-2024",
  "system": [
    {
      "text": "You are a digital assistant with a friendly personality"
    }
  ],
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "text": "What country is right next to Australia?"
        }
      ]
    },
    {
      "role": "assistant",
      "content": [
        {
          "text": "The closest country is New Zealand"
        }
      ]
    }
  ]
}
```

------
#### [ Text with reasoning ]

Cet exemple montre du texte avec un contenu de raisonnement facultatif pour la Amazon Nova version 2.0.

```
{
  "schemaVersion": "bedrock-conversation-2024",
  "system": [
    {
      "text": "You are a digital assistant with a friendly personality"
    }
  ],
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "text": "What country is right next to Australia?"
        }
      ]
    },
    {
      "role": "assistant",
      "content": [
        {
          "reasoningContent": {
            "reasoningText": {
              "text": "I need to use my world knowledge of geography to answer this question"
            }
          }
        },
        {
          "text": "The closest country to Australia is New Zealand, located to the southeast across the Tasman Sea."
        }
      ]
    }
  ]
}
```

**Note**  
Actuellement, seul `reasoningText` est pris en charge au sein de`reasoningContent`. Le contenu du raisonnement multimodal n'est pas encore disponible.

------
#### [ Image \+ text ]

Cet exemple montre comment inclure une entrée d'image dans du texte.

```
{
  "schemaVersion": "bedrock-conversation-2024",
  "system": [
    {
      "text": "You are a helpful assistant."
    }
  ],
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "image": {
            "format": "jpeg",
            "source": {
              "s3Location": {
                "uri": "s3://your-bucket/your-path/your-image.jpg",
                "bucketOwner": "your-aws-account-id"
              }
            }
          }
        },
        {
          "text": "Which country is highlighted in the image?"
        }
      ]
    },
    {
      "role": "assistant",
      "content": [
        {
          "reasoningContent": {
            "reasoningText": {
              "text": "I will determine the highlighted country by examining its location on the map and using my geographical knowledge"
            }
          }
        },
        {
          "text": "The highlighted country is New Zealand"
        }
      ]
    }
  ]
}
```

------
#### [ Video \+ text ]

Cet exemple montre comment inclure une entrée vidéo dans du texte.

```
{
  "schemaVersion": "bedrock-conversation-2024",
  "system": [
    {
      "text": "You are a helpful assistant."
    }
  ],
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "video": {
            "format": "mp4",
            "source": {
              "s3Location": {
                "uri": "s3://your-bucket/your-path/your-video.mp4",
                "bucketOwner": "your-aws-account-id"
              }
            }
          }
        },
        {
          "text": "What is shown in this video?"
        }
      ]
    },
    {
      "role": "assistant",
      "content": [
        {
          "reasoningContent": {
            "reasoningText": {
              "text": "I will analyze the video content to identify key elements"
            }
          }
        },
        {
          "text": "The video shows a map with New Zealand highlighted"
        }
      ]
    }
  ]
}
```

------

## Contenu du raisonnement
<a name="nova-2-reasoning-modes"></a>

Le contenu du raisonnement (également appelé chaîne de pensée) capture les étapes de réflexion intermédiaires du modèle avant de générer une réponse finale. À votre `assistant` tour, utilisez le `reasoningContent` champ pour inclure ces traces de raisonnement.

**Comment est calculée la perte :**
+ **Avec un contenu de raisonnement** — La perte d'entraînement inclut à la fois des jetons de raisonnement et des jetons de résultat final
+ **Sans raisonnement, contenu** : la perte d'entraînement est calculée uniquement sur les jetons de sortie finaux.

**Quand activer le mode raisonnement :** définissez `reasoning_enabled: true` dans votre configuration d'entraînement le moment où vous souhaitez que le modèle génère des jetons de réflexion avant de produire les résultats finaux ou si vous avez besoin de meilleures performances sur des tâches de raisonnement complexes. Définissez le `reasoning_enabled: false` moment où vous vous entraînez sur des tâches simples qui ne nécessitent pas d'étapes de raisonnement explicites.

**Note**  
Vous pouvez activer le mode raisonnement, que vos données d'entraînement contiennent ou non du contenu de raisonnement. Cependant, il est recommandé d'inclure des traces de raisonnement dans vos données d'entraînement afin que le modèle puisse tirer des leçons de ces exemples et améliorer la qualité du raisonnement.

**Directives de formatage :**
+ Utilisez du texte brut pour raisonner le contenu.
+ Évitez les balises de balisage telles que `<thinking>` et `</thinking>` sauf si cela est spécifiquement requis par votre tâche.
+ Assurez-vous que le contenu du raisonnement est clair et pertinent pour le processus de résolution des problèmes.

**Le contenu du raisonnement efficace doit inclure :**
+ Réflexions et analyses intermédiaires
+ Déductions logiques et étapes d'inférence
+ Step-by-step approches de résolution de problèmes
+ Liens explicites entre les étapes et les conclusions

Si votre jeu de données ne contient pas de traces de raisonnement, vous pouvez les créer à l'aide d'un modèle capable de raisonner tel que Nova Premier. Fournissez vos paires d'entrées-sorties au modèle et capturez son processus de raisonnement pour créer un ensemble de données augmenté par le raisonnement.

## Directives pour la préparation des jeux
<a name="nova-2-dataset-preparation"></a>

Le tableau suivant fournit des instructions pour préparer votre jeu de données d'entraînement.


**Directives pour la préparation des jeux**  

| Ligne directrice | Description | 
| --- | --- | 
| Taille et qualité |  [See the AWS documentation website for more details](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/nova-2-sft-data-prep.html)  | 
| Diversité | Incluez divers exemples qui permettent d'effectuer les opérations suivantes :[See the AWS documentation website for more details](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/nova-2-sft-data-prep.html) | 
| Formatage de sortie | Spécifiez clairement le format de sortie souhaité dans les réponses de l'assistant. Les exemples incluent les structures JSON, les tableaux, le format CSV ou les formats personnalisés spécifiques à votre application. | 
| Multi-turn conversations |  [See the AWS documentation website for more details](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/nova-2-sft-data-prep.html)  | 
| Liste de contrôle de qualité |  [See the AWS documentation website for more details](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/nova-2-sft-data-prep.html)  | 