

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Déployer un modèle personnalisé pour l’inférence à la demande
<a name="deploy-custom-model"></a>

Une fois que vous avez créé un modèle personnalisé à l’aide d’une tâche de personnalisation de modèle (peaufinage, distillation ou pré-entraînement continu), vous pouvez configurer l’inférence à la demande pour ce modèle.

Pour configurer l’inférence à la demande pour un modèle personnalisé, vous déployez le modèle avec un déploiement de modèle personnalisé. Après avoir déployé votre modèle personnalisé, vous utilisez le Amazon Resource Name (ARN) du déploiement comme paramètre `modelId` dans vos opérations API `InvokeModel` ou `Converse`. Vous pouvez utiliser le modèle déployé pour l’inférence à la demande avec les fonctionnalités Amazon Bedrock telles que les terrains de jeu, les agents et les bases de connaissances. 

**Topics**
+ [

## Modèles pris en charge
](#custom-model-inference-supported-models)
+ [

# Déployer un modèle personnalisé
](deploying-custom-model.md)
+ [

# Utiliser un déploiement pour l’inférence à la demande
](use-custom-model-on-demand.md)
+ [

# Supprimer un déploiement de modèle personnalisé
](delete-custom-model-deployment.md)

## Modèles pris en charge
<a name="custom-model-inference-supported-models"></a>

Vous pouvez configurer l’inférence à la demande pour les modèles suivants :
+ Amazon Nova Canvas
+ Amazon Nova Lite
+ Amazon Nova Micro
+ Amazon Nova Pro

# Déployer un modèle personnalisé
<a name="deploying-custom-model"></a>

Vous pouvez déployer un modèle personnalisé avec la console Amazon Bedrock AWS Command Line Interface, ou AWS SDKs. Pour plus d’informations sur l’utilisation du déploiement pour l’inférence, consultez [Utiliser un déploiement pour l’inférence à la demande](https://docs.aws.amazon.com/bedrock/latest/userguide/use-custom-model-on-demand.html). 

**Topics**
+ [

## Déployer un modèle personnalisé (console)
](#deploy-custom-model-console)
+ [

## Déployer un modèle personnalisé (AWS Command Line Interface)
](#deploy-custom-model-cli)
+ [

## Déploiement d’un modèle personnalisé (AWS SDKs)
](#deploy-custom-model-sdk)

## Déployer un modèle personnalisé (console)
<a name="deploy-custom-model-console"></a>

Vous déployez un modèle personnalisé à partir de la page **Modèles personnalisés** comme suit. Vous pouvez également déployer un modèle à partir de la page **Modèle personnalisé à la demande** avec les mêmes champs. Pour trouver cette page, dans **Inférence et évaluation** dans le panneau de navigation, sélectionnez **Modèle personnalisé à la demande**.

**Pour déployer un modèle personnalisé**

1. Connectez-vous à l' AWS Management Console aide d'un [rôle IAM avec les autorisations Amazon Bedrock](https://docs.aws.amazon.com//bedrock/latest/userguide/getting-started.html) et ouvrez la console Amazon Bedrock à l'adresse. [https://console.aws.amazon.com/nova/](https://console.aws.amazon.com/nova/)

1. Dans le panneau de navigation gauche, sélectionnez **Modèles personnalisés** sous **Modèles de fondation**.

1. Dans l’onglet **Modèles**, sélectionnez le bouton radio correspondant au modèle que vous voulez déployer.

1. Choisissez **Configurer l’inférence** et choisissez **Déployer avec la fonctionnalité à la demande**.

1. Sous **Détails du déploiement**, fournissez les informations suivantes :
   + **Nom du déploiement** (obligatoire) : saisissez un nom unique pour votre déploiement.
   + **Description** (facultatif) : entrez une description de votre déploiement.
   + **Balises** (facultatif) : ajoutez des balises pour la répartition des coûts et la gestion des ressources.

1. Choisissez **Créer**. Lorsque le statut affiche `Completed`, votre modèle personnalisé est prêt pour l’inférence à la demande. Pour plus d’informations sur l’utilisation du modèle personnalisé, consultez [Utiliser un déploiement pour l’inférence à la demande](https://docs.aws.amazon.com/bedrock/latest/userguide/use-custom-model-on-demand.html).

## Déployer un modèle personnalisé (AWS Command Line Interface)
<a name="deploy-custom-model-cli"></a>

Pour déployer un modèle personnalisé à des fins d'inférence à la demande à l'aide de AWS Command Line Interface, utilisez la `create-custom-model-deployment` commande avec le Amazon Resource Name (ARN) de votre modèle personnalisé. Cette commande utilise l'opération [CreateCustomModelDeployment](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_CreateCustomModelDeployment.html)API. Elle renvoie l’ARN du déploiement que vous pouvez utiliser comme `modelId` lorsque vous effectuez des demandes d’inférence. Pour plus d’informations sur l’utilisation du déploiement pour l’inférence, consultez [Utiliser un déploiement pour l’inférence à la demande](https://docs.aws.amazon.com/bedrock/latest/userguide/use-custom-model-on-demand.html).

```
aws bedrock create-custom-model-deployment \
--model-deployment-name "Unique name" \
--model-arn "Custom Model ARN" \
--description "Deployment description" \
--tags '[
    {
        "key": "Environment",
        "value": "Production"
    },
    {
        "key": "Team",
        "value": "ML-Engineering"
    },
    {
        "key": "Project",
        "value": "CustomerSupport"
    }
]' \
--client-request-token "unique-deployment-token" \
--region region
```

## Déploiement d’un modèle personnalisé (AWS SDKs)
<a name="deploy-custom-model-sdk"></a>

Pour déployer un modèle personnalisé à des fins d'inférence à la demande, utilisez l'opération d'[CreateCustomModelDeployment](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_CreateCustomModelDeployment.html)API avec le Amazon Resource Name (ARN) de votre modèle personnalisé. La réponse renvoie l’ARN du déploiement que vous pouvez utiliser comme `modelId` lors des demandes d’inférence. Pour plus d’informations sur l’utilisation du déploiement pour l’inférence, consultez [Utiliser un déploiement pour l’inférence à la demande](https://docs.aws.amazon.com/bedrock/latest/userguide/use-custom-model-on-demand.html).

Le code suivant montre comment utiliser le kit SDK pour Python (Boto3) afin de déployer un modèle personnalisé. 

```
def create_custom_model_deployment(bedrock_client):
    """Create a custom model deployment
    Args:
        bedrock_client: A boto3 Bedrock client for making API calls
 
    Returns:
        str: The ARN of the created custom model deployment
 
    Raises:
        Exception: If there is an error creating the deployment
    """
 
    try:
        response = bedrock_client.create_custom_model_deployment(
            modelDeploymentName="Unique deployment name",
            modelArn="Custom Model ARN",
            description="Deployment description",
            tags=[
                {'key': 'Environment', 'value': 'Production'},
                {'key': 'Team', 'value': 'ML-Engineering'},
                {'key': 'Project', 'value': 'CustomerSupport'}
            ],
            clientRequestToken=f"deployment-{uuid.uuid4()}"
        )
 
        deployment_arn = response['customModelDeploymentArn']
        print(f"Deployment created: {deployment_arn}")
        return deployment_arn
 
    except Exception as e:
        print(f"Error creating deployment: {str(e)}")
        raise
```

# Utiliser un déploiement pour l’inférence à la demande
<a name="use-custom-model-on-demand"></a>

Après avoir déployé votre modèle personnalisé pour l’inférence à la demande, vous pouvez l’utiliser pour générer des réponses en effectuant des demandes d’inférence. Pour les opérations `InvokeModel` ou `Converse`, vous utilisez le nom de ressource Amazon Resource Name (ARN) du déploiement comme `modelId`.

Pour plus d’informations sur la création de demandes d’inférence, consultez les rubriques suivantes :
+ [Soumettre des invites et générer des réponses à l’aide de l’inférence de modèle](https://docs.aws.amazon.com/bedrock/latest/userguide/inference.html)
+ [Conditions préalables à l’exécution de l’inférence de modèle](https://docs.aws.amazon.com/bedrock/latest/userguide/inference-prereq.html)
+ [Soumettre des invites et générer des réponses à l’aide de l’API](https://docs.aws.amazon.com/bedrock/latest/userguide/inference-api.html)

# Supprimer un déploiement de modèle personnalisé
<a name="delete-custom-model-deployment"></a>

Une fois que vous avez fini d’utiliser votre modèle pour l’inférence à la demande, vous pouvez supprimer le déploiement. Après avoir supprimé le déploiement, vous ne pouvez plus l’utiliser pour l’inférence à la demande, mais cela ne supprime pas le modèle personnalisé sous-jacent.

Vous pouvez supprimer un déploiement de modèle personnalisé à l'aide de la console Amazon Bedrock AWS Command Line Interface, ou AWS SDKs.

**Important**  
La suppression d’un déploiement de modèle personnalisé est irréversible. Assurez-vous que vous n’avez plus besoin du déploiement avant de procéder à la suppression. Si vous devez réutiliser le modèle personnalisé pour l’inférence à la demande, vous devez créer un nouveau déploiement.

**Topics**
+ [

## Suppression d’un déploiement de modèle personnalisé (console)
](#delete-deployment-console)
+ [

## Supprimer un déploiement de modèle personnalisé (AWS Command Line Interface)
](#delete-deployment-cli)
+ [

## Suppression d’un déploiement de modèle personnalisé (AWS SDKs)
](#delete-deployment-sdk)

## Suppression d’un déploiement de modèle personnalisé (console)
<a name="delete-deployment-console"></a>

**Pour supprimer un déploiement de modèle personnalisé**

1. Dans le panneau de navigation, sous **Inférence et évaluation**, sélectionnez **Modèle personnalisé à la demande**.

1. Sélectionnez le déploiement de modèle personnalisé que vous voulez supprimer.

1. Sélectionnez **Delete (Supprimer)**.

1. Dans la boîte de dialogue de confirmation, saisissez le nom du déploiement pour confirmer la suppression.

1. Choisissez **Supprimer** pour confirmer.

Le statut du déploiement passera à `Deleting` pendant la suppression. Une fois la suppression terminée, le déploiement sera supprimé de la liste.

## Supprimer un déploiement de modèle personnalisé (AWS Command Line Interface)
<a name="delete-deployment-cli"></a>

Pour supprimer un déploiement de modèle personnalisé à l'aide du AWS Command Line Interface, utilisez la `delete-custom-model-deployment` commande avec votre identifiant de déploiement.

```
aws bedrock delete-custom-model-deployment \
--custom-model-deployment-identifier "deployment-arn-or-name" \
--region region
```

## Suppression d’un déploiement de modèle personnalisé (AWS SDKs)
<a name="delete-deployment-sdk"></a>

Pour supprimer un déploiement de modèle personnalisé par programmation, utilisez l'opération d'[DeleteCustomModelDeployment](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_DeleteCustomModelDeployment.html)API avec le nom ou l'ARN (Amazon Resource Name) du déploiement. Le code suivant montre comment utiliser le kit SDK for Python (Boto3) pour supprimer un déploiement de modèle personnalisé. 

```
def delete_custom_model_deployment(bedrock_client):
    """Delete a custom model deployment
 
    Args:
        bedrock_client: A boto3 Bedrock client for making API calls
 
    Returns:
        dict: The response from the delete operation
 
    Raises:
        Exception: If there is an error deleting the deployment
    """
 
    try:
        response = bedrock_client.delete_custom_model_deployment(
            customModelDeploymentIdentifier="Deployment identifier"
        )
 
        print(f"Deployment deletion initiated")
        return response
 
    except Exception as e:
        print(f"Error deleting deployment: {str(e)}")
        raise
```