

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Modèles Writer AI Palmyra
<a name="model-parameters-writer-palmyra"></a>

Cette section décrit les paramètres de demande et les champs de réponse pour les modèles Writer AI. Utilisez ces informations pour effectuer des appels d’inférence aux modèles Writer AI à l’aide des opérations [InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html) et [InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html) (streaming). Cette section inclut également des exemples de code Python qui montrent comment appeler les modèles Writer AI. Pour utiliser un modèle dans une opération d’inférence, vous avez besoin de l’ID du modèle. Pour obtenir l’ID du modèle, consultez [Modèles de fondation pris en charge dans Amazon Bedrock](models-supported.md). Certains modèles fonctionnent également avec l’[API Converse](conversation-inference.md). Pour vérifier si l’API Converse prend en charge un modèle Writer AI spécifique, consultez [Modèles et fonctionnalités des modèles pris en charge](conversation-inference-supported-models-features.md). Pour plus d’exemples de code, consultez [Exemples de code pour Amazon Bedrock utilisant AWS SDKs](service_code_examples.md).

Les modèles de fondation d’Amazon Bedrock prennent en charge les modalités d’entrée et de sortie, qui varient d’un modèle à l’autre. Pour vérifier les modalités prises en charge par les modèles Writer AI, consultez [Modèles de fondation pris en charge dans Amazon Bedrock](models-supported.md). Pour vérifier quelles fonctionnalités Amazon Bedrock sont prises en charge par les modèles Writer AI, consultez [Modèles de fondation pris en charge dans Amazon Bedrock](models-supported.md). Pour vérifier dans quelles régions AWS les modèles Writer AI sont disponibles, consultez [Modèles de fondation pris en charge dans Amazon Bedrock](models-supported.md).

Lorsque vous effectuez des appels d’inférence avec les modèles Writer AI, vous incluez une invite pour le modèle. Pour plus d’informations générales sur la création d’invites pour les modèles pris en charge par Amazon Bedrock, consultez [Concepts d’ingénierie de requête](prompt-engineering-guidelines.md). Pour obtenir des informations sur les invites spécifiques Writer AI, consultez le [guide d’ingénierie de requête Writer AI]().

**Writer Palmyra X4**

Classé en tête du classement Stanford HELM, Writer Palmyra X4 atteint des performances supérieures dans le cadre de tâches complexes et de flux de travail agentiques. Il combine une fenêtre contextuelle de 128 000 jetons à une suite de fonctionnalités destinées aux entreprises, notamment le raisonnement avancé, l’appel d’outils, la délégation LLM, la génération à enrichissement contextuel (RAG) intégrée, la génération de code, les sorties structurées, la multimodalité et le support multilingue. À l’aide d’outils spécifiques à l’entreprise qui étendent la capacité d’action du modèle, Palmyra X4 permet aux développeurs de créer des applications et des agents chargés de mettre à jour le système, d’effectuer des transactions, d’envoyer des e-mails, de déclencher un flux de travail, etc.

**Writer Palmyra X5**

Avec une fenêtre contextuelle d’un million de jetons, Writer Palmyra X5 marque la fin des contraintes contextuelles pour le développement d’applications et d’agents. Le nouveau modèle de Writer atteint des performances supérieures en matière d’inférence contextuelle prolongée grâce à une mémoire et à une puissance de traitement étendues, permettant aux développeurs de créer plus rapidement des flux de travail agentiques plus complexes en plusieurs étapes. À l’instar de Palmyra X4, Palmyra X5 inclut une suite de fonctionnalités adaptées aux entreprises, notamment le raisonnement avancé, l’appel d’outils, la délégation LLM, la génération à enrichissement contextuel (RAG) intégrée, la génération de code, les sorties structurées, la multimodalité et le support multilingue

**Topics**
+ [Writer Palmyra X4](model-parameters-palmyra-x4.md)
+ [Writer Palmyra X5](model-parameters-palmyra-x5.md)

# Writer Palmyra X4
<a name="model-parameters-palmyra-x4"></a>

Writer Palmyra X4 est un modèle avec une fenêtre contextuelle pouvant contenir jusqu’à 128 000 jetons. Ce modèle excelle dans le traitement et la compréhension de tâches complexes, ce qui le rend idéal pour l’automatisation des flux de travail, les tâches de codage et l’analyse des données.
+ Prestataire : Writer
+ Catégories : génération de texte, génération de code, mise en forme de texte enrichi
+ Dernière version : v1
+ Date de sortie : 28 avril 2025
+ ID du modèle : `writer.palmyra-x4-v1:0`
+ Modalité : texte
+ Nombre maximum de jetons : entrée : 122 880 jetons, sortie : 8 192 jetons
+ Langue : anglais, espagnol, français, allemand, chinois et plusieurs autres langues
+ Type de déploiement : sans serveur

## Champ body de la demande d’invocation Palmyra X4
<a name="model-parameters-palmyra-x4-request-body"></a>

Lorsque vous effectuez un appel [InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html) ou [InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html) à l’aide d’un modèle Writer, remplissez le champ `body` avec un objet JSON conforme à celui ci-dessous. Entrez l’invite dans le champ `text` de l’objet `text_prompts`.

```
{
"modelId": "writer.palmyra-x4-v1:0",
"contentType": "application/json",
"accept": "application/json",
"body": "{\"messages\":[{\"role\":\"user\",\"content\":{\"text\":\"Explain quantum computing in simple terms\"}}]}"
}
```

Le tableau suivant indique les valeurs minimales, maximales et par défaut des paramètres numériques.


****  

| Paramètre | Type | Par défaut | Gamme/Validation | Description | 
| --- | --- | --- | --- | --- | 
| messages | array | Obligatoire | 1-∞ articles | Historique des messages de discussion | 
| temperature | float | 1.0 | 0,0 ≤ x ≤ 2,0 | Température de prélèvement | 
| top\$1p | float | 1.0 | 0,0 < valeur ≤ 1,0 | Seuil d’échantillonnage du noyau | 
| max\$1tokens | int | 16 | 1 ≤ x ≤ 8 192 | Nombre maximum de jetons à générer | 
| min\$1tokens | int | 0 | 0 ≤ x ≤ max\$1tokens | Nombre minimum de jetons avant l’arrêt | 
| stop | array | [] | ≤ 4 entrées | Séquences d’arrêt | 
| Seed (Noyau) | int | null | Nombre entier | Random Seed (Nombre aléatoire) | 
| presence\$1penalty | float | 0.0 | -2,0 ≤ x ≤ 2,0 | Nouvelle pénalité de présence de jetons | 
| frequency\$1penalty | float | 0.0 | -2,0 ≤ x ≤ 2,0 | Pénalité de fréquence de jeton | 

## Champ body de la réponse d’invocation Palmyra X4
<a name="model-parameters-palmyra-x4-response-body"></a>

Le JSON de réponse pour Writer Palmyra X4 utilise le format suivant :

```
{
  "id": "chatcmpl-a689a6e150b048ca8814890d3d904d41",
  "object": "chat.completion",
  "created": 1745854231,
  "model": "writer.palmyra-x4-v1:0",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "reasoning_content": null,
        "content": "Quantum computing harnesses quantum mechanics to process information in extraordinarily powerful ways. Unlike classical bits, which are 0 or 1, quantum bits (qubits) can exist in multiple states simultaneously through superposition. Qubits also entangle, allowing them to be interconnected in such a way that the state of one (whether it's 0 or 1) can depend on the state of another, no matter the distance between them. This combination of superposition and entanglement enables quantum computers to solve complex problems much faster than classical computers, particularly in areas like cryptography, optimization, and simulations of molecular structures. However, quantum computing is still in its early stages, facing challenges in stability and scalability.",
        "tool_calls": []
      },
      "logprobs": null,
      "finish_reason": "stop",
      "stop_reason": null
    }
  ],
  "usage": {
    "prompt_tokens": 43,
    "total_tokens": 186,
    "completion_tokens": 143,
    "prompt_tokens_details": null
  },
  "prompt_logprobs": null
}
```

## Writer Palmyra X4Exemple de code
<a name="model-parameters-palmyra-x4-example-code"></a>

Exemples de code pour Writer Palmyra X4 :

```
import boto3
import json
from botocore.exceptions import ClientError

client = boto3.client("bedrock-runtime", region_name="us-west-2")
model_id = "writer.palmyra-x4-v1:0"

# Format the request payload using the model's native structure.
native_request = {
    "temperature": 1,
    "messages": [
        {
            "role": "user",
            "content": "Explain quantum computing in simple terms.",
        }
    ],
}

# Convert the native request to JSON.
request = json.dumps(native_request)

try:
    # Invoke the model with the request.
    response = client.invoke_model(modelId=model_id, body=request)
except (ClientError, Exception) as e:
    print(f"ERROR: Can't invoke '{model_id}'. Reason: {e}")
    exit(1)

# Decode the response body.
model_response = json.loads(response["body"].read())

# Extract and print the response text.
response_text = model_response["content"][0]["text"]
print(response_text)
```

# Writer Palmyra X5
<a name="model-parameters-palmyra-x5"></a>

Writer Palmyra X5 inclut une suite de fonctionnalités adaptées aux entreprises, notamment le raisonnement avancé, l’appel d’outils, la délégation LLM, la génération à enrichissement contextuel (RAG) intégrée, la génération de code, les sorties structurées, la multimodalité et le support multilingue.

Le modèle Writer Palmyra X5 possède les commandes suivantes :
+ Prestataire : Writer
+ Catégories : génération de texte, génération de code, mise en forme de texte enrichi
+ Dernière version : v1
+ Date de sortie : 28 avril 2025
+ ID du modèle : `writer.palmyra-x5-v1:0`
+ Modalité : texte
+ Nombre maximum de jetons : entrée : 1 040 000 jetons, sortie : 8 192 jetons 
+ Langue : anglais, espagnol, français, allemand, chinois et plusieurs autres langues
+ Type de déploiement : sans serveur

## Champ body de la demande d’invocation Palmyra X5
<a name="model-parameters-palmyra-x5-request-body"></a>

Lorsque vous effectuez un appel [InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html) ou [InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html) à l’aide d’un modèle Writer, remplissez le champ `body` avec un objet JSON conforme à celui ci-dessous. Entrez l’invite dans le champ `text` de l’objet `text_prompts`.

```
{
"modelId": "writer.palmyra-x5-v1:0",
"contentType": "application/json",
"accept": "application/json",
"body": "{\"messages\":[{\"role\":\"user\",\"content\":{\"text\":\"Explain quantum computing in simple terms\"}}]}"
}
```

Le tableau suivant indique les valeurs minimales, maximales et par défaut des paramètres numériques.


****  

| Paramètre | Type | Par défaut | Gamme/Validation | Description | 
| --- | --- | --- | --- | --- | 
| messages | array | Obligatoire | 1-∞ articles | Historique des messages de discussion | 
| temperature | float | 1.0 | 0,0 ≤ x ≤ 2,0 | Température de prélèvement | 
| top\$1p | float | 1.0 | 0,0 ≤ x ≤ 1,0 | Seuil d’échantillonnage du noyau | 
| max\$1tokens | int | 16 | 1 ≤ x ≤ 8 192 | Nombre maximum de jetons à générer | 
| min\$1tokens | int | 0 | 0 ≤ x ≤ max\$1tokens | Nombre minimum de jetons avant l’arrêt | 
| stop | array | [] | ≤ 4 entrées | Séquences d’arrêt | 
| Noyau | int | null | Nombre entier | Nombre aléatoire | 
| presence\$1penalty | float | 0.0 | -2,0 ≤ x ≤ 2,0 | Nouvelle pénalité de présence de jetons | 
| frequency\$1penalty | float | 0.0 | -2,0 ≤ x ≤ 2,0 | Pénalité de fréquence de jeton | 

## Champ body de la réponse d’invocation Palmyra X5
<a name="model-parameters-palmyra-x5-response-body"></a>

Le JSON de réponse pour Writer Palmyra X5 utilise le format suivant :

```
{
  "id": "chatcmpl-a689a6e150b048ca8814890d3d904d41",
  "object": "chat.completion",
  "created": 1745854231,
  "model": "writer.palmyra-x5-v1:0",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "reasoning_content": null,
        "content": "Quantum computing harnesses quantum mechanics to process information in extraordinarily powerful ways. Unlike classical bits, which are 0 or 1, quantum bits (qubits) can exist in multiple states simultaneously through superposition. Qubits also entangle, allowing them to be interconnected in such a way that the state of one (whether it's 0 or 1) can depend on the state of another, no matter the distance between them. This combination of superposition and entanglement enables quantum computers to solve complex problems much faster than classical computers, particularly in areas like cryptography, optimization, and simulations of molecular structures. However, quantum computing is still in its early stages, facing challenges in stability and scalability.",
        "tool_calls": []
      },
      "logprobs": null,
      "finish_reason": "stop",
      "stop_reason": null
    }
  ],
  "usage": {
    "prompt_tokens": 43,
    "total_tokens": 186,
    "completion_tokens": 143,
    "prompt_tokens_details": null
  },
  "prompt_logprobs": null
}
```