As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá. # Modelos Palmyra da Writer AI Esta seção descreve os parâmetros de solicitação e os campos de resposta dos modelos da Writer AI. Use essas informações para fazer chamadas de inferência a modelos da Writer AI com as operações [InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html) e [InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html) (streaming). Esta seção também inclui exemplos de código do Python que mostram como chamar modelos da Writer AI. Para usar um modelo em uma operação de inferência, o ID do modelo é necessário. Para obter o ID do modelo, consulte [Modelos de base compatíveis no Amazon Bedrock](models-supported.md). Alguns modelos também funcionam com a [API Converse](conversation-inference.md). Para verificar se a API Converse pode ser usada em um modelo da Writer AI específico, consulte [Modelos compatíveis e recursos do modelo](conversation-inference-supported-models-features.md). Para obter mais exemplos de código, consulte [Exemplos de código para o Amazon Bedrock usando AWS SDKs](service_code_examples.md). Os modelos de base no Amazon Bedrock são compatíveis com as modalidades de entrada e saída, que variam de modelo para modelo. Para verificar as modalidades compatíveis com os modelos da Writer AI, consulte [Modelos de base compatíveis no Amazon Bedrock](models-supported.md). Para verificar quais recursos do Amazon Bedrock são compatíveis com os modelos da Writer AI, consulte [Modelos de base compatíveis no Amazon Bedrock](models-supported.md). Para verificar em quais regiões da AWS esses modelos da Writer AI estão disponíveis, consulte [Modelos de base compatíveis no Amazon Bedrock](models-supported.md). Ao fazer chamadas de inferência com modelos da Writer AI, inclua um prompt no modelo. Para obter informações gerais sobre como criar prompts para os modelos compatíveis com o Amazon Bedrock, consulte [Conceitos de engenharia de prompts](prompt-engineering-guidelines.md). Para obter informações de prompts específicos da Writer AI, consulte o [Writer AI prompt engineering guide](). **Writer Palmyra X4** Com a melhor classificação no Stanford HELM, o Writer Palmyra X4 alcança desempenho superior em tarefas complexas e fluxos de trabalho agênticos. Ele oferece uma janela de contexto de 128 mil tokens e um conjunto de recursos de empresarial, como raciocínio avançado, chamada de ferramentas, delegação de LLM, RAG integrada, geração de código, saídas estruturadas, multimodalidade e suporte multilíngue. Usando ferramentas específicas da empresa que ampliam a capacidade de ação do modelo, o Palmyra X4 permite que os desenvolvedores criem aplicações e agentes que atualizam o sistema, realizam transações, enviam e-mails, acionam o fluxo de trabalho etc. **Writer Palmyra X5** Com uma janela de contexto de 1 milhão de tokens, o Writer Palmyra X5 é um marco do fim das restrições de contexto para o desenvolvimento de aplicações e agentes. O modelo mais novo da Writer alcança desempenho superior em inferência de contexto longo por meio de memória expandida e poder de processamento, permitindo que os desenvolvedores criem fluxos de trabalho agênticos mais complexos e de várias etapas mais depressa. Tal como o Palmyra X4, o Palmyra X5 inclui um conjunto de recursos prontos para uso empresarial, como raciocínio avançado, chamada de ferramentas, delegação de LLM, RAG integrada, geração de código, saídas estruturadas, multimodalidade e suporte multilíngue. **Topics** + [ # Writer Palmyra X4 ](model-parameters-palmyra-x4.md) + [ # Writer Palmyra X5 ](model-parameters-palmyra-x5.md) # Writer Palmyra X4 O Writer Palmyra X4 é um modelo com uma janela de contexto de até 128 mil tokens. Esse modelo é excelente para processamento e compreensão de tarefas complexas, o que o torna ideal para automação de fluxos de trabalho, tarefas de codificação e análise de dados. + Fornecedor: Writer + Categorias: geração de texto, geração de código, formatação de rich text + Última versão: v1 + Data de lançamento: 28 de abril de 2025 + ID de modelo: `writer.palmyra-x4-v1:0` + Modalidade: texto + Máximo de tokens: entrada: 122.880 tokens, saída: 8.192 tokens + Idioma: inglês, espanhol, francês, alemão, chinês e vários outros + Tipo de implantação: sem servidor ## Campo do corpo da resposta de invocação do Palmyra X4 Ao fazer uma chamada [InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html) ou [InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html) usando um modelo da Writer, preencha o campo `body` com um objeto JSON que esteja em conformidade com o modelo abaixo. Insira o prompt no campo `text` do objeto `text_prompts`. ``` { "modelId": "writer.palmyra-x4-v1:0", "contentType": "application/json", "accept": "application/json", "body": "{\"messages\":[{\"role\":\"user\",\"content\":{\"text\":\"Explain quantum computing in simple terms\"}}]}" } ``` A tabela a seguir mostra os valores mínimo, máximo e padrão para os parâmetros numéricos. **** | Parameter | Tipo | Padrão | Intervalo/Validação | Descrição | | --- | --- | --- | --- | --- | | mensagens | array | Obrigatório | 1-∞ itens | Mensagens do histórico de chat | | temperature | flutuação | 1,0 | 0.0 ≤ x ≤ 2.0 | Temperatura da amostragem | | top\$1p | flutuação | 1,0 | 0.0 < value ≤ 1.0 | Limite da amostragem do núcleo | | max\$1tokens | int | 16 | 1 ≤ x ≤ 8192 | Máximo de tokens a serem gerados | | min\$1tokens | int | 0 | 0 ≤ x ≤ max\$1tokens | Tokens mínimos antes de parar | | parar | array | [] | ≤4 entradas | Sequências de paradas | | semente | int | nulo | Qualquer inteiro | Random seed (Semente aleatória) | | presence\$1penalty | flutuação | 0.0 | -2.0 ≤ x ≤ 2.0 | Penalidade de presença de um novo token | | frequency\$1penalty | flutuação | 0.0 | -2.0 ≤ x ≤ 2.0 | Penalidade de frequência de token | ## Campo do corpo da resposta de invocação do Palmyra X4 A resposta JSON para o Writer Palmyra X4 usa o seguinte formato: ``` { "id": "chatcmpl-a689a6e150b048ca8814890d3d904d41", "object": "chat.completion", "created": 1745854231, "model": "writer.palmyra-x4-v1:0", "choices": [ { "index": 0, "message": { "role": "assistant", "reasoning_content": null, "content": "Quantum computing harnesses quantum mechanics to process information in extraordinarily powerful ways. Unlike classical bits, which are 0 or 1, quantum bits (qubits) can exist in multiple states simultaneously through superposition. Qubits also entangle, allowing them to be interconnected in such a way that the state of one (whether it's 0 or 1) can depend on the state of another, no matter the distance between them. This combination of superposition and entanglement enables quantum computers to solve complex problems much faster than classical computers, particularly in areas like cryptography, optimization, and simulations of molecular structures. However, quantum computing is still in its early stages, facing challenges in stability and scalability.", "tool_calls": [] }, "logprobs": null, "finish_reason": "stop", "stop_reason": null } ], "usage": { "prompt_tokens": 43, "total_tokens": 186, "completion_tokens": 143, "prompt_tokens_details": null }, "prompt_logprobs": null } ``` ## Writer Palmyra X4Código de exemplo do Exemplo de código para o Writer Palmyra X4: ``` import boto3 import json from botocore.exceptions import ClientError client = boto3.client("bedrock-runtime", region_name="us-west-2") model_id = "writer.palmyra-x4-v1:0" # Format the request payload using the model's native structure. native_request = { "temperature": 1, "messages": [ { "role": "user", "content": "Explain quantum computing in simple terms.", } ], } # Convert the native request to JSON. request = json.dumps(native_request) try: # Invoke the model with the request. response = client.invoke_model(modelId=model_id, body=request) except (ClientError, Exception) as e: print(f"ERROR: Can't invoke '{model_id}'. Reason: {e}") exit(1) # Decode the response body. model_response = json.loads(response["body"].read()) # Extract and print the response text. response_text = model_response["content"][0]["text"] print(response_text) ``` # Writer Palmyra X5 O Writer Palmyra X5 inclui um conjunto de recursos prontos para uso corporativo, como raciocínio avançado, chamada de ferramentas, delegação de LLM, RAG integrada, geração de código, saídas estruturadas, multimodalidade e suporte multilíngue. O modelo Writer Palmyra X5 tem os seguintes controles: + Fornecedor: Writer + Categorias: geração de texto, geração de código, formatação de rich text + Última versão: v1 + Data de lançamento: 28 de abril de 2025 + ID de modelo: `writer.palmyra-x5-v1:0` + Modalidade: texto + Máximo de tokens: entrada de 1.040.000 tokens e saída de 8.192 tokens + Idioma: inglês, espanhol, francês, alemão, chinês e vários outros + Tipo de implantação: sem servidor ## Campo do corpo da resposta de invocação do Palmyra X5 Ao fazer uma chamada [InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html) ou [InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html) usando um modelo da Writer, preencha o campo `body` com um objeto JSON que esteja em conformidade com o modelo abaixo. Insira o prompt no campo `text` do objeto `text_prompts`. ``` { "modelId": "writer.palmyra-x5-v1:0", "contentType": "application/json", "accept": "application/json", "body": "{\"messages\":[{\"role\":\"user\",\"content\":{\"text\":\"Explain quantum computing in simple terms\"}}]}" } ``` A tabela a seguir mostra os valores mínimo, máximo e padrão para os parâmetros numéricos. **** | Parameter | Tipo | Padrão | Intervalo/Validação | Descrição | | --- | --- | --- | --- | --- | | mensagens | array | Obrigatório | 1-∞ itens | Mensagens do histórico de chat | | temperature | flutuação | 1,0 | 0.0 ≤ x ≤ 2.0 | Temperatura da amostragem | | top\$1p | flutuação | 1,0 | 0.0 < x ≤ 1.0 | Limite da amostragem do núcleo | | max\$1tokens | int | 16 | 1 ≤ x ≤ 8192 | Máximo de tokens a serem gerados | | min\$1tokens | int | 0 | 0 ≤ x ≤ max\$1tokens | Tokens mínimos antes de parar | | parar | array | [] | ≤4 entradas | Sequências de paradas | | semente | int | nulo | Qualquer inteiro | Random seed (Semente aleatória) | | presence\$1penalty | flutuação | 0.0 | -2.0 ≤ x ≤ 2.0 | Penalidade de presença de um novo token | | frequency\$1penalty | flutuação | 0.0 | -2.0 ≤ x ≤ 2.0 | Penalidade de frequência de token | ## Campo do corpo da resposta de invocação do Palmyra X5 A resposta JSON para o Writer Palmyra X5 usa o seguinte formato: ``` { "id": "chatcmpl-a689a6e150b048ca8814890d3d904d41", "object": "chat.completion", "created": 1745854231, "model": "writer.palmyra-x5-v1:0", "choices": [ { "index": 0, "message": { "role": "assistant", "reasoning_content": null, "content": "Quantum computing harnesses quantum mechanics to process information in extraordinarily powerful ways. Unlike classical bits, which are 0 or 1, quantum bits (qubits) can exist in multiple states simultaneously through superposition. Qubits also entangle, allowing them to be interconnected in such a way that the state of one (whether it's 0 or 1) can depend on the state of another, no matter the distance between them. This combination of superposition and entanglement enables quantum computers to solve complex problems much faster than classical computers, particularly in areas like cryptography, optimization, and simulations of molecular structures. However, quantum computing is still in its early stages, facing challenges in stability and scalability.", "tool_calls": [] }, "logprobs": null, "finish_reason": "stop", "stop_reason": null } ], "usage": { "prompt_tokens": 43, "total_tokens": 186, "completion_tokens": 143, "prompt_tokens_details": null }, "prompt_logprobs": null } ```