Configurar uma política de palavras para sua barreira de proteção

Remover uma lista específica de palavras e frases das conversas com filtros de palavras

As Barreiras de Proteção do Amazon Bedrock têm filtros de palavras que podem ser usados para bloquear palavras e frases (correspondência exata) em prompts de entrada e em respostas do modelo. É possível usar os filtros de palavras a seguir para bloquear palavrões, conteúdo ofensivo ou impróprio ou conteúdo com nomes de concorrentes ou de produtos.

Filtro de palavrões: ative para bloquear palavras obscenas. A lista de palavrões é baseada em definições convencionais de obscenidade e é atualizada continuamente.
Filtro de palavras personalizado — Adicione palavras e frases personalizadas usando até três palavras em uma lista. Console de gerenciamento da AWS É possível adicionar até dez mil itens ao filtro de palavras personalizado.

Você tem as seguintes opções para adicionar palavras e frases usando o Console de gerenciamento da AWS do Amazon Bedrock:
- Adicione manualmente no editor de texto.
- Carregue um arquivo .txt ou .csv.
- Carregue um objeto de um bucket do Amazon S3.
nota
Você só pode fazer upload de documentos e objetos usando Console de gerenciamento da AWS o. As operações de API e do SDK só podem ser usadas com texto e não incluem o upload de documentos e objetos.

Configurar uma política de palavras para sua barreira de proteção

Você pode configurar políticas de palavras para sua grade de proteção usando a API Amazon Bedrock ou Console de gerenciamento da AWS Amazon Bedrock.

Console

Faça login no Console de gerenciamento da AWS com uma identidade do IAM que tenha permissões para usar o console Amazon Bedrock. Em seguida, abra o console Amazon Bedrock em https://console.aws.amazon.com/bedrock.
No painel de navegação à esquerda, escolha Barreiras de proteção e selecione Criar uma barreira de proteção.
Na página Fornecer detalhes da barreira de proteção, faça o seguinte:
1. Na seção Detalhes da barreira de proteção, forneça um Nome e uma Descrição opcional para a barreira de proteção.
2. Em Mensagens para prompts bloqueados, insira uma mensagem que exibida quando a barreira de proteção é aplicada. Marque a caixa de seleção Aplicar a mesma mensagem bloqueada para respostas para usar a mesma mensagem quando a barreira de proteção for aplicada na resposta.
3. (Opcional) Para ativar a inferência entre regiões para sua grade de proteção, expanda a inferência e selecione Ativar Cross-Region inferência entre regiões para sua grade de proteção. Escolha um perfil de guardrail que defina o destino para Regiões da AWS onde as solicitações de inferência de guardrail podem ser roteadas.
4. (Opcional) Por padrão, sua grade de proteção é criptografada com um. Chave gerenciada pela AWS Para usar sua própria chave do KMS gerenciada pelo cliente, expanda Seleção da chave do KMS e marque a caixa de seleção Personalizar configurações de criptografia (avançadas).
  
  Você pode selecionar uma AWS KMS chave existente ou selecionar Criar uma AWS KMS chave para criar uma nova.
5. (Opcional) Para adicionar tags à barreira de proteção, expanda Tags e selecione Adicionar nova tag para cada tag que você definir.
  
  Para obter mais informações, consulte Marcação de recursos do Amazon Bedrock.
6. Escolha Próximo.

Na página Adicionar filtros de palavras, faça o seguinte:

Selecione Filtrar palavrões para bloquear palavrões em prompts e respostas. A lista de palavrões é baseada em definições convencionais e é atualizada continuamente.

Em Adicionar palavras e frases personalizadas, selecione como adicionar palavras e frases para que a barreira de proteção bloqueie. Se fizer upload de um arquivo de palavras, cada linha do arquivo deverá conter uma palavra ou uma frase de até três palavras. Não inclua um cabeçalho. Você tem as seguintes opções:

Opção	Instruções
Adicionar palavras e frases manualmente	Adicione palavras e frases diretamente na seção Visualizar e editar palavras e frases.
Fazer upload de um arquivo local	Depois de selecionar a opção Escolher arquivo, carregue um arquivo .txt ou .csv que contenha as palavras e frases.
Carregar de um objeto do Amazon S3	Faça upload de um objeto no bucket do Amazon S3.

Edite as palavras e frases a serem bloqueadas pela barreira de proteção na seção Visualizar e editar palavras e frases. Você tem as seguintes opções:
- Se carregar de uma lista de palavras de um arquivo local ou objeto do Amazon S3, essa seção será preenchida com a sua lista de palavras. Para filtrar itens com erros, selecione Mostrar erros.
- Para adicionar um item à lista de palavras, selecione Adicionar palavra ou frase. Insira uma palavra ou frase de até três palavras na caixa e pressione Enter ou selecione o ícone de marca de seleção para confirmar o item.
- Para editar um item, selecione o ícone de edição ( ) ao lado do item.
- Para excluir um item da lista de palavras, selecione o ícone da lixeira ( ) ou, se estiver editando um item, selecione o ícone de exclusão ( ) ao lado do item.
- Para excluir itens que contêm erros, selecione Excluir tudo e escolha Excluir todas as linhas com erro.
- Para excluir todos os itens, selecione Excluir tudo e escolha Excluir todas as linhas.
- Para pesquisar um item, insira uma expressão na barra de pesquisa.
- Para mostrar somente itens com erros, selecione o menu suspenso Mostrar tudo e selecione Mostrar somente erros.
- Para configurar o tamanho de cada página na tabela ou a exibição da coluna na tabela, selecione o ícone de configurações ( ). Defina suas preferências e selecione Confirmar.
- Por padrão, essa seção exibe o editor de Tabela. Para mudar para um editor de texto no qual seja possível inserir uma palavra ou frase em cada linha, selecione Editor de texto. O Editor de texto fornece os seguintes recursos:
  - É possível copiar uma lista de palavras de outro editor de texto e colá-la nesse editor.
  - Um ícone X vermelho aparece ao lado dos itens que contêm erros e uma lista de erros aparece ao lado do editor.
Escolha Próximo para configurar outras políticas conforme necessário ou Pular para revisar e criar para finalizar a criação da barreira de proteção.
Analise as configurações da barreira de proteção.
1. Selecione Editar em qualquer seção na qual desejar fazer alterações.
2. Quando terminar de configurar as políticas, selecione Criar para criar a barreira de proteção.

API

Para criar uma grade de proteção com políticas de palavras, envie uma CreateGuardrailsolicitação. O formato da solicitação é o seguinte:


POST /guardrails HTTP/1.1
Content-type: application/json

{
    "blockedInputMessaging": "string",
    "blockedOutputsMessaging": "string",
    "wordPolicyConfig": {
        "managedWordListsConfig": [
            {
                "inputAction": "BLOCK | NONE",
                "inputEnabled": true,
                "outputAction": "BLOCK | NONE",
                "outputEnabled": true,
                "type": "PROFANITY"
            },
        ],
        "wordsConfig": [{
            "text": "string",
            "inputAction": "BLOCK | NONE",
            "inputEnabled": true,
            "outputAction": "BLOCK | NONE",
            "outputEnabled": true
        }]
    },
    "description": "string",
    "kmsKeyId": "string",
    "name": "string",
    "tags": [{
        "key": "string",
        "value": "string"
    }],
    "crossRegionConfig": {
        "guardrailProfileIdentifier": "string"
    }
}

Especifique um name e uma description para a barreira de proteção.
Especifique mensagens para quando a barreira de proteção bloquear um prompt ou uma resposta do modelo com sucesso nos campos blockedInputMessaging e blockedOutputsMessaging.
Configure políticas de palavras no objeto wordPolicyConfig:
- Use managedWordListsConfig para configurar uma lista predefinida de palavrões.
- Use a matriz wordsConfig para especificar palavras e frases personalizadas a serem filtradas:
  - Especifique as palavras e frases a serem filtradas no campo text.
  - (Opcional) Use inputAction ou outputAction para especificar a ação a ser executada quando a palavra for detectada em prompts ou respostas, respectivamente. Escolha BLOCK para bloquear o conteúdo e substituí-lo por mensagens bloqueadas ou NONE para não executar nenhuma ação além de exibir as informações de detecção.
  - (Opcional) Use inputEnabled e outputEnabled para controlar se a avaliação da barreira de proteção está habilitada para entradas e saídas.
(Opcional) Anexe todas as tags à barreira de proteção. Para obter mais informações, consulte Marcação de recursos do Amazon Bedrock.
(Opcional) Por segurança, inclua o ARN de uma chave do KMS no campo. kmsKeyId.
(Opcional) Para habilitar a inferência entre regiões, especifique um perfil de barreira de proteção no objeto crossRegionConfig.

O formato da resposta é o seguinte:


HTTP/1.1 202
Content-type: application/json

{
    "createdAt": "string",
    "guardrailArn": "string",
    "guardrailId": "string",
    "version": "string"
}

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Adicionar tópicos negados

Adicionar filtros de informações sensíveis

Remover uma lista específica de palavras e frases das conversas com filtros de palavras

nota

Configurar uma política de palavras para sua barreira de proteção