As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
O que são verificações automatizadas de raciocínio nos Amazon Bedrock Guardrails?
O que as verificações automatizadas de raciocínio fazem
Um dos principais desafios dos grandes modelos de linguagem (LLMs) é garantir a precisão de suas respostas. Sem validação, LLMs pode produzir alucinações ou informações imprecisas que minam a confiança. As verificações automatizadas de raciocínio no Amazon Bedrock Guardrails ajudam a resolver esse problema usando técnicas matemáticas para validar o conteúdo de linguagem natural em relação às políticas que você define.
Ao contrário dos componentes tradicionais de proteção que bloqueiam ou filtram o conteúdo com base na correspondência de padrões, as verificações automatizadas de raciocínio usam lógica formal para fornecer feedback estruturado sobre por que uma resposta está correta ou incorreta. Esse feedback pode ser usado para orientar um LLM a gerar conteúdo que seja comprovadamente consistente com sua política. Especificamente, as verificações automatizadas de raciocínio podem:
-
Detecte declarações factualmente incorretas nas respostas do LLM provando matematicamente que o conteúdo gerado contradiz suas regras de política.
-
Destaque suposições não declaradas em que uma resposta é consistente com sua política, mas não aborda todas as regras relevantes, indicando que a resposta pode estar incompleta.
-
Forneça explicações matematicamente verificáveis de por que declarações precisas estão corretas, citando as regras políticas específicas e as atribuições de variáveis que apoiam a conclusão.
Esses recursos tornam as verificações de raciocínio automatizadas diferentes de outros componentes do Amazon Bedrock Guardrails. Filtros de conteúdo e políticas de tópicos atuam como portas binárias — eles bloqueiam ou permitem conteúdo. As verificações automatizadas de raciocínio atuam como uma camada de verificação que fornece feedback detalhado e acionável que você pode usar para melhorar as respostas programaticamente.
Quando usar verificações automatizadas de raciocínio
As verificações automatizadas de raciocínio são mais valiosas quando você precisa demonstrar a base factual para a resposta de um LLM. Considere usá-los quando seu aplicativo envolver:
-
Setores regulamentados, como saúde, recursos humanos e serviços financeiros, nos quais informações incorretas podem ter consequências legais ou de conformidade.
-
Conjuntos de regras complexos, como aprovações de hipotecas, leis de zoneamento, elegibilidade para seguros ou benefícios para funcionários, em que várias condições interagem para determinar um resultado.
-
Cenários de conformidade que exigem respostas de IA auditáveis com provas matematicamente verificáveis de que a resposta é consistente com suas políticas.
-
Aplicativos voltados para o cliente em que orientações incorretas podem corroer a confiança, como chatbots que respondem a perguntas sobre políticas da empresa, elegibilidade de produtos ou termos de serviço.
O que as verificações automatizadas de raciocínio não fazem
Para definir as expectativas certas, esteja ciente das seguintes limitações:
-
Sem proteção imediata de injeção. As verificações automatizadas de raciocínio validam exatamente o que você envia. Se conteúdo malicioso ou manipulado for fornecido como entrada, a validação será realizada nesse conteúdo no estado em que se encontra. Para detectar e bloquear ataques de injeção de prompt, use filtros de conteúdo com verificações com raciocínio automatizado.
-
Sem detecção fora do tópico. O raciocínio automatizado analisa apenas textos relevantes para a política. Ele ignora conteúdo não relacionado e não pode dizer se uma resposta está fora do tópico. Para detectar respostas fora do tópico, use políticas de tópico.
-
Sem suporte para streaming. As verificações automatizadas de raciocínio não oferecem suporte ao streaming APIs. Você deve validar as respostas completas.
-
Somente em inglês. Atualmente, as verificações automatizadas de raciocínio são compatíveis apenas com inglês (EUA).
-
Escopo limitado à sua política. Um
VALIDresultado garante validade somente para as partes da entrada capturadas por meio de variáveis de política. Declarações que estão fora do escopo das variáveis da sua política não são validadas. Por exemplo, “Posso enviar minha lição de casa com atraso porque tenho um atestado médico falso” pode ser considerado válido se a política não tiver nenhuma variável para determinar se o atestado médico é falso.
As verificações automatizadas de raciocínio complementam outros recursos do Amazon Bedrock Guardrails, como filtros de conteúdo e políticas de tópicos. Para obter a melhor proteção, use-os juntos. Para ter mais informações, consulte os componentes de barreira de proteção.
End-to-end visão geral do fluxo de
O uso de verificações automatizadas de raciocínio envolve quatro fases: criar uma política, testá-la, implantá-la em uma grade de proteção e integrá-la ao seu aplicativo.
Source Document ──► Extracted Policy ──► Testing ──► Deployment ──► Integration (rules) (formal logic) (verify) (guardrail) (validate responses and act on feedback)
-
Crie uma política. Faça upload de um documento de origem que contenha as regras que você deseja aplicar. O raciocínio automatizado extrai regras lógicas formais e um esquema de variáveis do seu documento. Um relatório de fidelidade é gerado automaticamente e mede a precisão com que a política extraída representa seus documentos de origem, com pontuações de cobertura e precisão e uma base detalhada que vincula cada regra e variável às declarações específicas no conteúdo original. Analise a política extraída e o relatório de fidelidade para garantir que a política capture suas regras corretamente. Para obter mais informações, consulte Criar uma política de raciocínio automatizado.
-
Teste e refine. Os testes ajudam a garantir que sua política possa validar com precisão o conteúdo gerado, mesmo quando você faz alterações na própria política. Crie testes que imitem as perguntas que seus usuários farão e as respostas que seu LLM pode gerar. As verificações automatizadas de raciocínio usam modelos básicos para traduzir a linguagem natural em lógica. Use cenários gerados para validar a exatidão das regras e testes de QnA para validar a precisão da tradução lógica da linguagem natural. Refine sua política com base nos resultados dos testes. Para obter mais informações, consulte Testar uma política de raciocínio automatizado.
-
Implantar. Salve uma versão imutável da sua política testada e anexe-a a uma grade de proteção. Você pode automatizar a implantação usando nossos pipelines CloudFormation de CI/CD. Para obter mais informações, consulte Implantar uma política de raciocínio automatizado em uma aplicação.
-
Integrar. Em tempo de execução, as descobertas do Automated Reasoning são retornadas por meio APIs de uma configuração do Amazon Bedrock Guardrails:
Converse,InvokeModel,InvokeAgent, eRetrieveAndGenerate, bem como a API independente.ApplyGuardrailInspecione as descobertas para decidir se deve fornecer a resposta, reescrevê-la usando o feedback ou pedir esclarecimentos ao usuário. As verificações automatizadas de raciocínio operam apenas no modo de detecção — elas retornam descobertas e feedback em vez de bloquear o conteúdo. Para obter mais informações sobre como integrar verificações de raciocínio automatizado em seu aplicativo, consulteIntegre verificações automatizadas de raciocínio em seu aplicativo. Para obter mais informações sobre as permissões necessárias para habilitar verificações de raciocínio automatizado, consultePermissões para políticas de raciocínio automatizado com ApplyGuardrail.
Disponibilidade e suporte linguístico
As verificações automatizadas de raciocínio no Amazon Bedrock Guardrails geralmente estão disponíveis nas seguintes regiões:
Leste dos EUA (N. da Virgínia)
Oeste dos EUA (Oregon)
Leste dos EUA (Ohio)
UE (Frankfurt)
UE (Paris)
UE (Irlanda)
Atualmente, as verificações automatizadas de raciocínio são compatíveis apenas com inglês (EUA).
Limitações e considerações
Antes de implementar as verificações de raciocínio automatizado, esteja ciente dessas limitações técnicas:
-
Complexidade do documento. Os documentos de origem devem ser bem estruturados com regras claras e inequívocas. Documentos altamente complexos com condições aninhadas ou declarações contraditórias podem não ser extraídos de forma clara e convertidos em lógica formal. Os documentos de entrada são limitados a 5 MB de tamanho e 50.000 caracteres. Você pode dividir documentos maiores e mesclar cada seção em sua política. Imagens e tabelas em documentos também afetam o número de caracteres de entrada.
-
Tempo de processamento. A validação automatizada de verificações de raciocínio adiciona latência às respostas do seu aplicativo. Planeje um tempo adicional de processamento, especialmente para políticas complexas com muitas variáveis. O número de variáveis em uma política contribui diretamente para o aumento da latência de validação.
-
Escopo da política. Para criar políticas mais fáceis de manter, cada política deve se concentrar em um domínio específico (por exemplo, RH, finanças, jurídico) em vez de tentar cobrir várias áreas não relacionadas em uma única política.
-
Limites variáveis e de regras. Políticas com números excessivos de variáveis ou interações de regras excessivamente complexas podem atingir os limites de processamento ou retornar resultados de TOO_COMPLEX. Consulte a documentação de limites do Amazon Bedrock e. Referência de resultados de validação
-
Dependência da linguagem natural. A precisão da validação depende de quão bem a linguagem natural nas solicitações do usuário e nas respostas do modelo pode ser traduzida para as variáveis lógicas formais da sua política. As verificações automatizadas de raciocínio usam modelos básicos para traduzir a linguagem natural em representações lógicas. Descrições variáveis influenciam a qualidade dessa tradução.
-
Aritmética não linear. As verificações automatizadas de raciocínio podem expirar ou retornar TOO_COMPLEX se as restrições envolverem raciocínio com aritmética não linear (por exemplo, números ou expoentes irracionais).
Preços
As verificações com raciocínio automatizado nas Barreiras de Proteção do Amazon Bedrock são cobradas com base no número de solicitações de validação processadas. Para ter informações atuais sobre preço, consulte a página Preços do Amazon Bedrock
As cobranças são aplicadas a cada solicitação de validação, independentemente do resultado (por exemplo, VALID, INVALID e TRANSLATION_AMBIGUOUS). Para otimizar os custos:
-
Use limites de confiança apropriados para equilibrar a precisão com os requisitos de processamento.
-
Considere armazenar em cache os resultados da validação para consultas idênticas ou similares, quando apropriado para seu caso de uso.
-
Monitore os padrões de uso e ajuste as políticas para reduzir solicitações de validação desnecessárias.
Inferência entre regiões para operações de política
O raciocínio automatizado utiliza a inferência entre regiões para otimizar o desempenho e a disponibilidade das operações de criação e teste de políticas. Operações específicas de API distribuem automaticamente o processamento pelas regiões da AWS dentro do seu limite geográfico para garantir a entrega confiável de serviços.
As seguintes operações de API de raciocínio automatizado utilizam a inferência entre regiões:
-
StartAutomatedReasoningPolicyBuildWorkflow— Invocado durante a criação e compilação da política a partir dos documentos de origem. -
StartAutomatedReasoningPolicyTestWorkflow— Invocado durante os procedimentos de validação e teste de políticas.
Essas operações invocam grandes modelos de linguagem para extrair regras lógicas formais dos documentos de origem e converter constructos em linguagem natural em representações lógicas estruturadas. Para garantir um nível ideal de desempenho e disponibilidade, o processamento de solicitações é distribuído de acordo com o seguinte roteamento geográfico:
-
Regiões dos Estados Unidos: as solicitações de API originadas do Leste dos EUA (Norte da Virgínia), Oeste dos EUA (Oregon) ou Leste dos EUA (Ohio) podem ser processadas em qualquer região compatível dos EUA.
-
Regiões da União Europeia: as solicitações de API provenientes da UE (Frankfurt), UE (Paris) ou UE (Irlanda) podem ser processadas em qualquer região compatível da UE.
Importante
Os dados do cliente permanecem dentro do limite geográfico de origem (Estados Unidos ou União Europeia) e são processados de acordo com os compromissos de residência de dados da AWS. A inferência entre regiões encaminha as solicitações exclusivamente dentro da mesma região geográfica para otimizar o desempenho e a disponibilidade do serviço.
A inferência entre regiões opera de forma transparente sem exigir a configuração do cliente. A funcionalidade da API permanece consistente, independentemente da região específica que processa a solicitação.