Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Faire des demandes d'inférence
L'inférence est le processus qui consiste à générer une sortie à partir d'une entrée fournie à un modèle. Avant de pouvoir envoyer une demande d'inférence à Amazon Bedrock, vous devez autoriser votre rôle à effectuer les actions de l'API d'invocation du modèle. Cela dépend du terminal que vous utilisez.
Point de terminaison bedrock-mantle
Si la politique AmazonBedrockMantleInferenceAccess AWS gérée est attachée à votre rôle, vous pouvez ignorer cette section. Sinon, associez les autorisations suivantes pour permettre l'inférence via le bedrock-mantle point de terminaison (API Responses, Chat Completions, API Messages) :
{ "Version": "2012-10-17", "Statement": [ { "Sid": "MantleInferencePermissions", "Effect": "Allow", "Action": [ "bedrock-mantle:CreateInference", "bedrock-mantle:GetProject", "bedrock-mantle:ListProjects", "bedrock-mantle:ListTagsForResources" ], "Resource": "*" } ] }
Point de terminaison bedrock-runtime
Si la politique AmazonBedrockFullAccess AWS gérée est attachée à votre rôle, vous pouvez ignorer cette section. Sinon, attachez les autorisations suivantes pour permettre l'inférence via le bedrock-runtime point de terminaison (API Converse et Invoke) :
{ "Version": "2012-10-17", "Statement": [ { "Sid": "ModelInvocationPermissions", "Effect": "Allow", "Action": [ "bedrock:InvokeModel", "bedrock:InvokeModelWithResponseStream", "bedrock:GetInferenceProfile", "bedrock:ListInferenceProfiles", "bedrock:RenderPrompt", "bedrock:GetCustomModel", "bedrock:ListCustomModels", "bedrock:GetImportedModel", "bedrock:ListImportedModels", "bedrock:GetProvisionedModelThroughput", "bedrock:ListProvisionedModelThroughputs", "bedrock:GetGuardrail", "bedrock:ListGuardrails", "bedrock:ApplyGuardrail" ], "Resource": "*" } ] }
Pour une description détaillée de chaque autorisation, voirConditions préalables à l’exécution de l’inférence de modèle.