Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Acceso y seguridad para modelos de peso abierto
Antes de comenzar con el ajuste preciso de refuerzos (RFT), asegúrese de entender qué tipo de acceso necesita Amazon Bedrock para sus operaciones. RFT-specific RFT requiere permisos adicionales además de los ajustes estándar debido a sus capacidades de ejecución de funciones de recompensa.
Requisitos previos
Antes de utilizar las API de ajuste precisas OpenAI compatibles con Amazon Bedrock, asegúrese de disponer de lo siguiente:
-
Una AWS cuenta con los permisos adecuados para acceder a Amazon Bedrock
-
Autenticación: puede autenticarse mediante:
-
Clave de API de Amazon Bedrock (necesaria para el OpenAI SDK y disponible para las solicitudes HTTP)
-
AWS credenciales (compatibles con las solicitudes HTTP)
nota
Si utiliza claves de API a corto term/long plazo de Amazon Bedrock, asegúrese de que su función tenga acceso a los siguientes permisos de política de IAM: y.
AmazonBedrockMantleFullAccessPermisos Lambda para funciones de recompensa -
-
OpenAISDK (opcional): instala el SDK de OpenAI Python si utilizas SDK-based solicitudes.
-
Variables de entorno: establece las siguientes variables de entorno:
-
OPENAI_API_KEY— Configúrelo en su clave de API de Amazon Bedrock -
OPENAI_BASE_URL— Configúrelo en el punto final de Amazon Bedrock de su región (por ejemplo,https://bedrock-mantle.us-west-2.api.aws/v1)
Para obtener más información, consulte API de respuestas.
-
-
Los datos de entrenamiento se formatearon como archivos JSONL con este propósito.
fine-tunePara obtener más información, consulte Prepare los datos para los modelos de peso abierto.
Permisos Lambda para funciones de recompensa
Debe añadir permisos de invocación a Lambda. A continuación, se muestra un ejemplo de política que puede utilizar:
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "lambda:InvokeFunction" ], "Resource": [ "arn:aws:lambda:*:*:function:reward-function-name" ] } ] }
También puede utilizar modelos alojados en Amazon Bedrock como jueces para configurar las funciones de recompensa. Deberá añadir permisos específicos para invocar modelos básicos a la función de ejecución de Lambda. En su rol de lambda, puede configurar estas políticas administradas para las LLM a efectos de calificación. Consulte AmazonBedrockLimitedAccess.
El siguiente es un ejemplo de cómo invocar los modelos básicos de Amazon Bedrock como juez mediante la API Invoke:
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "bedrock:InvokeModel" ], "Resource": [ "arn:aws:bedrock:*:*:foundation-model/*" ] } ] }