Requisitos previos Permisos Lambda para funciones de recompensa

Acceso y seguridad para modelos de peso abierto

Antes de comenzar con el ajuste preciso de refuerzos (RFT), asegúrese de entender qué tipo de acceso necesita Amazon Bedrock para sus operaciones. RFT-specific RFT requiere permisos adicionales además de los ajustes estándar debido a sus capacidades de ejecución de funciones de recompensa.

Requisitos previos

Antes de utilizar las API de ajuste precisas OpenAI compatibles con Amazon Bedrock, asegúrese de disponer de lo siguiente:

Una AWS cuenta con los permisos adecuados para acceder a Amazon Bedrock
Autenticación: puede autenticarse mediante:
- Clave de API de Amazon Bedrock (necesaria para el OpenAI SDK y disponible para las solicitudes HTTP)
- AWS credenciales (compatibles con las solicitudes HTTP)
nota
Si utiliza claves de API a corto term/long plazo de Amazon Bedrock, asegúrese de que su función tenga acceso a los siguientes permisos de política de IAM: y. AmazonBedrockMantleFullAccess Permisos Lambda para funciones de recompensa
OpenAISDK (opcional): instala el SDK de OpenAI Python si utilizas SDK-based solicitudes.
Variables de entorno: establece las siguientes variables de entorno:
- OPENAI_API_KEY— Configúrelo en su clave de API de Amazon Bedrock
- OPENAI_BASE_URL— Configúrelo en el punto final de Amazon Bedrock de su región (por ejemplo,https://bedrock-mantle.us-west-2.api.aws/v1)
Para obtener más información, consulte API de respuestas.
Los datos de entrenamiento se formatearon como archivos JSONL con este propósito. fine-tune Para obtener más información, consulte Prepare los datos para los modelos de peso abierto.

Permisos Lambda para funciones de recompensa

Debe añadir permisos de invocación a Lambda. A continuación, se muestra un ejemplo de política que puede utilizar:


{
    "Version": "2012-10-17",
    "Statement": [
        {
            "Effect": "Allow",
            "Action": [
                "lambda:InvokeFunction"
            ],
            "Resource": [
                "arn:aws:lambda:*:*:function:reward-function-name"
            ]
        }
    ]
}

También puede utilizar modelos alojados en Amazon Bedrock como jueces para configurar las funciones de recompensa. Deberá añadir permisos específicos para invocar modelos básicos a la función de ejecución de Lambda. En su rol de lambda, puede configurar estas políticas administradas para las LLM a efectos de calificación. Consulte AmazonBedrockLimitedAccess.

El siguiente es un ejemplo de cómo invocar los modelos básicos de Amazon Bedrock como juez mediante la API Invoke:


{
    "Version": "2012-10-17",
    "Statement": [
        {
            "Effect": "Allow",
            "Action": [
                "bedrock:InvokeModel"
            ],
            "Resource": [
                "arn:aws:bedrock:*:*:foundation-model/*"
            ]
        }
    ]
}

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Fine-tune modelos de peso abierto que utilizan API de OpenAI

Preparación de los datos

Acceso y seguridad para modelos de peso abierto

Requisitos previos

nota

Permisos Lambda para funciones de recompensa