Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Inferencia mediante la API de respuestas
Amazon Bedrock proporciona la API de OpenAI respuestas a través del bedrock-mantle punto final, con la tecnología de Mantle, un motor de inferencia distribuido para el servicio de modelos de aprendizaje automático a gran escala. Este punto de conexión le permite utilizar OpenAI SDK y herramientas conocidas con los modelos de Amazon Bedrock, lo que le permite migrar las aplicaciones existentes con cambios de código mínimos; basta con actualizar la URL base y la clave de API.
importante
Cuando utilice el OpenAI SDK con Amazon Bedrock, debe apuntarlo al punto final de Amazon Bedrock, no al OpenAI punto final. Establezca las siguientes variables de entorno:
OPENAI_BASE_URL="https://bedrock-mantle.<your-region>.api.aws/v1" OPENAI_API_KEY="<your Bedrock API key>"
No utilices tu clave de OpenAI API ni la URL OpenAI base (https://api.openai.com/v1). Se conectan OpenAI directamente a Amazon Bedrock, no a Amazon. Para crear una clave de API de Amazon Bedrock, consulteClaves de API.
También ofrece otras ventajas como las siguientes:
-
Inferencia asíncrona: Support para cargas de trabajo de inferencia de larga duración a través de la API de respuestas
-
Gestión de conversaciones avanzada: reconstruye automáticamente el contexto sin pasar manualmente el historial de conversaciones con cada solicitud
-
Uso simplificado de herramientas: integración optimizada para los flujos de trabajo de los agentes
-
Modos de respuesta flexibles: Support para respuestas de streaming y no streaming
-
Migración sencilla: compatible con las bases de código OpenAI del SDK existentes
Regiones y puntos finales compatibles
El bedrock-mantle punto final está disponible en las siguientes AWS regiones:
| Nombre de la región | Región | Punto de conexión |
|---|---|---|
| Este de EE. UU. (Ohio) | us-east-2 | bedrock-mantle.us-east-2.api.aws |
| Este de EE. UU. (Norte de Virginia) | us-east-1 | bedrock-mantle.us-east-1.api.aws |
| Oeste de EE. UU. (Oregón) | us-west-2 | bedrock-mantle.us-west-2.api.aws |
| Asia-Pacífico (Yakarta) | ap-southeast-3 | bedrock-mantle.ap-southeast-3.api.aws |
| Asia-Pacífico (Mumbai) | ap-south-1 | bedrock-mantle.ap-south-1.api.aws |
| Asia-Pacífico (Sídney) | ap-southeast-2 | bedrock-mantle.ap-southeast-2.api.aws |
| Asia-Pacífico (Tokio) | ap-northeast-1 | bedrock-mantle.ap-northeast-1.api.aws |
| Europa (Fráncfort) | eu-central-1 | bedrock-mantle.eu-central-1.api.aws |
| Europa (Irlanda) | eu-west-1 | bedrock-mantle.eu-west-1.api.aws |
| Europa (Londres) | eu-west-2 | bedrock-mantle.eu-west-2.api.aws |
| Europa (Milán) | eu-south-1 | bedrock-mantle.eu-south-1.api.aws |
| Europa (Estocolmo) | eu-north-1 | bedrock-mantle.eu-north-1.api.aws |
| América del Sur (São Paulo) | sa-east-1 | bedrock-mantle.sa-east-1.api.aws |
Requisitos previos
Antes de usar las API, asegúrese de tener lo siguiente: OpenAI
-
Autenticación: puede autenticarse mediante:
-
Clave de API de Amazon Bedrock (necesaria para el OpenAI SDK)
-
AWS credenciales (compatibles con las solicitudes HTTP)
-
-
OpenAISDK (opcional): instala el SDK de OpenAI Python si utilizas SDK-based solicitudes.
-
Variables de entorno: establece las siguientes variables de entorno:
-
OPENAI_API_KEY— Configúrelo en su clave de API de Amazon Bedrock -
OPENAI_BASE_URL— Configúrelo en el punto final de Amazon Bedrock de su región (por ejemplo,https://bedrock-mantle.us-east-1.api.aws/v1)
-
API de modelos
La API de modelos te permite descubrir los modelos disponibles en Amazon Bedrock con tecnología Mantle. Use esta API para recuperar una lista de modelos que puede usar con la API de respuestas. Para obtener información completa sobre la API, consulta la documentación de OpenAI los modelos
Enumere los modelos disponibles
Para ver una lista de los modelos disponibles, selecciona la pestaña del método que prefieras y, a continuación, sigue los pasos:
API de respuestas
La API de respuestas proporciona una gestión de conversaciones con estado y admite la transmisión, el procesamiento en segundo plano y las interacciones en varios turnos. Para obtener información completa sobre la API, consulta la documentación de OpenAIRespuestas
nota
No todos los modelos admiten la API de respuestas. Para ver qué modelos son compatibles con la API de respuestas, consulteCompatibilidad de API.
Cómo almacena la API de respuestas el estado de la conversación
La API de respuestas puede usar el estado almacenado para habilitar las conversaciones en varios turnos y te permite hacer referencia a los turnos anteriores a través del previous_response_id parámetro. El almacenamiento está habilitado de forma predeterminada, pero se puede deshabilitar por solicitud mediante el store parámetro. El ámbito de las respuestas almacenadas depende del proyecto. La respuesta de un proyecto no puede usarse como respuesta anterior ni leerse en un segundo proyecto. Para obtener más información sobre los proyectos, consulteProyectos (OpenAI-compatible).
-
Cuando
storeestrue(el valor predeterminado), Amazon Bedrock conserva la respuesta, incluidas las entradas y salidas, durante 30 días en la región de origen de la solicitud. Durante este período, puede encadenar las solicitudes de seguimiento pasandoprevious_response_idy recuperando la respuesta.GET /v1/responses/{id}Transcurridos 30 días, la respuesta se elimina automáticamente y ya no se puede recuperar. -
Cuando
storeesfalseasí, Amazon Bedrock no conserva ningún dato de la solicitud o respuesta. Elprevious_response_idparámetro no se puede utilizar para continuar la conversación.
El valor predeterminado debe coincidir con true la especificación de la API de OpenAI respuestas. Los clientes que no deseen que Amazon Bedrock conserve los datos de las conversaciones deben store configurarlo de forma explícita false en cada solicitud. Los datos almacenados se guardan en la región de origen de la solicitud, se cifran en reposo y se asignan al recurso de proyecto de la AWS cuenta que realiza la llamada. Los datos se almacenan únicamente para atender sus solicitudes y no se utilizan ni conservan para ningún otro propósito.
Solicitud básica
Para crear una respuesta, selecciona la pestaña del método que prefieras y, a continuación, sigue estos pasos:
Transmita las respuestas
Para recibir los eventos de respuesta de forma incremental, elige la pestaña del método que prefieras y, a continuación, sigue estos pasos: