Regiones y puntos finales compatibles Requisitos previos API de modelos API de respuestas

Inferencia mediante la API de respuestas

Amazon Bedrock proporciona la API de OpenAI respuestas a través del bedrock-mantle punto final, con la tecnología de Mantle, un motor de inferencia distribuido para el servicio de modelos de aprendizaje automático a gran escala. Este punto de conexión le permite utilizar OpenAI SDK y herramientas conocidas con los modelos de Amazon Bedrock, lo que le permite migrar las aplicaciones existentes con cambios de código mínimos; basta con actualizar la URL base y la clave de API.

importante

Cuando utilice el OpenAI SDK con Amazon Bedrock, debe apuntarlo al punto final de Amazon Bedrock, no al OpenAI punto final. Establezca las siguientes variables de entorno:


OPENAI_BASE_URL="https://bedrock-mantle.<your-region>.api.aws/v1"
OPENAI_API_KEY="<your Bedrock API key>"

No utilices tu clave de OpenAI API ni la URL OpenAI base (https://api.openai.com/v1). Se conectan OpenAI directamente a Amazon Bedrock, no a Amazon. Para crear una clave de API de Amazon Bedrock, consulteClaves de API.

También ofrece otras ventajas como las siguientes:

Inferencia asíncrona: Support para cargas de trabajo de inferencia de larga duración a través de la API de respuestas
Gestión de conversaciones avanzada: reconstruye automáticamente el contexto sin pasar manualmente el historial de conversaciones con cada solicitud
Uso simplificado de herramientas: integración optimizada para los flujos de trabajo de los agentes
Modos de respuesta flexibles: Support para respuestas de streaming y no streaming
Migración sencilla: compatible con las bases de código OpenAI del SDK existentes

El tráfico de inferencia al bedrock-mantle punto final se rige por un conjunto de cuotas independiente del punto final. bedrock-runtime Para obtener más información sobre las cuotas de los tokens de entrada y salida y sobre cómo solicitar aumentos, consulteCuotas para el punto final entre el lecho rocoso y el manto.

Regiones y puntos finales compatibles

El bedrock-mantle punto final está disponible en las siguientes AWS regiones:

Nombre de la región	Región	Punto de conexión
Este de EE. UU. (Ohio)	us-east-2	bedrock-mantle.us-east-2.api.aws
Este de EE. UU. (Norte de Virginia)	us-east-1	bedrock-mantle.us-east-1.api.aws
Oeste de EE. UU. (Oregón)	us-west-2	bedrock-mantle.us-west-2.api.aws
Asia-Pacífico (Yakarta)	ap-southeast-3	bedrock-mantle.ap-southeast-3.api.aws
Asia-Pacífico (Mumbai)	ap-south-1	bedrock-mantle.ap-south-1.api.aws
Asia-Pacífico (Sídney)	ap-southeast-2	bedrock-mantle.ap-southeast-2.api.aws
Asia-Pacífico (Tokio)	ap-northeast-1	bedrock-mantle.ap-northeast-1.api.aws
Europa (Fráncfort)	eu-central-1	bedrock-mantle.eu-central-1.api.aws
Europa (Irlanda)	eu-west-1	bedrock-mantle.eu-west-1.api.aws
Europa (Londres)	eu-west-2	bedrock-mantle.eu-west-2.api.aws
Europa (Milán)	eu-south-1	bedrock-mantle.eu-south-1.api.aws
Europa (Estocolmo)	eu-north-1	bedrock-mantle.eu-north-1.api.aws
América del Sur (São Paulo)	sa-east-1	bedrock-mantle.sa-east-1.api.aws
AWS GovCloud (US-West)	us-gov-west-1	bedrock-mantle.us-gov-west-1.api.aws

Requisitos previos

Antes de usar las API, asegúrese de tener lo siguiente: OpenAI

Autenticación: puede autenticarse mediante:
- Clave de API de Amazon Bedrock (necesaria para el OpenAI SDK)
- AWScredenciales (compatibles con las solicitudes HTTP)
OpenAISDK (opcional): instala el SDK de OpenAI Python si utilizas SDK-based solicitudes.
Variables de entorno: establece las siguientes variables de entorno:
- OPENAI_API_KEY— Configúrelo en su clave de API de Amazon Bedrock
- OPENAI_BASE_URL— Configúrelo en el punto final de Amazon Bedrock de su región (por ejemplo,https://bedrock-mantle.us-east-1.api.aws/v1)

API de modelos

La API de modelos te permite descubrir los modelos disponibles en Amazon Bedrock con tecnología Mantle. Use esta API para recuperar una lista de modelos que puede usar con la API de respuestas. Para obtener información completa sobre la API, consulta la documentación de OpenAI los modelos.

Enumere los modelos disponibles

Para ver una lista de los modelos disponibles, seleccione la pestaña correspondiente al método que prefiera y, a continuación, siga los pasos:

API de respuestas

La API de respuestas proporciona una gestión de conversaciones con estado y admite la transmisión, el procesamiento en segundo plano y las interacciones en varios turnos. Para obtener información completa sobre la API, consulta la documentación de OpenAIRespuestas.

nota

No todos los modelos admiten la API de respuestas. Para ver qué modelos son compatibles con la API de respuestas, consulteCompatibilidad de API por modelos.

Cómo almacena la API de respuestas el estado de la conversación

La API de respuestas puede usar el estado almacenado para habilitar las conversaciones en varios turnos y te permite hacer referencia a los turnos anteriores a través del previous_response_id parámetro. El almacenamiento está habilitado de forma predeterminada, pero se puede deshabilitar por solicitud mediante el store parámetro. El ámbito de las respuestas almacenadas depende del proyecto. La respuesta de un proyecto no puede usarse como respuesta anterior ni leerse en un segundo proyecto. Para obtener más información sobre los proyectos, consulteProyectos (OpenAI-compatible).

Cuando store es true (el valor predeterminado), Amazon Bedrock conserva la respuesta, incluidas las entradas y salidas, durante 30 días en la región de origen de la solicitud. Durante este período, puede encadenar las solicitudes de seguimiento pasando previous_response_id y recuperando la respuesta. GET /v1/responses/{id} Transcurridos 30 días, la respuesta se elimina automáticamente y ya no se puede recuperar.
Cuando store es false así, Amazon Bedrock no conserva ningún dato de la solicitud o respuesta. El previous_response_id parámetro no se puede utilizar para continuar la conversación.

El valor predeterminado debe coincidir con true la especificación de la API de OpenAI respuestas. Los clientes que no deseen que Amazon Bedrock conserve los datos de las conversaciones deben store configurarlo de forma explícita false en cada solicitud. Los datos almacenados se guardan en la región de origen de la solicitud, se cifran en reposo y se asignan al recurso de proyecto de la AWS cuenta que realiza la llamada. Los datos se almacenan únicamente para atender sus solicitudes y no se utilizan ni conservan para ningún otro propósito.

Solicitud básica

Para crear una respuesta, selecciona la pestaña del método que prefieras y, a continuación, sigue estos pasos:

Transmita las respuestas

Para recibir los eventos de respuesta de forma incremental, elige la pestaña del método que prefieras y, a continuación, sigue estos pasos:

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Realización de solicitudes de inferencia

API de finalización de chats