Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Nova Premier
Amazon — Nova Premier
Detalles del modelo
Nova Premier es el modelo multimodal de Amazon para el razonamiento complejo, los flujos de trabajo de los agentes y la destilación de modelos. Para obtener más información sobre el desarrollo y el rendimiento del modelo, consulte la tarjeta. model/service
Fecha de lanzamiento del modelo: 31 de octubre de 2025
Fecha de finalización del modelo: 14 de septiembre de 2026
Acuerdos de licencia de usuario final y condiciones de uso: Ver
Ciclo de vida del modelo: Legacy
Ventana de contexto: 1 millón de fichas
Número máximo de fichas de salida: 25 000
Razonamiento: compatible
Límite de conocimiento: octubre de 2024
| Modalidades de entrada | Modalidades de salida | APIs compatibles | Puntos finales compatibles |
|---|---|---|---|
Responses | bedrock-runtime | ||
Chat Completions | bedrock-mantle | ||
Invoke | |||
Converse | |||
Capacidades y características
Características de Bedrock
Funciones compatibles con el uso bedrock-runtime de un punto final
| Soportado | No se admite |
|---|---|
Almacenamiento rápido en caché mediante bedrock-runtime un punto final
Para obtener más información, consulte Almacenamiento rápido en caché para una inferencia de modelos más rápida.
| Se admite el almacenamiento rápido en caché | Número mínimo de tokens por punto de control de caché | Número máximo de puntos de control de caché por solicitud | TTL compatible | Campos que aceptan puntos de control de caché rápidos |
|---|---|---|---|---|
| Sí | 1K* | 4 | 5 minutos | system y messages |
* Los modelos de Amazon Nova admiten un máximo de 20 000 fichas para un rápido almacenamiento en caché. El almacenamiento rápido en caché se utiliza principalmente para mensajes de texto.
Precios
Para conocer los precios, consulta la página de precios de Amazon Bedrock
Acceso programático
Utilice los siguientes ID de modelo y URL de punto final para acceder a este modelo mediante programación. Para obtener más información sobre las API y los puntos de enlace disponibles, consulte API compatibles y puntos de enlace compatibles.
| Punto de conexión | ID del modelo | In-Region URL del punto final | ID de geoinferencia | ID de inferencia global |
|---|---|---|---|---|
bedrock-runtime |
amazon.nova-premier-v1:0 |
https://bedrock-runtime.{region}.amazonaws.com |
us.amazon.nova-premier-v1:0 |
No compatible |
Por ejemplo, si la región es us-east-1 (Virginia del Norte), la URL del punto de ejecución de bedrock-runtime será «» y para bedrock-mantle será https://bedrock-runtime.us-east-1.amazonaws.com «». https://bedrock-mantle.us-east-1.api.aws/v1
Niveles de servicio
Amazon Bedrock ofrece varios niveles de servicio para adaptarse a sus requisitos de carga de trabajo. Standard proporciona acceso de pago por token sin compromiso. Priority ofrece un mayor rendimiento con un compromiso basado en el tiempo. Flex proporciona un acceso de menor costo para cargas de trabajo flexibles y no urgentes. Reserved ofrece un rendimiento específico con un compromiso a largo plazo para cargas de trabajo predecibles. Para obtener más información, consulte los niveles de servicio.
| Estándar | Priority (Prioridad) | Flexible | Reservado |
|---|---|---|---|
Disponibilidad regional
La disponibilidad regional de un vistazo
Bedrock ofrece tres opciones de inferencia: In-Regionmantiene las solicitudes dentro de una sola región para garantizar un cumplimiento estricto, las Cross-Region rutas geográficas entre regiones de una misma geografía (EE. UU., UE, etc.) para obtener un mayor rendimiento y respetar la residencia de los datos, y Cross-Region las rutas globales a cualquier parte del mundo para obtener el máximo rendimiento cuando no hay restricciones de residencia. Consulte la Disponibilidad regional página para obtener más información.
| Region | In-Region | Geo | Global |
|---|---|---|---|
us-east-1(Virginia del Norte) | |||
us-east-2(Ohio) | |||
us-west-2(Oregón) |
Detalles de la geoinferencia
Geografía: EE. UU.
ID de inferencia geográfica: us.amazon.nova-premier-v1:0
| Región de origen | Regiones de destino |
|---|---|
| us-east-1 (Norte de Virginia) | us-east-1 (Virginia del Norte), us-east-2 (Ohio), us-west-2 (Oregón) |
| us-east-2 (Ohio) | us-east-1 (Virginia del Norte), us-east-2 (Ohio), us-west-2 (Oregón) |
| us-west-2 (Oregón) | us-east-1 (Virginia del Norte), us-east-2 (Ohio), us-west-2 (Oregón) |
Cuotas y límites
Su cuenta de AWS tiene cuotas predeterminadas para mantener el rendimiento del servicio y garantizar el uso adecuado de Amazon Bedrock. Las cuotas predeterminadas asignadas a una cuenta pueden actualizarse en función de factores regionales, el historial de pagos, el uso fraudulento o la and/or aprobación de una solicitud de aumento de cuota. Para obtener más información, consulte la Cuotas para Amazon Bedrock documentación y consulte los límites del modelo.
Código de muestra
Paso 1: Cuenta de AWS: si ya tiene una cuenta de AWS, omita este paso. Si es la primera vez que utiliza AWS, regístrese para obtener una cuenta de AWS
Paso 2: Clave de API: vaya a la consola de Amazon Bedrock
Paso 3: Obtenga el SDK: para usar esta guía de introducción, debe tener Python ya instalado. A continuación, instale el software correspondiente en función de las API que utilice.
pip install boto3
Paso 4: Defina las variables de entorno: configure su entorno para que utilice la clave de API para la autenticación.
AWS_BEARER_TOKEN_BEDROCK="<provide your Bedrock API key>"
Paso 5: Ejecute su primera solicitud de inferencia: guarde el archivo como bedrock-first-request.py