Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Nova Micro
Amazon — Nova Micro
Detalles del modelo
Nova Micro es el modelo de solo texto más rápido de Amazon, optimizado para ofrecer velocidad y bajo coste en tareas como el resumen, la traducción y la clasificación. Para obtener más información sobre el desarrollo y el rendimiento del modelo, consulte la tarjeta. model/service
Fecha de lanzamiento del modelo: 5 de diciembre de 2024
Fecha de finalización del modelo: no antes 12/4 del 2025
Acuerdos de licencia de usuario final y condiciones de uso: Ver
Ciclo de vida del modelo: activo
Ventana de contexto: 128 000 fichas
Número máximo de fichas de salida: 5000
Límite de conocimiento: octubre de 2024
| Modalidades de entrada | Modalidades de salida | APIs compatibles | Puntos finales compatibles |
|---|---|---|---|
Responses | bedrock-runtime | ||
Chat Completions | bedrock-mantle | ||
Invoke | |||
Converse | |||
Capacidades y características
Características de Bedrock
Funciones compatibles con el terminal bedrock-runtime
| Compatible | No compatible |
|---|---|
Almacenamiento rápido en caché mediante bedrock-runtime un punto final
Para obtener más información, consulte Almacenamiento rápido en caché para una inferencia de modelos más rápida.
| Se admite el almacenamiento rápido en caché | Número mínimo de tokens por punto de control de caché | Número máximo de puntos de control de caché por solicitud | TTL compatible | Campos que aceptan puntos de control de caché rápidos |
|---|---|---|---|---|
| Sí | 1K* | 4 | 5 minutos | system y messages |
* Los modelos de Amazon Nova admiten un máximo de 20 000 fichas para un rápido almacenamiento en caché.
Precios
Para conocer los precios, consulta la página de precios de Amazon Bedrock
Acceso programático
Utilice los siguientes ID de modelo y URL de punto final para acceder a este modelo mediante programación. Para obtener más información sobre las API y los puntos de enlace disponibles, consulte API compatibles y puntos de enlace compatibles.
| Punto de conexión | ID del modelo | In-Region URL del punto final | ID de geoinferencia | ID de inferencia global |
|---|---|---|---|---|
bedrock-runtime |
amazon.nova-micro-v1:0 |
https://bedrock-runtime.{region}.amazonaws.com |
|
No compatible |
Por ejemplo, si la región es us-east-1 (Virginia del Norte), la URL del punto de ejecución de bedrock-runtime será «» y para bedrock-mantle será https://bedrock-runtime.us-east-1.amazonaws.com «». https://bedrock-mantle.us-east-1.api.aws/v1
Niveles de servicio
Amazon Bedrock ofrece varios niveles de servicio para adaptarse a sus requisitos de carga de trabajo. Standard proporciona acceso de pago por token sin compromiso. Priority ofrece un mayor rendimiento con un compromiso basado en el tiempo. Flex proporciona un acceso de menor costo para cargas de trabajo flexibles y no urgentes. Reserved ofrece un rendimiento específico con un compromiso a largo plazo para cargas de trabajo predecibles. Para obtener más información, consulte los niveles de servicio.
| Estándar | Priority (Prioridad) | Flexible | Reservado |
|---|---|---|---|
Disponibilidad regional
La disponibilidad regional de un vistazo
Bedrock ofrece tres opciones de inferencia: In-Regionmantiene las solicitudes dentro de una sola región para garantizar un cumplimiento estricto, las Cross-Region rutas geográficas entre regiones de una misma geografía (EE. UU., UE, etc.) para obtener un mayor rendimiento y respetar la residencia de los datos, y Cross-Region las rutas globales a cualquier parte del mundo para obtener el máximo rendimiento cuando no hay restricciones de residencia. Consulte la Disponibilidad regional página para obtener más información.
| Region | In-Region | Geo | Global |
|---|---|---|---|
us-east-1(Virginia del Norte) | |||
us-east-2(Ohio) | |||
us-west-2(Oregón) | |||
us-gov-west-1 (GovCloud) | |||
eu-central-1(Fráncfort) | |||
eu-north-1(Estocolmo) | |||
eu-south-1(Milán) | |||
eu-south-2(España) | |||
eu-west-1(Irlanda) | |||
eu-west-2(Londres) | |||
eu-west-3(París) | |||
ap-southeast-2(Sídney) | |||
il-central-1(Tel Aviv) |
Detalles de la geoinferencia
Geografía: EE. UU.
ID de inferencia geográfica: us.amazon.nova-micro-v1:0
| Región de origen | Regiones de destino |
|---|---|
| us-east-1 (Norte de Virginia) | us-east-1 (Virginia del Norte), us-east-2 (Ohio), us-west-2 (Oregón) |
| us-east-2 (Ohio) | us-east-1 (Virginia del Norte), us-east-2 (Ohio), us-west-2 (Oregón) |
| us-west-2 (Oregón) | us-east-1 (Virginia del Norte), us-east-2 (Ohio), us-west-2 (Oregón) |
Geografía: UE
ID de inferencia geográfica: eu.amazon.nova-micro-v1:0
| Región de origen | Regiones de destino |
|---|---|
| eu-central-1 (Fráncfort) | eu-central-1 (Fráncfort), eu-north-1 (Estocolmo), eu-west-1 (Irlanda), eu-west-3 (París) |
| eu-north-1 (Estocolmo) | eu-central-1 (Fráncfort), eu-north-1 (Estocolmo), eu-west-1 (Irlanda), eu-west-3 (París) |
| eu-south-1 (Milán) | eu-central-1 (Fráncfort), eu-north-1 (Estocolmo), eu-south-1 (Milán), eu-west-1 (Irlanda), eu-west-3 (París) |
| eu-south-2 (España) | eu-central-1 (Fráncfort), eu-north-1 (Estocolmo), eu-south-2 (España), eu-west-1 (Irlanda), eu-west-3 (París) |
| eu-west-1 (Irlanda) | eu-central-1 (Fráncfort), eu-north-1 (Estocolmo), eu-west-1 (Irlanda), eu-west-3 (París) |
| eu-west-3 (París) | eu-central-1 (Fráncfort), eu-north-1 (Estocolmo), eu-west-1 (Irlanda), eu-west-3 (París) |
| il-central-1 (Tel Aviv) | eu-central-1 (Fráncfort), eu-north-1 (Estocolmo), eu-south-1 (Milán), eu-west-1 (Irlanda), eu-west-3 (París), il-central-1 (Tel Aviv) |
Cuotas y límites
Su cuenta de AWS tiene cuotas predeterminadas para mantener el rendimiento del servicio y garantizar un uso adecuado de Amazon Bedrock. Las cuotas predeterminadas asignadas a una cuenta pueden actualizarse en función de factores regionales, el historial de pagos, el uso fraudulento o la and/or aprobación de una solicitud de aumento de cuota. Para obtener más información, consulte la Cuotas para Amazon Bedrock documentación y consulte los límites del modelo.
Código de muestra
Paso 1: Cuenta de AWS: si ya tiene una cuenta de AWS, omita este paso. Si es la primera vez que utiliza AWS, regístrese para obtener una cuenta de AWS
Paso 2: Clave de API: vaya a la consola de Amazon Bedrock
Paso 3: Obtenga el SDK: para usar esta guía de introducción, debe tener Python ya instalado. A continuación, instale el software correspondiente en función de las API que utilice.
pip install boto3
Paso 4: Defina las variables de entorno: configure su entorno para que utilice la clave de API para la autenticación.
AWS_BEARER_TOKEN_BEDROCK="<provide your Bedrock API key>"
Paso 5: Ejecute su primera solicitud de inferencia: guarde el archivo como bedrock-first-request.py
Para ver el esquema completo de solicitudes y respuestas, incluidos todos los parámetros admitidos, como system las indicaciones,temperature,topP, y stopSequencestoolConfig, consulte el esquema completo de solicitudes en la Guía del usuario de Amazon Nova.