Incrustar v4 - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Incrustar v4

Cohere: incrustar v4

Detalles del modelo

Embed v4 es el modelo de incrustación multimodal unificado de Cohere que procesa texto, imágenes y contenido mixto en un único modelo para búsquedas y RAG. Para obtener más información sobre el desarrollo y el rendimiento del modelo, consulte la tarjeta de modelo/servicio.

Modalidades de entrada Modalidades de salida APIs compatible Puntos finales compatibles
NoAudioYesIncrustaciónNo ResponsesYes bedrock-runtime
YesImagenNoImagenNo Chat CompletionsNo bedrock-mantle
NoDiscursoNoDiscursoYes Invoke
YesTextoNoTextoNo Converse
NoVídeoNoVídeo

Capacidades y características

Características de Bedrock

Funciones compatibles con el terminal bedrock-runtime

Precios

Para conocer los precios, consulta la página de precios de Amazon Bedrock.

Acceso programático

Utilice el siguiente modelo IDs y punto final URLs para acceder a este modelo mediante programación. Para obtener más información sobre los puntos de conexión disponibles APIs y los puntos de conexión, consulte los puntos de conexión APIs compatibles y los puntos de conexión compatibles.

Punto de conexión ID del modelo URL del punto final de la región ID de geoinferencia ID de inferencia global
bedrock-runtime cohere.embed-v4:0 https://bedrock-runtime.{region}.amazonaws.com

us.cohere.embed-v4:0

eu.cohere.embed-v4:0

global.cohere.embed-v4:0

Por ejemplo, si la región es us-east-1 (Virginia del Norte), la URL del punto final de bedrock-runtime será "» y para bedrock-mantle será https://bedrock-runtime.us-east-1.amazonaws.com "https://bedrock-mantle.us-east-1.api.aws/v1 «.

Niveles de servicio

Amazon Bedrock ofrece varios niveles de servicio para adaptarse a sus requisitos de carga de trabajo. El estándar proporciona pay-per-token acceso sin compromiso. Priority ofrece un mayor rendimiento con un compromiso basado en el tiempo. Flex proporciona un acceso de menor costo para cargas de trabajo flexibles. non-time-sensitive Reserved ofrece un rendimiento específico con un compromiso a largo plazo para cargas de trabajo predecibles. Para obtener más información, consulte los niveles de servicio.

Estándar Priority (Prioridad) Flexible Reservado
Yes No No No

Disponibilidad regional

La disponibilidad regional de un vistazo

Bedrock ofrece tres opciones de inferencia: In-Region mantiene las solicitudes dentro de una sola región para garantizar un cumplimiento estricto, las rutas georegionales entre regiones de una geografía (EE. UU., UE, etc.) para obtener un mayor rendimiento y respetar la residencia de los datos, y las rutas globales entre regiones a cualquier parte del mundo para obtener el máximo rendimiento cuando no hay restricciones de residencia. Consulte la página para obtener más información. Disponibilidad regional

Region En la región Geo Global
us-east-1(Virginia del Norte)YesYesYes
us-east-2(Ohio)NoYesYes
us-west-1(Norte de California)NoYesYes
us-west-2(Oregón)NoYesYes
ca-central-1(Canadá)NoNoYes
eu-central-1(Fráncfort)NoYesYes
eu-central-2(Zúrich)NoYesYes
eu-north-1(Estocolmo)NoYesYes
eu-south-1(Milán)NoYesYes
eu-south-2(España)NoYesYes
eu-west-1(Irlanda)YesYesYes
eu-west-2(Londres)NoYesYes
eu-west-3(París)NoYesYes
ap-northeast-1(Tokio)YesNoYes
ap-northeast-2(Seúl)NoNoYes
ap-northeast-3(Osaka)NoNoYes
ap-south-1(Bombay)NoNoYes
ap-south-2(Hyderabad)NoNoYes
ap-southeast-1(Singapur)NoNoYes
ap-southeast-2(Sídney)NoNoYes
ap-southeast-3(Yakarta)NoNoYes
ap-southeast-4(Melbourne)NoNoYes
sa-east-1(São Paulo)NoNoYes

Detalles de la geoinferencia

Geografía: EE. UU.

ID de inferencia geográfica: us.cohere.embed-v4:0

Región de origen Regiones de destino
us-east-1 (Norte de Virginia)us-east-1 (Virginia del Norte), us-east-2 (Ohio), us-west-2 (Oregón)
us-east-2 (Ohio)us-east-1 (Virginia del Norte), us-east-2 (Ohio), us-west-2 (Oregón)
us-west-1 (norte de California)us-east-1 (Virginia del Norte), us-east-2 (Ohio), us-west-1 (norte de California), us-west-2 (Oregón)
us-west-2 (Oregón)us-east-1 (Virginia del Norte), us-east-2 (Ohio), us-west-2 (Oregón)

Geografía: UE

ID de inferencia geográfica: eu.cohere.embed-v4:0

Región de origen Regiones de destino
eu-central-1 (Fráncfort)eu-central-1 (Fráncfort), eu-north-1 (Estocolmo), eu-south-1 (Milán), eu-south-2 (España), eu-west-1 (Irlanda), eu-west-3 (París)
eu-central-2 (Zúrich)eu-central-1 (Fráncfort), eu-central-2 (Zúrich), eu-north-1 (Estocolmo), eu-south-1 (Milán), eu-south-2 (España), eu-west-1 (Irlanda), eu-west-3 (París)
eu-north-1 (Estocolmo)eu-central-1 (Fráncfort), eu-north-1 (Estocolmo), eu-south-1 (Milán), eu-south-2 (España), eu-west-1 (Irlanda), eu-west-3 (París)
eu-south-1 (Milán)eu-central-1 (Fráncfort), eu-north-1 (Estocolmo), eu-south-1 (Milán), eu-south-2 (España), eu-west-1 (Irlanda), eu-west-3 (París)
eu-south-2 (España)eu-central-1 (Fráncfort), eu-north-1 (Estocolmo), eu-south-1 (Milán), eu-south-2 (España), eu-west-1 (Irlanda), eu-west-3 (París)
eu-west-1 (Irlanda)eu-central-1 (Fráncfort), eu-north-1 (Estocolmo), eu-south-1 (Milán), eu-south-2 (España), eu-west-1 (Irlanda), eu-west-3 (París)
eu-west-2 (Londres)eu-central-1 (Fráncfort), eu-north-1 (Estocolmo), eu-south-1 (Milán), eu-south-2 (España), eu-west-1 (Irlanda), eu-west-2 (Londres), eu-west-3 (París)
eu-west-3 (París)eu-central-1 (Fráncfort), eu-north-1 (Estocolmo), eu-south-1 (Milán), eu-south-2 (España), eu-west-1 (Irlanda), eu-west-3 (París)

Detalles de la inferencia global

ID de inferencia global Américas EMEA Asia-Pacífico
global.cohere.embed-v 4:0
  • us-east-1 (Norte de Virginia)

  • us-east-2 (Ohio)

  • us-west-1 (norte de California)

  • us-west-2 (Oregón)

  • ca-central-1 (Canadá)

  • sa-east-1 (São Paulo)

  • eu-central-1 (Fráncfort)

  • eu-central-2 (Zúrich)

  • eu-north-1 (Estocolmo)

  • eu-south-1 (Milán)

  • eu-south-2 (España)

  • eu-west-1 (Irlanda)

  • eu-west-2 (Londres)

  • eu-west-3 (París)

  • ap-northeast-1 (Tokio)

  • ap-northeast-2 (Seúl)

  • ap-northeast-3 (Osaka)

  • ap-south-1 (Mumbai)

  • ap-south-2 (Hyderabad)

  • ap-southeast-1 (Singapur)

  • ap-southeast-2 (Sídney)

  • ap-southeast-3 (Yakarta)

  • ap-southeast-4 (Melbourne)

Cuotas y límites

Su cuenta de AWS tiene cuotas predeterminadas para mantener el rendimiento del servicio y garantizar el uso adecuado de Amazon Bedrock. Las cuotas predeterminadas asignadas a una cuenta pueden actualizarse en función de factores regionales, el historial de pagos, el uso fraudulento o la and/or aprobación de una solicitud de aumento de cuota. Para obtener más información, consulte la Cuotas para Amazon Bedrock documentación y consulte los límites del modelo.

Código de muestra

Paso 1: Cuenta de AWS: si ya tiene una cuenta de AWS, omita este paso. Si es la primera vez que utiliza AWS, regístrese para obtener una cuenta de AWS.

Paso 2: Clave de API: vaya a la consola de Amazon Bedrock y genere una clave de API a largo plazo.

Paso 3: Obtenga el SDK: para usar esta guía de introducción, debe tener Python ya instalado. A continuación, instale el software correspondiente en función del APIs que esté utilizando.

pip install boto3

Paso 4: Defina las variables de entorno: configure su entorno para que utilice la clave API para la autenticación.

AWS_BEARER_TOKEN_BEDROCK="<provide your Bedrock API key>"

Paso 5: Ejecute su primera solicitud de inferencia: guarde el archivo como bedrock-first-request.py

Invoke API
import json import boto3 client = boto3.client('bedrock-runtime', region_name='us-east-1') response = client.invoke_model( modelId='cohere.embed-v4:0', body=json.dumps({ 'messages': [{ 'role': 'user', 'content': 'Can you explain the features of Amazon Bedrock?'}], 'max_tokens': 1024 }) ) print(json.loads(response['body'].read()))