v4 einbetten - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

v4 einbetten

Cohere — v4 einbetten

Modelldetails

Embed v4 ist das einheitliche multimodale Einbettungsmodell von Cohere, das Text, Bilder und gemischte Inhalte in einem einzigen Modell für Suche und RAG verarbeitet. Weitere Informationen zur Modellentwicklung und Leistung finden Sie auf der Modell-/Servicekarte.

  • Datum der Markteinführung des Modells: 15. April 2025

  • EOL-Datum des Modells: N/A

  • Endbenutzer-Lizenzverträge und Nutzungsbedingungen: Ansicht

  • Modelllebenszyklus: Aktiv

  • Kontextfenster: 128.000 Token

Eingabemodalitäten Ausgabemodalitäten APIs unterstützt Unterstützte Endpunkte
NoAudioYesEinbettenNo ResponsesYes bedrock-runtime
YesBildNoBildNo Chat CompletionsNo bedrock-mantle
NoRedeNoRedeYes Invoke
YesTextNoTextNo Converse
No-VideoNo-Video

Fähigkeiten und Funktionen

Eigenschaften von Bedrock

Funktionen, die mithilfe bedrock-runtime von Endpoint unterstützt werden

Preisgestaltung

Die Preise finden Sie auf der Seite mit den Preisen von Amazon Bedrock.

Programmatischer Zugriff

Verwenden Sie das folgende Modell IDs und den folgenden Endpunkt URLs , um programmgesteuert auf dieses Modell zuzugreifen. Weitere Informationen zu den verfügbaren Endpunkten APIs und Endpunkten finden Sie unter APIs Unterstützte Endgeräte und Unterstützte Endgeräte.

Endpunkt Modell-ID Endpunkt-URL in der Region Geoinferenz-ID Globale Inferenz-ID
bedrock-runtime cohere.embed-v4:0 https://bedrock-runtime.{region}.amazonaws.com

us.cohere.embed-v4:0

eu.cohere.embed-v4:0

global.cohere.embed-v4:0

Wenn Region beispielsweise us-east-1 (Nord-Virginia) ist, dann lautet die URL des Bedrock-Runtime-Endpunkts "" und für Bedrock-Mantle https://bedrock-runtime.us-east-1.amazonaws.com "https://bedrock-mantle.us-east-1.api.aws/v1“.

Dienststufen

Amazon Bedrock bietet mehrere Servicestufen, um Ihren Workload-Anforderungen gerecht zu werden. Standard bietet pay-per-token unverbindlichen Zugriff. Priority bietet einen höheren Durchsatz mit einer zeitbasierten Verpflichtung. Flex bietet kostengünstigeren Zugriff für flexible Workloads. non-time-sensitive Reserved bietet einen dedizierten Durchsatz mit einer Laufzeit für vorhersehbare Workloads. Weitere Informationen finden Sie unter Servicestufen.

Standard Priorität Flex Reserviert
Yes No No No

Regionale Verfügbarkeit

Die regionale Verfügbarkeit auf einen Blick

Bedrock bietet drei Inferenzoptionen: Innerhalb der Region werden Anfragen innerhalb einer einzigen Region aufbewahrt, um die strikte Einhaltung der Vorschriften zu gewährleisten, regionsübergreifende geografische Routen zwischen Regionen innerhalb einer Region (USA, EU usw.) für einen höheren Durchsatz bei gleichzeitiger Wahrung der Datenresidenz und globale, regionsübergreifende Routen überall auf der Welt für maximalen Durchsatz, wenn es keine Aufenthaltsbeschränkungen gibt. Weitere Informationen finden Sie auf der Seite. Regionale Verfügbarkeit

Region In der Region Geo Global
us-east-1(Nord-Virginia)YesYesYes
us-east-2(Ohio)NoYesYes
us-west-1(Nordkalifornien)NoYesYes
us-west-2(Oregon)NoYesYes
ca-central-1(Kanada)NoNoYes
eu-central-1(Frankfurt)NoYesYes
eu-central-2(Zürich)NoYesYes
eu-north-1(Stockholm)NoYesYes
eu-south-1(Mailand)NoYesYes
eu-south-2(Spanien)NoYesYes
eu-west-1(Irland)YesYesYes
eu-west-2(London)NoYesYes
eu-west-3(Paris)NoYesYes
ap-northeast-1(Tokio)YesNoYes
ap-northeast-2(Seoul)NoNoYes
ap-northeast-3(Ōsaka)NoNoYes
ap-south-1(Mumbai)NoNoYes
ap-south-2(Hyderabad)NoNoYes
ap-southeast-1(Singapur)NoNoYes
ap-southeast-2(Sydney)NoNoYes
ap-southeast-3(Jakarta)NoNoYes
ap-southeast-4(Melbourne)NoNoYes
sa-east-1(Sao Paulo)NoNoYes

Einzelheiten zur Geoinferenz

Geo: USA

Geo-Inferenz-ID: us.cohere.embed-v4:0

Quellregion Zielregionen
us-east-1 (N. Virginia)us-east-1 (Nord-Virginia), us-east-2 (Ohio), US-West-2 (Oregon)
us-east-2 (Ohio)us-east-1 (Nord-Virginia), us-east-2 (Ohio), US-West-2 (Oregon)
us-west-1 (Nordkalifornien)us-east-1 (Nord-Virginia), us-east-2 (Ohio), US-West-1 (Nordkalifornien), US-West-2 (Oregon)
us-west-2 (Oregon)us-east-1 (Nord-Virginia), us-east-2 (Ohio), US-West-2 (Oregon)

Geo: EU

Geo-Inferenz-ID: eu.cohere.embed-v4:0

Quellregion Zielregionen
eu-central-1 (Frankfurt)eu-central-1 (Frankfurt), eu-nord-1 (Stockholm), eu-south-1 (Mailand), eu-south-2 (Spanien), eu-west-1 (Irland), eu-west-3 (Paris)
eu-central-2 (Zürich)eu-central-1 (Frankfurt), eu-central-2 (Zürich), eu-nord-1 (Stockholm), eu-south-1 (Mailand), eu-south-2 (Spanien), eu-west-1 (Irland), eu-west-3 (Paris)
eu-nord-1 (Stockholm)eu-central-1 (Frankfurt), eu-nord-1 (Stockholm), eu-south-1 (Mailand), eu-south-2 (Spanien), eu-west-1 (Irland), eu-west-3 (Paris)
eu-south-1 (Mailand)eu-central-1 (Frankfurt), eu-nord-1 (Stockholm), eu-south-1 (Mailand), eu-south-2 (Spanien), eu-west-1 (Irland), eu-west-3 (Paris)
eu-south-2 (Spanien)eu-central-1 (Frankfurt), eu-nord-1 (Stockholm), eu-south-1 (Mailand), eu-south-2 (Spanien), eu-west-1 (Irland), eu-west-3 (Paris)
eu-west-1 (Ireland)eu-central-1 (Frankfurt), eu-nord-1 (Stockholm), eu-south-1 (Mailand), eu-south-2 (Spanien), eu-west-1 (Irland), eu-west-3 (Paris)
eu-west-2 (London)eu-central-1 (Frankfurt), eu-north-1 (Stockholm), eu-south-1 (Mailand), eu-south-2 (Spanien), eu-west-1 (Irland), eu-west-2 (London), eu-west-3 (Paris)
eu-west-3 (Paris)eu-central-1 (Frankfurt), eu-nord-1 (Stockholm), eu-south-1 (Mailand), eu-south-2 (Spanien), eu-west-1 (Irland), eu-west-3 (Paris)

Einzelheiten zu den globalen Schlussfolgerungen

Globale Inferenz-ID Amerika EMEA Asien-Pazifik
global.cohere.embed-v 4:0
  • us-east-1 (N. Virginia)

  • us-east-2 (Ohio)

  • us-west-1 (Nordkalifornien)

  • us-west-2 (Oregon)

  • ca-central-1 (Kanada)

  • sa-east-1 (São Paulo)

  • eu-central-1 (Frankfurt)

  • eu-central-2 (Zürich)

  • eu-nord-1 (Stockholm)

  • eu-south-1 (Mailand)

  • eu-south-2 (Spanien)

  • eu-west-1 (Ireland)

  • eu-west-2 (London)

  • eu-west-3 (Paris)

  • ap-northeast-1 (Tokyo)

  • ap-northeast-2 (Seoul)

  • ap-northeast-3 (Osaka)

  • ap-south-1 (Mumbai)

  • ap-south-2 (Hyderabad)

  • ap-southeast-1 (Singapur)

  • ap-southeast-2 (Sydney)

  • ap-southeast-3 (Jakarta)

  • ap-southeast-4 (Melbourne)

Kontingente und Einschränkungen

Ihr AWS-Konto verfügt über Standardkontingente, um die Leistung des Service aufrechtzuerhalten und eine angemessene Nutzung von Amazon Bedrock sicherzustellen. Die einem Konto zugewiesenen Standardkontingente können je nach regionalen Faktoren, Zahlungsverlauf, betrügerischer Nutzung und and/or Genehmigung einer Anfrage zur Erhöhung des Kontingents aktualisiert werden. Weitere Informationen finden Sie in der Kontingente für Amazon Bedrock Dokumentation und in den Grenzwerten für das Modell.

Beispiel-Code

Schritt 1 — AWS-Konto: Wenn Sie bereits ein AWS-Konto haben, überspringen Sie diesen Schritt. Wenn Sie neu bei AWS sind, registrieren Sie sich für ein AWS-Konto.

Schritt 2 — API-Schlüssel: Rufen Sie die Amazon Bedrock-Konsole auf und generieren Sie einen langfristigen API-Schlüssel.

Schritt 3 — Holen Sie sich das SDK: Um dieses Handbuch für die ersten Schritte verwenden zu können, muss Python bereits installiert sein. Installieren Sie dann die entsprechende Software, je nachdem, welche APIs Sie verwenden.

pip install boto3

Schritt 4 — Umgebungsvariablen festlegen: Konfigurieren Sie Ihre Umgebung so, dass sie den API-Schlüssel für die Authentifizierung verwendet.

AWS_BEARER_TOKEN_BEDROCK="<provide your Bedrock API key>"

Schritt 5 — Führen Sie Ihre erste Inferenzanfrage aus: Speichern Sie die Datei unter bedrock-first-request.py

Invoke API
import json import boto3 client = boto3.client('bedrock-runtime', region_name='us-east-1') response = client.invoke_model( modelId='cohere.embed-v4:0', body=json.dumps({ 'messages': [{ 'role': 'user', 'content': 'Can you explain the features of Amazon Bedrock?'}], 'max_tokens': 1024 }) ) print(json.loads(response['body'].read()))