Sematkan v4 - Amazon Bedrock

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Sematkan v4

Cohere - Sematkan v4

Detail Model

Embed v4 adalah model penyematan multimodal terpadu Cohere yang memproses teks, gambar, dan konten campuran dalam satu model untuk pencarian dan RAG. Untuk informasi selengkapnya tentang pengembangan dan kinerja model, lihat model/kartu layanan.

  • Tanggal peluncuran model: 15 Apr 2025

  • Tanggal model EOL: N/A

  • Perjanjian Lisensi Pengguna Akhir dan Ketentuan Penggunaan: Lihat

  • Siklus hidup model: Aktif

  • Jendela konteks: 128K token

Modalitas Masukan Modalitas Keluaran APIs didukung Endpoint didukung
NoAudioYesMenyematkanNo ResponsesYes bedrock-runtime
YesGambarNoGambarNo Chat CompletionsNo bedrock-mantle
NoPidatoNoPidatoYes Invoke
YesTeksNoTeksNo Converse
NoVideoNoVideo

Kemampuan dan Fitur

Fitur Batuan Dasar

Fitur yang didukung menggunakan bedrock-runtime endpoint

Harga

Untuk harga, silakan merujuk ke halaman Harga Amazon Bedrock.

Akses Terprogram

Gunakan model IDs dan titik akhir berikut URLs untuk mengakses model ini secara terprogram. Untuk informasi selengkapnya tentang tersedia APIs dan titik akhir, lihat APIs didukung dan Endpoint didukung.

Titik akhir ID Model URL titik akhir Dalam Wilayah ID inferensi geo ID inferensi global
bedrock-runtime cohere.embed-v4:0 https://bedrock-runtime.{region}.amazonaws.com

us.cohere.embed-v4:0

eu.cohere.embed-v4:0

global.cohere.embed-v4:0

Misalnya, jika wilayah adalah us-east-1 (Virginia N.), maka URL endpoint batuan dasar runtime akan menjadi "" dan untuk mantel dasar akan menjadi "https://bedrock-mantle.us-east-1.api.aws/v1 “. https://bedrock-runtime.us-east-1.amazonaws.com

Tingkatan Layanan

Amazon Bedrock menawarkan beberapa tingkatan layanan agar sesuai dengan persyaratan beban kerja Anda. Standar menyediakan pay-per-token akses tanpa komitmen. Prioritas menawarkan throughput yang lebih tinggi dengan komitmen berbasis waktu. Flex menyediakan akses berbiaya lebih rendah untuk beban kerja yang fleksibel. non-time-sensitive Reserved menyediakan throughput khusus dengan komitmen jangka untuk beban kerja yang dapat diprediksi. Untuk informasi selengkapnya, lihat tingkatan layanan.

Standar Prioritas Fleksibel Reserved
Yes No No No

Ketersediaan Wilayah

Sekilas tentang ketersediaan regional

Bedrock menawarkan tiga opsi inferensi: In-Region menyimpan permintaan dalam satu Wilayah untuk kepatuhan yang ketat, rute Geo Cross-Region di seluruh Wilayah dalam geografi (AS, UE, dll.) untuk throughput yang lebih tinggi sambil menghormati residensi data, dan rute Lintas Wilayah Global di mana saja di seluruh dunia untuk throughput maksimum ketika tidak ada kendala residensi. Lihat Ketersediaan wilayah halaman untuk lebih jelasnya.

Wilayah Dalam Wilayah Geo Global
us-east-1(Virginia Utara)YesYesYes
us-east-2(Ohio)NoYesYes
us-west-1(California Utara)NoYesYes
us-west-2(Oregon)NoYesYes
ca-central-1(Kanada)NoNoYes
eu-central-1(Frankfurt am Main)NoYesYes
eu-central-2(Zürich)NoYesYes
eu-north-1(Stockholm)NoYesYes
eu-south-1(Milan)NoYesYes
eu-south-2(Spanyol)NoYesYes
eu-west-1(Irlandia)YesYesYes
eu-west-2(London)NoYesYes
eu-west-3(Paris)NoYesYes
ap-northeast-1(Tokyo)YesNoYes
ap-northeast-2(Seoul)NoNoYes
ap-northeast-3(Osaka)NoNoYes
ap-south-1(Mumbai)NoNoYes
ap-south-2(Haiderabad)NoNoYes
ap-southeast-1(Singapura)NoNoYes
ap-southeast-2(Sydney)NoNoYes
ap-southeast-3(Jakarta)NoNoYes
ap-southeast-4(Melbourne)NoNoYes
sa-east-1(Sao Paulo)NoNoYes

Detail inferensi geo

Geo: AS

ID Inferensi Geo: us.cohere.embed-v4:0

Wilayah Sumber Wilayah Tujuan
us-east-1 (Virginia Utara)us-east-1 (Virginia N), us-east-2 (Ohio), us-west-2 (Oregon)
us-east-2 (Ohio)us-east-1 (Virginia N), us-east-2 (Ohio), us-west-2 (Oregon)
us-west-1 (California Utara)us-east-1 (Virginia N.), us-east-2 (Ohio), us-west-1 (California N.), us-west-2 (Oregon)
us-west-2 (Oregon)us-east-1 (Virginia N), us-east-2 (Ohio), us-west-2 (Oregon)

Geo: UE

ID Inferensi Geo: eu.cohere.embed-v4:0

Wilayah Sumber Wilayah Tujuan
eu-central-1 (Frankfurt am Main)eu-central-1 (Frankfurt), eu-north-1 (Stockholm), eu-south-1 (Milan), eu-south-1 (Milan), eu-south-2 (Spanyol), eu-west-1 (Irlandia), eu-west-3 (Paris)
eu-central-2 (Zürich)eu-central-1 (Frankfurt), eu-central-2 (Zurich), eu-north-1 (Stockholm), eu-south-1 (Milan), eu-south-1 (Milan), eu-south-2 (Spanyol), eu-west-1 (Irlandia), eu-west-1 (Irlandia), eu-south-2 eu-west-3 (Paris)
eu-north-1 (Stockholm)eu-central-1 (Frankfurt), eu-north-1 (Stockholm), eu-south-1 (Milan), eu-south-1 (Milan), eu-south-2 (Spanyol), eu-west-1 (Irlandia), eu-west-3 (Paris)
eu-south-1 (Milan)eu-central-1 (Frankfurt), eu-north-1 (Stockholm), eu-south-1 (Milan), eu-south-1 (Milan), eu-south-2 (Spanyol), eu-west-1 (Irlandia), eu-west-3 (Paris)
eu-south-2 (Spanyol)eu-central-1 (Frankfurt), eu-north-1 (Stockholm), eu-south-1 (Milan), eu-south-1 (Milan), eu-south-2 (Spanyol), eu-west-1 (Irlandia), eu-west-3 (Paris)
eu-west-1 (Irlandia)eu-central-1 (Frankfurt), eu-north-1 (Stockholm), eu-south-1 (Milan), eu-south-1 (Milan), eu-south-2 (Spanyol), eu-west-1 (Irlandia), eu-west-3 (Paris)
eu-west-2 (London)eu-central-1 (Frankfurt), eu-north-1 (Stockholm), eu-selatan-1 (Milan), eu-selatan-2 (Spanyol), eu-barat-1 (Irlandia), eu-west-2 (London), eu-west-1 (Irlandia), eu-west-2 (London), eu-west-2 (London), eu-west-eu-west-3 (Paris)
eu-west-3 (Paris)eu-central-1 (Frankfurt), eu-north-1 (Stockholm), eu-south-1 (Milan), eu-south-1 (Milan), eu-south-2 (Spanyol), eu-west-1 (Irlandia), eu-west-3 (Paris)

Detail inferensi global

ID Inferensi Global Amerika EMEA Asia Pasifik
global.cohere.embed-v 4:0
  • us-east-1 (Virginia Utara)

  • us-east-2 (Ohio)

  • us-west-1 (California Utara)

  • us-west-2 (Oregon)

  • ca-central-1 (Kanada)

  • sa-east-1 (sa-east-1)

  • eu-central-1 (Frankfurt am Main)

  • eu-central-2 (Zürich)

  • eu-north-1 (Stockholm)

  • eu-south-1 (Milan)

  • eu-south-2 (Spanyol)

  • eu-west-1 (Irlandia)

  • eu-west-2 (London)

  • eu-west-3 (Paris)

  • ap-northeast-1 (Tokyo)

  • ap-northeast-2 (Seoul)

  • ap-northeast-3 (Osaka)

  • ap-south-1 (Mumbai)

  • ap-south-2 (Hyderabad)

  • ap-southeast-1 (Singapura)

  • ap-southeast-2 (Sydney)

  • ap-southeast-3 (Jakarta)

  • ap-southeast-4 (Melbourne)

Kuota dan Batas

Akun AWS Anda memiliki kuota default untuk mempertahankan kinerja layanan dan untuk memastikan penggunaan Amazon Bedrock yang tepat. Kuota default yang ditetapkan ke akun dapat diperbarui tergantung pada faktor regional, riwayat pembayaran, penggunaan penipuan, and/or persetujuan permintaan peningkatan kuota. Untuk lebih jelasnya, silakan merujuk ke Kuota untuk Amazon Bedrock dokumentasi dan lihat batas untuk model.

Kode Sampel

Langkah 1 - Akun AWS: Jika Anda sudah memiliki akun AWS, lewati langkah ini. Jika Anda baru mengenal AWS, daftar akun AWS.

Langkah 2 - Kunci API: Buka konsol Amazon Bedrock dan buat kunci API jangka panjang.

Langkah 3 - Dapatkan SDK: Untuk menggunakan panduan memulai ini, Anda harus memiliki Python yang sudah diinstal. Kemudian instal perangkat lunak yang relevan tergantung pada yang APIs Anda gunakan.

pip install boto3

Langkah 4 - Tetapkan variabel lingkungan: Konfigurasikan lingkungan Anda untuk menggunakan kunci API untuk otentikasi.

AWS_BEARER_TOKEN_BEDROCK="<provide your Bedrock API key>"

Langkah 5 - Jalankan permintaan inferensi pertama Anda: Simpan file sebagai bedrock-first-request.py

Invoke API
import json import boto3 client = boto3.client('bedrock-runtime', region_name='us-east-1') response = client.invoke_model( modelId='cohere.embed-v4:0', body=json.dumps({ 'messages': [{ 'role': 'user', 'content': 'Can you explain the features of Amazon Bedrock?'}], 'max_tokens': 1024 }) ) print(json.loads(response['body'].read()))