View a markdown version of this page

Kompatibilitas API - Amazon Bedrock

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Kompatibilitas API

Amazon Bedrock mendukung empat keluarga API runtime, masing-masing dirancang untuk pola integrasi dan kasus penggunaan yang berbeda.

Keluarga panggilan: InvokeModel menangani panggilan respons tunggal yang sinkron. InvokeModelWithResponseStreammengembalikan respons sebagai aliran waktu nyata. InvokeModelWithBidirectionalStreammemungkinkan streaming dupleks penuh untuk aplikasi interaktif. AsyncInvokemengirimkan permintaan yang berjalan lama secara asinkron, menyimpan output ke Amazon S3.

Keluarga Converse: Converse menyediakan antarmuka model-agnostik terpadu untuk percakapan multi-putaran sinkron. ConverseStreammemberikan pengalaman yang sama dengan output streaming.

OpenAI-compatible keluarga: ChatCompletions mengimplementasikan antarmuka OpenAI Chat Completions, memungkinkan integrasi OpenAI-based yang ada berjalan di Bedrock dengan sedikit perubahan. Responses API mengimplementasikan antarmuka OpenAI Responses, mendukung interaksi stateful dan agentic dengan penggunaan alat bawaan dan manajemen riwayat percakapan.

Keluarga pesan: Messages mengimplementasikan antarmuka Pesan Antropik di bedrock-mantle titik akhir, memungkinkan SDK-based integrasi Antropik yang ada berjalan di Bedrock dengan sedikit perubahan.

Kita sekarang akan melihat daftar API yang didukung oleh masing-masing model.

AI21

Nama model Panggil Bercakap-cakap Penyelesaian Obrolan Respons Pesan
Jamba 1.5 Besar*
Jamba 1.5 Mini*

Amazon

Antropik

Cohere

Nama model Panggil Bercakap-cakap Penyelesaian Obrolan Respons Pesan
Perintah R*
Perintah R +*
Sematkan Bahasa Inggris
Sematkan Multilingual
Sematkan v4
Rerank 3.5

DeepSeek

Nama model Panggil Bercakap-cakap Penyelesaian Obrolan Respons Pesan
DeepSeek V3.2*
DeepSeek-R1*
DeepSeek-V3.1*

Google

Nama model Panggil Bercakap-cakap Penyelesaian Obrolan Respons Pesan
Gemma 3 12B IT*
Gemma 3 27B PT*
Gemma 3 4B IT*

Meta

MiniMax

Nama model Panggil Bercakap-cakap Penyelesaian Obrolan Respons Pesan
MiniMax M2*
MiniMax M2.1*
MiniMax M2.5*

Mistral

Moonshot

Nama model Panggil Bercakap-cakap Penyelesaian Obrolan Respons Pesan
Kimi K2 Berpikir*
Kimi K2.5*

NVIDIA

Nama model Panggil Bercakap-cakap Penyelesaian Obrolan Respons Pesan
NVIDIA Nemotron Nano 9B v2*
NVIDIA Nemotron Nano 12B v2 VL BF16*
Nemotron Nano 3 30B*
NVIDIA Nemotron 3 Super 120B*

OpenAI

Nama model Panggil Bercakap-cakap Penyelesaian Obrolan Respons Pesan
GPT OSS Safeguard 120B*
GPT OSS Safeguard 20B*
gpt-oss-120b*
gpt-oss-20b*

Qwen

Stabilitas

TwelveLabs

Nama model Panggil Bercakap-cakap Penyelesaian Obrolan Respons Pesan
Marengo Sematkan 3.0
Marengo Sematkan v2.7
Pegasus v1.2

Penulis

Nama model Panggil Bercakap-cakap Penyelesaian Obrolan Respons Pesan
Visi Palmyra 7B
Palmyra X4*
Palmyra X5*

Z.AI

Nama model Panggil Bercakap-cakap Penyelesaian Obrolan Respons Pesan
GLM 4,7*
GLM 4.7 Flash*
GLM 5*
catatan

* Dukungan Streaming: Model yang ditandai dengan tanda bintang (*) juga mendukungInvokeModelWithResponseStream, yang mengembalikan respons sebagai aliran waktu nyata.

Model yang mendukung StartAsyncInvoke

StartAsyncInvoke adalah Amazon Bedrock Runtime API yang memungkinkan penelepon mengirimkan permintaan pemanggilan model dan segera menerima kembali InvocationARN tanpa menunggu model selesai diproses. Pekerjaan berjalan di latar belakang, dan output ditulis ke bucket S3 yang ditentukan pemanggil setelah selesai. Penelepon kemudian dapat melakukan polling status pekerjaan menggunakan pendamping GetAsyncInvoke dan ListAsyncInvokes API. Pola ini dibuat khusus untuk beban kerja yang melibatkan input besar atau tidak sensitif latensi, terutama pembuatan video, audio, dan penyematan massal, di mana memegang koneksi sinkron terbuka tidak akan praktis.

Dalam hal model mana yang mendukungnya, model berikut mendukung StartAsyncInvoke:

  • TwelveLabs Marengo Embed 2.7 (twelvelabs.marengo-embed-2-7-v 1:0) - diperlukan untuk input video dan audio; hanya menangani teks dan gambar InvokeModel

  • TwelveLabs Marengo Embed 3.0 (twelvelabs.marengo-embed-3-0-v 1:0) - pola yang sama; async diperlukan untuk skala video/audio

  • Amazon Nova Reel (amazon.nova-reel-v 1:0 dan v 1:1) - pembuatan video secara eksklusif asinkron; output mendarat di S3

  • Amazon Nova Multimodal Embeddings (amazon.nova-2-multimodal-embeddings-v 1:0) - async diperlukan untuk input video yang lebih besar dari 25MB base64 yang dikodekan; sinkronisasi tersedia untuk input teks, gambar, dan dokumen

InvokeModelWithBidirectionalStream

InvokeModelWithBidirectionalStreamadalah Amazon Bedrock Runtime API yang membuat saluran dupleks penuh persisten antara pemanggil dan model, memungkinkan data audio mengalir di kedua arah secara bersamaan dan terus menerus. Tidak seperti InvokeModelWithResponseStream API standar InvokeModel atau bahkan, yang mengikuti pola permintaan-kemudian respons, API ini membuat koneksi tetap terbuka selama sesi sehingga model dapat memproses audio yang masuk saat tiba dan mengalirkan ucapan yang dihasilkan kembali dalam waktu dekat waktu nyata, tanpa menunggu ucapan lengkap selesai. Interaksi disusun sekitar tiga fase: inisialisasi sesi (di mana klien mengirim peristiwa konfigurasi untuk mengatur aliran), streaming audio (di mana audio yang diambil dikodekan dan dikirim sebagai aliran peristiwa berkelanjutan), dan streaming respons (di mana model secara bersamaan mengembalikan transkripsi teks ucapan pengguna dan output audio yang disintesis). InvokeModelWithBidirectionalStreamtidak dapat digunakan dengan kunci Amazon Bedrock API dan memerlukan otentikasi berbasis kredensil AWS standar, yang mencerminkan siklus hidup sesi yang lebih kompleks dibandingkan dengan operasi Runtime Bedrock lainnya.

Model-model berikut mendukung API ini:

  • Keluarga Amazon Nova Sonic: Baik amazon.nova-sonic-v 1:0 dan amazon.nova-2-sonic-v 1:0 menggunakannya sebagai satu-satunya jalur pemanggilan mereka, karena arsitektur ucapan-ke-ucapan pada dasarnya membutuhkan saluran dua arah langsung yang tidak dapat disediakan oleh Converse atau Converse. InvokeModel