AI21 Amazon Antropik Cohere DeepSeek Google Meta MiniMax Mistral Moonshot NVIDIA OpenAI Qwen Stabilitas TwelveLabs Penulis xAi Z.AI Model yang mendukung StartAsyncInvoke InvokeModelWithBidirectionalStream

Kompatibilitas API menurut model

Amazon Bedrock mendukung empat keluarga API runtime, masing-masing dirancang untuk pola integrasi dan kasus penggunaan yang berbeda.

Keluarga panggilan: InvokeModel menangani panggilan respons tunggal yang sinkron. InvokeModelWithResponseStreammengembalikan respons sebagai aliran waktu nyata. InvokeModelWithBidirectionalStreammemungkinkan streaming dupleks penuh untuk aplikasi interaktif. AsyncInvokemengirimkan permintaan yang berjalan lama secara asinkron, menyimpan output ke Amazon S3.

Keluarga Converse: Converse menyediakan antarmuka model-agnostik terpadu untuk percakapan multi-putaran sinkron. ConverseStreammemberikan pengalaman yang sama dengan output streaming.

OpenAI-compatible keluarga: ChatCompletions mengimplementasikan antarmuka OpenAI Chat Completions, memungkinkan integrasi OpenAI-based yang ada berjalan di Bedrock dengan sedikit perubahan. Responses API mengimplementasikan antarmuka OpenAI Responses, mendukung interaksi stateful dan agentic dengan penggunaan alat bawaan dan manajemen riwayat percakapan.

Keluarga pesan: Messages mengimplementasikan antarmuka Pesan Antropik di bedrock-mantle titik akhir, memungkinkan SDK-based integrasi Antropik yang ada berjalan di Bedrock dengan sedikit perubahan.

Kita sekarang akan melihat daftar API yang didukung oleh masing-masing model.

AI21

Nama model	Panggil	Bercakap	Penyelesaian Obrolan	Respons	Pesan
Jamba 1.5 Besar*
Jamba 1.5 Mini*

Amazon

Nama model	Panggil	Bercakap	Penyelesaian Obrolan	Respons	Pesan
Embeddings Multimodal Amazon Nova
Nova 2 Lite*
Nova 2 Sonic
Kanvas Nova
Nova Lite*
Nova Mikro*
Nova Premier*
Nova Pro*
Gulungan Nova
Nova Sonic*
Titan Embeddings G1 - Teks
Generator Gambar Titan G1 v2
Embeddings Multimodal Titan G1
Penyematan Teks Titan V2

Antropik

Nama model	Panggil	Bercakap	Penyelesaian Obrolan	Respons	Pesan
Mitos Claude 5
Dongeng Claude 5
Pratinjau Claude Mythos
Claude 3 Haiku*
Claude 3.5 Haiku*
Claude Haiku 4.5*
Claude Opus 4.1*
Claude Opus 4.5*
Claude Opus 4.6*
Claude Opus 4.7*
Claude Opus 4.8*
Claude Soneta 4*
Claude Soneta 4.5*
Claude Soneta 4.6*

Cohere

Nama model	Panggil	Bercakap	Penyelesaian Obrolan	Respons	Pesan
Perintah R*
Perintah R +*
Sematkan Bahasa Inggris
Sematkan Multilingual
Sematkan v4
Rerank 3.5

DeepSeek

Nama model	Panggil	Bercakap	Penyelesaian Obrolan	Respons	Pesan
DeepSeek V3.2*
DeepSeek-R1*
DeepSeek-V3.1*

Google

Nama model	Panggil	Bercakap	Penyelesaian Obrolan	Respons	Pesan
Gemma 3 12B IT*
Gemma 3 27B PT*
Gemma 3 4B IT*

MiniMax

Nama model	Panggil	Bercakap	Penyelesaian Obrolan	Respons	Pesan
MiniMax M2*
MiniMax M2.1*
MiniMax M2.5*

Mistral

Nama model	Panggil	Bercakap	Penyelesaian Obrolan	Respons	Pesan
Devstral 2 123B*
Magistral Kecil 2509*
Kementerian 14B 3.0*
Ministro 3 8B*
Ministro 3B*
Instruksi Mistral 7B*
Mistral Besar*
Mistral Besar 3*
Mistral Kecil*
Instruksi Mixtral 8x7B*
Pixtral Besar*
Voxtral Mini 3B 2507*
Voxtral Kecil 24B 2507*

Moonshot

Nama model	Panggil	Bercakap	Penyelesaian Obrolan	Respons	Pesan
Kimi K2 Berpikir*
Kimi K2.5*

NVIDIA

Nama model	Panggil	Bercakap	Penyelesaian Obrolan	Respons	Pesan
NVIDIA Nemotron Nano 9B v2*
NVIDIA Nemotron Nano 12B v2 VL BF16*
Nemotron Nano 3 30B*
NVIDIA Nemotron 3 Super 120B*

OpenAI

Nama model	Panggil	Bercakap	Penyelesaian Obrolan	Respons	Pesan
GPT-5.5
GPT-5.4
GPT OSS Safeguard 120B*
GPT OSS Safeguard 20B*
gpt-oss-120b*
gpt-oss-20b*

Qwen

Nama model	Panggil	Bercakap	Penyelesaian Obrolan	Respons	Pesan
Qwen3 235B A22B 2507*
Qwen3 32B*
Qwen3 Coder 480B A35B Instruksi*
Qwen3 Coder Berikutnya*
Qwen3 Berikutnya 80B A3B*
Qwen3 VL 235B A22B*
Qwen3-Coder-30B-A3B-Instruct*

Stabilitas

Nama model	Panggil	Bercakap	Penyelesaian Obrolan	Respons	Pesan
Gambar Stabil Konservatif Kelas Atas
Sketsa Kontrol Gambar Stabil
Struktur Kontrol Gambar Stabil
Skala Kreatif Gambar Stabil
Objek Hapus Gambar Stabil
Gambar Stabil Cepat Kelas Atas
Inpaint Gambar Stabil
Outpaint Gambar Stabil
Gambar Stabil Hapus Latar Belakang
Pencarian Gambar Stabil dan Recolor
Pencarian dan Ganti Gambar Stabil
Panduan Gaya Gambar Stabil
Transfer Gaya Gambar Stabil

TwelveLabs

Nama model	Panggil	Bercakap	Penyelesaian Obrolan	Respons	Pesan
Marengo Sematkan 3.0
Marengo Sematkan v2.7
Pegasus v1.2

Penulis

Nama model	Panggil	Bercakap	Penyelesaian Obrolan	Respons	Pesan
Visi Palmyra 7B
Palmyra X4*
Palmyra X5*

xAi

Nama model	Panggil	Bercakap	Penyelesaian Obrolan	Respons	Pesan
Grok 4.3

Z.AI

Nama model	Panggil	Bercakap	Penyelesaian Obrolan	Respons	Pesan
GLM 4,7*
GLM 4.7 Flash*
GLM 5*

catatan

* Dukungan Streaming: Model yang ditandai dengan tanda bintang (*) juga mendukungInvokeModelWithResponseStream, yang mengembalikan respons sebagai aliran waktu nyata.

Model yang mendukung StartAsyncInvoke

StartAsyncInvoke adalah Amazon Bedrock Runtime API yang memungkinkan penelepon mengirimkan permintaan pemanggilan model dan segera menerima kembali InvocationARN tanpa menunggu model selesai diproses. Pekerjaan berjalan di latar belakang, dan output ditulis ke bucket S3 yang ditentukan pemanggil setelah selesai. Penelepon kemudian dapat melakukan polling status pekerjaan menggunakan pendamping GetAsyncInvoke dan ListAsyncInvokes API. Pola ini dibuat khusus untuk beban kerja yang melibatkan input besar atau tidak sensitif latensi, terutama pembuatan video, audio, dan penyematan massal, di mana memegang koneksi sinkron terbuka tidak akan praktis.

Dalam hal model mana yang mendukungnya, model berikut mendukung StartAsyncInvoke:

TwelveLabs Marengo Embed 2.7 (twelvelabs.marengo-embed-2-7-v 1:0) - diperlukan untuk input video dan audio; hanya menangani teks dan gambar InvokeModel
TwelveLabs Marengo Embed 3.0 (twelvelabs.marengo-embed-3-0-v 1:0) - pola yang sama; async diperlukan untuk skala video/audio
Amazon Nova Reel (amazon.nova-reel-v 1:0 dan v 1:1) - pembuatan video secara eksklusif asinkron; output mendarat di S3
Amazon Nova Multimodal Embeddings (amazon.nova-2-multimodal-embeddings-v 1:0) - async diperlukan untuk input video yang lebih besar dari 25MB base64 yang dikodekan; sinkronisasi tersedia untuk input teks, gambar, dan dokumen

InvokeModelWithBidirectionalStream

InvokeModelWithBidirectionalStreamadalah Amazon Bedrock Runtime API yang membuat saluran dupleks penuh persisten antara pemanggil dan model, memungkinkan data audio mengalir di kedua arah secara bersamaan dan terus menerus. Tidak seperti InvokeModelWithResponseStream API standar InvokeModel atau bahkan, yang mengikuti pola permintaan-kemudian respons, API ini membuat koneksi tetap terbuka selama sesi sehingga model dapat memproses audio yang masuk saat tiba dan mengalirkan ucapan yang dihasilkan kembali dalam waktu dekat waktu nyata, tanpa menunggu ucapan lengkap selesai. Interaksi disusun sekitar tiga fase: inisialisasi sesi (di mana klien mengirim peristiwa konfigurasi untuk mengatur aliran), streaming audio (di mana audio yang diambil dikodekan dan dikirim sebagai aliran peristiwa berkelanjutan), dan streaming respons (di mana model secara bersamaan mengembalikan transkripsi teks ucapan pengguna dan output audio yang disintesis). InvokeModelWithBidirectionalStreamtidak dapat digunakan dengan kunci Amazon Bedrock API dan memerlukan otentikasi berbasis kredensil AWS standar, yang mencerminkan siklus hidup sesi yang lebih kompleks dibandingkan dengan operasi Runtime Bedrock lainnya.

Model berikut mendukung API ini:

Keluarga Amazon Nova Sonic: Baik amazon.nova-sonic-v 1:0 dan amazon.nova-2-sonic-v 1:0 menggunakannya sebagai satu-satunya jalur pemanggilan mereka, karena arsitektur ucapan-ke-ucapan pada dasarnya membutuhkan saluran dua arah langsung yang tidak dapat disediakan oleh Converse atau Converse. InvokeModel

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

&Kompatibilitas ketersediaan model

Ketersediaan titik akhir menurut model

Nama model	Panggil	Bercakap	Penyelesaian Obrolan	Respons	Pesan
Instruksi Llama 3 70B*
Instruksi Llama 3 8B*
Instruksi Llama 3.1 405B
Instruksi Llama 3.1 70B*
Instruksi Llama 3.1 8B*
Instruksi Llama 3.2 11B*
Instruksi Llama 3.2 1B*
Instruksi Llama 3.2 3B*
Instruksi Llama 3.2 90B*
Instruksi Llama 3.3 70B*
Llama 4 Maverick 17B Instruksi*
Instruksi Llama 4 Scout 17B*