View a markdown version of this page

Grok 4.3 - Amazon Bedrock

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Grok 4.3

Ikon yang menampilkan logo xAI. xAi — Grok 4.3

Detail Model

Grok 4.3 adalah model penalaran pertama yang menawarkan upaya penalaran yang selalu aktif dan dapat dikonfigurasi (tidak ada, rendah, sedang, tinggi). Karena penalaran selalu aktif daripada opsional, ia berperilaku lebih konsisten di seluruh loop agen multi-langkah daripada model yang dapat melewatkan pemikiran. Ini juga menawarkan penggunaan alat yang kuat dan kemampuan mengikuti instruksi untuk membangun agen multi-langkah, dan efisiensi token untuk membantu menjaga inferensi volume tinggi tetap hemat biaya. Grok 4.3 sangat cocok untuk beban kerja perusahaan seperti tinjauan kontrak, penelitian hukum kasus, analisis perjanjian kredit, dan Tanya Jawab dokumen keuangan, sambil memberikan hasil yang konsisten dan berkualitas tinggi di seluruh AI percakapan, pencarian, obrolan, dan alur kerja multi-putaran. Grok 4.3 berjalan pada Mantle, mesin inferensi baru di Amazon Bedrock yang dirancang untuk kinerja harga, dengan dukungan untuk pemanggilan alat, output terstruktur, dan streaming respons.

  • Tanggal peluncuran model: 15 Juni 2026

  • Tanggal model EOL: N/A

  • Perjanjian Lisensi Pengguna Akhir dan Ketentuan Penggunaan: Lihat

  • Siklus hidup model: Aktif

  • Jendela konteks: 1M token

  • Penalaran: Didukung (dapat dikonfigurasi: rendah, sedang, tinggi)

Modalitas Masukan Modalitas Keluaran API yang didukung Endpoint didukung
Red circle with white X icon indicating error, cancel, or close action.AudioRed circle with white X icon indicating error, cancel, or close action.MenyematkanGreen circle with white checkmark icon. Chat CompletionsRed circle with white X icon indicating error, cancel, or close action. bedrock-runtime
Green circle with white checkmark icon.GambarRed circle with white X icon indicating error, cancel, or close action.GambarGreen circle with white checkmark icon. ResponsesGreen circle with white checkmark icon. bedrock-mantle
Red circle with white X icon indicating error, cancel, or close action.PidatoRed circle with white X icon indicating error, cancel, or close action.PidatoRed circle with white X icon indicating error, cancel, or close action. Invoke
Green circle with white checkmark icon.TeksGreen circle with white checkmark icon.TeksRed circle with white X icon indicating error, cancel, or close action. Converse
Red circle with white X icon indicating error, cancel, or close action.VideoRed circle with white X icon indicating error, cancel, or close action.Video
catatan

Model ini tersedia di openai/v1/responses jalur di bedrock-mantle titik akhir. Ini berbeda dari v1/responses jalur yang digunakan oleh model lain pada titik akhir respons.

Kemampuan dan Fitur

Fitur Batuan Dasar

Fitur yang didukung menggunakan bedrock-mantle endpoint

Didukung Tidak Didukung

Harga

Untuk harga, silakan merujuk ke halaman Harga Amazon Bedrock.

Akses Terprogram

Gunakan ID model dan URL titik akhir berikut untuk mengakses model ini secara terprogram. Untuk informasi selengkapnya tentang API dan titik akhir yang tersedia, lihat API yang didukung dan Endpoint didukung.

Titik akhir ID Model In-Region URL titik akhir ID inferensi geo ID inferensi global
bedrock-mantle xai.grok-4.3 https://bedrock-mantle.{region}.api.aws/openai/v1 Tidak didukung Tidak didukung

Misalnya, jika wilayah adalah us-west-2 (Oregon), maka URL titik akhir mantel dasar akan menjadi "”. https://bedrock-mantle.us-west-2.api.aws/openai/v1

Tingkatan Layanan

Amazon Bedrock menawarkan beberapa tingkatan layanan agar sesuai dengan persyaratan beban kerja Anda. Standar menyediakan akses bayar per token tanpa komitmen. Prioritas menawarkan throughput yang lebih tinggi dengan komitmen berbasis waktu. Flex menyediakan akses berbiaya lebih rendah untuk beban kerja yang fleksibel dan tidak sensitif terhadap waktu. Reserved menyediakan throughput khusus dengan komitmen jangka untuk beban kerja yang dapat diprediksi. Untuk informasi selengkapnya, lihat tingkatan layanan.

Standar Prioritas Fleksibel Reserved
Green circle with white checkmark icon. Green circle with white checkmark icon. Green circle with white checkmark icon. Red circle with white X icon indicating error, cancel, or close action.

Ketersediaan Wilayah

Sekilas tentang ketersediaan regional

Bedrock menawarkan tiga opsi inferensi: In-Regionmenyimpan permintaan dalam satu Wilayah untuk kepatuhan yang ketat, Cross-Region rute Geo lintas Wilayah dalam geografi (AS, UE, dll.) untuk throughput yang lebih tinggi sambil menghormati residensi data, dan Cross-Region rute Global di mana saja di seluruh dunia untuk throughput maksimum ketika tidak ada kendala residensi. Lihat Ketersediaan regional berdasarkan model halaman untuk lebih jelasnya.

Wilayah In-Region Geo Global
us-west-2(Oregon)Green circle with white checkmark icon.Red circle with white X icon indicating error, cancel, or close action.Red circle with white X icon indicating error, cancel, or close action.
us-east-1(Virginia Utara)Green circle with white checkmark icon.Red circle with white X icon indicating error, cancel, or close action.Red circle with white X icon indicating error, cancel, or close action.
us-east-2(Ohio)Green circle with white checkmark icon.Red circle with white X icon indicating error, cancel, or close action.Red circle with white X icon indicating error, cancel, or close action.

Kuota dan Batas

Akun AWS Anda memiliki kuota default untuk mempertahankan kinerja layanan dan untuk memastikan penggunaan Amazon Bedrock yang tepat. Kuota default yang ditetapkan ke akun dapat diperbarui tergantung pada faktor regional, riwayat pembayaran, penggunaan penipuan, and/or persetujuan permintaan peningkatan kuota. Untuk lebih jelasnya, silakan merujuk ke Kuota untuk Amazon Bedrock dokumentasi dan lihat batas untuk model.

Saat mengkonsumsi throughput sesuai permintaan pada bedrock-mantle titik akhir, skala throughput yang tersedia dari waktu ke waktu. Tidak semua permintaan dalam kuota Anda dijamin berhasil selama periode permintaan tinggi, jadi ramping secara bertahap adalah penting. Untuk model ini, batas default tidak muncul secara langsung melalui Service Quotas, jadi sebaiknya ikuti ramp sebagai panduan Anda.

Kode Sampel

Langkah 1 - Akun AWS: Jika Anda sudah memiliki akun AWS, lewati langkah ini. Jika Anda baru mengenal AWS, daftar akun AWS.

Langkah 2 - Kunci API: Buka konsol Amazon Bedrock dan buat kunci API jangka panjang.

Langkah 3 - Dapatkan SDK: Untuk menggunakan panduan memulai ini, Anda harus memiliki Python yang sudah diinstal. Kemudian instal perangkat lunak yang relevan tergantung pada API yang Anda gunakan.

Chat Completions API
pip install openai
Responses API
pip install openai

Langkah 4 - Tetapkan variabel lingkungan: Konfigurasikan lingkungan Anda untuk menggunakan kunci API untuk otentikasi.

Chat Completions API
OPENAI_API_KEY="<provide your Bedrock API key>" OPENAI_BASE_URL="https://bedrock-mantle.us-west-2.api.aws/openai/v1"
Responses API
OPENAI_API_KEY="<provide your Bedrock API key>" OPENAI_BASE_URL="https://bedrock-mantle.us-west-2.api.aws/openai/v1"

Langkah 5 - Jalankan permintaan inferensi pertama Anda: Simpan file sebagai bedrock-first-request.py

Chat Completions API
from openai import OpenAI client = OpenAI() response = client.chat.completions.create( model="xai.grok-4.3", messages=[ {"role": "user", "content": "Can you explain the features of Amazon Bedrock?"} ] ) print(response)
Responses API
from openai import OpenAI client = OpenAI() response = client.responses.create( model="xai.grok-4.3", input="Can you explain the features of Amazon Bedrock?" ) print(response)

Pertimbangan dan Batasan Penggunaan

  • Upaya penalaran — Penalaran selalu aktif secara default. Anda dapat mengonfigurasi upaya melalui reasoning parameter: {"effort": "none"} (menonaktifkan penalaran), "low" (default),"medium", atau. "high" Konten penalaran dienkripsi dan dapat dikembalikan dengan meneruskan include: ["reasoning.encrypted_content"] permintaan API Responses. Anda dapat mengirim kembali konten terenkripsi pada giliran berikutnya untuk memberikan konteks penalaran untuk percakapan multi-putaran. API Penyelesaian Obrolan tidak mengembalikan token penalaran.

    response = client.responses.create( model="xai.grok-4.3", reasoning={"effort": "high"}, include=["reasoning.encrypted_content"], input="Explain quantum entanglement simply." ) print(response.output_text)
  • Parameter default — Grok 4.3 menggunakan default yang berbeda dari spesifikasi OpenAI API standar: default ke (tidak), temperature default ke 0.7 (tidak1), top_p dan default ke. 0.95 1 max_completion_tokens 131072 Sesuaikan nilai-nilai ini secara eksplisit jika aplikasi Anda memerlukan perilaku yang berbeda.