Apa itu MCP?

LLMs bekerja dengan memprediksi jawaban atas prompt berdasarkan data pelatihan mereka. Ini berarti bahwa LLM hanya dapat memberikan jawaban tentang data dan peristiwa yang telah dilihatnya. Metode seperti Retrieval Augmented Generation (RAG) dan basis pengetahuan memungkinkan Anda untuk memasukkan data kontekstual. Namun, jika Anda bertanya kepada LLM apa ramalan cuaca besok atau berapa banyak pelanggan di database Anda, kemungkinan akan berhalusinasi atau tidak dapat memberikan jawaban karena ini berada di luar pengetahuan pra-terlatih LLM. Untuk dapat menjawab pertanyaan semacam ini, agen membutuhkan akses ke kemampuan eksternal, data, dan APIs di luar konteks asli LLM.

Memahami alat

Kami dapat memberikan akses LLM ke sistem dan konteks tambahan melalui alat.Alat adalah fungsi yang diberikan kepada LLM untuk mencapai tujuan yang jelas. Alat dapat memanggil API, menanyakan database, melakukan operasi kalkulator, mengoperasikan kotak pasir kode, melakukan pencarian web, dan bahkan memanggil sistem AI lain atau. agent-as-a-tool Setiap alat harus menyertakan deskripsi yang memberi tahu LLM apa yang dilakukan alat, kapan menggunakannya, dan parameter apa yang diterimanya. Hal ini memungkinkan LLM untuk membuat keputusan bernuansa tentang alat atau kombinasi alat mana yang akan dipanggil berdasarkan masukan pengguna. LLM diberitahu tentang alat apa yang tersedia untuk agen, memungkinkannya menghasilkan tanggapan yang menginstruksikan agen untuk memanggil alat tersebut. Misalnya, ketika Anda bertanya LLM berapa banyak pelanggan dalam database Anda, LLM akan mengirim tanggapan kembali ke agen yang meminta untuk menjalankan query_database alat dengan parameter input tertentu. LLM menentukan alat mana yang akan dipanggil dan input untuk panggilan alat. Agen kemudian mengeksekusi alat, yang mengubah input bahasa alami menjadi panggilan fungsi yang benar secara sintaksis dan menjalankan kueri. Agen memanggil alat atau alat berdasarkan instruksi dari LLM, dan hasil tersebut diteruskan kembali ke LLM. Ini mengambil keuntungan dari kemampuan LLM untuk bernalar atas input berbasis teks dan memilih alat yang sesuai untuk pekerjaan itu.

Gambar berikut menunjukkan bagaimana setiap agen mengelola set alatnya sendiri untuk setiap target.

Akses alat penskalaan dapat menghadirkan tantangan untuk solusi AI agen:

Jika setiap pengembang membuat alat mereka sendiri untuk kemampuan eksternal yang sama, ada banyak upaya duplikat dan cara non-standar untuk berinteraksi dengan kemampuan eksternal ini. Ini menghasilkan implementasi yang tidak konsisten di seluruh agen Anda. Meskipun Anda dapat memecahkan masalah itu dengan mengembangkan alat standar di perpustakaan dan mendistribusikannya, ini tidak memiliki tata kelola terpusat. Hal ini membuat sulit untuk menegakkan kebijakan keamanan, melacak penggunaan alat, mengelola pembuatan versi di seluruh tim, atau memastikan kepatuhan dengan standar organisasi. Selain itu, ketika Anda menyematkan alat secara langsung dengan agen, Anda harus menerapkan kembali agen Anda setiap kali alat baru dibuat atau yang sudah ada diperbarui.
Menyediakan alat untuk LLM mengkonsumsi jendela konteksnya. Jendela konteks adalah jumlah token (unit teks yang LLMs memproses — biasanya mewakili kata-kata, bagian kata, atau tanda baca) yang dapat dipertimbangkan oleh model pada satu waktu. LLMs memiliki batas jendela konteks. Alat dan dokumentasinya menggunakan jendela konteks terbatas itu bersama dengan permintaan sistem dan permintaan pengguna. Saat jendela konteks terisi, LLMs dapat mengalami penurunan kinerja karena beberapa faktor: kesulitan dalam mengidentifikasi informasi yang relevan, peningkatan kompleksitas pemrosesan, dan berkurangnya kapasitas untuk penalaran. Tantangannya diperparah ketika definisi alat, petunjuk sistem, dan riwayat percakapan bersaing untuk ruang jendela konteks terbatas karena disediakan pada setiap pemanggilan LLM.

Dengan demikian, jumlah alat dan bagaimana mereka didokumentasikan memiliki dampak langsung pada kinerja LLM, seperti waktu respons, dan akurasi.

MCP menetapkan standar universal untuk menghubungkan agen ke kemampuan eksternal. Ini biasanya disebut sebagai “USB-C untuk aplikasi AI.” Alih-alih mendaftarkan alat secara langsung dengan agen, server MCP bertindak sebagai perantara untuk alat hosting yang ditemukan dan dipanggil melalui JSON-RPC 2.0. Alih-alih menambahkan puluhan atau ratusan alat berbeda ke agen Anda dan mempertahankannya dari waktu ke waktu, MCP memungkinkan Anda mendaftarkan server MCP yang merangkum alat yang dapat diakses agen Anda. Pendekatan ini menstandarisasi bagaimana alat dikemas, disajikan, dan dipanggil. Ini dapat membantu mengatasi tantangan skala dan tata kelola penggunaan alat di dalam agen Anda. Ini juga memisahkan pengembangan dan operasi agen dari alat yang digunakannya untuk kemampuan eksternal.

Gambar berikut menunjukkan agen yang menggunakan MCP untuk mengakses sumber daya eksternal.

Menggunakan Model Context Protocol untuk mengakses sumber daya eksternal.

Namun, standar MCP tidak menyelesaikan semua tantangan penskalaan dan tata kelola. Implementasi server MCP harus dikombinasikan dengan desain alat yang efektif, hosting, dan strategi tata kelola perusahaan. Panduan ini memberikan praktik terbaik untuk setiap strategi untuk membantu Anda membangun dan menggunakan MCP sebagai bagian dari solusi AI agen Anda.

Kapan menggunakan MCP

MCP menyediakan infrastruktur strategis untuk menskalakan inisiatif AI agen Anda. Dengan memusatkan manajemen dan tata kelola alat, server MCP mengurangi biaya kumulatif untuk membangun dan memelihara integrasi khusus di beberapa agen. Ini memberikan pengembalian yang meningkat saat ekosistem agen Anda berkembang.

MCP kemungkinan menjadi bagian dari strategi Anda ketika:

Anda memerlukan tata kelola terpusat untuk bagaimana agen mengakses sistem dan layanan perusahaan, seperti database, alat internal APIs, dan integrasi pihak ketiga.
Pengembang menghabiskan terlalu banyak waktu untuk menulis integrasi khusus yang tidak konsisten di seluruh implementasi.
Anda memiliki alat duplikat yang dapat melayani kemampuan umum.
Anda ingin menawarkan alat atau data milik Anda kepada konsumen eksternal atau sistem agen pihak ketiga melalui antarmuka MCP standar yang diatur, membuka aliran pendapatan baru sambil menjaga keamanan dan kontrol.

Setelah Anda memutuskan bahwa server MCP akan menjadi bagian dari strategi Anda, evaluasi apakah implementasi server MCP open-source yang ada memenuhi kebutuhan Anda, apakah mereka memerlukan peningkatan, atau apakah Anda perlu membangun server khusus. Banyak implementasi server MCP pra-bangun tersedia di repositori publik, dan mencakup kemampuan umum seperti akses sistem file, penjelajahan web, kotak pasir kode, akses basis data, dan integrasi API.

Dalam banyak kasus, server MCP yang sudah ada sudah cukup. Misalnya, AWS menyediakan, server MCP jarak jauh terkelola yang menyediakan asisten dan agen AI akses yang aman dan terautentikasi Layanan AWS melalui interaksi bahasa alami. AWS MCP Server Anda dapat menggunakannya AWS MCP Server untuk melakukan AWS tugas multi-langkah yang kompleks dengan menggabungkan akses real-time ke AWS dokumentasi, panggilan API yang benar secara sintaksis, dan alur kerja pra-bangun yang disebut Agen SOPs yang mengikuti praktik terbaik. AWS AWS terus menguji AWS MCP Server untuk memastikan bahwa agen pelanggan dapat menggunakannya dengan sukses.

Anda harus menguji server MCP yang ada ini dengan agen Anda untuk menentukan apakah mereka memenuhi kasus penggunaan Anda. Jika agen gagal menyelesaikan alur kerja, menghasilkan respons yang salah atau kurang optimal, gagal menavigasi proses multi-langkah yang kompleks, atau melewatkan praktik terbaik atau pertimbangan keamanan khusus domain yang penting, Anda harus mempertimbangkan peningkatan dalam beberapa dimensi.

Ketika server MCP yang ada tidak sepenuhnya memenuhi kebutuhan Anda dan mereka berjuang untuk menggunakan alat yang ada dengan benar atau menghasilkan respons yang akurat, pertimbangkan pendekatan peningkatan ini sebelum membangun server khusus:

Perkaya konteks agen — Jika agen Anda berjuang untuk menggunakan alat dengan benar atau efisien di server MCP yang ada, pertimbangkan untuk melengkapi definisi alat tersebut dengan dokumentasi atau contoh tambahan. Ini membantu memberikan konteks tambahan untuk LLM.
Tambahkan alat pelengkap — Perluas server MCP yang ada dengan alat yang mengakses data organisasi atau konteks tambahan yang dibutuhkan agen untuk menyelesaikan alur kerja dengan sukses.
Tingkatkan yang mendasari APIs — Sederhanakan layanan Anda APIs agar lebih ramah LLM dengan mengurangi kompleksitas parameter, memberikan pesan kesalahan yang lebih jelas, dan menawarkan default yang masuk akal yang dapat digunakan agen.

Saat menggunakan implementasi server MCP yang ada mempercepat pengembangan untuk kemampuan umum, membangun server MCP kustom adalah suatu keharusan ketika kasus penggunaan Anda memerlukan fungsionalitas khusus. Server MCP khusus membantu Anda merangkum keahlian domain, menegakkan standar organisasi, meningkatkan keandalan agen untuk alur kerja yang kompleks, dan mendukung kepatuhan terhadap persyaratan keamanan. Pertimbangkan untuk membangun server MCP khusus dalam situasi berikut:

Alur kerja khusus domain — Alur kerja multi-langkah yang membutuhkan keahlian domain harus dienkapsulasi dalam alat MCP khusus ketika pengetahuan yang diperlukan tidak ditangkap dalam dokumentasi API. Misalnya, alih-alih membiarkan agen mengatur jalur data perawatan kesehatan yang kompleks yang harus memvalidasi kepatuhan Undang-Undang Portabilitas dan Akuntabilitas Asuransi Kesehatan (HIPAA), menganonimkan PII, dan mengubah ke HL7 format FHIR, sediakan alat yang menyematkan keahlian domain secara langsung. process_patient_data Ini menghilangkan ketergantungan pada LLM untuk mengatur dan menjalankan langkah-langkah alur kerja dengan benar, yang meningkatkan konsistensi dan kepatuhan.
Abstraksi jalur emas — Agen mungkin berjuang untuk menerapkan pendekatan yang optimal karena mereka tidak memiliki konteks organisasi dan default ke pola dasar daripada praktik terbaik organisasi. Dalam skenario ini, Anda dapat menerapkan standar preskriptif untuk biaya, kinerja, atau keamanan dengan merangkum jalur emas ini dalam alat MCP khusus. Misalnya, alih-alih membiarkan agen menyebarkan infrastruktur dengan pengaturan default yang mungkin tidak aman atau tidak efisien, sediakan deploy_secure_infrastructure alat yang secara langsung menyematkan standar organisasi Anda.
Orkestrasi multi-layanan yang kompleks — Alih-alih membuat agen mengatur alur kerja yang kompleks dengan mencoba menyimpulkan urutan dan kumpulan layanan yang benar untuk digunakan di setiap langkah, Anda dapat secara deterministik membangun logika itu di dalam alat MCP. Anda mungkin juga ingin memberikan keahlian tentang pola integrasi layanan optimal yang mungkin tidak disadari oleh agen. Ini juga dapat meningkatkan akurasi dan efisiensi agen Anda.
Praktik terbaik khusus layanan — Ini umum untuk alat yang berfokus pada keamanan yang membantu agen menerapkan kebijakan enkripsi, kontrol akses, dan pola kepatuhan khusus untuk layanan yang diakses melalui alat agen. Selain itu, jika ada praktik terbaik operasional khusus layanan yang tidak jelas, menggunakan server MCP dapat membantu Anda memastikan bahwa mereka diterapkan dan tidak diserahkan kepada agen untuk dipikirkan.

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Pengantar

Strategi desain alat MCP