

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Model fondasi AI generatif di Kanvas SageMaker
<a name="canvas-fm-chat"></a>

Amazon SageMaker Canvas menyediakan model dasar AI generatif yang dapat Anda gunakan untuk memulai obrolan percakapan. Model pembuatan konten ini dilatih pada sejumlah besar data teks untuk mempelajari pola statistik dan hubungan antar kata, dan mereka dapat menghasilkan teks yang koheren yang secara statistik mirip dengan teks tempat mereka dilatih. Anda dapat menggunakan kemampuan ini untuk meningkatkan produktivitas Anda dengan melakukan hal berikut:
+ Menghasilkan konten, seperti garis besar dokumen, laporan, dan blog
+ Meringkas teks dari kumpulan teks besar, seperti transkrip panggilan pendapatan, laporan tahunan, atau bab-babnya manual pengguna
+ Ekstrak wawasan dan takeaways kunci dari bagian teks yang besar, seperti catatan rapat atau narasi
+ Meningkatkan teks dan menangkap kesalahan tata bahasa atau kesalahan ketik

Model dasar adalah kombinasi dari Amazon SageMaker JumpStart dan [Amazon Bedrock](https://docs.aws.amazon.com/bedrock/latest/userguide/what-is-service.html) model bahasa besar (LLMs). Canvas menawarkan model-model berikut:


| Model | Tipe | Deskripsi | 
| --- | --- | --- | 
|  Amazon Titan  | Model Amazon Bedrock |  Amazon Titan adalah model bahasa tujuan umum yang kuat yang dapat Anda gunakan untuk tugas-tugas seperti meringkas, pembuatan teks (seperti membuat posting blog), klasifikasi, tanya jawab terbuka, dan ekstraksi informasi. Ini dilatih sebelumnya pada kumpulan data besar, sehingga cocok untuk tugas dan penalaran yang kompleks. Untuk terus mendukung praktik terbaik dalam penggunaan AI yang bertanggung jawab, model yayasan Amazon Titan dibuat untuk mendeteksi dan menghapus konten berbahaya dalam data, menolak konten yang tidak pantas dalam input pengguna, dan memfilter output model yang berisi konten yang tidak pantas (seperti ujaran kebencian, kata-kata kotor, dan kekerasan).  | 
|  Anthropic Claude Instant  | Model Amazon Bedrock |  Claude Instant Anthropic adalah model yang lebih cepat dan lebih hemat biaya namun masih sangat mumpuni. Model ini dapat menangani berbagai tugas termasuk dialog biasa, analisis teks, ringkasan, dan menjawab pertanyaan dokumen. Sama seperti Claude-2, Claude Instant dapat mendukung hingga 100.000 token di setiap prompt, setara dengan sekitar 200 halaman informasi.  | 
|  Anthropic Claude-2  | Model Amazon Bedrock |  Claude-2 adalah model Anthropic yang paling kuat, yang unggul dalam berbagai tugas mulai dari dialog canggih dan pembuatan konten kreatif hingga instruksi terperinci berikut. Claude-2 dapat mengambil hingga 100.000 token di setiap prompt, setara dengan sekitar 200 halaman informasi. Ini dapat menghasilkan respons yang lebih lama dibandingkan dengan versi sebelumnya. Ini mendukung kasus penggunaan seperti menjawab pertanyaan, ekstraksi informasi, menghapus PII, pembuatan konten, klasifikasi pilihan ganda, permainan peran, membandingkan teks, ringkasan, dan Tanya Jawab dokumen dengan kutipan.  | 
|  Instruksi Falcon-7B  | JumpStart model |  Falcon-7B-Instruct memiliki 7 miliar parameter dan disetel dengan baik pada campuran kumpulan data obrolan dan instruksi. Ini cocok sebagai asisten virtual dan berkinerja terbaik saat mengikuti instruksi atau terlibat dalam percakapan. Karena model ini dilatih pada sejumlah besar data web berbahasa Inggris, ia membawa stereotip dan bias yang biasa ditemukan online dan tidak cocok untuk bahasa selain bahasa Inggris. Dibandingkan dengan Falcon-40B-Instruct, Falcon-7B-Instruct adalah model yang sedikit lebih kecil dan lebih kompak.  | 
|  Instruksi Falcon-40B  | JumpStart model |  Falcon-40B-Instruct memiliki 40 miliar parameter dan disetel dengan baik pada campuran kumpulan data obrolan dan instruksi. Ini cocok sebagai asisten virtual dan berkinerja terbaik saat mengikuti instruksi atau terlibat dalam percakapan. Karena model ini dilatih pada sejumlah besar data web berbahasa Inggris, ia membawa stereotip dan bias yang biasa ditemukan online dan tidak cocok untuk bahasa selain bahasa Inggris. Dibandingkan dengan Falcon-7B-Instruct, Falcon-40B-Instruct adalah model yang sedikit lebih besar dan lebih kuat.  | 
|  Jurassic-2 Pertengahan  | Model Amazon Bedrock |  Jurassic-2 Mid adalah model pembuatan teks berkinerja tinggi yang dilatih pada kumpulan teks yang sangat besar (saat ini hingga pertengahan 2022). Ini sangat serbaguna, tujuan umum, dan mampu menyusun teks seperti manusia dan menyelesaikan tugas-tugas kompleks seperti menjawab pertanyaan, klasifikasi teks, dan banyak lainnya. Model ini menawarkan kemampuan instruksi zero-shot, memungkinkannya diarahkan hanya dengan bahasa alami dan tanpa menggunakan contoh. Ini bekerja hingga 30% lebih cepat dari pendahulunya, model Jurassic-1. Jurassic-2 Mid adalah AI21 model berukuran sedang, dirancang dengan cermat untuk mencapai keseimbangan yang tepat antara kualitas luar biasa dan keterjangkauan.  | 
|  Jurassic-2 Ultra  | Model Amazon Bedrock |  Jurassic-2 Ultra adalah model pembuatan teks berkinerja tinggi yang dilatih pada kumpulan teks yang sangat besar (saat ini hingga pertengahan 2022). Ini sangat serbaguna, tujuan umum, dan mampu menyusun teks seperti manusia dan menyelesaikan tugas-tugas kompleks seperti menjawab pertanyaan, klasifikasi teks, dan banyak lainnya. Model ini menawarkan kemampuan instruksi zero-shot, memungkinkannya diarahkan hanya dengan bahasa alami dan tanpa menggunakan contoh. Ini bekerja hingga 30% lebih cepat dari pendahulunya, model Jurassic-1. Dibandingkan dengan Jurassic-2 Mid, Jurassic-2 Ultra adalah model yang sedikit lebih besar dan lebih kuat.  | 
|  Llama-2-7B-obrolan  | JumpStart model |  LLAMA-2-7B-Chat adalah model dasar oleh Meta yang cocok untuk terlibat dalam percakapan yang bermakna dan koheren, menghasilkan konten baru, dan mengekstrak jawaban dari catatan yang ada. Karena model ini dilatih pada sejumlah besar data internet berbahasa Inggris, ia membawa bias dan batasan yang biasa ditemukan secara online dan paling cocok untuk tugas-tugas dalam bahasa Inggris.  | 
|  Llama-2-13B-Obrolan  | Model Amazon Bedrock |  Llama-2-13B-Chat oleh Meta disetel dengan baik pada data percakapan setelah pelatihan awal tentang data internet. Ini dioptimalkan untuk dialog alami dan kemampuan obrolan yang menarik, membuatnya cocok sebagai agen percakapan. Dibandingkan dengan LLAMA-2-7B-chat yang lebih kecil, Llama-2-13B-Chat memiliki parameter hampir dua kali lebih banyak, memungkinkannya untuk mengingat lebih banyak konteks dan menghasilkan respons percakapan yang lebih bernuansa. Seperti Llama-2-7B-Chat, Llama-2-13B-Chat dilatih pada data berbahasa Inggris dan paling cocok untuk tugas-tugas dalam bahasa Inggris.  | 
|  Llama-2-70B-Obrolan  | Model Amazon Bedrock |  Seperti Llama-2-7B-Chat dan Llama-2-13B-Chat, model Llama-2-70B-Chat oleh Meta dioptimalkan untuk terlibat dalam dialog alami dan bermakna. Dengan 70 miliar parameter, model percakapan besar ini dapat mengingat konteks yang lebih luas dan menghasilkan respons yang sangat koheren jika dibandingkan dengan versi model yang lebih ringkas. Namun, ini datang dengan mengorbankan respons yang lebih lambat dan persyaratan sumber daya yang lebih tinggi. Llama-2-70B-Chat dilatih pada sejumlah besar data internet berbahasa Inggris dan paling cocok untuk tugas-tugas dalam bahasa Inggris.  | 
|  Mistral-7B  | JumpStart model |  Mistral-7B oleh Mistral.AI adalah model bahasa tujuan umum yang sangat baik yang cocok untuk berbagai tugas bahasa alami (NLP) seperti pembuatan teks, ringkasan, dan menjawab pertanyaan. Ini menggunakan grouped-query attention (GQA) yang memungkinkan kecepatan inferensi lebih cepat, membuatnya bekerja sebanding dengan model dengan dua atau tiga kali lebih banyak parameter. Itu dilatih pada campuran data teks termasuk buku, situs web, dan makalah ilmiah dalam bahasa Inggris, sehingga paling cocok untuk tugas-tugas dalam bahasa Inggris.  | 
|  Mistral-7B-Obrolan  | JumpStart model |  Mistral-7B-Chat adalah model percakapan oleh Mistral.AI berdasarkan Mistral-7B. Sementara Mistral-7B adalah yang terbaik untuk tugas-tugas NLP umum, Mistral-7B-Chat telah disempurnakan lebih lanjut pada data percakapan untuk mengoptimalkan kemampuannya untuk obrolan alami dan menarik. Akibatnya, Mistral-7B-Chat menghasilkan lebih banyak respons seperti manusia dan mengingat konteks tanggapan sebelumnya. Seperti Mistral-7B, model ini paling cocok untuk tugas bahasa Inggris.  | 
|  Instruksi MPT-7B  | JumpStart model |  MPT-7B-Instruct adalah model untuk tugas-tugas berikut instruksi bentuk panjang dan dapat membantu Anda dengan tugas menulis termasuk ringkasan teks dan menjawab pertanyaan untuk menghemat waktu dan tenaga Anda. Model ini dilatih pada sejumlah besar data yang disetel dengan baik dan dapat menangani input yang lebih besar, seperti dokumen yang kompleks. Gunakan model ini saat Anda ingin memproses teks dalam jumlah besar atau ingin model menghasilkan respons yang panjang.  | 

Model dasar dari Amazon Bedrock saat ini hanya tersedia di Wilayah AS Timur (Virginia N.) dan AS Barat (Oregon). Selain itu, saat menggunakan model foundation dari Amazon Bedrock, Anda dikenakan biaya berdasarkan volume token input dan token output, seperti yang ditentukan oleh masing-masing penyedia model. Untuk informasi selengkapnya, lihat [halaman harga Amazon Bedrock](https://aws.amazon.com/bedrock/pricing/). Model JumpStart foundation diterapkan pada instans SageMaker AI Hosting, dan Anda dikenai biaya untuk durasi penggunaan berdasarkan jenis instans yang digunakan. Untuk informasi selengkapnya tentang biaya berbagai jenis instans, lihat bagian Amazon SageMaker AI Hosting: Inferensi Waktu Nyata di [halaman SageMaker harga](https://aws.amazon.com/sagemaker/pricing/).

Kueri dokumen adalah fitur tambahan yang dapat Anda gunakan untuk kueri dan mendapatkan wawasan dari dokumen yang disimpan dalam indeks menggunakan Amazon Kendra. Dengan fungsi ini, Anda dapat menghasilkan konten dari konteks dokumen-dokumen tersebut dan menerima tanggapan yang spesifik untuk kasus penggunaan bisnis Anda, sebagai lawan dari tanggapan yang umum terhadap sejumlah besar data di mana model yayasan dilatih. Untuk informasi selengkapnya tentang indeks di Amazon Kendra, lihat Panduan Pengembang [Amazon Kendra](https://docs.aws.amazon.com/kendra/latest/dg/what-is-kendra.html).

Jika Anda ingin mendapatkan tanggapan dari salah satu model foundation yang disesuaikan dengan data dan kasus penggunaan Anda, Anda dapat menyempurnakan model foundation. Untuk mempelajari selengkapnya, lihat [Model pondasi yang menyempurnakan](canvas-fm-chat-fine-tune.md).

*Jika Anda ingin mendapatkan prediksi dari model SageMaker JumpStart yayasan Amazon melalui aplikasi atau situs web, Anda dapat menerapkan model tersebut ke titik akhir SageMaker AI.* SageMaker Titik akhir AI menghosting model Anda, dan Anda dapat mengirim permintaan ke titik akhir melalui kode aplikasi Anda untuk menerima prediksi dari model. Untuk informasi selengkapnya, lihat [Menerapkan model Anda ke titik akhir](canvas-deploy-model.md).

# Lengkapi prasyarat untuk model pondasi di Canvas SageMaker
<a name="canvas-fm-chat-prereqs"></a>

Bagian berikut menguraikan prasyarat untuk berinteraksi dengan model dasar dan menggunakan fitur kueri dokumen di Canvas. Sisa konten di halaman ini mengasumsikan bahwa Anda telah memenuhi prasyarat untuk model pondasi. Fitur kueri dokumen memerlukan izin tambahan.

## Prasyarat untuk model pondasi
<a name="canvas-fm-chat-prereqs-fm"></a>

Izin yang Anda perlukan untuk berinteraksi dengan model disertakan dalam izin Ready-to-use model Canvas. Untuk menggunakan model generatif yang didukung AI di Canvas, Anda harus mengaktifkan izin **konfigurasi Ready-to-use model Canvas** saat menyiapkan domain Amazon SageMaker AI Anda. Untuk informasi selengkapnya, lihat [Prasyarat untuk menyiapkan Amazon Canvas SageMaker](canvas-getting-started.md#canvas-prerequisites). **Konfigurasi Ready-to-use model Canvas** melampirkan kebijakan [AmazonSageMakerCanvasAIServicesAccess](https://docs.aws.amazon.com/sagemaker/latest/dg/security-iam-awsmanpol-canvas.html#security-iam-awsmanpol-AmazonSageMakerCanvasAIServicesAccess) ke peran eksekusi pengguna Canvas AWS Identity and Access Management (IAM) Anda. Jika Anda mengalami masalah dengan pemberian izin, lihat topiknya. [Memecahkan masalah dengan pemberian izin melalui konsol AI SageMaker](canvas-limits.md#canvas-troubleshoot-trusted-services)

Jika sudah menyiapkan domain, Anda dapat mengedit pengaturan domain dan mengaktifkan izin. Untuk petunjuk tentang cara mengedit setelan domain Anda, lihat[Edit pengaturan domain](domain-edit.md). Saat mengedit pengaturan untuk domain Anda, buka **pengaturan Canvas** dan nyalakan opsi **Aktifkan Ready-to-use model Canvas**.

Model JumpStart foundation tertentu juga mengharuskan Anda meminta peningkatan kuota instans SageMaker AI. Canvas menghosting model yang saat ini berinteraksi dengan Anda pada instans ini, tetapi kuota default untuk akun Anda mungkin tidak mencukupi. Jika Anda mengalami kesalahan saat menjalankan salah satu model berikut, minta peningkatan kuota untuk jenis instance terkait:
+ Falcon-40B —, `ml.g5.12xlarge` `ml.g5.24xlarge`
+ Falcon-13B —,, `ml.g5.2xlarge` `ml.g5.4xlarge` `ml.g5.8xlarge`
+ MPT-7B-Instruksikan -,, `ml.g5.2xlarge` `ml.g5.4xlarge` `ml.g5.8xlarge`

Untuk jenis instans sebelumnya, minta peningkatan dari 0 menjadi 1 untuk kuota penggunaan titik akhir. Untuk informasi selengkapnya tentang cara meningkatkan kuota instans untuk akun Anda, lihat [Meminta peningkatan kuota di Panduan Pengguna *Service* Quotas](https://docs.aws.amazon.com/servicequotas/latest/userguide/request-quota-increase.html).

## Prasyarat untuk kueri dokumen
<a name="canvas-fm-chat-prereqs-kendra"></a>

**catatan**  
Kueri dokumen didukung sebagai berikut Wilayah AWS: AS Timur (Virginia N.), AS Timur (Ohio), AS Barat (Oregon), Eropa (Irlandia), Asia Pasifik (Singapura), Asia Pasifik (Sydney), Asia Pasifik (Tokyo), dan Asia Pasifik (Mumbai).

Fitur kueri dokumen mengharuskan Anda sudah memiliki indeks Amazon Kendra yang menyimpan dokumen dan metadata dokumen Anda. Untuk informasi selengkapnya tentang Amazon Kendra, lihat Panduan Pengembang [Amazon Kendra](https://docs.aws.amazon.com/kendra/latest/dg/what-is-kendra.html). *Untuk mempelajari lebih lanjut tentang kuota untuk mengkueri indeks, lihat [Kuota di Panduan Pengembang](https://docs.aws.amazon.com/kendra/latest/dg/quotas.html) Amazon Kendra.*

Anda juga harus memastikan bahwa profil pengguna Canvas Anda memiliki izin yang diperlukan untuk kueri dokumen. [AmazonSageMakerCanvasFullAccess](https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerCanvasFullAccess.html)Kebijakan harus dilampirkan ke peran eksekusi AWS IAM untuk domain SageMaker AI yang menghosting aplikasi Canvas Anda (kebijakan ini dilampirkan secara default ke semua profil pengguna Canvas baru dan yang sudah ada). Anda juga harus secara khusus memberikan izin kueri dokumen dan menentukan akses ke satu atau beberapa indeks Amazon Kendra.

Jika administrator Canvas Anda menyiapkan domain atau profil pengguna baru, minta mereka menyiapkan domain dengan mengikuti petunjuk di[Prasyarat untuk menyiapkan Amazon Canvas SageMaker](canvas-getting-started.md#canvas-prerequisites). Saat menyiapkan domain, mereka dapat mengaktifkan izin kueri dokumen melalui konfigurasi ** Ready-to-usemodel Canvas**.

Administrator Canvas dapat mengelola izin kueri dokumen di tingkat profil pengguna juga. Misalnya, jika administrator ingin memberikan izin kueri dokumen ke beberapa profil pengguna tetapi menghapus izin untuk orang lain, mereka dapat mengedit izin untuk pengguna tertentu.

Prosedur berikut menunjukkan cara mengaktifkan izin kueri dokumen untuk profil pengguna tertentu:

1. Buka konsol SageMaker AI di [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Di panel navigasi kiri, pilih **Konfigurasi admin**.

1. Di bawah **konfigurasi Admin**, pilih **domain**.

1. Dari daftar domain, pilih domain profil pengguna.

1. Pada halaman **detail domain**, pilih **profil Pengguna** yang izinnya ingin Anda edit.

1. Pada halaman **Detail Pengguna**, pilih **Edit**.

1. Di panel navigasi kiri, pilih **Pengaturan kanvas**.

1. Di bagian **konfigurasi Ready-to-use model Canvas**, aktifkan tombol **Aktifkan kueri dokumen menggunakan Amazon Kendra**.

1. Di dropdown, pilih satu atau beberapa indeks Amazon Kendra yang ingin Anda berikan aksesnya.

1. Pilih **Kirim** untuk menyimpan perubahan pada pengaturan domain Anda.

Anda sekarang harus dapat menggunakan model dasar Canvas untuk menanyakan dokumen dalam indeks Amazon Kendra yang ditentukan.

# Mulai percakapan baru untuk menghasilkan, mengekstrak, atau meringkas konten
<a name="canvas-fm-chat-new"></a>

Untuk memulai dengan model foundation AI generatif di Canvas, Anda dapat memulai sesi obrolan baru dengan salah satu model. Untuk JumpStart model, Anda dikenakan biaya saat model aktif, jadi Anda harus memulai model saat Anda ingin menggunakannya dan mematikannya ketika Anda selesai berinteraksi. Jika Anda tidak mematikan JumpStart model, Canvas mematikannya setelah 2 jam tidak aktif. Untuk model Amazon Bedrock (seperti Amazon Titan), Anda dikenakan biaya dengan prompt; model sudah aktif dan tidak perlu dimulai atau dimatikan. Anda dikenakan biaya langsung untuk penggunaan model ini oleh Amazon Bedrock.

Untuk membuka obrolan dengan model, lakukan hal berikut:

1. Buka aplikasi SageMaker Canvas.

1. Di panel navigasi kiri, pilih **eady-to-usemodel R**.

1. Pilih **Menghasilkan, mengekstrak, dan meringkas konten**.

1. Pada halaman selamat datang, Anda akan menerima rekomendasi untuk memulai model default. Anda dapat memulai model yang direkomendasikan, atau Anda dapat memilih **Pilih model lain** dari dropdown untuk memilih yang berbeda.

1. Jika Anda memilih model JumpStart pondasi, Anda harus memulainya sebelum tersedia untuk digunakan. Pilih **Mulai model**, dan kemudian model diterapkan ke instance SageMaker AI. Mungkin perlu beberapa menit untuk menyelesaikan ini. Saat model sudah siap, Anda dapat memasukkan petunjuk dan mengajukan pertanyaan model.

   Jika Anda memilih model pondasi dari Amazon Bedrock, Anda dapat mulai menggunakannya secara instan dengan memasukkan prompt dan mengajukan pertanyaan.

Tergantung pada modelnya, Anda dapat melakukan berbagai tugas. Misalnya, Anda dapat memasukkan bagian teks dan meminta model untuk meringkasnya. Atau, Anda dapat meminta model untuk membuat ringkasan singkat tentang tren pasar di domain Anda.

Respons model dalam obrolan didasarkan pada konteks permintaan Anda sebelumnya. Jika Anda ingin mengajukan pertanyaan baru di obrolan yang tidak terkait dengan topik percakapan sebelumnya, kami sarankan Anda memulai obrolan baru dengan model tersebut.

# Ekstrak informasi dari dokumen dengan kueri dokumen
<a name="canvas-fm-chat-query"></a>

**catatan**  
Bagian ini mengasumsikan bahwa Anda telah menyelesaikan bagian di atas[Prasyarat untuk kueri dokumen](canvas-fm-chat-prereqs.md#canvas-fm-chat-prereqs-kendra).

Kueri dokumen adalah fitur yang dapat Anda gunakan saat berinteraksi dengan model dasar di Canvas. Dengan kueri dokumen, Anda dapat mengakses kumpulan dokumen yang disimpan dalam indeks Amazon *Kendra*, yang menyimpan konten dokumen Anda dan disusun sedemikian rupa untuk membuat dokumen dapat dicari. Anda dapat mengajukan pertanyaan spesifik yang ditargetkan ke data dalam indeks Amazon Kendra Anda, dan model yayasan mengembalikan jawaban atas pertanyaan Anda. Misalnya, Anda dapat menanyakan basis pengetahuan internal informasi TI dan mengajukan pertanyaan seperti “Bagaimana cara saya terhubung ke jaringan perusahaan saya?” Untuk informasi selengkapnya tentang menyiapkan indeks, lihat Panduan [Pengembang Amazon Kendra](https://docs.aws.amazon.com/kendra/latest/dg/what-is-kendra.html).

Saat menggunakan fitur kueri dokumen, model dasar membatasi tanggapan mereka terhadap konten dokumen dalam indeks Anda dengan teknik yang disebut Retrieval Augmented Generation (RAG). Teknik ini menggabungkan informasi yang paling relevan dari indeks bersama dengan prompt pengguna dan mengirimkannya ke model foundation untuk mendapatkan respons. Respons terbatas pada apa yang dapat ditemukan di indeks Anda, mencegah model memberi Anda respons yang salah berdasarkan data eksternal. Untuk informasi lebih lanjut tentang proses ini, lihat posting blog [Membangun aplikasi AI Generatif dengan akurasi tinggi dengan cepat pada data perusahaan](https://aws.amazon.com/blogs/machine-learning/quickly-build-high-accuracy-generative-ai-applications-on-enterprise-data-using-amazon-kendra-langchain-and-large-language-models/).

Untuk memulai, dalam obrolan dengan model dasar di Canvas, aktifkan sakelar **Kueri dokumen** di bagian atas halaman. Dari dropdown, pilih indeks Amazon Kendra yang ingin Anda kueri. Kemudian, Anda dapat mulai mengajukan pertanyaan terkait dengan dokumen dalam indeks Anda.

**penting**  
Kueri dokumen mendukung [Bandingkan output model](canvas-fm-chat-compare.md) fitur ini. Setiap riwayat obrolan yang ada akan ditimpa saat Anda memulai obrolan baru untuk membandingkan output model.

# Mulai model
<a name="canvas-fm-chat-manage"></a>

**catatan**  
Bagian berikut menjelaskan model start up, yang hanya berlaku untuk model JumpStart pondasi, seperti Falcon-40B-Instruct. Anda dapat mengakses model Amazon Bedrock, seperti Amazon Titan, secara instan kapan saja.

Anda dapat memulai JumpStart model sebanyak yang Anda suka. Setiap JumpStart model aktif dikenakan biaya pada akun Anda, jadi kami menyarankan Anda untuk tidak memulai lebih banyak model daripada yang Anda gunakan saat ini.

Untuk memulai model lain, Anda dapat melakukan hal berikut:

1. Pada halaman **Menghasilkan, mengekstrak, dan meringkas konten**, pilih **Obrolan baru**.

1. Pilih model dari menu dropdown. Jika Anda ingin memilih model yang tidak ditampilkan di dropdown, pilih **Mulai model lain**, lalu pilih model yang ingin Anda mulai.

1. Pilih **model Mulai**.

Model akan mulai memulai, dan dalam beberapa menit Anda dapat mengobrol dengan model.

# Matikan model
<a name="canvas-fm-chat-shut-down"></a>

Kami sangat menyarankan Anda mematikan model yang tidak Anda gunakan. Model secara otomatis mati setelah 2 jam tidak aktif. Namun, untuk mematikan model secara manual, Anda dapat melakukan hal berikut:

1. Pada halaman **Menghasilkan, mengekstrak, dan meringkas konten**, buka obrolan untuk model yang ingin Anda matikan.

1. Pada halaman obrolan, pilih ikon **Opsi lainnya** (![\[Vertical ellipsis icon representing a menu or more options.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png)).

1. Pilih **Shut down model**.

1. Di kotak **Matikan konfirmasi model**, pilih **Matikan**.

Model mulai dimatikan. Jika obrolan Anda membandingkan dua model atau lebih, Anda dapat mematikan model individual dari halaman obrolan dengan memilih ikon **Opsi Lainnya** (![\[Vertical ellipsis icon representing a menu or more options.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png)) model dan kemudian memilih **Matikan model**.

# Bandingkan output model
<a name="canvas-fm-chat-compare"></a>

Anda mungkin ingin membandingkan output dari model yang berbeda secara berdampingan untuk melihat output model mana yang Anda sukai. Ini dapat membantu Anda memutuskan model mana yang paling cocok untuk kasus penggunaan Anda. Anda dapat membandingkan hingga tiga model dalam obrolan.

**catatan**  
Setiap model individu dikenakan biaya pada akun Anda.

Anda harus memulai obrolan baru untuk menambahkan model untuk perbandingan. Untuk membandingkan output model secara berdampingan dalam obrolan, lakukan hal berikut:

1. Dalam obrolan, pilih **Obrolan baru**.

1. Pilih **Bandingkan**, dan gunakan menu tarik-turun untuk memilih model yang ingin Anda tambahkan. Untuk menambahkan model ketiga, pilih **Bandingkan** lagi untuk menambahkan model lain.
**catatan**  
Jika Anda ingin menggunakan JumpStart model yang saat ini tidak aktif, Anda diminta untuk memulai model.

Saat model aktif, Anda melihat kedua model berdampingan dalam obrolan. Anda dapat mengirimkan prompt Anda, dan setiap model merespons dalam obrolan yang sama, seperti yang ditunjukkan pada gambar berikut.

![\[Tangkapan layar antarmuka Canvas dengan output dari dua model yang ditampilkan berdampingan.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/studio/canvas/canvas-chat-compare-outputs.png)


Setelah selesai berinteraksi, pastikan untuk mematikan JumpStart model apa pun secara individual untuk menghindari biaya lebih lanjut.

# Model pondasi yang menyempurnakan
<a name="canvas-fm-chat-fine-tune"></a>

Model dasar yang dapat Anda akses melalui Amazon SageMaker Canvas dapat membantu Anda dengan berbagai tugas tujuan umum. Namun, jika Anda memiliki kasus penggunaan tertentu dan ingin respons yang disesuaikan berdasarkan data Anda sendiri, Anda dapat *menyempurnakan model* dasar.

Untuk menyempurnakan model pondasi, Anda menyediakan kumpulan data yang terdiri dari petunjuk sampel dan respons model. Kemudian, Anda melatih model pondasi pada data. Akhirnya, model pondasi yang disetel dengan baik dapat memberi Anda respons yang lebih spesifik.

Daftar berikut berisi model dasar yang dapat Anda sesuaikan di Canvas:
+ Titan Ekspres
+ Falcon-7B
+ Instruksi Falcon-7B
+ Instruksi Falcon-40B
+ Falcon-40B
+ Flan-T5-Besar
+ Flan-T5-XL
+ Flan-T5-Xxl
+ MPT-7B
+ Instruksi MPT-7B

Anda dapat mengakses informasi lebih rinci tentang setiap model pondasi dalam aplikasi Canvas sambil menyempurnakan model. Untuk informasi selengkapnya, lihat [Sempurnakan modelnya](#canvas-fm-chat-fine-tune-procedure-model).

Topik ini menjelaskan cara menyempurnakan model foundation di Canvas.

## Sebelum Anda mulai
<a name="canvas-fm-chat-fine-tune-prereqs"></a>

Sebelum menyempurnakan model foundation, pastikan Anda memiliki izin untuk Ready-to-use model di Canvas dan peran AWS Identity and Access Management eksekusi yang memiliki hubungan kepercayaan dengan Amazon Bedrock, yang memungkinkan Amazon Bedrock untuk mengambil peran Anda sambil menyempurnakan model foundation.

Saat menyiapkan atau mengedit domain Amazon SageMaker AI Anda, Anda harus 1) mengaktifkan izin konfigurasi Ready-to-use model Canvas, dan 2) membuat atau menentukan peran Amazon Bedrock, yang merupakan peran eksekusi IAM di mana SageMaker AI melampirkan hubungan kepercayaan dengan Amazon Bedrock. Untuk informasi selengkapnya tentang mengonfigurasi setelan ini, lihat[Prasyarat untuk menyiapkan Amazon Canvas SageMaker](canvas-getting-started.md#canvas-prerequisites).

Anda dapat mengonfigurasi peran Amazon Bedrock secara manual jika Anda lebih suka menggunakan peran eksekusi IAM Anda sendiri (daripada membiarkan SageMaker AI membuatnya atas nama Anda). Untuk informasi selengkapnya tentang mengonfigurasi hubungan kepercayaan peran eksekusi IAM Anda sendiri dengan Amazon Bedrock, lihat. [Berikan Izin Pengguna untuk Menggunakan Amazon Bedrock dan Fitur Generatif AI di Canvas](canvas-fine-tuning-permissions.md)

Anda juga harus memiliki kumpulan data yang diformat untuk menyempurnakan model bahasa besar (). LLMs Berikut ini adalah daftar persyaratan untuk dataset Anda:
+ Dataset harus berbentuk tabel dan berisi setidaknya dua kolom data teks — satu kolom input (yang berisi contoh petunjuk ke model) dan satu kolom keluaran (yang berisi contoh respons dari model).

  Contohnya adalah sebagai berikut:     
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/canvas-fm-chat-fine-tune.html)
+ Kami merekomendasikan bahwa kumpulan data memiliki setidaknya 100 pasangan teks (baris item input dan output yang sesuai). Ini memastikan bahwa model pondasi memiliki data yang cukup untuk fine-tuning dan meningkatkan akurasi responsnya.
+ Setiap item input dan output harus berisi maksimal 512 karakter. Apa pun yang lebih lama dikurangi menjadi 512 karakter saat menyempurnakan model pondasi.

Saat menyempurnakan model Amazon Bedrock, Anda harus mematuhi kuota Amazon Bedrock. Untuk informasi selengkapnya, lihat [Kuota penyesuaian model](https://docs.aws.amazon.com/bedrock/latest/userguide/quotas.html#model-customization-quotas) di *Panduan Pengguna Amazon Bedrock*.

Untuk informasi selengkapnya tentang persyaratan dan batasan kumpulan data umum di Canvas, lihat[Buat kumpulan data](canvas-import-dataset.md).

## Sempurnakan model pondasi
<a name="canvas-fm-chat-fine-tune-procedure"></a>

Anda dapat menyempurnakan model foundation dengan menggunakan salah satu metode berikut dalam aplikasi Canvas:
+ Saat dalam **Menghasilkan, mengekstrak, dan meringkas obrolan konten** dengan model foundation, pilih ikon **model Fine-tune (**). ![\[Magnifying glass icon with a plus sign, indicating a search or zoom-in function.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/studio/canvas/wrench-icon-small.png)
+ Saat dalam obrolan dengan model foundation, jika Anda telah membuat ulang respons dua kali atau lebih, Canvas menawarkan opsi untuk **menyempurnakan** model. Tangkapan layar berikut menunjukkan kepada Anda seperti apa tampilannya.  
![\[Screenshot dari opsi Fine-tune foundation model yang ditampilkan dalam obrolan.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/studio/canvas/fine-tuning-ingress.png)
+ Pada halaman **Model saya**, Anda dapat membuat model baru dengan memilih **Model baru**, lalu pilih **Fine-tune foundation** model.
+ Pada halaman beranda **Ready-to-use model**, Anda dapat memilih **Buat model Anda sendiri**, dan kemudian di kotak dialog **Buat model baru**, pilih **Fine-tune foundation** model.
+ **Saat menjelajahi kumpulan data Anda di tab **Data Wrangler**, Anda dapat memilih kumpulan data dan memilih Buat model.** Kemudian, pilih model **foundation Fine-tune**.

Setelah Anda mulai menyempurnakan model, lakukan hal berikut:

### Pilih kumpulan data
<a name="canvas-fm-chat-fine-tune-procedure-select"></a>

Pada tab **Select** untuk menyempurnakan model, Anda memilih data yang ingin Anda latih model foundation.

Pilih kumpulan data yang ada atau buat kumpulan data baru yang memenuhi persyaratan yang tercantum di bagian[Sebelum Anda mulai](#canvas-fm-chat-fine-tune-prereqs). Untuk informasi selengkapnya tentang cara membuat kumpulan data, lihat[Buat kumpulan data](canvas-import-dataset.md).

Ketika Anda telah memilih atau membuat kumpulan data dan Anda siap untuk melanjutkan, **pilih Pilih kumpulan data**.

### Sempurnakan modelnya
<a name="canvas-fm-chat-fine-tune-procedure-model"></a>

Setelah memilih data Anda, Anda sekarang siap untuk memulai pelatihan dan menyempurnakan model.

Pada tab **Fine-tune**, lakukan hal berikut:

1. (Opsional) Pilih **Pelajari lebih lanjut tentang model fondasi kami** untuk mengakses informasi lebih lanjut tentang setiap model dan membantu Anda memutuskan model atau model fondasi mana yang akan diterapkan.

1. Untuk **Pilih hingga 3 model dasar**, buka menu tarik-turun dan periksa hingga 3 model dasar (hingga 2 JumpStart model dan 1 model Amazon Bedrock) yang ingin Anda sesuaikan selama pekerjaan pelatihan. Dengan menyempurnakan beberapa model foundation, Anda dapat membandingkan kinerjanya dan akhirnya memilih yang paling cocok untuk kasus penggunaan Anda sebagai model default. Untuk informasi selengkapnya tentang model default, lihat[Lihat kandidat model di papan peringkat model](canvas-evaluate-model-candidates.md).

1. Untuk **kolom Pilih Input**, pilih kolom data teks dalam kumpulan data Anda yang berisi contoh petunjuk model.

1. Untuk **kolom Select Output**, pilih kolom data teks dalam kumpulan data Anda yang berisi contoh respons model.

1. (Opsional) Untuk mengonfigurasi pengaturan lanjutan untuk pekerjaan pelatihan, pilih **Konfigurasi model**. Untuk informasi selengkapnya tentang pengaturan pembuatan model lanjutan, lihat[Konfigurasi bangunan model lanjutan](canvas-advanced-settings.md).

   Di jendela pop-up **Configure model**, lakukan hal berikut:

   1. Untuk **Hyperparameters**, Anda dapat menyesuaikan **hitungan Epoch**, **Ukuran Batch**, **Learning rate**, dan **Learning rate warmup untuk setiap model yang** Anda pilih. Untuk informasi selengkapnya tentang parameter ini, lihat [bagian Hyperparameters dalam JumpStart dokumentasi](https://docs.aws.amazon.com/sagemaker/latest/dg/jumpstart-fine-tune.html#jumpstart-hyperparameters).

   1. Untuk **Pemisahan data**, Anda dapat menentukan persentase cara membagi data antara **set Pelatihan dan set** **Validasi**.

   1. Untuk **runtime pekerjaan Max**, Anda dapat mengatur jumlah waktu maksimum Canvas menjalankan pekerjaan pembuatan. Fitur ini hanya tersedia untuk model JumpStart foundation.

   1. Setelah mengonfigurasi pengaturan, pilih **Simpan**.

1. Pilih **Fine-tune** untuk mulai melatih model fondasi yang Anda pilih.

Setelah pekerjaan fine-tuning dimulai, Anda dapat meninggalkan halaman. Saat model ditampilkan sebagai **Siap** di halaman **Model Saya**, model siap digunakan, dan sekarang Anda dapat menganalisis kinerja model fondasi yang disetel dengan baik.

### Analisis model pondasi yang disetel dengan baik
<a name="canvas-fm-chat-fine-tune-procedure-analyze"></a>

Pada tab **Analisis** model pondasi yang disetel dengan baik, Anda dapat melihat kinerja model.

Tab **Ikhtisar** di halaman ini menunjukkan kepada Anda skor kebingungan dan kerugian, bersama dengan analisis yang memvisualisasikan peningkatan model dari waktu ke waktu selama pelatihan. Tangkapan layar berikut menunjukkan tab **Ikhtisar**.

![\[Tab Analisis dari model pondasi yang disetel dengan baik di Canvas, menunjukkan kurva kebingungan dan kerugian.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/studio/canvas/canvas-fine-tune-analyze-2.png)


Di halaman ini, Anda dapat melihat visualisasi berikut:
+ **Kurva kebingungan** mengukur seberapa baik model memprediksi kata berikutnya secara berurutan, atau seberapa tata bahasa keluaran model tersebut. Idealnya, ketika model meningkat selama pelatihan, skor menurun dan menghasilkan kurva yang turun dan rata seiring waktu.
+ **Kurva Kerugian** mengukur perbedaan antara output yang benar dan output yang diprediksi model. Kurva kerugian yang menurun dan rata dari waktu ke waktu menunjukkan bahwa model meningkatkan kemampuannya untuk membuat prediksi yang akurat.

Tab **Metrik lanjutan** menunjukkan hiperparameter dan metrik tambahan untuk model Anda. Sepertinya tangkapan layar berikut:

![\[Tangkapan layar tab Metrik lanjutan dari model foundation yang disetel dengan baik di Canvas.\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/images/studio/canvas/canvas-fine-tune-metrics.png)


Tab **Metrik lanjutan** berisi informasi berikut:
+ Bagian **Explainability** berisi **Hyperparameters**, yang merupakan nilai yang ditetapkan sebelum pekerjaan untuk memandu fine-tuning model. Jika Anda tidak menentukan hyperparameters kustom dalam pengaturan lanjutan model di [Sempurnakan modelnya](#canvas-fm-chat-fine-tune-procedure-model) bagian, maka Canvas memilih hyperparameters default untuk Anda.

  Untuk JumpStart model, Anda juga dapat melihat metrik lanjutan [ROUGE (Recall-Oriented Understudy for Gisting Evaluation)](https://en.wikipedia.org/wiki/ROUGE_(metric)), yang mengevaluasi kualitas ringkasan yang dihasilkan oleh model. Ini mengukur seberapa baik model dapat merangkum poin-poin utama dari suatu bagian.
+ Bagian **Artefak** memberi Anda tautan ke artefak yang dihasilkan selama pekerjaan fine-tuning. Anda dapat mengakses data pelatihan dan validasi yang disimpan di Amazon S3, serta tautan ke laporan evaluasi model (untuk mempelajari lebih lanjut, lihat paragraf berikut).

Untuk mendapatkan lebih banyak wawasan evaluasi model, Anda dapat mengunduh laporan yang dihasilkan menggunakan [SageMaker Clarify](https://docs.aws.amazon.com/sagemaker/latest/dg/clarify-configure-processing-jobs.html), yang merupakan fitur yang dapat membantu Anda mendeteksi bias dalam model dan data Anda. Pertama, buat laporan dengan memilih **Hasilkan laporan evaluasi** di bagian bawah halaman. Setelah laporan dibuat, Anda dapat mengunduh laporan lengkap dengan memilih **Unduh laporan** atau dengan kembali ke bagian **Artefak**.

Anda juga dapat mengakses notebook Jupyter yang menunjukkan cara mereplikasi pekerjaan fine-tuning Anda dalam kode Python. Anda dapat menggunakan ini untuk mereplikasi atau membuat perubahan terprogram pada pekerjaan fine-tuning Anda atau mendapatkan pemahaman yang lebih dalam tentang bagaimana Canvas menyempurnakan model Anda. Untuk mempelajari lebih lanjut tentang notebook model dan cara mengaksesnya, lihat[Unduh notebook model](canvas-notebook.md).

Untuk informasi selengkapnya tentang cara menafsirkan informasi di tab **Analisis** model fondasi yang disetel dengan baik, lihat topiknya. [Evaluasi model](canvas-evaluate-model.md)

Setelah menganalisis tab **Gambaran Umum** dan **metrik lanjutan**, Anda juga dapat memilih untuk membuka **papan peringkat Model**, yang menampilkan daftar model dasar yang dilatih selama pembuatan. Model dengan skor kerugian terendah dianggap sebagai model berkinerja terbaik dan dipilih sebagai model **Default**, yang merupakan model yang analisisnya Anda lihat di tab **Analisis**. Anda hanya dapat menguji dan menerapkan model default. Untuk informasi selengkapnya tentang papan peringkat model dan cara mengubah model default, lihat. [Lihat kandidat model di papan peringkat model](canvas-evaluate-model-candidates.md)

### Uji model foundation yang disetel dengan baik dalam obrolan
<a name="canvas-fm-chat-fine-tune-procedure-test"></a>

Setelah menganalisis kinerja model pondasi yang disetel dengan baik, Anda mungkin ingin mengujinya atau membandingkan responsnya dengan model dasar. Anda dapat menguji model foundation yang disetel dengan baik dalam obrolan di fitur **Hasilkan, ekstrak, dan ringkaskan konten**.

Mulai obrolan dengan model yang disetel dengan memilih salah satu metode berikut:
+ Pada tab **Analisis** model yang disetel dengan baik, pilih **Uji dalam Ready-to-use** model dasar.
+ Pada halaman **Ready-to-use model** Canvas, pilih **Menghasilkan, mengekstrak, dan meringkas konten**. Kemudian, pilih **Obrolan baru** dan pilih versi model yang ingin Anda uji.

Model dimulai dalam obrolan, dan Anda dapat berinteraksi dengannya seperti model dasar lainnya. Anda dapat menambahkan lebih banyak model ke obrolan dan membandingkan outputnya. Untuk informasi selengkapnya tentang fungsionalitas obrolan, lihat[Model fondasi AI generatif di Kanvas SageMaker](canvas-fm-chat.md).

## Operasionalkan model pondasi yang disetel dengan baik
<a name="canvas-fm-chat-fine-tune-mlops"></a>

Setelah menyempurnakan model Anda di Canvas, Anda dapat melakukan hal berikut:
+ Daftarkan model ke Registry SageMaker Model untuk integrasi ke dalam MLOps proses organisasi Anda. Untuk informasi selengkapnya, lihat [Daftarkan versi model di SageMaker registri model AI](canvas-register-model.md).
+ *Terapkan model ke titik akhir SageMaker AI dan kirim permintaan ke model dari aplikasi atau situs web Anda untuk mendapatkan prediksi (atau inferensi).* Untuk informasi selengkapnya, lihat [Menerapkan model Anda ke titik akhir](canvas-deploy-model.md).

**penting**  
Anda hanya dapat mendaftarkan dan menerapkan model foundation fine-tuned JumpStart berbasis berbasis, bukan model berbasis Amazon Bedrock.