

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Fine-tune Amazon Nova model dengan fine-tuning yang diawasi
<a name="nova-2-sft-data-prep"></a>

Amazon NovaData 2.0 SFT menggunakan format Converse API yang sama dengan Amazon Nova 1.0, dengan penambahan bidang konten penalaran opsional. Untuk spesifikasi format lengkap, lihat [ReasoningContentBlock](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ReasoningContentBlock.html)dan [skema Converse API](https://docs.aws.amazon.com/bedrock/latest/userguide/conversation-inference-call.html).

**Fitur yang didukung:**
+ **Jenis input** - Teks, gambar, atau video di blok konten pengguna
+ **Konten asisten** - Text-only tanggapan dan konten penalaran
+ **Komposisi dataset** — Harus homogen. Pilih salah satu dari yang berikut ini: belokan teks saja, teks\+gambar berubah, atau teks\+video berubah

**penting**  
Anda tidak dapat mencampur gambar dan video dalam kumpulan data yang sama atau di belokan yang berbeda.

**Keterbatasan saat ini:**
+ **Penggunaan alat** - Meskipun penggunaan alat didukung dalam format input, saat ini tidak didukung oleh Amazon Nova 2.0 SFT. Menambahkan bagian alat dapat menyebabkan pekerjaan Anda gagal.
+ **Konten penalaran multimodal - Meskipun format Converse mendukung konten** penalaran berbasis gambar, ini tidak didukung oleh 2.0 SFT. Amazon Nova
+ **Set validasi** - Menyediakan set validasi mungkin didukung melalui UI tetapi tidak akan didukung selama pelatihan SFT.

**Format media yang didukung:**
+ **Gambar** - PNG, JPEG, GIF
+ **Video** - MOV, MKV, MP4

## Contoh format data
<a name="nova-2-sft-data-examples"></a>

------
#### [ Text-only ]

Contoh ini menunjukkan format teks dasar saja yang kompatibel dengan Amazon Nova 1.0.

```
{
  "schemaVersion": "bedrock-conversation-2024",
  "system": [
    {
      "text": "You are a digital assistant with a friendly personality"
    }
  ],
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "text": "What country is right next to Australia?"
        }
      ]
    },
    {
      "role": "assistant",
      "content": [
        {
          "text": "The closest country is New Zealand"
        }
      ]
    }
  ]
}
```

------
#### [ Text with reasoning ]

Contoh ini menunjukkan teks dengan konten penalaran opsional untuk Amazon Nova 2.0.

```
{
  "schemaVersion": "bedrock-conversation-2024",
  "system": [
    {
      "text": "You are a digital assistant with a friendly personality"
    }
  ],
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "text": "What country is right next to Australia?"
        }
      ]
    },
    {
      "role": "assistant",
      "content": [
        {
          "reasoningContent": {
            "reasoningText": {
              "text": "I need to use my world knowledge of geography to answer this question"
            }
          }
        },
        {
          "text": "The closest country to Australia is New Zealand, located to the southeast across the Tasman Sea."
        }
      ]
    }
  ]
}
```

**catatan**  
Saat ini, hanya `reasoningText` didukung di dalam`reasoningContent`. Konten penalaran multimodal belum tersedia.

------
#### [ Image \+ text ]

Contoh ini menunjukkan bagaimana memasukkan input gambar dengan teks.

```
{
  "schemaVersion": "bedrock-conversation-2024",
  "system": [
    {
      "text": "You are a helpful assistant."
    }
  ],
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "image": {
            "format": "jpeg",
            "source": {
              "s3Location": {
                "uri": "s3://your-bucket/your-path/your-image.jpg",
                "bucketOwner": "your-aws-account-id"
              }
            }
          }
        },
        {
          "text": "Which country is highlighted in the image?"
        }
      ]
    },
    {
      "role": "assistant",
      "content": [
        {
          "reasoningContent": {
            "reasoningText": {
              "text": "I will determine the highlighted country by examining its location on the map and using my geographical knowledge"
            }
          }
        },
        {
          "text": "The highlighted country is New Zealand"
        }
      ]
    }
  ]
}
```

------
#### [ Video \+ text ]

Contoh ini menunjukkan cara memasukkan input video dengan teks.

```
{
  "schemaVersion": "bedrock-conversation-2024",
  "system": [
    {
      "text": "You are a helpful assistant."
    }
  ],
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "video": {
            "format": "mp4",
            "source": {
              "s3Location": {
                "uri": "s3://your-bucket/your-path/your-video.mp4",
                "bucketOwner": "your-aws-account-id"
              }
            }
          }
        },
        {
          "text": "What is shown in this video?"
        }
      ]
    },
    {
      "role": "assistant",
      "content": [
        {
          "reasoningContent": {
            "reasoningText": {
              "text": "I will analyze the video content to identify key elements"
            }
          }
        },
        {
          "text": "The video shows a map with New Zealand highlighted"
        }
      ]
    }
  ]
}
```

------

## Konten penalaran
<a name="nova-2-reasoning-modes"></a>

Konten penalaran (juga disebut rantai pemikiran) menangkap langkah-langkah pemikiran menengah model sebelum menghasilkan jawaban akhir. Pada `assistant` gilirannya, gunakan `reasoningContent` bidang untuk memasukkan jejak penalaran ini.

**Bagaimana kerugian dihitung:**
+ **Dengan konten penalaran** — Kerugian pelatihan mencakup token penalaran dan token keluaran akhir
+ **Tanpa penalaran konten** - Kerugian pelatihan dihitung hanya pada token keluaran akhir

**Kapan mengaktifkan mode penalaran:** Atur `reasoning_enabled: true` konfigurasi pelatihan Anda saat Anda ingin model menghasilkan token pemikiran sebelum menghasilkan output akhir atau perlu meningkatkan kinerja pada tugas penalaran yang kompleks. Tetapkan `reasoning_enabled: false` saat Anda berlatih pada tugas-tugas sederhana yang tidak mendapat manfaat dari langkah-langkah penalaran eksplisit.

**catatan**  
Anda dapat mengaktifkan mode penalaran terlepas dari apakah data pelatihan Anda berisi konten penalaran. Namun, memasukkan jejak penalaran dalam data pelatihan Anda disarankan agar model dapat belajar dari contoh-contoh ini dan meningkatkan kualitas penalaran.

**Pedoman pemformatan:**
+ Gunakan teks biasa untuk penalaran konten.
+ Hindari tag markup seperti `<thinking>` dan `</thinking>` kecuali secara khusus diperlukan oleh tugas Anda.
+ Pastikan konten penalaran jelas dan relevan dengan proses pemecahan masalah.

**Konten penalaran yang efektif harus mencakup:**
+ Pikiran dan analisis menengah
+ Pengurangan logis dan langkah inferensi
+ Step-by-step pendekatan pemecahan masalah
+ Hubungan eksplisit antara langkah dan kesimpulan

Jika kumpulan data Anda tidak memiliki jejak penalaran, Anda dapat membuatnya menggunakan model berkemampuan penalaran seperti Nova Premier. Berikan pasangan input-output Anda ke model dan tangkap proses penalarannya untuk membangun kumpulan data yang diperbesar dengan alasan.

## Pedoman persiapan kumpulan data
<a name="nova-2-dataset-preparation"></a>

Tabel berikut memberikan panduan untuk mempersiapkan dataset pelatihan Anda.


**Pedoman persiapan kumpulan data**  

| Pedoman | Deskripsi | 
| --- | --- | 
| Ukuran dan kualitas |  [See the AWS documentation website for more details](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/nova-2-sft-data-prep.html)  | 
| Keanekaragaman | Sertakan beragam contoh yang melakukan hal berikut:[See the AWS documentation website for more details](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/nova-2-sft-data-prep.html) | 
| Pemformatan keluaran | Tentukan dengan jelas format output yang diinginkan dalam tanggapan asisten. Contohnya termasuk struktur JSON, tabel, format CSV, atau format kustom khusus untuk aplikasi Anda. | 
| Multi-turn percakapan |  [See the AWS documentation website for more details](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/nova-2-sft-data-prep.html)  | 
| Daftar periksa kualitas |  [See the AWS documentation website for more details](http://docs.aws.amazon.com/id_id/bedrock/latest/userguide/nova-2-sft-data-prep.html)  | 