

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Akses dan keamanan untuk model berbobot terbuka
<a name="rft-open-weight-access-security"></a>

Sebelum Anda memulai reinforcement fine-tuning (RFT), pastikan Anda memahami jenis akses yang dibutuhkan Amazon Bedrock untuk operasi. RFT-specific RFT memerlukan izin tambahan di luar fine-tuning standar karena kemampuan eksekusi fungsi reward.

## Prasyarat
<a name="fine-tuning-openai-prereq"></a>

Sebelum menggunakan API fine-tuning yang OpenAI kompatibel dengan Amazon Bedrock, pastikan Anda memiliki yang berikut:

1.  AWS Akun dengan izin yang sesuai untuk mengakses Amazon Bedrock

1. **Otentikasi** - Anda dapat mengautentikasi menggunakan:
   + Kunci Amazon Bedrock API (diperlukan untuk OpenAI SDK dan tersedia untuk permintaan HTTP)
   + AWS kredensil (didukung untuk permintaan HTTP)
**catatan**  
Jika Anda menggunakan kunci API term/long jangka pendek Amazon Bedrock, pastikan peran Anda memiliki akses ke izin kebijakan IAM berikut: dan. `AmazonBedrockMantleFullAccess` [Izin Lambda untuk fungsi hadiah](#openai-fine-tuning-lambda-permissions)

1. **OpenAISDK (opsional)** - Instal SDK OpenAI Python jika menggunakan permintaan. SDK-based 

1. **Variabel lingkungan** - Mengatur variabel lingkungan berikut:
   + `OPENAI_API_KEY`— Setel ke kunci API Amazon Bedrock Anda
   + `OPENAI_BASE_URL`— Setel ke titik akhir Amazon Bedrock untuk wilayah Anda (misalnya,) `https://bedrock-mantle.us-west-2.api.aws/v1`

   Untuk informasi selengkapnya, lihat [Respons API](bedrock-mantle.md#bedrock-mantle-responses).

1. **Data pelatihan** diformat sebagai file JSONL dengan tujuan. `fine-tune` Untuk informasi selengkapnya, lihat [Siapkan data untuk model berbobot terbuka](rft-prepare-data-open-weight.md).

## Izin Lambda untuk fungsi hadiah
<a name="openai-fine-tuning-lambda-permissions"></a>

Anda harus menambahkan izin pemanggilan Lambda. Berikut ini menunjukkan contoh kebijakan yang dapat Anda gunakan:

```
{
    "Version": "2012-10-17",		 	 	 
    "Statement": [
        {
            "Effect": "Allow",
            "Action": [
                "lambda:InvokeFunction"
            ],
            "Resource": [
                "arn:aws:lambda:*:*:function:{{reward-function-name}}"
            ]
        }
    ]
}
```

Anda juga dapat menggunakan model yang dihosting Amazon Bedrock sebagai Hakim untuk menyiapkan fungsi hadiah. Anda perlu menambahkan izin khusus untuk memanggil model dasar ke peran eksekusi Lambda. Di peran lambda, Anda dapat mengonfigurasi kebijakan terkelola ini untuk LLM untuk penilaian. Lihat [AmazonBedrockLimitedAccess](https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonBedrockLimitedAccess.html).

Berikut ini adalah contoh untuk menjalankan model foundation Amazon Bedrock sebagai hakim menggunakan Invoke API:

```
{
    "Version": "2012-10-17",		 	 	 
    "Statement": [
        {
            "Effect": "Allow",
            "Action": [
                "bedrock:InvokeModel"
            ],
            "Resource": [
                "arn:aws:bedrock:*:*:foundation-model/*"
            ]
        }
    ]
}
```