

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Mengaktifkan partisi speaker
<a name="conversation-diarization-med"></a>

Untuk mengaktifkan partisi speaker di Amazon Transcribe Medical, gunakan diarization *speaker*. Ini memungkinkan Anda untuk melihat apa yang dikatakan pasien dan apa yang dikatakan dokter dalam output transkripsi.

Saat Anda mengaktifkan diarisasi speaker, Amazon Transcribe Medis memberi label pada setiap *pembicara dengan pengenal* unik untuk setiap pembicara. *Ucapan* adalah unit pidato yang biasanya dipisahkan dari ucapan lain dengan diam. Dalam transkripsi batch, ucapan dari dokter dapat menerima label `spk_0` dan ucapan pasien dapat menerima label. `spk_1`

Jika ucapan dari satu pembicara tumpang tindih dengan ucapan dari pembicara lain, Amazon Transcribe Medis memerintahkannya dalam transkripsi pada waktu mulai mereka. Ucapan yang tumpang tindih dalam audio input tidak tumpang tindih dalam output transkripsi.

Anda dapat mengaktifkan diarisasi speaker saat Anda mentranskripsikan file audio menggunakan pekerjaan transkripsi batch, atau dalam aliran waktu nyata.

**Topics**
+ [Mengaktifkan partisi speaker dalam transkripsi batch](conversation-diarization-batch-med.md)
+ [Mengaktifkan partisi speaker dalam streaming waktu nyata](conversation-diarization-streaming-med.md)

# Mengaktifkan partisi speaker dalam transkripsi batch
<a name="conversation-diarization-batch-med"></a>

Anda dapat mengaktifkan partisi speaker dalam pekerjaan transkripsi batch menggunakan [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html)API atau. Konsol Manajemen AWS Ini memungkinkan Anda untuk mempartisi teks per pembicara dalam percakapan klinis-pasien dan menentukan siapa yang mengatakan apa dalam output transkripsi.

## Konsol Manajemen AWS
<a name="conversation-diarization-batch-med-console"></a>

Untuk menggunakan Konsol Manajemen AWS untuk mengaktifkan diarisasi speaker dalam pekerjaan transkripsi Anda, Anda mengaktifkan identifikasi audio dan kemudian partisi speaker.

1. Masuk ke [Konsol Manajemen AWS](https://console.aws.amazon.com/transcribe/).

1. Di panel navigasi, di bawah Amazon Transcribe Medis, pilih Pekerjaan **transkripsi**.

1. Pilih **Buat tugas**.

1. Pada halaman **Tentukan detail pekerjaan**, berikan informasi tentang pekerjaan transkripsi Anda.

1. Pilih **Berikutnya**.

1. Aktifkan **identifikasi Audio**.

1. Untuk **jenis identifikasi Audio**, pilih **Partisi speaker**.

1. Untuk **Jumlah speaker maksimum**, masukkan jumlah speaker maksimum yang menurut Anda berbicara dalam file audio Anda.

1. Pilih **Buat**.

## API
<a name="conversation-diarization-batch-med-api"></a>

**Untuk mengaktifkan partisi speaker menggunakan tugas transkripsi batch (API)**
+ Untuk [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_StartMedicalTranscriptionJob.html)API, tentukan yang berikut ini.

  1. Untuk`MedicalTranscriptionJobName`, tentukan nama yang unik di Anda Akun AWS.

  1. Untuk`LanguageCode`, tentukan kode bahasa yang sesuai dengan bahasa yang digunakan dalam file audio.

  1. Untuk `MediaFileUri` parameter `Media` objek, tentukan nama file audio yang ingin Anda transkripsikan.

  1. Untuk`Specialty`, tentukan spesialisasi medis dokter yang berbicara dalam file audio.

  1. Untuk `Type`, tentukan `CONVERSATION`.

  1. Untuk`OutputBucketName`, tentukan Amazon S3 ember untuk menyimpan hasil transkripsi.

  1. Untuk `Settings` objek, tentukan yang berikut ini.

     1. `ShowSpeakerLabels` – `true`.

     1. `MaxSpeakerLabels`— Bilangan bulat antara 2 dan 10 untuk menunjukkan jumlah speaker yang menurut Anda berbicara dalam audio Anda.

Permintaan berikut menggunakan AWS SDK untuk Python (Boto3) untuk memulai pekerjaan transkripsi batch dari dialog pasien dokter perawatan primer dengan partisi pembicara diaktifkan.

```
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_medical_transcription_job(
    MedicalTranscriptionJobName = job_name,
    Media={
        'MediaFileUri': job_uri
    },
    OutputBucketName = 'amzn-s3-demo-bucket',
    OutputKey = 'my-output-files/', 
    LanguageCode = 'en-US',
    Specialty = 'PRIMARYCARE',
    Type = 'CONVERSATION',
    OutputBucketName = 'amzn-s3-demo-bucket',
Settings = {'ShowSpeakerLabels': True,
         'MaxSpeakerLabels': 2
         }
         )
while True:
    status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name)
    if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)
```

Kode contoh berikut menunjukkan hasil transkripsi dari pekerjaan transkripsi dengan partisi speaker diaktifkan.

```
{
    "jobName": "job ID",
    "accountId": "111122223333",
    "results": {
        "transcripts": [
            {
                "transcript": "Professional answer."
            }
        ],
        "speaker_labels": {
            "speakers": 1,
            "segments": [
                {
                    "start_time": "0.000000",
                    "speaker_label": "spk_0",
                    "end_time": "1.430",
                    "items": [
                        {
                            "start_time": "0.100",
                            "speaker_label": "spk_0",
                            "end_time": "0.690"
                        },
                        {
                            "start_time": "0.690",
                            "speaker_label": "spk_0",
                            "end_time": "1.210"
                        }
                    ]
                }
            ]
        },
        "items": [
            {
                "start_time": "0.100",
                "end_time": "0.690",
                "alternatives": [
                    {
                        "confidence": "0.8162",
                        "content": "Professional"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "0.690",
                "end_time": "1.210",
                "alternatives": [
                    {
                        "confidence": "0.9939",
                        "content": "answer"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "alternatives": [
                    {
                        "content": "."
                    }
                ],
                "type": "punctuation"
            }
        ]
    },
    "status": "COMPLETED"
}
```

## AWS CLI
<a name="diarization-batch-cli"></a>

**Untuk mentranskripsikan file audio percakapan antara dokter yang mempraktikkan perawatan primer dan pasien ()AWS CLI**
+ Jalankan kode berikut.

  ```
                      
  aws transcribe start-transcription-job \
  --region us-west-2 \
  --cli-input-json file://example-start-command.json
  ```

  Kode berikut menunjukkan isi dari`example-start-command.json`.

  ```
  {
      "MedicalTranscriptionJobName": "my-first-med-transcription-job",       
       "Media": {
            "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac"
        },
        "OutputBucketName": "amzn-s3-demo-bucket",
        "OutputKey": "my-output-files/", 
        "LanguageCode": "en-US",
        "Specialty": "PRIMARYCARE",
        "Type": "CONVERSATION",
        "Settings":{
            "ShowSpeakerLabels": true,
            "MaxSpeakerLabels": 2
          }
  }
  ```

# Mengaktifkan partisi speaker dalam streaming waktu nyata
<a name="conversation-diarization-streaming-med"></a>

Untuk mempartisi speaker dan memberi label pidato mereka dalam aliran waktu nyata, gunakan Konsol Manajemen AWS atau permintaan streaming. Partisi speaker bekerja paling baik untuk antara dua dan lima speaker dalam satu aliran. Meskipun Amazon Transcribe Medical dapat mempartisi lebih dari lima speaker dalam satu aliran, akurasi partisi berkurang jika Anda melebihi angka itu.

Untuk memulai permintaan HTTP/2, gunakan API. [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html) Untuk memulai WebSocket permintaan, gunakan URI yang telah ditandatangani sebelumnya. URI berisi informasi yang diperlukan untuk mengatur komunikasi dua arah antara aplikasi Anda dan Medis. Amazon Transcribe 

## Mengaktifkan partisi speaker dalam audio yang diucapkan ke mikrofon Anda ()Konsol Manajemen AWS
<a name="conversation-diarization-console"></a>

Anda dapat menggunakannya Konsol Manajemen AWS untuk memulai aliran real-time dari percakapan klinis-pasien, atau dikte yang diucapkan ke mikrofon Anda secara real-time.

1. Masuk ke [Konsol Manajemen AWS](https://console.aws.amazon.com/transcribe/).

1. Di panel navigasi, untuk Amazon Transcribe Medis pilih **Transkripsi waktu nyata**.

1. Untuk **jenis input Audio**, pilih jenis pidato medis yang ingin Anda transkripsikan.

1. Untuk **Pengaturan tambahan**, pilih **Partisi speaker**.

1. Pilih **Mulai streaming** untuk mulai mentranskripsikan audio waktu nyata Anda.

1. Bicaralah ke mikrofon.

## Mengaktifkan partisi speaker dalam aliran HTTP/2
<a name="conversation-diarization-med-http2"></a>

Untuk mengaktifkan partisi speaker dalam aliran HTTP/2 percakapan medis, gunakan [https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html](https://docs.aws.amazon.com/transcribe/latest/APIReference/API_streaming_StartMedicalStreamTranscription.html)API dan tentukan yang berikut ini: 
+ Untuk`LanguageCode`, tentukan kode bahasa yang sesuai dengan bahasa dalam aliran. Nilai yang valid adalah`en-US`.
+ Untuk`MediaSampleHertz`, tentukan laju sampel audio.
+ Untuk`Specialty`, tentukan spesialisasi medis penyedia.
+ `ShowSpeakerLabel` – `true`

Untuk informasi lebih lanjut tentang menyiapkan aliran HTTP/2 untuk mentranskripsikan percakapan medis, lihat. [Menyiapkan aliran HTTP/2](streaming-setting-up.md#streaming-http2)

## Mengaktifkan partisi speaker dalam permintaan WebSocket
<a name="conversation-diarization-med-websocket"></a>

Untuk mempartisi speaker dalam WebSocket aliran dengan API, gunakan format berikut untuk membuat URI yang telah ditandatangani sebelumnya untuk memulai WebSocket permintaan dan disetel `show-speaker-label` ke. `true` 

```
GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/medical-stream-transcription-websocket
?language-code=languageCode
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=Signature Version 4 signature 
&X-Amz-SignedHeaders=host
&media-encoding=flac
&sample-rate=16000
&session-id=sessionId
&specialty=medicalSpecialty
&type=CONVERSATION
&vocabulary-name=vocabularyName
&show-speaker-label=boolean
```

Kode berikut menunjukkan contoh respons terpotong dari permintaan streaming.

```
{
  "Transcript": {
    "Results": [
      {
        "Alternatives": [
          {
            "Items": [
              {
                "Confidence": 0.97,
                "Content": "From",
                "EndTime": 18.98,
                "Speaker": "0",
                "StartTime": 18.74,
                "Type": "pronunciation",
                "VocabularyFilterMatch": false
              },
              {
                "Confidence": 1,
                "Content": "the",
                "EndTime": 19.31,
                "Speaker": "0",
                "StartTime": 19,
                "Type": "pronunciation",
                "VocabularyFilterMatch": false
              },
              {
                "Confidence": 1,
                "Content": "last",
                "EndTime": 19.86,
                "Speaker": "0",
                "StartTime": 19.32,
                "Type": "pronunciation",
                "VocabularyFilterMatch": false
              },
             ...
              {
                "Confidence": 1,
                "Content": "chronic",
                "EndTime": 22.55,
                "Speaker": "0",
                "StartTime": 21.97,
                "Type": "pronunciation",
                "VocabularyFilterMatch": false
              },
              ...
                "Confidence": 1,
                "Content": "fatigue",
                "EndTime": 24.42,
                "Speaker": "0",
                "StartTime": 23.95,
                "Type": "pronunciation",
                "VocabularyFilterMatch": false
              },
              {
                "EndTime": 25.22,
                "StartTime": 25.22,
                "Type": "speaker-change",
                "VocabularyFilterMatch": false
              },
              {
                "Confidence": 0.99,
                "Content": "True",
                "EndTime": 25.63,
                "Speaker": "1",
                "StartTime": 25.22,
                "Type": "pronunciation",
                "VocabularyFilterMatch": false
              },
              {
                "Content": ".",
                "EndTime": 25.63,
                "StartTime": 25.63,
                "Type": "punctuation",
                "VocabularyFilterMatch": false
              }
            ],
            "Transcript": "From the last note she still has mild sleep deprivation and chronic fatigue True."
          }
        ],
        "EndTime": 25.63,
        "IsPartial": false,
        "ResultId": "XXXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXX",
        "StartTime": 18.74
      }
    ]
  }
}
```

Amazon Transcribe Medis memecah aliran audio masuk Anda berdasarkan segmen ucapan alami, seperti perubahan speaker atau jeda dalam audio. Transkripsi dikembalikan secara progresif ke aplikasi Anda, dengan setiap respons berisi lebih banyak ucapan yang ditranskripsi hingga seluruh segmen ditranskripsi. Kode sebelumnya adalah contoh terpotong dari segmen ucapan yang ditranskripsi sepenuhnya. Label speaker hanya muncul untuk segmen yang sepenuhnya ditranskripsi. 

Daftar berikut menunjukkan organisasi objek dan parameter dalam output transkripsi streaming.

**`Transcript`**  
Setiap segmen pidato memiliki `Transcript` objeknya sendiri.

**`Results`**  
Setiap `Transcript` objek memiliki objeknya sendiri`Results`. Objek ini berisi `isPartial` bidang. Ketika nilainya`false`, hasil yang dikembalikan adalah untuk seluruh segmen pidato.

**`Alternatives`**  
Setiap `Results` objek memiliki `Alternatives` objek.

**`Items`**  
Setiap `Alternatives` objek memiliki `Items` objeknya sendiri yang berisi informasi tentang setiap kata dan tanda baca dalam keluaran transkripsi. Saat Anda mengaktifkan partisi speaker, setiap kata memiliki `Speaker` label untuk segmen ucapan yang ditranskripsi sepenuhnya. Amazon Transcribe Medis menggunakan label ini untuk menetapkan bilangan bulat unik untuk setiap pembicara dalam aliran. `Type`Parameter yang memiliki nilai `speaker-change` menunjukkan bahwa satu orang telah berhenti berbicara dan orang lain akan segera memulai.

**`Transcript`**  
Setiap objek Item berisi segmen ucapan yang ditranskripsi sebagai nilai `Transcript` bidang.

Untuk informasi selengkapnya tentang WebSocket permintaan, lihat[Menyiapkan WebSocket aliran](streaming-setting-up.md#streaming-websocket).