

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# Amazon Titan Image Generator G1 모델
<a name="titan-image-models"></a>

Amazon Titan Image Generator G1은 사용자가 다양한 방식으로 이미지를 생성하고 편집할 수 있는 이미지 생성 모델입니다. 사용자가 자연어 프롬프트를 입력하기만 하면 텍스트 기반 설명과 일치하는 이미지를 생성할 수 있습니다. 또한 마스크 없이 텍스트 기반 프롬프트를 적용하거나 이미지 마스크를 사용하여 이미지의 특정 부분을 편집하는 등 기존 이미지를 업로드하고 편집할 수 있습니다. 또한 이 모델은 이미지의 경계를 확장하는 아웃페인팅과 누락된 영역을 채우는 인페인팅을 지원합니다. 선택적 텍스트 프롬프트를 기반으로 이미지의 변형을 생성할 수 있는 기능과, 사용자가 참조 이미지를 사용하여 스타일을 전송하거나 여러 참조의 스타일을 결합할 수 있는 즉각적인 사용자 지정 옵션을 제공하며, 이 모든 옵션에서 미세 조정이 필요하지 않습니다.

Amazon Titan Image Generator G1 v2에는 여러 고급 기능이 추가되었습니다. 이러한 기능으로 사용자는 참조 이미지를 활용하여 이미지 생성에 가이드를 제공할 수 있습니다. 여기서 출력 이미지는 텍스트 프롬프트를 따라가면서 참조 이미지의 레이아웃 및 구성에 맞게 생성됩니다. 또한 사용자 입력 없이 여러 객체가 포함된 이미지에서 배경을 제거할 수 있는 자동 배경 제거 기능도 포함되어 있습니다. 이 모델은 생성된 이미지의 색상 팔레트를 정확하게 제어하므로 사용자는 추가적인 미세 조정 없이도 브랜드의 시각적 아이덴티티를 유지할 수 있습니다. 또한 주제 일관성 기능을 사용하면 사용자가 참조 이미지로 모델을 미세 조정하여, 생성된 이미지에서 선택한 주제(예: 반려동물, 신발 또는 핸드백)를 유지할 수 있습니다. 이 포괄적인 기능 모음을 통해 사용자는 창의적 잠재력과 풍부한 상상력을 발휘하여 비전을 실현할 수 있습니다.

Amazon Titan Image Generator G1 모델 프롬프트 엔지니어링 지침에 대한 자세한 내용은 [Amazon Titan Image Generator Prompt Engineering 모범 사례를](https://d2eo22ngex1n9g.cloudfront.net/Documentation/User+Guides/Titan/Amazon+Titan+Image+Generator+Prompt+Engineering+Guidelines.pdf) 참조하세요.

책임감 있는 AI 사용에 대한 모범 사례를 지속적으로 지원하기 위해 Titan 파운데이션 모델(FM)은 데이터에서 유해한 콘텐츠를 탐지 및 제거하고, 사용자 입력에서 부적절한 콘텐츠를 거부하고, 부적절한 콘텐츠(예: 혐오 표현, 비속어, 폭력)가 포함된 모델 출력을 필터링하도록 구축되었습니다. Titan Image Generator FM은 생성된 모든 이미지에 보이지 않는 워터마크와 [C2PA](https://c2pa.org/) 메타데이터를 추가합니다.

Amazon Bedrock 콘솔에서 워터마크 감지 기능을 사용하거나 Amazon Bedrock 워터마크 감지 API(미리 보기)를 직접 호출하여 이미지에 Titan Image Generator의 워터마크가 포함되어 있는지 확인할 수 있습니다. [Content Credentials Verify](https://contentcredentials.org/verify)와 같은 사이트를 사용하여 이미지가 Titan Image Generator에서 생성된 것인지 확인할 수도 있습니다.

**Amazon Titan Image Generator v2** 개요
+ **모델 ID** – `amazon.titan-image-generator-v2:0 `
+ **최대 입력 문자** - 512자
+ **최대 입력 이미지 크기** - 5MB(일부 특정 해상도만 지원됨)
+ **인/아웃페인팅, 배경 제거, 이미지 컨디셔닝, 색상 팔레트를 사용한 최대 이미지 크기** - 1,408 x 1,408픽셀
+ **이미지 변형을 사용한 최대 이미지 크기** - 4,096x4,096픽셀
+ **언어** - 영어
+ **출력 유형** - 이미지
+ **지원되는 이미지 유형** - JPEG, JPG, PNG
+ **추론 유형** - 온디맨드, 프로비저닝된 처리량
+ **지원되는 사용 사례** - 이미지 생성, 이미지 편집, 이미지 변형, 배경 제거, 색상 안내 콘텐츠 

## 특성
<a name="titanimage-features"></a>
+ 텍스트-이미지(T2I) 생성 - 텍스트 프롬프트를 입력하고 새 이미지를 출력으로 생성합니다. 생성된 이미지는 텍스트 프롬프트에 설명된 개념을 캡처합니다.
+ T2I 모델 미세 조정 - 여러 이미지를 가져와서 나만의 스타일과 개인 맞춤으로 캡처한 다음 핵심 T2I 모델을 미세 조정합니다. 미세 조정된 모델은 특정 사용자의 스타일과 개인 맞춤을 준수하는 이미지를 생성합니다.
+ 이미지 편집 옵션 - 인페인팅, 아웃페인팅, 변형 생성, 이미지 마스크를 사용하지 않는 자동 편집 등이 포함됩니다.
+ 인페인팅 - 사용자가 입력하거나 모델에서 추정한 이미지 및 분할 마스크를 입력으로 사용하고 마스크 내의 영역을 재구성합니다. 인페인팅을 사용하면 마스크된 요소를 제거하고 배경 픽셀로 바꿀 수 있습니다.
+ 아웃페인팅 - 사용자가 입력하거나 모델에서 추정한 이미지 및 분할 마스크를 입력으로 사용하고 영역을 매끄럽게 확장하는 새 픽셀을 생성합니다. 이미지를 경계선까지 확장할 때 마스크된 이미지의 픽셀을 보존하려면 정밀한 아웃페인팅을 사용합니다. 기본값 아웃페인팅을 사용하면 분할 설정에 따라 마스크된 이미지의 픽셀을 이미지 경계까지 확장할 수 있습니다.
+ 이미지 변형 - 1\$15개의 이미지와 필요한 경우 프롬프트를 입력으로 사용합니다. 입력 이미지의 내용은 보존되지만, 스타일과 배경이 달라지는 새 이미지를 생성합니다.
+ 이미지 컨디셔닝 - (V2만 해당) 입력 참조 이미지를 사용하여 이미지 생성을 안내합니다. 모델은 텍스트 프롬프트를 따라가면서 참조 이미지의 레이아웃 및 구성과 일치하는 출력 이미지를 생성합니다.
+ 주제 일관성 - (V2만 해당) 주제 일관성을 통해 사용자는 참조 이미지로 모델을 미세 조정하여, 생성된 이미지에서 선택한 주제(예: 반려동물, 신발 또는 핸드백)를 유지할 수 있습니다.
+ 색상 안내 콘텐츠 - (V2만 해당) 프롬프트와 함께 16진수 색상 코드 목록을 제공할 수 있습니다. 1\$110개의 16진수 코드를 제공할 수 있습니다. Titan Image Generator G1 V2에서 반환한 이미지에는 사용자가 제공한 색상 팔레트가 포함됩니다.
+ 배경 제거 - (V2만 해당) 입력 이미지에서 여러 객체를 자동으로 식별하고 배경을 제거합니다. 출력 이미지의 배경은 투명합니다.
+ 콘텐츠 출처 - [Content Credentials Verify](https://contentcredentials.org/verify)와 같은 사이트를 사용하여 이미지가 Titan Image Generator에서 생성되었는지 확인할 수 있습니다. 메타데이터가 제거되지 않은 한 이미지가 생성된 이미지임을 나타내야 합니다.

**참고**  
미세 조정된 모델을 사용하는 경우 API 또는 모델의 인페인팅, 아웃페인팅 또는 색상 팔레트 기능을 사용할 수 없습니다.

## 파라미터
<a name="titanimage-parameters"></a>

Amazon Titan Image Generator G1 모델 추론 파라미터에 대한 자세한 내용은 [Amazon Titan Image Generator G1 모델 추론 파라미터를](model-parameters-titan-image.md) 참조하세요.

## 미세 조정
<a name="titanimage-finetuning"></a>

Amazon Titan Image Generator G1 모델 미세 조정에 대한 자세한 내용은 다음 페이지를 참조하세요.
+ [모델 미세 조정을 위한 데이터 준비](model-customization-prepare.md)
+ [Amazon Titan Image Generator G1 모델 사용자 지정 하이퍼파라미터](custom-models-hp.md#cm-hp-titan-image)

**Amazon Titan Image Generator G1 모델 미세 조정 및 요금**

모델은 다음 예제 공식을 사용하여 작업당 총 요금을 계산합니다.

총 요금 = 단계 \$1 배치 크기 \$1 표시된 이미지당 요금

최소값(자동):
+ 최소 단계(자동) - 500
+ 최소 배치 크기 - 8
+ 기본 학습률 - 0.00001
+ 표시된 이미지당 요금 - 0.005

**하이퍼파라미터 설정 미세 조정**

**단계** - 모델이 각 배치에 노출된 횟수입니다. 기본 단계 수 세트는 없습니다. 10\$140,000 사이의 숫자 또는 문자열 값 ‘Auto(자동)’를 선택해야 합니다.

**단계 설정 - 자동** - Amazon Bedrock은 훈련 정보를 기반으로 합리적인 값을 결정합니다. 훈련 비용보다 모델 성능을 우선시하려면 이 옵션을 선택합니다. 단계 수는 자동으로 결정됩니다. 이 숫자는 일반적으로 데이터세트를 기반으로 1,000\$18,000입니다. 작업 비용은 모델을 데이터에 노출하는 데 사용되는 단계 수의 영향을 받습니다. 작업 비용이 계산되는 방법을 알아보려면 요금 세부 정보의 요금 예제 섹션을 참조하세요. (위의 예제 표를 참조하여 ‘자동’을 선택할 때 단계 수와 이미지 수가 어떻게 관련되는지 확인하세요.) 

**단계 설정 - 사용자 지정** - Bedrock이 사용자 지정 모델을 훈련 데이터에 노출시킬 단계 수를 입력할 수 있습니다. 이 값은 10\$140,000이어야 합니다. 더 낮은 단계 수 값을 사용하면 모델에서 생성된 이미지당 비용을 줄일 수 있습니다.

**배치 크기** - 모델 파라미터를 업데이트하기 전에 처리된 샘플 수입니다. 이 값은 8에서 192 사이이며 8의 배수입니다.

**학습률** - 훈련 데이터의 각 배치 이후 모델 파라미터가 업데이트되는 비율입니다. 0과 1 사이의 부동 소수점 값입니다. 학습률은 기본적으로 0.00001로 설정됩니다.

미세 조정 절차에 대한 자세한 내용은 [Submit a model customization job](https://docs.aws.amazon.com/bedrock/latest/userguide/model-customization-submit.html)을 참조하세요.

## 출력
<a name="titanimage-output"></a>

Amazon Titan Image Generator G1 모델은 출력 이미지 크기와 품질을 사용하여 이미지 가격 책정 방식을 결정합니다. 이 모델에는 크기에 따라 두 개의 요금 세그먼트가 있습니다. 하나는 512\$1512 이미지용이고 다른 하나는 1024\$11024 이미지용입니다. 가격은 이미지 높이\$1너비, 512\$1512 이하 또는 512\$1512 이상의 이미지 크기를 기준으로 책정됩니다.

Amazon Bedrock 요금에 대한 자세한 내용은 [Amazon Bedrock 요금](https://aws.amazon.com/bedrock/pricing/)을 참조하세요.

## 워터마크 감지
<a name="titanimage-watermark"></a>

**참고**  
Amazon Bedrock 콘솔 및 API에 대한 워터마크 감지는 공개 미리 보기 릴리스로 제공 중이며 Titan Image Generator G1에서 생성된 워터마크만 감지합니다. 현재 이 기능은 `us-west-2` 및 `us-east-1` 리전에서만 사용 가능합니다. 워터마크 감지는 Titan Image Generator G1에서 생성된 워터마크를 매우 정확하게 감지합니다. 원본 이미지에서 수정된 이미지인 경우 감지 결과가 덜 정확할 수 있습니다.

이 모델은 잘못된 정보의 확산을 줄이고, 저작권 보호를 지원하고, 콘텐츠 사용을 추적할 수 있도록 생성된 모든 이미지에 보이지 않는 워터마크를 추가합니다. 워터마크 감지 기능을 사용하면 워터마크의 존재 여부를 검사할 수 있어 이미지가 Titan Image Generator G1 모델로 생성되었는지 확인할 수 있습니다.

**참고**  
Watermark Detection API는 미리 보기로 제공 중이며 변경될 수 있습니다. SDK를 사용하려면 가상 환경을 만드는 것이 좋습니다. 최신 SDK에서는 워터마크 감지 API를 사용할 수 없으므로 워터마크 감지 API로 버전을 설치하기 전에 가상 환경에서 최신 버전의 SDK를 제거하는 것이 좋습니다.

이미지를 업로드하여 이미지에 Titan Image Generator G1의 워터마크가 있는지 감지할 수 있습니다. 다음 단계에 따라 콘솔을 사용하여 이 모델에서 워터마크를 감지할 수 있습니다.

**Titan Image Generator G1을 사용하여 워터마크를 감지하는 방법**

1. [Amazon Bedrock 콘솔](https://console.aws.amazon.com/bedrock)에서 Amazon Bedrock 콘솔을 엽니다.

1. Amazon Bedrock의 탐색 창에서 **개요**를 선택합니다. **빌드 및 테스트** 탭을 선택합니다.

1. **세이프가드** 섹션에서 **워터마크 감지**로 이동하여 **워터마크 감지 보기**를 선택합니다.

1. **이미지 업로드**를 선택하고 JPG 또는 PNG 형식의 파일을 찾습니다. 허용되는 최대 파일 크기는 5MB입니다.

1. 파일을 업로드하면 이름, 파일 크기, 마지막으로 수정된 날짜와 함께 이미지 썸네일이 표시됩니다. **업로드** 섹션에서 이미지를 삭제하거나 바꾸려면 X를 선택합니다.

1. **분석**을 선택하여 워터마크 감지 분석을 시작합니다.

1. 이미지는 **결과** 아래에서 미리 볼 수 있으며, 워터마크가 감지되면 이미지 아래에 **워터마크가 감지**라고 표시되고 이미지 전체에 배너가 표시됩니다. 워터마크가 감지되지 않으면 이미지 아래의 텍스트에 **워터마크가 감지되지 않음**이라고 표시됩니다.

1. 다음 이미지를 로드하려면 **업로드** 섹션의 이미지 썸네일에서 X를 선택하고 분석할 새 이미지를 선택합니다.

## 프롬프트 엔지니어링 지침
<a name="titanimage-prompt"></a>

**마스크 프롬프트** - 이 알고리즘은 픽셀을 개념으로 분류합니다. 사용자는 마스크 프롬프트의 해석에 따라 마스크할 이미지 영역을 분류하는 데 사용할 텍스트 프롬프트를 제공합니다. 프롬프트 옵션은 더 복잡한 프롬프트를 해석하고 마스크를 분할 알고리즘으로 인코딩할 수 있습니다.

**이미지 마스크** - 이미지 마스크를 사용하여 마스크 값을 설정할 수도 있습니다. 이미지 마스크를 마스크의 프롬프트 입력과 결합하여 정확도를 향상시킬 수 있습니다. 이미지 마스크 파일은 다음 파라미터에 부합해야 합니다.
+ 마스크 이미지의 마스크 이미지 값은 0(검은색) 또는 255(흰색)여야 합니다. 값이 0인 이미지 마스크 영역은 사용자 프롬프트 또는 입력 이미지의 이미지로 재생성됩니다.
+ `maskImage` 필드는 base64 인코딩 이미지 문자열이어야 합니다.
+ 마스크 이미지는 입력 이미지와 크기가 같아야 합니다(높이와 너비가 동일).
+ 입력 이미지와 마스크 이미지에는 PNG 또는 JPG 파일만 사용할 수 있습니다.
+ 마스크 이미지는 흑백 픽셀 값만 사용해야 합니다.
+ 마스크 이미지는 RGB 채널만 사용할 수 있습니다(알파 채널은 미지원).

Amazon Titan Image Generator 프롬프트 엔지니어링에 대한 자세한 내용은 [Amazon Titan Image Generator G1 models Prompt Engineering Best Practices](https://d2eo22ngex1n9g.cloudfront.net/Documentation/User+Guides/Titan/Amazon+Titan+Image+Generator+Prompt+Engineering+Guidelines.pdf)를 참조하세요.

일반적인 프롬프트 엔지니어링 지침은 [프롬프트 엔지니어링 지침](https://docs.aws.amazon.com/bedrock/latest/userguide/prompt-engineering-guidelines.html)을 참조하세요.