

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 추론 프로파일을 사용하여 모델 간접 호출 리소스 설정
<a name="inference-profiles"></a>

*추론 프로파일*은 추론 프로파일이 모델 간접 호출 요청을 라우팅할 수 있는 모델과 하나 이상의 리전을 정의하는 Amazon Bedrock의 리소스입니다. 다음 태스크에 추론 프로파일을 사용할 수 있습니다.
+ **사용량 지표 추적** - CloudWatch 로그를 설정하고 애플리케이션 추론 프로파일로 모델 간접 호출 요청을 제출하여 모델 간접 호출에 대한 사용량 지표를 수집합니다. 추론 프로파일에 대한 정보를 볼 때 이러한 지표를 검사하고 이를 사용하여 결정을 알릴 수 있습니다. CloudWatch 로그 설정 방법에 대한 자세한 내용은 [CloudWatch Logs 및 Amazon S3를 사용하여 모델 간접 호출 모니터링](model-invocation-logging.md) 섹션을 참조하세요.
+ **태그를 사용하여 비용 모니터링** - 온디맨드 모델 간접 호출 요청을 제출할 때 애플리케이션 추론 프로파일에 태그를 연결하여 비용을 추적합니다. 비용 할당에 태그를 사용하는 방법에 대한 자세한 내용은 AWS Billing 사용 설명서의 [비용 할당 태그를 사용하여 AWS 비용 구성 및 추적](https://docs.aws.amazon.com/awsaccountbilling/latest/aboutv2/cost-alloc-tags.html)을 참조하세요.
+ **교차 리전 추론** - 여러 AWS 리전이 포함된 추론 프로파일을 사용하여 처리량을 늘립니다. 추론 프로파일은 이러한 리전에 모델 간접 호출 요청을 분산하여 처리량과 성능을 높입니다. 교차 리전 추론에 대한 자세한 내용은 [교차 리전 추론을 통한 처리량 증대](cross-region-inference.md) 섹션을 참조하세요.

Amazon Bedrock은 다음과 같은 유형의 추론 프로파일을 제공합니다.
+ **교차 리전(시스템 정의) 추론 프로파일** - Amazon Bedrock에서 사전 정의되고 모델에 대한 요청을 라우팅할 수 있는 여러 리전을 포함하는 추론 프로파일입니다.
+ **애플리케이션 추론 프로파일** - 사용자가 비용 및 모델 사용량을 추적하기 위해 생성하는 추론 프로파일입니다. 모델 간접 호출 요청을 한 리전 또는 여러 리전으로 라우팅하는 추론 프로파일을 생성할 수 있습니다.
  + 한 리전에서 모델의 비용 및 사용량을 추적하는 추론 프로파일을 생성하려면 추론 프로파일이 요청을 라우팅할 리전에서 파운데이션 모델을 지정합니다.
  + 여러 리전에서 모델의 비용 및 사용량을 추적하는 추론 프로파일을 생성하려면 추론 프로파일이 요청을 라우팅할 모델 및 리전을 정의하는 교차 리전(시스템 정의) 추론 프로파일을 지정합니다.

다음 기능과 함께 추론 프로파일을 사용하여 요청을 여러 리전으로 라우팅하고 이러한 기능으로 이루어진 간접 호출 요청의 사용량 및 비용을 추적할 수 있습니다.
+ 모델 추론 - Amazon Bedrock 콘솔의 플레이그라운드에서 추론 프로파일을 선택하거나 [InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html), [InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html), [Converse](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html) 및 [ConverseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ConverseStream.html) 작업을 직접적으로 호출할 때 추론 프로파일의 ARN을 지정하여 모델 간접 호출을 실행할 때 추론 프로파일을 사용합니다. 자세한 내용은 [추론 요청](inference.md) 단원을 참조하십시오.
+ 지식 기반 벡터 임베딩 및 응답 생성 - 지식 기반을 쿼리한 후 응답을 생성하거나, 데이터 소스에서 비텍스트 정보를 구문 분석할 때 추론 프로파일을 사용합니다. 자세한 내용은 [쿼리 및 응답을 사용하여 지식 기반 테스트](knowledge-base-test.md) 및 [데이터 소스에 대한 구문 분석 옵션](kb-advanced-parsing.md)을 참조하세요.
+ 모델 평가 - 모델 평가 작업을 제출할 때 평가할 모델로 추론 프로파일을 제출할 수 있습니다. 자세한 내용은 [Amazon Bedrock 리소스의 성능 평가](evaluation.md) 단원을 참조하십시오.
+ 프롬프트 관리 - 프롬프트 관리에서 만든 프롬프트에 대한 응답을 생성할 때 추론 프로파일을 사용할 수 있습니다. 자세한 내용은 [Amazon Bedrock에서 프롬프트 관리를 사용하여 재사용 가능한 프롬프트 구성 및 저장](prompt-management.md) 섹션을 참조하세요.
+ 흐름 - 흐름의 프롬프트 노드에서 인라인을 정의하는 프롬프트에 대한 응답을 생성할 때 추론 프로파일을 사용할 수 있습니다. 자세한 내용은 [Amazon Bedrock Flows를 사용하여 엔드 투 엔드 생성형 AI 워크플로 구축](flows.md) 단원을 참조하십시오.

추론 프로파일 사용 요금은 추론 프로파일을 직접적으로 호출하는 리전의 모델 가격을 기준으로 계산됩니다. 요금에 대한 자세한 내용은 [Amazon Bedrock 요금](https://aws.amazon.com/bedrock/pricing/)을 참조하세요.

교차 리전 추론 프로파일이 제공할 수 있는 처리량에 대한 자세한 내용은 [교차 리전 추론을 통한 처리량 증대](cross-region-inference.md) 섹션을 참조하세요.

**Topics**
+ [추론 프로파일에 지원되는 리전 및 모델](inference-profiles-support.md)
+ [추론 프로파일의 사전 조건](inference-profiles-prereq.md)
+ [애플리케이션 추론 프로파일 생성](inference-profiles-create.md)
+ [애플리케이션 추론 프로파일의 태그 수정](inference-profiles-modify.md)
+ [추론 프로파일에 대한 정보 확인](inference-profiles-view.md)
+ [모델 간접 호출에 추론 프로파일 사용](inference-profiles-use.md)
+ [애플리케이션 추론 프로파일 삭제](inference-profiles-delete.md)