

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 배포 계획
<a name="plan-your-deployment"></a>

이 섹션에서는 배포 계획을 위한 [비용](cost.md), [보안](security-1.md), [리전](#supported-aws-regions) 및 [할당량](quotas.md) 고려 사항에 대해 설명합니다.

**중요**  
이 솔루션은 AI 생성 모델에 액세스하기 위한 기본 서비스로 Amazon Bedrock을 활용합니다. 먼저 모델에 대한 액세스를 요청해야 솔루션 내에서 모델을 사용할 수 있습니다. 자세한 내용은 *Amazon Bedrock 사용 설명서*의 [모델 액세스를](https://docs.aws.amazon.com/bedrock/latest/userguide/model-access.html) 참조하세요.

## 지원되는 AWS 리전
<a name="supported-aws-regions"></a>

**중요**  
이 솔루션은 일부 AWS 리전에서 현재 사용할 수 없는 Amazon Bedrock 및 Amazon Kendra 서비스를 선택적으로 사용합니다. 이러한 서비스를 사용할 수 있는 AWS 리전에서이 솔루션을 시작해야 합니다. 리전별 AWS 서비스의 최신 가용성은 [AWS 리전 서비스 목록을](https://aws.amazon.com/about-aws/global-infrastructure/regional-product-services/) 참조하세요.

AWS의 생성형 AI Application Builder는 다음 AWS 리전에서 지원됩니다.


| 리전 이름 |  | 
| --- | --- | 
|  미국 동부(오하이오)  |  캐나다(중부)  | 
|  미국 동부(버지니아 북부)  |  유럽(프랑크푸르트)  | 
|  미국 서부(캘리포니아 북부)  |  유럽(아일랜드)  | 
|  미국 서부(오리건)  |  유럽(런던)  | 
|  아시아 태평양(뭄바이)  |  유럽(밀라노)  | 
|  아시아 태평양(서울)  |  유럽(파리)  | 
|  아시아 태평양(싱가포르)  |  유럽(스톡홀름)  | 
|  아시아 태평양(시드니)  |  Middle East (Bahrain)  | 
|  아시아 태평양(도쿄)  |  남아메리카(상파울루)  | 

**참고**  
배포에서 AWS 외부에서 액세스한 파운데이션 모델을 사용하는 경우 모델 공급자에게 APIs를 사용할 수 있는 리전을 확인하세요. 특정 리전에서만 APIs 사용할 수 있는 경우 지연 시간이 길거나 시간 초과가 발생할 수 있습니다. 또한 조직의 법률 및 규정 준수 팀에 문의하여 리전 경계를 넘어가는 데이터의 고려 사항을 평가하는 것이 중요합니다.

# 비용
<a name="cost"></a>

이 AWS 솔루션을 사용하면 사용하는 리소스에 대해서만 비용을 지불하며 최소 요금이나 설정 요금은 없습니다. 사용자는 생성형 AI 사용 사례 및를 시작하는 데 사용되는 대시보드와 배포된 사용 사례에 대한 비용을 지불합니다. 배포된 사용 사례의 비용은 구성에 따라 다릅니다. 구성 예:

1. 매월 약 20 USD의 비용이 드는 간단한 배포 대시보드입니다.

1. 문서에 액세스하지 않고 Amazon Bedrock으로 구동되는 미국 동부(버지니아 북부)에서 실행되는 기본 설정으로 배포된 간단한 프로덕션 지원 챗봇 사용 사례로, 매월 약 200 USD의 비용도 듭니다.

1. Amazon VPC 사용 사례에서 수십만 개 이상의 문서에 대해 하루에 8,000개의 쿼리를 지원하는 확장 시스템으로, 요금은 매월 약 1,500 USD입니다. 사용 사례 비용은 모델 공급자가 다른 텍스트 사용 사례, 검색 증강 생성(RAG)이 활성화된 상태 또는 활성화되지 않은 상태 등과 같은 구성에 따라 달라집니다.


| 워크로드 설명 | 예상 비용(USD/월) | 
| --- | --- | 
|   [배포 대시보드의 샘플 비용](#sample-deployment-dashboard-cost)   |  \$120/월  | 
|   [텍스트 기반 개념 증명에 대한 샘플 비용](#sample-costs-for-a-text-based-proof-of-concept)  (배포 대시보드 및 텍스트 사용 사례 1개, 하루에 약 100건의 상호 작용 포함)  |  \$140/월  | 
|   [확장성이 뛰어난 생성형 AI 쿼리 엔진의 샘플 비용](#sample-costs-for-a-highly-scalable-generative-ai-query-engine)  (배포 대시보드, 텍스트 사용 사례 1개, [VPC가 활성화된](#incremental-cost-of-enabling-amazon-vpc-for-a-use-case) 상태에서 하루에 \$18K 쿼리가 있는 최대 100K 개의 RAG용 Amazon Kendra 인덱스 포함   |  \$11,500/월  | 
|   [에이전트 기반 개념 증명에 대한 샘플 비용](#sample-costs-for-an-agent-based-proof-of-concept)  (배포 대시보드, Amazon Bedrock 지식 기반 및 Amazon Bedrock 가드레일이 활성화된 Bedrock 에이전트 사용 사례 1개, 하루에 최대 100개의 상호 작용 포함)  |  \$1840/월  | 
|   [MCP 서버의 샘플 비용](#sample-costs-for-mcp-server)  (배포 대시보드, Lambda 통합을 위한 게이트웨이 메서드가 포함된 MCP 서버 사용 사례 1개, 하루에 최대 100개의 도구 호출 포함)  |  \$122/월  | 
|   [에이전트 빌더의 샘플 비용](#sample-costs-for-agent-builder)  (배포 대시보드, MCP 통합 및 장기 메모리가 활성화된 Agent Builder 사용 사례 1개, 하루에 최대 100개의 상호 작용 포함)  |  \$155/월  | 
|   [Workflow Builder의 샘플 비용](#sample-costs-for-workflow-builder)  (배포 대시보드, 에이전트 빌더 에이전트 3명이 있는 워크플로 1개, 하루에 최대 100개의 상호 작용 포함)  |  \$1109/월  | 

**중요**  
이 예제는 특정 워크로드에 대한 비용을 추정하는 데 도움을 주기 위한 것입니다. 다양한 LLMs, 구성 또는 AWS 서비스를 사용하면 비용이 변경될 수 있습니다(예: 서버리스/온디맨드 결제 vs. 프로비저닝된/시간 청구). 비용을 관리하려면 [AWS Cost Explorer](https://aws.amazon.com/aws-cost-management/aws-cost-explorer/)를 통해 [예산을 생성하는](https://docs.aws.amazon.com/cost-management/latest/userguide/budgets-create.html) 것이 좋습니다. 요금은 변경될 수 있습니다. 자세한 내용은이 솔루션에 사용되는 각 AWS 서비스의 요금 웹 페이지를 참조하세요.

## 배포 대시보드 실행을 위한 샘플 비용
<a name="sample-deployment-dashboard-cost"></a>

다음 표에는 기본 파라미터와 한 달 동안 미국 동부(버지니아 북부) 리전의 활성 사용자 100명이 포함된 배포 대시보드의 비용 내역이 나와 있습니다.이 비용은 월 약 20 USD입니다.


| AWS 서비스 | 측정 기준 | 비용[USD] | 
| --- | --- | --- | 
|  API Gateway, DynamoDB, CloudFront, Amazon S3, Lambda, Systems Manager 파라미터 스토어  |  캐싱이 활성화되지 않은 상태에서 매월 5,000건의 512KB REST API 호출  |  1.97 USD  | 
|  Amazon Cognito  |  고급 보안 기능이 활성화되어 있고 SAML 또는 OIDC 페더레이션을 통해 로그인하는 사용자가 없는 월 100명의 활성 사용자  |  5.55 USD  | 
|  AWS WAF  |  규칙 그룹이 없는 1개의 웹 ACL 및 7개의 정의된 규칙에서 10,000개의 웹 요청  |  12.60 USD  | 
|  총 배포 대시보드 비용  |  |   **20.12 USD**   | 

## 텍스트 기반 개념 증명에 대한 샘플 비용
<a name="sample-costs-for-a-text-based-proof-of-concept"></a>

배포 대시보드에는 지정된 시간에 많은 사용 사례가 배포될 수 있습니다. 다음 표는 LLM을 사용하여 하루에 100개의 쿼리를 수행하는 비즈니스 사용자 1명에 대해 RAG 없이 배포된 사용 사례의 비용 분석을 보여줍니다. 쿼리는 WebSocket에서 문자 메시지로 전송되고 응답은 스트리밍이 활성화되어 있다는 가정하에 토큰으로 다시 스트리밍됩니다. Amazon Bedrock Nova Pro 모델을 사용하면이 사용 사례를 실행하는 데 드는 비용은 월 약 20 USD입니다.


| AWS 서비스 | 측정 기준 | 비용[USD] | 
| --- | --- | --- | 
|  API Gateway(WebSocket), CloudFront, Lambda, Amazon S3, AWS Systems Manager 파라미터 스토어  |  하루에 100건의 채팅 상호 작용. 평균 메시지 크기는 메시지당 32KB, 연결당 5분입니다.  |  0.61 USD  | 
|  CloudWatch  |  실험을 위해 상세 정보 모드가 켜져 있는 1.5GB CloudWatch 로그  |  7.23 USD  | 
|  Amazon DynamoDB  |  대화 기록 테이블, 1GB 스토리지 LLM 구성 테이블, 1GB 스토리지  |  3.05 USD  | 
|   **사용 사례 비용의 소계(LLMs 제외)**   |  |   **10.89 USD**   | 
|  Amazon Bedrock(Nova Pro)  |  하루에 100건의 상호 작용에 대한 가정: \$1 일일 190K000개의 입력 토큰에 대한 월별 비용 = 0.152 USD × 30 \$1 일일 16K000개의 출력 토큰에 대한 월별 비용 = 0.0512 USD × 30  |  6.10 USD  | 
|   **Amazon Bedrock(Nova Pro)을 사용한 총 애플리케이션 비용**   |   **10.89 USD(사용 사례 비용) \$1 6.10 USD(Amazon Bedrock 비용)**   |   **17.00 USD**   | 

**참고**  
AWS 네트워크 외부의 서비스에 대한 추론 호출 비용은 이러한 추정치에 포함되지 않습니다. AWS 모델 공급자를 사용하지 않는 경우 LLM 공급자의 요금 안내서를 참조하세요.  
AWS 서비스에 대한 요금 가이드는 [Amazon Bedrock 요금](https://aws.amazon.com/bedrock/pricing/) 및 [Amazon SageMaker AI 요금](https://aws.amazon.com/sagemaker/pricing/)에서 확인할 수 있습니다.

## 확장성이 뛰어난 생성형 AI 쿼리 엔진의 샘플 비용
<a name="sample-costs-for-a-highly-scalable-generative-ai-query-engine"></a>

다음 표에는 Amazon Bedrock의 Nova Pro 모델을 LLM으로 사용하는 RAG 지원 사용 사례의 비용 내역이 나와 있습니다. Bedrock 지식 기반이 추가되면이 사용 사례 비용은 월 약 1,300 USD입니다.


| AWS 서비스 | 측정 기준 | 비용[USD] | 
| --- | --- | --- | 
|  API Gateway(WebSocket)  |  하루에 8,000건의 채팅 상호 작용. 평균 메시지 크기는 메시지당 32KB, 연결당 5분입니다.  |  38.89 USD  | 
|  CloudFront  |  인터넷으로 전송된 100GB 데이터와 오리진으로 전송된 1GB 데이터가 포함된 월별 요청 240,000개  |  8.76 USD  | 
|  Amazon Bedrock(Nova Pro)  |  가정: 입력 토큰 = promptTemplate(400) \$1 컨텍스트(400)\$1 chatHistory(1080) \$1 쿼리 입력 토큰(20)= 1,900 출력 토큰 = 160(평균) 하루에 8,000개의 트랜잭션을 사용하는 경우 일일 입력 토큰 비용(1,900 x 8,000 = 토큰 15,200,000개 x 토큰당 가격 0.0008/1000) 일일 출력 토큰 비용(160 x 8,000 = 토큰 1,280,000개 x 토큰당 가격 0.0032/1000) 월별 비용((12.16 USD \$1 4.10 USD) x 30)  |  487.80 USD  | 
|  CloudWatch  |  로그에 대해 수집된 5GB 데이터를 사용하는 지표 24개와 대시보드 1개  |  9.72 USD  | 
|  DynamoDB  |  DynamoDB 테이블은 최대 1KB 데이터, 하루에 8,000회 읽기 및 쓰기의 각 레코드에 대한 대화 기록을 추적합니다.  |  11.70 USD  | 
|  Lambda  |  컨테이너 크기 - 128MB, 임시 512MB 스토리지, 권한 부여에 사용되는 Lambda 함수 2개 컨테이너 크기 - 256MB, 512MB 임시 스토리지, 초당 요청 5개, 평균 컴퓨팅 시간 20초  |  20.89 USD  | 
|   **총 사용 사례 비용**   |  |   **\$1577.76/월 \$1 지식 기반 비용(아래 참조)**   | 

**참고**  
AWS 네트워크 외부의 서비스에 대한 API 호출 비용은 이러한 추정치에 포함되지 않습니다. Amazon Bedrock을 사용하지 않는 경우 LLM 공급자의 요금 안내서를 참조하세요.

## 지식 기반 추가 비용
<a name="cost-of-adding-a-knowledge-base"></a>

지식 기반 비용은 사용되는 지식 기반 유형과 지식 기반에서 사용하는 지원 벡터 스토어( Bedrock의 경우)에 따라 달라집니다. 지식 기반을 프로비저닝하고 관리하는 것은 솔루션 범위를 벗어납니다.

 **Amazon Bedrock 지식 기반** 

이 솔루션은 Amazon Bedrock 지식 기반과 관련된 리소스를 관리하거나 프로비저닝하지 않습니다. Amazon Bedrock은 지식 기반 기능 자체를 사용하는 데 비용이 발생하지 않지만 각 쿼리에서 사용 사례에 사용되는 임베딩 모델의 사용에 대해서는 요금이 부과됩니다. 또한 지식 기반(예: [Amazon OpenSearch Service](https://aws.amazon.com/opensearch-service)의 인덱스 또는 Amazon Relational Database Service 내의 데이터베이스)의 백업 벡터 스토어에는 여기에서 제공하거나 계산할 수 없는 관련 비용이 발생합니다.

위의 확장성이 뛰어난 생성형 AI 쿼리 엔진 시나리오의 경우 Amazon Bedrock 임베딩 모델을 호출하기 위해이 서비스로 인해 발생하는 비용은 다음과 같습니다.


| AWS 서비스 | 측정 기준 | 비용[USD] | 
| --- | --- | --- | 
|  Amazon Bedrock(Amazon Titan Text Embeddings V2)  |  쿼리당 1,900개의 입력 토큰이 있는 일일 쿼리 8,000개 = 토큰 15,200,000개 = 일일 0.30 USD. 일일 비용 x 30일 = \$19.00 USD 월별 비용  |  9.00 USD  | 
|  Amazon OpenSearch Service(서버리스) 샘플 사용량  |  4 x OpenSearch 컴퓨팅 유닛(OCU)(청구 가능한 최소 금액) = 일일 23.04 USD를 사용하는 기본 서버리스 구성 일일 비용 x 30일 = 691.20 USD  이렇게 하면 일부 워크로드에는 더 많은 OCUs 필요하지만 기존 프로비저닝된 OpenSearch 리소스가 있는 고객은 여기에서 비용이 적게 들기 때문에 대략적인 추정치를 얻을 수 있습니다.   |  691.20 USD  | 
|   **총 추가 비용**   |  |  700.20 USD  | 

 **Amazon Kendra** 

솔루션은 Kendra 인덱스를 프로비저닝하거나 직접 가져올 수 있습니다. 위의 확장성이 뛰어난 생성형 AI 쿼리 엔진에 적합한 구성을 실행하는 데 드는 비용은 다음과 같습니다.


| AWS 서비스 | 측정 기준 | 비용[USD] | 
| --- | --- | --- | 
|  Amazon Kendra  |  0\$150개의 데이터 소스가 있는 Amazon Kendra Enterprise Edition을 사용하여 하루에 0\$18,000개의 쿼리와 최대 100,000개의 문서  |  1,008.00 USD  | 

**참고**  
사용 사례 간에 Amazon Kendra 인덱스를 공유할 수 있지만 이로 인해 인덱스당 쿼리 수가 증가할 수 있습니다. Amazon Kendra Enterprise 에디션을 벗어나는 경우 추가 요금이 적용됩니다.

## 사용 사례에 대해 Amazon VPC를 활성화하는 데 드는 증분 비용
<a name="incremental-cost-of-enabling-amazon-vpc-for-a-use-case"></a>

다음 표에는 두 AZs.


| AWS 서비스 | 측정 기준 | 비용[USD] | 
| --- | --- | --- | 
|  Amazon NAT 게이트웨이  |  가정: 각 AZ에 NAT 게이트웨이가 있는 2개의 AZ 배포. NAT Gateway를 통해 처리되는 데이터 100GB 730시간, 매월 처리되는 데이터 100GB  |  74.70 USD  | 
|  AWS PrivateLink(VPC 엔드포인트)  |  가정: AZ 배포 2개, 각 AZ에 프라이빗 서브넷 1개, 탄력적 네트워크 인터페이스(ENIs. 6개의 VPC 엔드포인트, VPC 엔드포인트당 2ENIs, 한 달에 1,024GB 데이터가 처리되는 730시간  |  97.84 USD  | 
|  퍼블릭 IPv4 주소  |  가정: AZ 배포 2개, 각 퍼블릭 서브넷에 NAT 게이트웨이가 있는 각 AZ에 퍼블릭 서브넷 1개. 활성 퍼블릭 IPv4 1개로 구성된 각 NAT 게이트웨이. 활성 퍼블릭 IPv4 주소 2개 x 한 달에 730시간 x 시간당 0.005 USD 요금 = 7.3 USD  |  7.30 USD  | 
|  추가 요금 (Amazon VPC의 경우)  |  |   **179.93 USD**   | 

## 프로비저닝된 처리량 사용 시 비용에 미치는 영향
<a name="cost-implications-when-using-provisioned-throughput"></a>

프로비저닝된 처리량 비용은 프로비저닝한 모델 유형과 약정 기간 및 약정 기간 동안 선택한 모델 단위에 따라 달라집니다. 프로비저닝된 처리량 사용과 관련된 추가 비용이 있습니다.

자세한 내용과 up-to-date 요금은 [Bedrock 요금을](https://aws.amazon.com/bedrock/pricing/) 참조하세요.

## 교차 리전 추론 사용 비용
<a name="cost-for-using-cross-region-inference"></a>

[교차 리전 추론](https://docs.aws.amazon.com/bedrock/latest/userguide/cross-region-inference.html)을 사용하기 위한 라우팅 또는 데이터 전송에는 추가 비용이 들지 않습니다. 소스 또는 기본 리전과 동일한 가격의 모델 토큰당 요금을 지불합니다.

## 에이전트 기반 개념 증명에 대한 샘플 비용
<a name="sample-costs-for-an-agent-based-proof-of-concept"></a>

Amazon Bedrock Agents를 사용하면 추가 기능과 함께 지원 모델 및 지식 기반(RAG가 활성화된 경우)과 같이 에이전트로 구성된 구성 요소를 기준으로 요금이 청구됩니다. 다음 표는 온디맨드 Claude 3.5 Sonnet 모델, Amazon Bedrock 지식 기반 및 Amazon Bedrock 가드레일로 구성된 Bedrock 에이전트 사용 사례의 비용 분석을 보여줍니다.

[Amazon Bedrock 지식 기반을 추가하는 비용과](#cost-of-adding-a-knowledge-base) 마찬가지로이 솔루션은 Amazon Bedrock 에이전트와 관련된 리소스를 관리하거나 프로비저닝하지 않습니다. 또한이 솔루션은 Amazon Bedrock 지식 기반을 사용하는 데 비용이 발생하지 않지만 다음에 대한 비용이 발생합니다.
+ 전송되는 각 쿼리에 임베딩 모델 사용
+ 지식 기반의 백업 벡터 스토어(예: Amazon OpenSearch Service의 인덱스 또는 Amazon RDS 내의 데이터베이스)

다음 표에서는 쿼리당 1,900개의 입력 토큰과 160개의 출력 토큰을 사용하여 하루에 100개의 상호 작용을 가정합니다.

**참고**  
이 샘플 Bedrock Agent 사용 사례의 경우 외부 API를 사용하도록 구성된 작업 그룹이 있는 경우 해당 비용이 추가됩니다. 이 테이블의 계산 범위를 벗어납니다.


| AWS 서비스 | 측정 기준 | 비용[USD] | 
| --- | --- | --- | 
|  API Gateway(WebSocket), CloudFront, Lambda, Amazon S3, Systems Manager 파라미터 스토어  |  일일 채팅 상호 작용 100건, 메시지당 평균 메시지 크기 32KB, 연결당 5분  |  0.61 USD  | 
|  CloudWatch  |  실험을 위해 상세 정보 모드가 켜져 있는 1.5GB CloudWatch Logs  |  7.23 USD  | 
|  DynamoDB  |  1KB 레코드 크기 및 1GB 스토리지에 대한 LLM 구성 테이블  |  0.25 USD  | 
|   **비용 소계(LLMs 제외)**   |  |   **8.09 USD**   | 
|  Anthropic Claude 3.5 Sonnet  |  \$1 일일 190K 개의 입력 토큰에 대한 일일 비용(0.003/1,000개의 토큰) = 0.57 USD \$1 일일 비용 × 30일 = 17.10 USD \$1 일일 16K 출력 토큰의 일일 비용(0.015/1,000 토큰) = 0.24 USD \$1 일일 비용 × 30일 = 7.20 USD  |  24.30 USD  | 
|  Amazon Bedrock 지식 기반용 Amazon Bedrock(Amazon Titan Text Embeddings V2)  |  일일 190K 개의 입력 토큰에 대한 일일 비용(0.00002/1000 토큰) = 0.004 일일 비용 × 30일 = 0.12 USD  |  0.12 USD  | 
|  Amazon OpenSearch Service(서버리스) 샘플 사용량  |  4 × OpenSearch 컴퓨팅 유닛(OCU)(청구 가능한 최소 금액) = 일일 23.04 USD를 사용한 기본 서버리스 구성 일일 비용 × 30일 = 691.20 USD  |  691.20 USD  | 
|  Amazon Bedrock Guardrails  |  190K 토큰은 약 760K(190,000 × 4) 문자 및 3,800 텍스트 단위(760K 문자/200)와 동일합니다. 콘텐츠 필터, 개인 식별 정보(PII) 필터, 민감한 정보 필터(정규 표현식) 및 단어 필터로 구성된 가드레일을 고려합니다. 일일 콘텐츠 필터 비용(0.75/1000 텍스트 단위) \$1 PII 필터 비용(0.1/1000 텍스트 단위) \$1 민감한 정보 필터(정규) \$1 단어 필터 = 2.85 \$1 0.38 \$1 0 USD \$1 0 USD 월별 비용 = 일일 비용 × 30일 = 96.90 USD  |  96.90 USD  | 
|   **Anthropic Claude 3.5 Sonnet에서 지원하는 에이전트의 총 애플리케이션 비용**   |   *8.09 USD(사용 사례 비용) \$1* **812.52 USD(기타 에이전트 구성)**   |  820.61 USD  | 

**참고**  
AWS 모델 공급자를 사용하지 않는 경우 LLM 공급자의 요금 안내서를 참조하세요. AWS 서비스에 대한 요금 가이드는 [Amazon Bedrock 요금](https://aws.amazon.com/bedrock/pricing/) 및 [Amazon SageMaker AI 요금](https://aws.amazon.com/sagemaker/pricing/)에서 확인할 수 있습니다.

## MCP 서버의 샘플 비용
<a name="sample-costs-for-mcp-server"></a>

MCP 서버 사용 사례를 통해 Amazon Bedrock AgentCore에서 모델 컨텍스트 프로토콜 서버를 배포하고 관리할 수 있습니다. 다음 표는 게이트웨이 메서드를 사용하여 기존 Lambda 함수를 래핑하는 MCP 서버 사용 사례의 비용 분석을 보여줍니다.

솔루션은 AgentCore Gateway 배포 및 구성을 관리합니다. 다음과 같은 요금이 부과됩니다.
+ 인프라 비용(API Gateway, Lambda, DynamoDB, CloudWatch, S3)
+ AgentCore Gateway 사용량(도구 간접 호출당)
+ Lambda 함수 실행 비용(Lambda 대상이 있는 게이트웨이 메서드의 경우)
+ 외부 API 비용(해당하는 경우 API 또는 MCP Server 대상이 있는 게이트웨이 메서드의 경우)


| 항목 | 계산 | 비용 | 
| --- | --- | --- | 
|  Amazon API Gateway(REST API)  |  하루에 100개의 도구 호출 × 30일 = 매월 3,000개의 요청  |  0.05 USD  | 
|  AWS Lambda(오케스트레이션)  |  하루에 100회 호출 × 30일 × 1초 평균 × 512MB = 매월 3,000GB-초  |  0.05 USD  | 
|  Amazon DynamoDB  |  매월 3,000개의 읽기/쓰기 요청 \$1 1GB 스토리지  |  0.15 USD  | 
|  Amazon CloudWatch  |  3,000회 호출에 대한 표준 모니터링 및 로깅  |  1.00 USD  | 
|  Amazon S3  |  구성 스토리지 및 로그(최소 사용량)  |  0.25 USD  | 
|  Amazon Bedrock AgentCore Gateway  |  매월 3,000개의 도구 호출  |  0.05 USD  | 
|  대상 Lambda 함수  |  하루에 100회 호출 × 30일 × 0.5초 × 128MB = 매월 1,500GB-초  |  0.25 USD  | 
|   **총 월별 비용**   |   *1.75 USD(인프라) \$1 0.05 USD(AgentCore Gateway)*   |  1.80 USD  | 

**참고**  
비용은 배포 방법(게이트웨이 대 런타임), 대상 유형 및 사용 패턴에 따라 달라집니다. 런타임 메서드 배포에는 게이트웨이 요금 대신 AgentCore 런타임 요금이 발생합니다. 외부 API 비용 및 사용자 지정 컨테이너 호스팅 비용은 추가 비용입니다.

## Agent Builder의 샘플 비용
<a name="sample-costs-for-agent-builder"></a>

Agent Builder를 사용하면 Amazon Bedrock AgentCore에서 사용자 지정 에이전트를 생성하고 배포할 수 있습니다. 다음 표는 Claude 3.5 Sonnet, MCP 서버 통합 및 장기 메모리가 활성화된 상태로 구성된 Agent Builder 사용 사례의 비용 분석을 보여줍니다.

솔루션은 AgentCore 런타임 배포 및 구성을 관리합니다. 다음과 같은 요금이 부과됩니다.
+ 인프라 비용(API Gateway, Lambda, DynamoDB, CloudWatch, S3)
+ AgentCore 런타임 소비(실제 에이전트 실행 시간을 기준으로 한 CPU 및 메모리 시간)
+ 파운데이션 모델 추론(입력 및 출력 토큰)
+ AgentCore 메모리(단기 이벤트 및 장기 스토리지/검색)

다음 표에서는 하루에 100개의 상호 작용을 쿼리당 1,900개의 입력 토큰과 160개의 출력 토큰으로 가정하고, 평균 에이전트 실행 시간은 상호 작용당 5초입니다.


| AWS 서비스 | 측정 기준 | 비용[USD] | 
| --- | --- | --- | 
|  API Gateway(WebSocket), CloudFront, Lambda, Amazon S3, Systems Manager 파라미터 스토어  |  일일 채팅 상호 작용 100건, 메시지당 평균 메시지 크기 32KB, 연결당 5분  |  0.61 USD  | 
|  CloudWatch  |  실험을 위해 상세 정보 모드가 켜져 있는 1.5GB CloudWatch Logs  |  7.23 USD  | 
|  DynamoDB  |  1KB 레코드 크기 및 1GB 스토리지에 대한 LLM 구성 테이블  |  0.25 USD  | 
|   **인프라 비용 소계**   |  |   **8.09 USD**   | 
|  Amazon Bedrock AgentCore 런타임  |  \$1 CPU: vCPU 1개 × 5초 × 상호 작용 100개 = vCPU 125초/일 = vCPU 0.140시간/일 \$1 일일 비용: 0.140 × 0.0895 USD = 0.013 USD \$1 월별 비용: 0.013 USD × 30 = 0.38 USD \$1 메모리: 512MB(0.5GB) × 5초 × 100 상호 작용 = 250GB-초/일 = 0.069GB-시간/일 \$1 일일 비용: 0.069 × 0.00945 = 0.0007 USD \$1 월별 비용: 0.0007 USD × 30 = 0.02 USD  |  0.40 USD  | 
|  Anthropic Claude 3.5 Sonnet  |  \$1 일일 190K 개의 입력 토큰에 대한 일일 비용(0.003/1,000개의 토큰) = 0.57 USD \$1 일일 비용 × 30일 = 17.10 USD \$1 일일 16K 출력 토큰의 일일 비용(0.015/1,000 토큰) = 0.24 USD \$1 일일 비용 × 30일 = 7.20 USD  |  24.30 USD  | 
|  Amazon Bedrock AgentCore 메모리  |  \$1 단기 메모리: 100개의 새 이벤트/일 × 0.25 USD/1,000개의 이벤트 = 0.025 USD/일 \$1 월별 비용: 0.025 USD × 30 = 0.75 USD \$1 장기 메모리 스토리지(기본 제공 전략): 레코드 100개 × 레코드 0.75/1,000 USD/월 = 0.075 USD/월 \$1 장기 메모리 검색: 하루에 100회 검색 × \$10.50/1,000회 검색 = \$10.05/일 \$1 월별 비용: \$10.05 × 30 = \$11.50  |  2.33 USD  | 
|   **Claude 3.5 Sonnet을 사용하는 Agent Builder의 총 애플리케이션 비용**   |   *\$18.09(인프라) \$1 \$10.40(AgentCore 런타임) \$1 \$124.30(모델) \$1 \$12.33(메모리)*   |   **35.12 USD**   | 

**참고**  
AgentCore 런타임 요금은 소비 기반입니다. 실제 비용은 다음에 따라 달라집니다.  
에이전트 실행 시간(활성 처리 중 CPU 및 메모리 사용량)
상호 작용 수 및 복잡성
MCP 도구 사용(도구 실행을 위한 추가 CPU/메모리)
메모리 구성(단기 및 장기 메모리 활성화됨)
자세한 AgentCore 요금은 [Amazon Bedrock 요금을](https://aws.amazon.com/bedrock/agentcore/pricing/) 참조하세요.

**참고**  
외부 APIs 또는 서비스를 호출하는 MCP 서버를 사용하는 경우 해당 비용은 추가 비용이며이 계산 범위를 벗어납니다. 마찬가지로 AgentCore 브라우저 또는 코드 해석기 도구를 사용하는 경우 vCPU 시간당 0.0895 USD, GB 시간당 0.00945 USD의 소비 기반 요금이 적용됩니다.

## Workflow Builder의 샘플 비용
<a name="sample-costs-for-workflow-builder"></a>

Workflow Builder는 여러 Agent Builder 에이전트를 오케스트레이션하는 감독자 에이전트를 생성합니다. 다음 표에는 Claude 3.5 Sonnet 및 장기 메모리가 활성화된 상태로 구성된 감독자 에이전트 1명과 특수 에이전트 빌더 에이전트 3명이 있는 워크플로의 비용 내역이 나와 있습니다.

가정: 하루에 100건의 상호 작용, 상호 작용당 평균 2건의 에이전트 위임, 에이전트당 5초의 실행 시간.


| AWS 서비스 | 측정 기준 | 비용[USD] | 
| --- | --- | --- | 
|  API Gateway(WebSocket), CloudFront, Lambda, Amazon S3, Systems Manager 파라미터 스토어  |  일일 채팅 상호 작용 100건, 메시지당 평균 메시지 크기 32KB, 연결당 5분  |  0.61 USD  | 
|  CloudWatch  |  실험을 위해 상세 정보 모드가 켜져 있는 1.5GB CloudWatch Logs  |  7.23 USD  | 
|  DynamoDB  |  1KB 레코드 크기 및 1GB 스토리지에 대한 LLM 구성 테이블  |  0.25 USD  | 
|   **인프라 비용 소계**   |  |   **8.09 USD**   | 
|  Amazon Bedrock AgentCore 런타임(관리자 에이전트)  |  \$1 CPU: 1 vCPU × 5초 × 100 상호 작용 = 0.140 vCPU-시간/일 × 30 = 0.38 USD \$1 메모리: 0.5GB × 5초 × 100 상호 작용 = 0.069GB-시간/일 × 30 USD = 0.02 USD  |  0.40 USD  | 
|  Amazon Bedrock AgentCore 런타임(전문 에이전트 3개)  |  \$1 상호 작용당 평균 2회 위임 = 200개 에이전트 실행/일 \$1 CPU: 1 vCPU × 5초 × 200 = 0.278 vCPU-시간/일 × 30 = 0.75 USD \$1 메모리: 0.5GB × 5초 × 200 = 0.139GB-시간/일 × 30 = 0.04 USD  |  0.79 USD  | 
|  Anthropic Claude 3.5 Sonnet(수퍼바이저 에이전트)  |  \$1 입력: 190K 토큰/일 × 0.003/1K USD = 0.57/일 × 30 = 17.10 USD \$1 출력: 16K 토큰/일 × 0.015/1K USD = 0.24/일 × 30 = 7.20 USD  |  24.30 USD  | 
|  Anthropic Claude 3.5 Sonnet(특수화된 에이전트)  |  \$1 상호 작용당 평균 2회의 위임 \$1 입력: 380K 토큰/일 × \$10.003/1K = \$11.14/일 × 30 = \$134.20 \$1 출력: 32K 토큰/일 × \$10.015/1K = \$10.48/일 × 30 = \$114.40  |  48.60 USD  | 
|  Amazon Bedrock AgentCore 메모리(관리자 에이전트)  |  \$1 단기: 100개 이벤트/일 × 0.25 USD/1K × 30 = 0.75 USD \$1 장기 스토리지: 100개 레코드 × 0.75 USD/1K = 0.08 USD \$1 장기 검색: 100개 검색/일 × 0.50 USD/1K × 30 = 1.50 USD  |  2.33 USD  | 
|  Amazon Bedrock AgentCore 메모리(특수화된 에이전트)  |  \$1 단기: 200개 이벤트/일 × \$10.25/1K × 30 = \$11.50 \$1 장기 스토리지: 200개 레코드 × \$10.75/1K = \$10.15 \$1 장기 검색: 200개 검색/일 × \$10.50/1K × 30 = \$13.00  |  4.65 USD  | 
|   **에이전트가 3개인 Workflow Builder의 총 애플리케이션 비용**   |   *\$18.09(인프라) \$1 \$11.19(AgentCore 런타임) \$1 \$172.90(모델) \$1 \$16.98(메모리)*   |   **89.16 USD**   | 

**참고**  
위임률이 높을수록 토큰 소비가 비례하여 증가합니다.
자세한 AgentCore 요금은 [Amazon Bedrock 요금을](https://aws.amazon.com/bedrock/pricing/) 참조하세요.

# 보안
<a name="security-1"></a>

AWS 인프라에 시스템을 빌드하면 보안 책임은 사용자와 AWS가 분담합니다. AWS는 호스트 운영 체제, 가상화 계층 및 서비스가 운영되는 시설의 물리적 보안을 포함한 구성 요소를 운영, 관리 및 제어하기 때문에이 [공동 책임 모델은](https://aws.amazon.com/compliance/shared-responsibility-model/) 운영 부담을 줄입니다. AWS 보안에 대한 자세한 내용은 [AWS 클라우드 보안](https://aws.amazon.com/security/)을 참조하세요.

## Amazon Bedrock에서 파운데이션 모델 사용
<a name="using-third-party-models-on-amazon-bedrock"></a>

Amazon Bedrock은 Amazon Nova 모델의 모델 모음을 다른 주요 파운데이션 모델(FMs. Amazon Bedrock을 사용하는 경우 모든 모델은 AWS 인프라 내에서 호스팅됩니다. 즉, Amazon Bedrock을 LLM 공급자로 사용하면 모든 추론 요청이 AWS 네트워크 내에 유지되고 네트워크 트래픽이 리전을 벗어나지 않습니다.

**참고**  
Amazon Bedrock을 통해 사용할 수 있는 모든 파운데이션 모델(FMs)은 AWS에서 관리하고 소유한 AWS 인프라에서 직접 호스팅됩니다. 모델 공급자는 프롬프트 및 연속 또는 Amazon Bedrock 서비스 로그와 같은 고객 데이터에 액세스할 수 없습니다. Amazon Bedrock의 보안 태세에 대한 자세한 내용은 [Amazon Bedrock 사용 설명서의 Amazon Bedrock의 데이터 보호를](https://docs.aws.amazon.com/bedrock/) 참조하세요. ** 

## IAM 역할
<a name="iam-roles"></a>

IAM 역할을 통해 고객은 AWS 클라우드의 서비스 및 사용자에게 세분화된 액세스 정책 및 권한을 할당할 수 있습니다. 이 솔루션은 솔루션의 Lambda 함수에 리전 리소스를 생성할 수 있는 액세스 권한을 부여하는 IAM 역할을 생성합니다.

## CloudWatch Logs
<a name="cloudwatch-logs"></a>

배포 대시보드 모델 선택 페이지의 추가 설정에서 사용 사례를 배포하는 동안 상세 정보 모드를 활성화할 수 있습니다. 상세 정보 모드를 사용하면 디버깅 및 프롬프트 실험에 도움이 될 수 있는 자세한 CloudWatch 로그를 사용할 수 있습니다.

**참고**  
상세 정보 모드가 활성화되면 지식 기반(RAG가 활성화된 경우) 및 프롬프트에서 검색된 문서도 로깅되며, 여기에는 민감한 정보가 포함될 수 있습니다.

# VPC
<a name="vpc"></a>

솔루션은 Amazon VPC 구성을 위한 두 가지 옵션을 제공합니다.

1. 솔루션이 Amazon VPC를 빌드하도록 합니다.

1. 솔루션 내에서 사용할 수 있도록 자체 Amazon VPC를 관리하고 가져옵니다.

## 솔루션이 Amazon VPC를 빌드하도록 허용
<a name="let-the-solution-build-an-amazon-vpc-for-you"></a>

솔루션이 Amazon VPC를 빌드하도록 허용하는 옵션을 선택하면 기본적으로 CIDR 범위 10.10.0.0/20으로 2-AZ 아키텍처로 배포됩니다. 각 AZ에 퍼블릭 서브넷 1개와 프라이빗 서브넷 1개와 함께 [Amazon VPC IP 주소 관리자(IPAM)](https://docs.aws.amazon.com/vpc/latest/ipam/what-it-is-ipam.html)를 사용할 수 있습니다. 솔루션은 각 퍼블릭 서브넷에 NAT 게이트웨이를 생성하고 프라이빗 서브넷에 [ENIs](https://docs.aws.amazon.com/Lambda/latest/dg/foundation-networking.html)를 생성하도록 Lambda 함수를 구성합니다. 또한이 구성은 라우팅 테이블과 해당 항목, 보안 그룹 및 해당 규칙, 네트워크 ACLs, VPC 엔드포인트(게이트웨이 및 인터페이스 엔드포인트)를 생성합니다.

## 자체 Amazon VPC 관리
<a name="managing-your-own-amazon-vpc"></a>

Amazon VPC로 솔루션을 배포할 때 AWS 계정 및 리전의 기존 Amazon VPC를 사용할 수 있습니다. 고가용성을 보장하려면 두 개 이상의 가용 영역에서 VPC를 사용할 수 있도록 하는 것이 좋습니다. VPC에는 다음과 같은 VPC 엔드포인트와 VPC 및 라우팅 테이블 구성에 대한 관련 IAM 정책도 있어야 합니다.

### 배포 대시보드 Amazon VPC의 경우
<a name="deployment-dashboard-2"></a>

1.  [DynamoDB의 게이트웨이 엔드포인트](https://docs.aws.amazon.com/vpc/latest/privatelink/vpc-endpoints-ddb.html)입니다.

1.  [S3의 게이트웨이 엔드포인트](https://docs.aws.amazon.com/vpc/latest/privatelink/vpc-endpoints-s3.html)입니다.

1.  [CloudWatch의 인터페이스 엔드포인트](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CloudWatch-logs-and-interface-VPC.html)입니다.

1.  [AWS CloudFormation의 인터페이스 엔드포인트](https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/cfn-vpce-bucketnames.html)입니다.

### 사용 사례 Amazon VPC의 경우
<a name="use-cases-2"></a>

1.  [DynamoDB용 게이트웨이 엔드포인트](https://docs.aws.amazon.com/vpc/latest/privatelink/vpc-endpoints-ddb.html)입니다.

1.  [S3의 게이트웨이 엔드포인트](https://docs.aws.amazon.com/vpc/latest/privatelink/vpc-endpoints-s3.html)입니다.

1.  [CloudWatch의 인터페이스 엔드포인트](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CloudWatch-logs-and-interface-VPC.html)입니다.

1.  [Systems Manager Parameter Store의 인터페이스 엔드포인트](https://docs.aws.amazon.com/systems-manager/latest/userguide/setup-create-vpc.html)입니다.
**참고**  
솔루션에는 만 필요합니다`com.amazonaws.region.ssm`.

1.  [Amazon Bedrock용 인터페이스 엔드포인트(bedrock-runtime, agent-runtime, bedrock-agent-runtime)](https://docs.aws.amazon.com/bedrock/latest/userguide/vpc-interface-endpoints.html)

1. 선택 사항: 배포에서 Amazon Kendra를 지식 기반으로 사용하는 경우 [Amazon Kendra에 대한 인터페이스 엔드포인트](https://docs.aws.amazon.com/kendra/latest/dg/vpc-interface-endpoints.html)가 필요합니다.

1. 선택 사항: 배포에서 Amazon Bedrock 아래의 LLM을 사용하는 경우 [Amazon Bedrock에 대한 인터페이스 엔드포인트](https://docs.aws.amazon.com/bedrock/latest/userguide/vpc-interface-endpoints.html)가 필요합니다.
**참고**  
솔루션에는 만 필요합니다`com.amazonaws.region.bedrock-runtime`.

1. 선택 사항: 배포에서 LLM에 Amazon SageMaker AI를 사용하는 경우 [ Amazon SageMaker AI에 대한 인터페이스 엔드포인트](https://docs.aws.amazon.com/sagemaker/latest/dg/interface-vpc-endpoint.html)가 필요합니다.

**참고**  
솔루션은 자체 VPC **배포 가져오기 옵션을 사용할 때 VPC** 구성을 삭제하거나 수정하지 않습니다. 그러나 VPCs 생성 옵션에서 솔루션에 의해 생성된 모든 VPC는 삭제됩니다. **** 따라서 스택/배포 간에 솔루션 관리형 VPC를 공유할 때는 주의해야 합니다.  
예를 들어 배포 A는 **VPC 생성** 옵션을 사용합니다. 배포 B는 배포 A에서 생성한 **VPC를 사용하여 자체** VPC 가져오기를 사용합니다. 배포 B 전에 배포 A를 삭제하면 VPC가 삭제되었으므로 배포 B가 더 이상 작동하지 않습니다. 또한 배포 B는 Lambda 함수에서 생성한 ENIs를 사용하므로 배포 A를 삭제하면 오류가 발생하고 잔여 리소스가 보존될 수 있습니다.

# Amazon CloudFront
<a name="amazon-cloudfront"></a>

이 솔루션은 Amazon S3 버킷에 [호스팅](https://docs.aws.amazon.com/AmazonS3/latest/dev/WebsiteHosting.html)된 웹 콘솔을 배포합니다. 지연 시간을 줄이고 보안을 개선하기 위해이 솔루션에는 솔루션의 웹 사이트 버킷 콘텐츠에 대한 퍼블릭 액세스를 제공하는 CloudFront 사용자인 오리진 액세스 ID가 있는 CloudFront 배포가 포함됩니다. 자세한 내용을 알아보려면 *Amazon CloudFront 개발자 안내서*의 [오리진 액세스 ID(OAI)를 사용하여 Amazon S3 콘텐츠에 대한 액세스 제한](https://docs.aws.amazon.com/AmazonCloudFront/latest/DeveloperGuide/private-content-restricting-access-to-s3.html)을 참조하세요.

**참고**  
CloudFront의 계정 수준 소프트 할당량 제한은 응답 헤더 정책 20개입니다. 이 솔루션은 보안을 위해 사용자 지정 응답 헤더 정책을 생성합니다. AWS의 생성형 AI Application Builder 또는 사용 사례를 20개 이상 배포한 경우 할당량 한도에 도달하여 새 배포가 실패할 수 있습니다.

이 문제를 해결하려면 다음 단계에 따라 AWS Service Quotas 콘솔에서 **응답 헤더 정책** 할당량에 대한 할당량 증가를 요청할 수 있습니다.

1. AWS Service Quotas 콘솔을 엽니다.

1. 탐색 창에서 **AWS 서비스**를 선택합니다.

1. **Amazon CloudFront**를 검색하고 선택합니다.

1. **응답 헤더 정책** 할당량으로 스크롤하고 **할당량 증가 요청을** 선택합니다.

1. 프롬프트에 따라 AWS 계정에 대한 할당량 한도 증가를 요청합니다.

**응답 헤더 정책** 할당량을 늘리면 할당량 제한으로 인해 AWS 또는 해당 사용 사례에서 생성형 AI Application Builder의 새 배포가 실패하지 않도록 할 수 있습니다.

# 할당량
<a name="quotas"></a>

서비스 할당량(제한이라고도 함)은 AWS 계정의 최대 서비스 리소스 또는 작업 수입니다.

## 이 솔루션의 AWS 서비스에 대한 할당량
<a name="quotas-for-aws-services-in-this-solution"></a>

[이 솔루션에 구현된 각 서비스](architecture-details.md#aws-services-in-this-solution)의 할당량이 충분한지 확인하세요. 자세한 내용은 [AWS 서비스 할당량을 참조하세요](https://docs.aws.amazon.com/general/latest/gr/aws_service_limits.html).

다음 링크를 선택하여 해당 서비스에 대한 페이지로 이동합니다. 페이지를 전환하지 않고 설명서의 모든 AWS 서비스에 대한 서비스 할당량을 보려면 PDF 대신 [서비스 엔드포인트 및 할당량](https://docs.aws.amazon.com/general/latest/gr/aws-general.pdf#aws-service-information) 페이지에서 정보를 확인하세요.

## Amazon Bedrock AgentCore 할당량
<a name="agentcore-quotas"></a>

Agent Builder 배포의 경우 다음 Amazon [Bedrock AgentCore 서비스 할당량에 유의하세요.](https://docs.aws.amazon.com/bedrock-agentcore/latest/devguide/bedrock-agentcore-limits.html)


| 할당량 | 미국 동부(버지니아 북부) | 기타 리전 | 
| --- | --- | --- | 
|  계정당 활성 세션 워크로드  |  1000  |  500  | 
|  계정당 총 에이전트 수  |  1,000  |  1,000  | 
|  계정당 버전  |  1,000  |  1,000  | 