기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
Nova Micro
Amazon — Nova Micro
모델 세부 정보
Nova Micro는 요약, 번역 및 분류와 같은 작업의 속도와 저렴한 비용에 최적화된 Amazon의 가장 빠른 텍스트 전용 모델입니다. 모델 개발 및 성능에 대한 자세한 내용은 모델/서비스 카드를 참조하세요.
모델 시작 날짜: 2024년 12월 5일
모델 EOL 날짜: 12/4/2025 이전
최종 사용자 라이선스 계약 및 이용 약관: 보기
모델 수명 주기: 활성
컨텍스트 창: 128K 토큰
최대 출력 토큰: 5K
지식 마감: 2024년 10월
| 입력 모달리티 | 출력 모달리티 | 지원되는 APIs | 지원되는 엔드포인트 |
|---|---|---|---|
Responses | bedrock-runtime | ||
Chat Completions | bedrock-mantle | ||
Invoke | |||
Converse | |||
가격 책정
요금은 Amazon Bedrock 요금
프로그래밍 방식 액세스
다음 모델 IDs 및 엔드포인트 URLs 사용하여이 모델에 프로그래밍 방식으로 액세스합니다. 사용 가능한 APIs 및 엔드포인트에 대한 자세한 내용은 APIs 및 지원되는 엔드포인트를 참조하세요.
| Endpoint | 모델 ID | 리전 내 엔드포인트 URL | 지리 추론 ID | 글로벌 추론 ID |
|---|---|---|---|---|
bedrock-runtime |
amazon.nova-micro-v1:0 |
https://bedrock-runtime.{region}.amazonaws.com |
|
지원되지 않음 |
예를 들어 리전이 us-east-1(버지니아 북부)인 경우 bedrock-runtime 엔드포인트 URL은 "https://bedrock-runtime.us-east-1.amazonaws.com"이고 bedrock-mantle의 경우 "https://bedrock-mantle.us-east-1.api.aws/v1"입니다.
서비스 티어
Amazon Bedrock은 워크로드 요구 사항에 맞는 여러 서비스 계층을 제공합니다. 표준은 약정 없이 pay-per-token 액세스를 제공합니다. Priority는 시간 기반 약정으로 더 높은 처리량을 제공합니다. Flex는 유연하고 non-time-sensitive 워크로드에 대해 저렴한 액세스를 제공합니다. 예약은 예측 가능한 워크로드에 대한 기간 약정과 함께 전용 처리량을 제공합니다. 자세한 내용은 서비스 계층을 참조하세요.
| 표준 | 우선 순위 | Flex | 예약됨 |
|---|---|---|---|
리전별 가용성
리전별 가용성 한눈에 보기
Bedrock은 세 가지 추론 옵션을 제공합니다. 리전 내는 엄격한 규정 준수를 위해 단일 리전 내에 요청을 유지하고, 리전(미국, EU 등) 내 리전 간 지리적 교차 리전 경로는 데이터 레지던시를 준수하면서 더 높은 처리량을 제공하며, 글로벌 교차 리전 경로는 레지던시 제약이 없는 경우 최대 처리량을 위해 전 세계 어디서나 라우팅됩니다. 자세한 내용은 리전별 가용성 페이지를 참조하세요.
| 리전 | 리전 내 | 지리 | [Global] |
|---|---|---|---|
us-east-1 (버지니아 북부) | |||
us-east-2 (오하이오) | |||
us-west-2 (오레곤) | |||
us-gov-west-1 (GovCloud) | |||
eu-central-1 (프랑크푸르트) | |||
eu-north-1 (스톡홀름) | |||
eu-south-1 (밀라노) | |||
eu-south-2 (스페인) | |||
eu-west-1 (아일랜드) | |||
eu-west-2 (런던) | |||
eu-west-3 (파리) | |||
ap-southeast-2 (시드니) | |||
il-central-1 (텔아비브) |
지리 추론 세부 정보
지역: 미국
지리 추론 ID: us.amazon.nova-micro-v1:0
| 소스 리전 | 대상 리전 |
|---|---|
| us-east-1(버지니아 북부) | us-east-1(버지니아 북부), us-east-2(오하이오), us-west-2(오레곤) |
| us-east-2(오하이오) | us-east-1(버지니아 북부), us-east-2(오하이오), us-west-2(오레곤) |
| us-west-2(오리건) | us-east-1(버지니아 북부), us-east-2(오하이오), us-west-2(오레곤) |
지역: EU
지리 추론 ID: eu.amazon.nova-micro-v1:0
| 소스 리전 | 대상 리전 |
|---|---|
| eu-central-1(프랑크푸르트) | eu-central-1(프랑크푸르트), eu-north-1(스톡홀름), eu-west-1(아일랜드), eu-west-3(파리) |
| eu-north-1(스톡홀름) | eu-central-1(프랑크푸르트), eu-north-1(스톡홀름), eu-west-1(아일랜드), eu-west-3(파리) |
| eu-south-1(밀라노) | eu-central-1(프랑크푸르트), eu-north-1(스톡홀름), eu-south-1(밀라노), eu-west-1(아일랜드), eu-west-3(파리) |
| eu-south-2(스페인) | eu-central-1(프랑크푸르트), eu-north-1(스톡홀름), eu-south-2(스페인), eu-west-1(아일랜드), eu-west-3(파리) |
| eu-west-1(아일랜드) | eu-central-1(프랑크푸르트), eu-north-1(스톡홀름), eu-west-1(아일랜드), eu-west-3(파리) |
| eu-west-3(파리) | eu-central-1(프랑크푸르트), eu-north-1(스톡홀름), eu-west-1(아일랜드), eu-west-3(파리) |
| il-central-1(텔아비브) | eu-central-1(프랑크푸르트), eu-north-1(스톡홀름), eu-south-1(밀라노), eu-west-1(아일랜드), eu-west-3(파리), il-central-1(텔아비브) |
할당량과 제한
AWS 계정에는 서비스의 성능을 유지하고 Amazon Bedrock의 적절한 사용을 보장하기 위한 기본 할당량이 있습니다. 계정에 할당된 기본 할당량은 리전 요인, 결제 기록, 사기 사용 및/또는 할당량 증가 요청 승인에 따라 업데이트될 수 있습니다. 자세한 내용은 Amazon Bedrock의 할당량 설명서를 참조하고 모델의 제한을 참조하세요.
샘플 코드
1단계 - AWS 계정: AWS 계정이 이미 있는 경우이 단계를 건너뜁니다. AWS를 처음 사용하는 경우 AWS 계정에
2단계 - API 키: Amazon Bedrock 콘솔
3단계 - SDK 가져오기:이 시작 안내서를 사용하려면 Python이 이미 설치되어 있어야 합니다. 그런 다음 사용 중인 APIs에 따라 관련 소프트웨어를 설치합니다.
pip install boto3
4단계 - 환경 변수 설정: 인증에 API 키를 사용하도록 환경을 구성합니다.
AWS_BEARER_TOKEN_BEDROCK="<provide your Bedrock API key>"
5단계 - 첫 번째 추론 요청 실행: 파일을 로 저장 bedrock-first-request.py