Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Nova Lite
Amazon — Nova Lite
Détails du modèle
Date de lancement du modèle : 05 décembre 2024
Date EOL du modèle : Au plus tôt /2025 12/4
Contrats de licence utilisateur final et conditions d'utilisation : Afficher
Cycle de vie du modèle : actif
Fenêtre contextuelle : 300 000 jetons
Nombre maximum de jetons de sortie : 5 000
Date limite de disponibilité des connaissances : octobre 2024
| Modalités de saisie | Modalités de sortie | API prises en charge | Endpoints pris en charge |
|---|---|---|---|
Responses | bedrock-runtime | ||
Chat Completions | bedrock-mantle | ||
Invoke | |||
Converse | |||
Capacités et fonctionnalités
Caractéristiques de Bedrock
Fonctionnalités prises en charge avec bedrock-runtime Endpoint
| Soutenu | Non pris en charge |
|---|---|
Mise en cache rapide à l'aide du terminal bedrock-runtime
Pour plus d'informations, voir Mise en cache rapide pour une inférence de modèle plus rapide.
| Mise en cache rapide prise en charge | Nombre minimal de jetons par point de contrôle du cache | Nombre maximal de points de contrôle du cache par demande | TTL pris en charge | Champs qui acceptent les points de contrôle rapides du cache |
|---|---|---|---|---|
| Oui | 1 K* | 4 | 5 minutes | system et messages |
* Les modèles Amazon Nova prennent en charge un maximum de 20 000 jetons pour une mise en cache rapide. La mise en cache rapide concerne principalement les demandes de texte.
Tarification
Pour connaître les tarifs, consultez la page de tarification d'Amazon Bedrock
Accès programmatique
Utilisez les ID de modèle et les URL de point de terminaison suivants pour accéder à ce modèle par programmation. Pour plus d'informations sur les API et les points de terminaison disponibles, consultez les sections API prises en charge et Points de terminaison pris en charge.
| Point de terminaison | ID du modèle | In-Region URL du terminal | Identifiant d'inférence géographique | ID d'inférence global |
|---|---|---|---|---|
bedrock-runtime |
amazon.nova-lite-v1:0 |
https://bedrock-runtime.{region}.amazonaws.com |
|
Non pris en charge |
Par exemple, si la région est us-east-1 (Virginie du Nord), l'URL du point de terminaison bedrock-runtime sera « » et celle de bedrock-mantle sera https://bedrock-runtime.us-east-1.amazonaws.com « ». https://bedrock-mantle.us-east-1.api.aws/v1
Niveaux de service
Amazon Bedrock propose plusieurs niveaux de service pour répondre aux exigences de votre charge de travail. Standard fournit un accès au paiement par jeton sans engagement. Priority offre un débit plus élevé avec un engagement basé sur le temps. Flex fournit un accès à moindre coût pour les charges de travail flexibles et non urgentes. Reserved fournit un débit dédié avec un engagement à terme pour des charges de travail prévisibles. Pour plus d'informations, consultez la section niveaux de service.
| Standard | Priorité | Flex | Réservé |
|---|---|---|---|
Disponibilité par région
La disponibilité régionale en un coup d'œil
Bedrock propose trois options d'inférence : In-Regionconserver les demandes dans une seule région pour une conformité stricte, Cross-Regiongéo-itinéraires entre les régions d'une même zone géographique (États-Unis, UE, etc.) pour un débit plus élevé tout en respectant la résidence des données, et Cross-Region itinéraires mondiaux partout dans le monde pour un débit maximal en l'absence de contraintes de résidence. Reportez-vous à la Disponibilité par région page pour plus de détails.
| Région | In-Region | Géo | Solution internationale |
|---|---|---|---|
us-east-1(Virginie du Nord) | |||
us-east-2(Ohio) | |||
us-west-1(Californie du Nord) | |||
us-west-2(Oregon) | |||
us-gov-west-1 (GovCloud) | |||
eu-central-1(Francfort) | |||
eu-north-1(Stockholm) | |||
eu-south-1(Milan) | |||
eu-south-2(Espagne) | |||
eu-west-1(Irlande) | |||
eu-west-2(Londres) | |||
eu-west-3(Paris) | |||
ap-northeast-1(Tokyo) | |||
ap-southeast-2(Sydney) | |||
ap-southeast-3(Jakarta) | |||
il-central-1(Tel Aviv) | |||
me-central-1(Émirats arabes unis) |
Détails de la géo-inférence
Géo : États-Unis
Identifiant d'inférence géographique : us.amazon.nova-lite-v1:0
| Région source | Régions de destination |
|---|---|
| us-east-1 (Virginie du Nord) | us-east-1 (Virginie du Nord), us-east-2 (Ohio), us-west-2 (Oregon) |
| us-east-2 (Ohio) | us-east-1 (Virginie du Nord), us-east-2 (Ohio), us-west-2 (Oregon) |
| us-west-1 (Californie du Nord) | us-east-1 (Virginie du Nord), us-east-2 (Ohio), us-west-1 (Californie du Nord), us-west-2 (Oregon) |
| us-west-2 (Oregon) | us-east-1 (Virginie du Nord), us-east-2 (Ohio), us-west-2 (Oregon) |
Géo : UE
Identifiant d'inférence géographique : eu.amazon.nova-lite-v1:0
| Région source | Régions de destination |
|---|---|
| eu-central-1 (Francfort) | eu-central-1 (Francfort), eu-nord-1 (Stockholm), eu-west-1 (Irlande), eu-west-3 (Paris) |
| eu-north-1 (Stockholm) | eu-central-1 (Francfort), eu-nord-1 (Stockholm), eu-west-1 (Irlande), eu-west-3 (Paris) |
| eu-south-1 (Milan) | eu-central-1 (Francfort), eu-north-1 (Stockholm), eu-south-1 (Milan), eu-west-1 (Irlande), eu-west-3 (Paris) |
| eu-south-2 (Espagne) | eu-central-1 (Francfort), eu-north-1 (Stockholm), eu-south-2 (Espagne), eu-west-1 (Irlande), eu-west-3 (Paris) |
| eu-west-1 (Irlande) | eu-central-1 (Francfort), eu-nord-1 (Stockholm), eu-west-1 (Irlande), eu-west-3 (Paris) |
| eu-west-3 (Paris) | eu-central-1 (Francfort), eu-nord-1 (Stockholm), eu-west-1 (Irlande), eu-west-3 (Paris) |
| il-central-1 (Tel Aviv-Jaffa) | eu-central-1 (Francfort), eu-nord-1 (Stockholm), eu-sud-1 (Milan), eu-west-1 (Irlande), eu-west-3 (Paris), il-central-1 (Tel Aviv) |
Quotas et limites
Votre compte AWS dispose de quotas par défaut pour maintenir les performances du service et garantir une utilisation appropriée d'Amazon Bedrock. Les quotas par défaut attribués à un compte peuvent être mis à jour en fonction de facteurs régionaux, de l'historique des paiements, de l'utilisation frauduleuse ou de and/or l'approbation d'une demande d'augmentation de quota. Pour plus de détails, reportez-vous à Quotas pour Amazon Bedrock la documentation et aux limites du modèle.
Exemple de code
Étape 1 - Compte AWS : si vous possédez déjà un compte AWS, ignorez cette étape. Si vous utilisez AWS pour la première fois, créez un compte AWS
Étape 2 - Clé d'API : accédez à la console Amazon Bedrock
Étape 3 - Téléchargez le SDK : pour utiliser ce guide de démarrage, Python doit déjà être installé. Installez ensuite le logiciel approprié en fonction des API que vous utilisez.
pip install boto3
Étape 4 - Définissez les variables d'environnement : configurez votre environnement pour utiliser la clé API pour l'authentification.
AWS_BEARER_TOKEN_BEDROCK="<provide your Bedrock API key>"
Étape 5 - Exécutez votre première demande d'inférence : enregistrez le fichier sous bedrock-first-request.py