As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
DeepSeek-R1
DeepSeek — DeepSeek -R1
Detalhes do modelo
DeepSeek-R1 é DeepSeek o modelo de raciocínio usado chain-of-thought para resolver problemas complexos de matemática, codificação e lógica. Para obter mais informações sobre desenvolvimento e desempenho de modelos, consulte o modelo/cartão de serviço
Data de lançamento do modelo: 20 de janeiro de 2025
Data de EOL do modelo: Não antes de 3/10/2026
Contratos de licença de usuário final e termos de uso: Exibir
Ciclo de vida do modelo: Ativo
Janela de contexto: 128K tokens
Tokens de saída máximos: 8K
Raciocínio: Compatível
Limite de conhecimento: janeiro de 2025
| Modalidades de entrada | Modalidades de saída | APIs suportado | Endpoints suportados |
|---|---|---|---|
Responses | bedrock-runtime | ||
Chat Completions | bedrock-mantle | ||
Invoke | |||
Converse | |||
Capacidades e recursos
Características do Bedrock
Recursos compatíveis com o bedrock-runtime endpoint
Preços
Para obter os preços, consulte a página de preços do Amazon Bedrock
Acesso programático
Use o modelo IDs e o endpoint URLs a seguir para acessar esse modelo programaticamente. Para obter mais informações sobre os endpoints disponíveis APIs , consulte APIs suportados e Endpoints suportados.
| Endpoint | ID do modelo | URL do endpoint na região | ID de inferência geográfica | ID de inferência global |
|---|---|---|---|---|
bedrock-runtime |
deepseek.r1-v1:0 |
https://bedrock-runtime.{region}.amazonaws.com |
us.deepseek.r1-v1:0 |
Não compatível |
Por exemplo, se a região for us-east-1 (Norte da Virgínia), a URL do endpoint bedrock-runtime será "" e para bedrock-mantle será https://bedrock-runtime.us-east-1.amazonaws.com "https://bedrock-mantle.us-east-1.api.aws/v1”.
Níveis de serviço
O Amazon Bedrock oferece vários níveis de serviço para atender às suas necessidades de carga de trabalho. O padrão fornece pay-per-token acesso sem compromisso. O Priority oferece maior produtividade com um compromisso baseado em tempo. O Flex fornece acesso de baixo custo para cargas de trabalho flexíveis. non-time-sensitive O Reserved fornece taxa de transferência dedicada com um compromisso de longo prazo para cargas de trabalho previsíveis. Para obter mais informações, consulte níveis de serviço.
| Padrão | Priority | Flexionar | Reservado |
|---|---|---|---|
Disponibilidade regional
Visão geral da disponibilidade regional
A Bedrock oferece três opções de inferência: In-Region mantém as solicitações em uma única região para conformidade estrita, rotas geográficas entre regiões dentro de uma geografia (EUA, UE, etc.) para maior produtividade, respeitando a residência dos dados, e rotas globais entre regiões em qualquer lugar do mundo para máxima produtividade quando não há restrições de residência. Consulte a Disponibilidade regional página para obter mais detalhes.
| Região | Na região | Geo | Global |
|---|---|---|---|
us-east-1(Norte da Virgínia) | |||
us-east-2(Ohio) | |||
us-west-2(Oregon) |
Detalhes da inferência geográfica
Geo: EUA
ID de inferência geográfica: us.deepseek.r1-v1:0
| Região de origem | Regiões de destino |
|---|---|
| us-east-1 (N. Virginia) | us-east-1 (Norte da Virgínia), us-east-2 (Ohio), us-west-2 (Oregon) |
| us-east-2 (Ohio) | us-east-1 (Norte da Virgínia), us-east-2 (Ohio), us-west-2 (Oregon) |
| us-west-2 (Oregon) | us-east-1 (Norte da Virgínia), us-east-2 (Ohio), us-west-2 (Oregon) |
Cotas e limites
Sua conta da AWS tem cotas padrão para manter o desempenho do serviço e garantir o uso adequado do Amazon Bedrock. As cotas padrão atribuídas a uma conta podem ser atualizadas dependendo de fatores regionais, histórico de pagamentos, uso fraudulento e and/or aprovação de uma solicitação de aumento de cota. Para obter mais detalhes, consulte a Cotas do Amazon Bedrock documentação e veja os limites do modelo.
Código de exemplo
Etapa 1 - Conta da AWS: se você já tem uma conta da AWS, pule esta etapa. Se você é novo na AWS, cadastre-se em uma conta da AWS
Etapa 2 - Chave de API: acesse o console do Amazon Bedrock
Etapa 3 - Obtenha o SDK: para usar este guia de introdução, você deve ter o Python já instalado. Em seguida, instale o software relevante, dependendo do APIs que você está usando.
pip install boto3
Etapa 4 - Definir variáveis de ambiente: configure seu ambiente para usar a chave de API para autenticação.
AWS_BEARER_TOKEN_BEDROCK="<provide your Bedrock API key>"
Etapa 5 - Execute sua primeira solicitação de inferência: salve o arquivo como bedrock-first-request.py