

# Suporte multimodal para o Amazon Nova
<a name="modalities"></a>

**nota**  
Esta documentação é para o Amazon Nova versão 1. Para ver a documentação multimodal do Amazon Nova 2, acesse [Compreensão multimodal](https://docs.aws.amazon.com/nova/latest/nova2-userguide/using-multimodal-models.html).

Os modelos de compreensão do Amazon Nova são modelos de compreensão multimodais, o que significa que eles são compatíveis com entradas multimodais, como imagens, vídeos e documentos, para inferir e responder a perguntas com base no conteúdo fornecido. Os modelos do Amazon Nova estão equipados com novos recursos visuais que permitem que o modelo compreenda e analise imagens, documentos e vídeos, realizando assim casos de uso de compreensão multimodal.

A seção a seguir descreve as diretrizes para trabalhar com imagens, documentos e vídeos no Amazon Nova. Isso inclui estratégias de pré-processamento empregadas, exemplos de código e limitações relevantes a serem consideradas.

**Topics**
+ [Tipo de conteúdo compatível por modalidade](#modalities-content)
+ [Compreensão de imagens](modalities-image.md)
+ [Compreensão de vídeos](modalities-video.md)
+ [Compreensão do documento](modalities-document.md)
+ [Tratamento de erros](text-error-handing.md)

## Tipo de conteúdo compatível por modalidade
<a name="modalities-content"></a>

As informações a seguir detalham os formatos de arquivo compatíveis com arquivo de mídia e o método de entrada aceito.


| Tipo de arquivo de mídia | Formatos de arquivo compatíveis | **Método de entrada** | Estratégia de análise | 
| --- |--- |--- |--- |
| Imagem | PNG, JPG, JPEG, GIF, WebP | Base64<br />URI do Amazon S3 | Compreensão visual de imagens | 
| Documento de texto<br />*(Somente a API Converse)* | CSV, XLS, XLSX, HTML, TXT, MD, DOC | Bytes<br />URI do Amazon S3 | Compreensão textual somente do documento. | 
| Documento de mídia<br />*(Somente a API Converse)* | PDF, DOCX | Bytes<br />URI do Amazon S3 | Texto com compreensão de imagem intercalada | 
| Vídeo | MP4, MOV, MKV, WebM, FLV, MPEG, MPG, WMV, 3GP | Base64<br />URI do Amazon S3 | Compreensão visual de vídeos | 

**nota**  
Você pode incluir até cinco arquivos do seu computador ou 1000 arquivos do Amazon S3. Cada arquivo não deve ter mais de 1 GB quando carregado do Amazon S3. O tamanho total dos arquivos carregados não pode exceder 25 MB ao fazer o upload do seu computador ou 2 GB ao fazer o upload do Amazon S3.

Como 25 MB é o limite geral de carga útil, certifique-se de considerar a sobrecarga do base64. Enquanto estiver trabalhando, lembre-se de que bibliotecas e frameworks mantêm a memória, e o conteúdo de mídia transmitido pode se acumular rapidamente. Ao usar vídeo, especificar um `s3Location` deve aliviar muitos problemas de armazenamento.

**nota**  
Vídeos e documentos grandes levam tempo para serem processados, independentemente do método de entrada. Se o SDK do boto3 atingir o tempo limite enquanto aguarda uma resposta do Amazon Bedrock, verifique se você tem um valor de [read\_timeout](https://botocore.amazonaws.com/v1/documentation/api/latest/reference/config.html) apropriado definido e atualizou o boto3 no mínimo para a versão 1.38.