

# Amazon Nova のマルチモーダルサポート
<a name="modalities"></a>

**注記**  
このドキュメントは Amazon Nova バージョン 1 を対象としています。Amazon Nova 2 マルチモーダルドキュメントについては、「[マルチモーダル理解](https://docs.aws.amazon.com/nova/latest/nova2-userguide/using-multimodal-models.html)」を参照してください。

Amazon Nova 理解モデルはマルチモーダル理解モデルです。つまり、画像、動画、ドキュメントなどのマルチモーダル入力をサポートし、提供されたコンテンツに基づいて質問を推測して回答します。Amazon Nova モデルは、画像、ドキュメント、動画を理解して分析できる新しいビジョン機能が搭載されているため、マルチモーダル理解のユースケースを実現します。

次のセクションでは、Amazon Nova で画像、ドキュメント、動画を操作するためのガイドラインの概要を説明します。これには、採用された前処理戦略、コード例、および考慮すべき関連する制限が含まれます。

**Topics**
+ [モダリティでサポートされているコンテンツタイプ](#modalities-content)
+ [画像理解](modalities-image.md)
+ [動画理解](modalities-video.md)
+ [ドキュメント理解](modalities-document.md)
+ [エラー処理](text-error-handing.md)

## モダリティでサポートされているコンテンツタイプ
<a name="modalities-content"></a>

次の情報では、メディアファイルでサポートされているファイル形式と、受け入れられる入力方法について詳しく説明します。


| メディアファイルタイプ | サポートされるファイル形式 | **入力方法** | 解析戦略 | 
| --- |--- |--- |--- |
| Image | PNG、JPG、JPEG、GIF、WebP | Base64<br />Amazon S3 URI | 画像ビジョン理解 | 
| テキストドキュメント<br />*(Converse API のみ)* | CSV、XLS、XLSX、HTML、TXT、MD、DOC | バイト<br />Amazon S3 URI | ドキュメントからのテキスト理解のみ。 | 
| メディアドキュメント<br />*(Converse API のみ)* | PDF、DOCX | バイト<br />Amazon S3 URI | インターリーブされた画像理解を含むテキスト | 
| 動画 | MP4、MOV、MKV、WebM、FLV、MPEG、MPG、WMV、3GP | Base64<br />Amazon S3 URI | 動画ビジョン理解 | 

**注記**  
コンピュータから最大 5 個のファイル、または Amazon S3 から最大 1000 個のファイルを含めることができます。Amazon S3 からアップロードする場合、各ファイルは 1 GB 以下にする必要があります。アップロードされたファイルの合計サイズは、コンピュータからアップロードする場合は 25 MB、Amazon S3 からアップロードする場合は 2 GB を超えることはできません。

全体のペイロード制限は 25 MB であるため、必ず base64 のオーバーヘッドを考慮してください。作業中は、ライブラリとフレームワークがメモリを占有することや、渡されたメディアコンテンツがすぐに増えてしまう可能性があることに注意してください。動画を使用する場合、`s3Location` を指定すると、多くのストレージの問題が軽減されます。

**注記**  
大きな動画やドキュメントは、入力方法に関係なく処理に時間がかかります。Amazon Bedrock からのレスポンス待機中に boto3 SDK がタイムアウトする場合は、適切な [read\_timeout](https://botocore.amazonaws.com/v1/documentation/api/latest/reference/config.html) 値が設定され、boto3 がバージョン 1.38 以降にアップグレードされていることを確認してください。