

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# ナレッジベース
<a name="knowledge-base-integrations"></a>

ナレッジベースは、生成 AI を活用した検索と質問への回答に最適化された、データソースからのドキュメントやコンテンツの、インデックス化された整理されたコレクションです。チームがドキュメントを Confluence に保存する場合でも、SharePoint を通じてコラボレーションする場合でも、クラウドストレージ内のファイルを管理する場合でも、ナレッジベースを作成することで、この情報をすべて 1 つの統合検索エクスペリエンスに取り込むことができます。

 組み込みの統合は、数回クリックするだけでセットアップでき、Quick でデータを同期し、Google Drive、OneDrive、Confluence、SharePoint、S3、Web Crawler 全体で組織の知識を簡単に活用できます。チームがドキュメントを Confluence に保存する場合でも、SharePoint を通じてコラボレーションする場合でも、クラウドストレージ内のファイルを管理する場合でも、ナレッジベースを利用して、この情報をすべて 1 つの統合検索エクスペリエンスに取り込むことができます。

## ナレッジベースの仕組み
<a name="how-knowledge-bases-work"></a>

ナレッジベースは、Google Drive などのデータソースからのドキュメントまたはコンテンツのインデックス付きコレクションであり、生成 AI を活用した検索と質問への回答に最適化されています。複数のナレッジベースを同じソースから作成でき、すべて共有クイックインデックス内に配置できます。例えば、Google Drive から 2 つのフォルダを同期し、2 つのナレッジベースを作成する場合、1 つは*「返金ポリシーとは*」などのクエリに回答するためのポリシードキュメント、もう 1 つは「顧客のフィードバック」で*「顧客の一般的な苦情とは*」などのクエリに回答するためのナレッジベースです。どちらも同じインデックスに含めることができます。クイックはナレッジベース ID を使用してそれらを区別するため、クエリをフィルタリングして目的のナレッジベースから関連ドキュメントのみを取得できます。これにより、基になるデータが一緒にインデックス化されていても、ユーザーはさまざまなドメインやユースケースに関連する情報を整理、保護、取得できます。

ナレッジベースは、個別に使用することも、Amazon Quick スペースを通じてチームメンバーと共有することもできます。粗粒度のアクセスコントロールにより、ナレッジベースレベルでセキュリティが可能になり、ユーザーはアクセスが許可されているナレッジベースからのみ情報を受信できます。

### 作成プロセス
<a name="knowledge-base-creation-process"></a>

新しいデータアクセス統合をセットアップしながらナレッジベースを作成し、既存の統合を使用して追加のナレッジベースを作成できます。

1. **データアクセス統合のセットアップ** - 外部データソースに接続する

1. **コンテンツの選択** - フィルターとスコープ設定を使用して含めるコンテンツを選択します

1. **インデックス作成** - Amazon Quick は、選択したコンテンツを処理およびインデックス作成します。

1. **可用性** - ナレッジベースをスペースや AI エージェントで使用できるようになります。

### 機能
<a name="knowledge-base-capabilities"></a>

各ナレッジベースには以下の機能があります。
+ **コンテンツのインデックス作成** - 外部ソースからのテキスト、ドキュメント、構造化データを処理します
+ **セマンティック検索** - インデックス付きコンテンツ全体で AI を活用した検索を有効にします
+ **自動同期** - 設定可能な同期スケジュールでコンテンツをup-to-dateに保つ
+ **粗粒度のアクセスコントロール** - ユーザーがアクセスを許可されているナレッジベースからのみ情報を受信できるようにします。
+ **複数スペースの使用** - 複数のスペースおよび異なる AI エージェントで使用できます

## 一般的なワークフロー
<a name="general-workflow"></a>

ナレッジベースを使用するための一般的なワークフローは、次のステップに従います。

1. **データソース統合の設定** - 適切な認証を使用して外部アプリケーション (SharePoint、Google Drive、Confluence など) に接続します。詳細については、「[統合固有のガイド](integration-guides.md)」を参照してください。

1. **ナレッジベースの作成** - 新しい統合の設定中にナレッジベースを作成できます。関連するコンテンツに焦点を当てるように、インクルードフィルター、ファイルタイプの制限、フォルダの選択を設定して、コンテンツフィルターを設定します。

1. **同期スケジュールの設定** - データの更新頻度は、デフォルトで毎日に設定されます。同期頻度を編集して、ナレッジベースをソースの新しいコンテンツで更新する頻度を設定できます。

1. **モニタリングと管理** - 同期ステータスを確認し、アクセス許可を管理します。

## 一般的な設定
<a name="common-configuration-settings"></a>

ナレッジベースは、さまざまなデータソース統合で共通の設定パターンを共有します。これらの設定を理解することで、コンテンツのインデックス作成を最適化し、同期動作を効果的に管理できます。

**注記**  
これらの設定オプションはほとんどの統合で使用できますが、特定の設定と使用可能なオプションは、選択したデータソース統合によって異なる場合があります。

### ファイルサイズとコンテンツの制限
<a name="file-size-and-content-limits"></a>

ファイルサイズ制限を設定して、処理パフォーマンスを最適化し、ストレージコストを管理します。特定の制限はコンテンツタイプによって異なり、ナレッジベースを設定するとコンソールに表示されます。

**標準テキストドキュメント**  
PDFs、Word ファイル、テキストファイルなどのドキュメントに適用されます。ファイルサイズ制限は 500 MB です。

**動画ファイル**  
ビデオ処理が有効になっている場合に使用できます。サポートされている形式には、`.mp4`、`.mov`、 があります`.m4v`。ファイルサイズ制限は 10 GB (10240 MB) です。クイックインデックスは、ストレージの **GB あたり最大 10 個のビデオファイル**をサポートします。ユースケースでビデオボリュームを増やす必要がある場合は、この制限を延長する AWS サポート付きのチケットを開いてください。

**オーディオファイル**  
オーディオ処理が有効になっている場合に使用できます。サポートされている形式には`.mp3`、、` .wav`、` .m4a`、`.flac`、 などがあります` .ogg`。オーディオファイルの制限は 2 GB (2048 MB) です。  
抽出されたテキストが 30 MB のシステム制限を超えるファイルは、元のファイルサイズに関係なくインデックス化されません。1 つのドキュメントから抽出できるテキストの最大量は 30 MB です。

**イメージ**  
クイックインデックスでは、イメージに次の制限が適用されます。  
+ **ドキュメントあたりの制限**: ドキュメントあたり 500 イメージ
+ **GB あたりの制限**: インデックスストレージの GB あたり 10K イメージ
+ **インデックスあたりの制限**: インデックスあたり 2Mイメージ
ユースケースでイメージボリュームを増やす必要がある場合は、これらの制限を拡張する AWS サポート付きのチケットを開いてください。

### スケジュールと保護の同期
<a name="sync-schedule-and-safeguards"></a>

ナレッジベースが更新する頻度を設定し、意図しないコンテンツの削除から保護します。

#### 同期頻度
<a name="sync-frequency"></a>

デフォルトでは、データの更新頻度は毎日に設定されています。同期頻度を編集して、ナレッジベースがソースの新しいコンテンツで更新する頻度を設定できます。

#### ドキュメント削除の保護
<a name="document-deletion-safeguard"></a>

最大削除率しきい値を設定して、インデックス化されたコンテンツを偶発的な一括削除から保護します。同期ジョブがしきい値で許可されているよりも多くのドキュメントを削除する場合、削除フェーズはスキップされ、既存のインデックス付きコンテンツが保持されます。

この保護は、一時的なネットワークの問題、アクセス許可の変更、またはコンテンツを一時的に使用できなくなる可能性のあるソースシステムの問題から保護します。

# ナレッジベースで ACLs を管理するためのベストプラクティス
<a name="acl-best-practices-kb"></a>

アクセスコントロールリスト (ACLs) でナレッジベースを使用する場合、ユーザー ID とアクセス許可を正確に保つ責任があります。これにより、適切なユーザーが適切なドキュメントにアクセスできるようになります。デフォルトでは、ID とドキュメントレベルの ACL の変更は 24 時間ごとに自動的に同期されます。ユーザーまたはアクセス許可の更新は、ナレッジベースに別の更新スケジュールを設定していない限り、システムに表示されるまでに最大 1 日かかります。

特定のデータソースの ACLs「」を参照してください[Amazon S3 統合](s3-integration.md)。

**注記**  
Quick は、すべての E メールアドレスを大文字と小文字を区別しません。`JohnDoe@example.com`、`johndoe@example.com`、および `JOHNDOE@example.com`はすべて同じユーザーと見なされます。

## 重要なユーザー管理シナリオ
<a name="acl-user-management-scenarios"></a>

**E メールバインディングについて**

E メールアドレスは、ユーザーがチャットインタラクションを開始すると、Quick ユーザーに動的にバインドされます。このバインディングは、first-come-first-serveのアプローチに従います。特定の E メールアドレスとチャットする最初のユーザーは、名前空間内でその ID のバインドを確立します。

**従業員が組織を離れたとき**

従業員が退職したら、すぐにアクセスをクリーンアップします。

1. ACL 設定ファイルを更新して、E メールアドレスへの参照を削除します。例えば、Amazon S3 では、グローバル ACL ファイルまたはメタデータファイルを更新します。

1. ナレッジベースを更新して変更を適用します。

これにより、E メールが後で別のユーザーに再割り当てされた場合に発生する可能性のあるセキュリティの問題を回避できます。

**E メールアドレスが新しい従業員に再割り当てされた場合**
+ ACL 対応ナレッジベースのアクセスは、データセキュリティを保護するために、再割り当てされた E メールアドレスに対して自動的にロックされます。
+ 新しい従業員がその E メールに関連付けられたドキュメントにアクセスする前に、クイックサポートに連絡して、以前のユーザーのアクセスをクリーンアップしてください。

## 制限事項
<a name="acl-limitations"></a>

ナレッジベースにドキュメントレベルの ACLs を設定するときは、次の制限事項に注意してください。
+ **ドキュメントレベルの ACL 設定は永続的** – ACLs サポートなしで作成されたナレッジベースで ACL を有効にすることはできません。また、一度有効にACLs を無効にすることはできません。ACL 設定を変更するには、最初から必要な設定で新しいナレッジベースを作成します。
+ **名前空間内の共有 E メールアドレス** – 複数の Quick ユーザーが名前空間内で同じ E メールアドレスを共有する場合、システムはその共有 E メールを使用したすべてのユーザーへのアクセスを拒否します。この保護により、誤った人物にドキュメントへのアクセスを誤って付与することを防ぎます。
+ **ACL 解決スコープ** – すべての ACLs は、ナレッジベース作成者のクイック名前空間内で解決されます。これは、ACLsメールアドレスまたはグループ名で指定されているかどうかにかかわらず適用されます。クイックは、作成者の組織コンテキストで ID を検索して、一貫した ID 解決を確保します。
+ **E メールアドレスのリサイクルタイミング** – 組織が E メールアドレスをある従業員から別の従業員に再割り当てする場合は、重要なタイミングを考慮する必要があります。前の従業員がチャットや AI とのやり取りに Quick を使用したことがなく、次回の ACL 更新前に E メールが再割り当てされた場合、新しい従業員は前の従業員向けのドキュメントに一時的にアクセスすることがあります。

  これを回避するには、次の手順を順に実行します。

  1. ACLs (該当する場合、Amazon S3 など) を更新して古いユーザーを削除し、新しいユーザーを追加します。

  1. ナレッジベースを手動で更新するか、毎日の自動更新を待ちます。

  1. 新しい従業員に E メールアドレスを割り当てます。

  これにより、新しいユーザーが Quick の使用を開始する前に、アクセス許可が適切に同期されます。
+ **研究の互換性** – ドキュメントレベルの ACLsが有効になっているナレッジベースは現在、Quick Research と互換性がありません。ACL 対応ナレッジベースのドキュメントを研究目的で使用する必要がある場合は、それらのドキュメントの ACLs なしで別のナレッジベースを作成します。

# ナレッジベースのトラブルシューティング
<a name="troubleshooting-knowledge-bases"></a>

クイックナレッジベースで問題が発生した場合は、このトラブルシューティングガイドを使用して一般的な問題を特定して解決できます。ナレッジベースの問題には通常、ドキュメントの同期、ジョブの更新の失敗、またはアクセス許可が含まれます。

## ドキュメントがナレッジベースに表示されない
<a name="documents-not-appearing"></a>

表示されると予想されるドキュメントがナレッジベースに表示されない場合、いくつかの要因によってこの問題が発生する可能性があります。

**一般的な原因:**
+ **同期中** – ドキュメントがまだ処理中である可能性があります。更新ステータスをチェックして、更新が完了したことを確認します。
+ **サポートされていないファイル形式** – ドキュメントがサポートされている形式であることを確認します: Word、Excel、PowerPoint、PDF、CSV、TXT、RTF、JSON、XML、HTML
+ **ファイルサイズが大きすぎる** – 各ファイルは 50 MB 未満である必要があります。
+ **アクセス許可が不十分** – ナレッジベースにドキュメントソースにアクセスするための適切なアクセス許可があることを確認します。
+ **ドキュメントフィルタリング** – フィルターまたは除外ルールによって特定のドキュメントのインデックス作成が妨げられているかどうかを確認します。

**トラブルシューティングを行うには:**

1. 同期に失敗した特定のドキュメントに関連するエラーメッセージの更新履歴を確認します。

1. ドキュメントの形式とファイルサイズが要件を満たしていることを確認します。

1. アクセス許可と接続設定を確認します。

## 更新ジョブが失敗する
<a name="refresh-job-fails"></a>

更新ジョブは通常、ナレッジベースまたはデータソース接続で設定エラーが発生したときに失敗します。

**一般的な原因:**
+ アクセス**許可の問題** – 統合には、データソースにアクセスするための十分なアクセス許可がありません。
+ **設定エラー** – URLsまたはデータソース接続設定が正しくありません。
+ **リソースの制限** — ソースシステムからのレート制限。

**解決するには:**

1. 特定のエラーメッセージについては、更新履歴の詳細を確認してください。

1. すべての接続設定とアクセス許可が正しく設定されていることを確認します。

1. エラーメッセージに基づいて推奨アクションを実行します。

## 更新ジョブが問題で完了する
<a name="refresh-job-completes-with-issues"></a>

更新ジョブで問題が発生すると、ジョブは正常に処理されましたが、一部のドキュメントで問題が発生しました。

**これが意味するもの:**
+ **部分的な成功** – 一部のドキュメントは正常に同期され、他のドキュメントは失敗しました。
+ **ドキュメントレベルのエラー** – 個々のファイルには、フォーマットの問題、破損、またはアクセスの問題がある可能性があります。
+ **メタデータの問題** – ドキュメントメタデータまたは関連情報に関する問題。
+ **サイズまたは形式の違反** – 一部のファイルはサイズ制限を超えているか、サポートされていない形式である可能性があります。

**解決するには:**

1. 詳細な更新レポートを確認して、問題が発生したドキュメントを特定します。

1. 個々のドキュメントの問題に対処します。

1. 問題を解決した後、別の更新を実行します。

## 更新ジョブは成功しましたが、ドキュメントは表示されません
<a name="refresh-job-succeeds-no-documents"></a>

更新ジョブが成功と表示されたが、ナレッジベースにドキュメントが表示されない場合は、これらの潜在的な原因を確認してください。

**一般的な原因:**
+ **空のソース** – 設定されたデータソースの場所にはドキュメントが含まれていません。
+ **パス設定が正しく**ない — ソースパスまたは接続設定が正しい場所を指していません。
+ **ドキュメントフィルター** – 包含条件または除外条件により、すべてのドキュメントが除外される場合があります。
+ **読み取りアクセス許可がありません** – ジョブは正常に接続されましたが、実際のドキュメントを読み取るアクセス許可がありません。

**解決するには:**

1. データソース設定が正しい場所を指していることを確認します。

1. 指定された場所にドキュメントが存在することを確認します。

1. 適切なアクセス許可が設定されていることを確認します。

1. コンテンツを除外する可能性のあるドキュメントフィルターを確認します。

## 更新中のファイル形式の問題
<a name="file-format-issues"></a>

クイックナレッジベースは、特定のファイル形式をサポートしています。ファイルは、形式、サイズ、および文字制限の要件を満たしている必要があります。

**要件:**
+ **サポートされている形式:** Word、Excel、PowerPoint、PDF、CSV、TXT、RTF、JSON、XML、HTML
+ **ファイルサイズ制限:** ファイルあたり 50 MB
+ **ファイル条件:** 破損していない、またはパスワードで保護されていない

**フォーマットの問題を解決するには:**

1. ファイルが形式とサイズの要件を満たしていることを確認します。

1. サポートされていない形式をサポートされている形式に変換します。

1. ファイルからパスワード保護を削除します。

1. ファイルが破損していないことを確認します。

## アクセス拒否エラー
<a name="access-denied-errors"></a>

アクセス拒否エラーは通常、認証または認可の問題が原因で発生します。

**一般的な原因:**
+ **無効な認証情報** – 認証トークンまたはパスワードの有効期限が切れている可能性があります。
+ **アクセス許可が不十分** – 統合で使用されるアカウントは、データソースへの読み取りアクセスがありません。
+ **ネットワーク制限** – ファイアウォールまたはセキュリティポリシーはアクセスをブロックします。
+ **SSL/TLS の問題** — 安全な接続に関する証明書の問題。

**解決するには:**

1. **認証情報の検証** – 認証情報が最新で有効であることを確認します。統合を編集して再認証し、新しいトークンを生成します。

1. **ウェブクローラーデータソースの場合** – 安全な接続が正しく設定され、SSL 証明書が正しく設定され、信頼されていることを確認します。

1. **システム管理者に連絡する** – アクセスの問題が引き続き発生する場合は、システム管理者に連絡してください。アクセス許可またはセキュリティ設定の調整が必要になる場合があります。