Leistungsoptimierung

Wenn Sie eine externe Hive-Tabelle erstellen, die einer DynamoDB-Tabelle zugeordnet ist, wird keine Lese- oder Schreibkapazität von DynamoDB belegt. Lese- und Schreibaktivitäten in der Hive-Tabelle (wie INSERT oder SELECT) wirken sich jedoch direkt als Lese- und Schreibvorgänge in der zugrunde liegenden DynamoDB-Tabelle aus.

Apache Hive auf Amazon EMR implementiert eine eigene Logik für den I/O Lastausgleich in der DynamoDB-Tabelle und versucht, die Möglichkeit zu minimieren, dass der bereitgestellte Durchsatz der Tabelle überschritten wird. Am Ende jeder Hive-Abfrage gibt Amazon EMR Laufzeitmetriken zurück, einschließlich der Anzahl von Überschreitungen des bereitgestellten Durchsatzes. Sie können diese Informationen zusammen mit CloudWatch Metriken in Ihrer DynamoDB-Tabelle verwenden, um die Leistung bei nachfolgenden Anfragen zu verbessern.

Die Amazon-EMR-Konsole bietet grundlegende Überwachungstools für Ihren Cluster. Weitere Informationen finden Sie unter Anzeigen und Überwachen eines Clusters im Managementleitfaden für Amazon EMR.

Außerdem können Sie Ihren Cluster und Hadoop-Aufträge mithilfe von webbasierten Tools wie Hue und Ganglia sowie der Hadoop-Webschnittstelle überwachen. Weitere Informationen finden Sie unter Anzeigen von auf Amazon-EMR-Clustern gehosteten Webschnittstellen im Management Guide für Amazon EMR.

In diesem Abschnitt werden Schritte beschrieben, wie Sie die Leistung von Hive-Operationen für externe DynamoDB-Tabellen optimieren können.

Themen

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Lesen von nicht UTF-8 druckbaren Zeichendaten

DynamoDB – Bereitgestellter Durchsatz