

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Überlegungen zu Presto in Amazon EMR
<a name="emr-presto-considerations"></a>

Berücksichtigen Sie die folgenden Unterschiede und Einschränkungen, wenn Sie [Presto](https://aws.amazon.com/big-data/what-is-presto/) in Amazon EMR ausführen.

## In der Befehlszeile von Presto ausführbare Datei
<a name="emr-presto-command-line-cli"></a>

In Amazon EMR verwenden PrestoDB und Trino dieselbe ausführbare Befehlszeilendatei `presto-cli`, wie im folgenden Beispiel.

```
presto-cli --catalog hive
```

## Nicht konfigurierbare Presto-Bereitstellungseigenschaften
<a name="emr-presto-deployment-config"></a>

Die Version von Amazon EMR, die Sie verwenden, bestimmt die verfügbaren Presto-Bereitstellungskonfigurationen. Weitere Informationen zu diesen Konfigurationseigenschaften finden Sie unter [Bereitstellen von Presto](https://prestodb.io/docs/current/installation/deployment.html) in der Presto-Dokumentation. Die folgende Tabelle zeigt die Konfigurationsoptionen der Presto-`properties`-Dateien.


| Datei | Konfigurierbar | 
| --- | --- | 
|  `log.properties`  |  PrestoDB: Konfigurierbar in Amazon-EMR-Versionen 4.0.0 und höher. Verwenden Sie die `presto-log`-Konfigurationsklassifizierung.  | 
|  `config.properties`  |  PrestoDB: Konfigurierbar in Amazon-EMR-Versionen 4.0.0 und höher. Verwenden Sie die `presto-config`-Konfigurationsklassifizierung.  | 
|  `hive.properties`  |  PrestoDB: Konfigurierbar in der Amazon-EMR-Version 4.1.0 und höher. Verwenden Sie die `presto-connector-hive`-Konfigurationsklassifizierung.  | 
|  `node.properties`  |  PrestoDB: Konfigurierbar in der Amazon-EMR-Version 5.6.0 und höher. Verwenden Sie die `presto-node`-Konfigurationsklassifizierung.  | 
|  `jvm.config`  |  Nicht konfigurierbar.  | 

## PrestoDB-Installation
<a name="emr-prestodb-prestosql"></a>

Der Anwendungsname *Presto* wird weiterhin verwendet, um PrestoDB auf Clustern zu installieren. 

Sie können entweder PrestoDB oder Trino installieren, aber Sie können nicht beide auf einem einzigen Cluster installieren. Wenn Sie beim Versuch, einen Cluster zu erstellen, sowohl PrestoDB als auch Trino angeben, tritt ein Validierungsfehler auf und die Anfrage zur Clustererstellung schlägt fehl.

## EMRFS- und PrestoS3-Konfiguration FileSystem
<a name="emr-presto-prestos3"></a>

Mit Amazon-EMR-Versionen 5.12.0 und höher kann PrestoDB EMRFS verwenden. Weitere Informationen finden Sie unter [EMR File System (EMRFS)](https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-fs) im *Verwaltungshandbuch für Amazon EMR*. In früheren Versionen von Amazon EMR FileSystem ist PrestoS3 die einzige Konfigurationsoption.

Sie können eine Sicherheitskonfiguration verwenden, um die Verschlüsselung für EMRFS-Daten in Amazon S3 einzurichten. Sie können auch IAM-Rollen für EMRFS-Anforderungen an Amazon S3 verwenden. Weitere Informationen finden unter [Verschlüsselungsoptionen verstehen](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-data-encryption-options.html) und [IAM-Rollen für EMRFS in Amazon S3 konfigurieren](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-emrfs-iam-roles.html) im *Verwaltungshandbuch für Amazon EMR*.

**Anmerkung**  
Wenn Sie die zugrunde liegenden Daten in Amazon S3 mit Amazon-EMR-Version 5.12.0 abfragen, können Presto-Fehler auftreten. Dies liegt daran, dass Presto die Konfigurationsklassifizierungswerte von `emrfs-site.xml` nicht abruft. Um dieses Problem zu umgehen, erstellen Sie ein `emrfs`-Unterverzeichnis unter `usr/lib/presto/plugin/hive-hadoop2/` und erstellen einen Symlink `usr/lib/presto/plugin/hive-hadoop2/emrfs` zu der vorhandenen Datei `/usr/share/aws/emr/emrfs/conf/emrfs-site.xml`. Starten Sie dann den Presto-Server-Prozess neu (`sudo presto-server stop` gefolgt von `sudo presto-server start`). 

Sie können den EMRFS-Standard überschreiben und stattdessen PrestoS3 verwenden. FileSystem Verwenden Sie dazu die `presto-connector-hive`-Konfigurationsklassifizierung, um `hive.s3-file-system-type` auf `PRESTO` zu setzen, wie im folgenden Beispiel veranschaulicht. Weitere Informationen finden Sie unter [Anwendungen konfigurieren](emr-configure-apps.md).

```
[
   {
      "Classification": "presto-connector-hive",
      "Properties": {
         "hive.s3-file-system-type": "PRESTO"
      }
   }
]
```

Wenn Sie PrestoS3 verwenden, verwenden Sie die `presto-connector-hive` KonfigurationsklassifizierungFileSystem, um PrestoS3-Eigenschaften zu konfigurieren. FileSystem Weitere Informationen zu den verfügbaren Eigenschaften finden Sie unter [Amazon-S3-Konfiguration](https://prestodb.io/docs/current/connector/hive.html#amazon-s3-configuration) im Abschnitt zum Hive-Konnektor in der Presto-Dokumentation. Diese Einstellungen gelten nicht für EMRFS.

## Standardeinstellung für Endbenutzer-Identitätswechsel
<a name="emr-presto-end-user-impersonation"></a>

Standardmäßig ist der Endbenutzer-Identitätswechsel ab der Amazon-EMR-Version 5.12.0 und höher für den Zugriff auf HDFS aktiviert. Weitere Informationen finden Sie im Abschnitt zum [Endbenutzer-Identitätswechsel](https://prestodb.io/docs/current/connector/hive-security.html#end-user-impersonation) in der Presto-Dokumentation. Um diese Einstellung zu ändern, setzen Sie die `presto-config`-Konfigurationsklassifizierung der `hive.hdfs.impersonation.enabled`-Eigenschaft auf `false`.

## Standardport für die Presto-Webschnittstelle
<a name="emr-presto-default-web-port"></a>

Standardmäßig konfiguriert Amazon EMR die Presto-Webschnittstelle auf dem Presto-Koordinator dazu, den Port 8889 (für PrestoDB und Trino) zu verwenden. Um den Port zu ändern, verwenden Sie die `presto-config`-Konfigurationsklassifizierung, um die `http-server.http.port`-Eigenschaft festzulegen. Weitere Informationen finden Sie unter [Konfigurationseigenschaften](https://prestodb.io/docs/current/installation/deployment.html#config-properties) im Abschnitt zur *Bereitstellung von Presto* in der Presto-Dokumentation.

## Problem bei der Hive-Bucket-Ausführung in einigen Versionen
<a name="emr-presto-bucket-execution"></a>

Presto Version 152.3 hat ein Problem mit der Hive-Bucket-Ausführung, das in Presto in einigen Fällen zu einer erheblich langsameren Abfrageleistung führt. Die Amazon-EMR-Versionen 5.0.3, 5.1.0 und 5.2.0 enthalten diese Version von Presto. Um dieses Problem abzumildern, verwenden Sie die `presto-connector-hive`-Konfigurationsklassifizierung, um die Eigenschaft `hive.bucket-execution` auf `false` zu setzen, wie im folgenden Beispiel veranschaulicht.

```
[
   {
      "Classification": "presto-connector-hive",
      "Properties": {
         "hive.bucket-execution": "false"
      }
   }
]
```