View a markdown version of this page

Aus Google-Sheets-Entitäten lesen - AWS Glue

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Aus Google-Sheets-Entitäten lesen

Voraussetzungen

  • Ein Google SpreadSheet , von dem Sie gerne lesen würden. Sie benötigen die SpreadSheet ID und den TabNamen der Tabelle.

Google-Sheets-Entitäts- und Felddetails

Entität Datentyp Unterstützte Operatoren
Tabellenkalkulation Zeichenfolge n. v. (Filter wird nicht unterstützt)

Beispiel

googleSheets_read = glueContext.create_dynamic_frame.from_options( connection_type="googlesheets", connection_options={ "connectionName": "connectionName", "ENTITY_NAME": "{SpreadSheetID}#{SheetTabName}", "API_VERSION": "v4" }

Partitionierung von Abfragen

Nur für die Partitionierung auf Datensatzbasis kann NUM_PARTITIONS als zusätzliche Spark-Optionen bereitgestellt werden, wenn Sie Parallelität in Spark nutzen möchten. Mit diesem Parameter würde die ursprüngliche Abfrage in NUM_PARTITIONS Unterabfragen aufgeteilt, die von Spark-Aufgaben gleichzeitig ausgeführt werden können.

Beispiel mit NUM_PARTITIONS

googlesheets_read = glueContext.create_dynamic_frame.from_options( connection_type="googlesheets", connection_options={ "connectionName": "connectionName", "ENTITY_NAME": "{SpreadSheetID}#{SheetTabName}", "API_VERSION": "v4", "NUM_PARTITIONS": "10" }