View a markdown version of this page

Vorbereiten der Eingabedaten - Amazon Redshift

Amazon Redshift unterstützt ab Patch 198 nicht mehr die Erstellung neuer Python-UDFs. Bestehende Python-UDFs werden bis zum 30. Juni 2026 weiterhin funktionieren. Weitere Informationen finden Sie im Blog-Posting.

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Vorbereiten der Eingabedaten

Wenn die Eingabedaten nicht mit den Tabellenspalten kompatibel sind, die diese erhalten, wird der COPY-Befehl fehlschlagen.

Wenden Sie die folgenden Richtlinien an, um sicherzustellen, dass die Eingabedaten gültig sind:

  • Ihre Daten können nur UTF-8 Zeichen mit einer Länge von bis zu vier Byte enthalten.

  • Überprüfen Sie, ob CHAR- und VARCHAR-Zeichenfolgen die Länge der entsprechenden Spalten nicht überschreiten. VARCHAR-Zeichenfolgen werden in Bytes und nicht in Zeichen gemessen. Daher erfordert eine Zeichenfolge mit vier chinesischen Zeichen, die jeweils vier Bytes enthalten, eine VARCHAR(16)-Spalte.

  • Multibyte-Zeichen können nur mit VARCHAR-Spalten verwendet werden. Überprüfen Sie, ob Multibyte-Zeichen nicht mehr als vier Bytes enthalten.

  • Überprüfen Sie, ob Daten für CHAR-Spalten nur Einzelbyte-Zeichen enthalten.

  • Verwenden Sie keine Sonderzeichen oder eine spezielle Syntax, um das letzte Feld in einem Datensatz anzuzeigen. Dieses Feld kann ein Trennzeichen sein.

  • Wenn Ihre Daten Nullterminatoren enthalten, die auch als NUL (UTF-8 0000) oder binäre Null (0x000) bezeichnet werden, können Sie diese Zeichen als NULL-Zeichen in CHAR- oder VARCHAR-Spalten laden, indem Sie die Option NULL AS im COPY-Befehl verwenden: oder. null as '\0' null as '\000' Wenn Sie NULL AS nicht verwenden, schlägt COPY fehl, wenn Null-Terminatoren vorhanden sind.

  • Wenn Ihre Zeichenfolgen Sonderzeichen wie Trennzeichen und eingebettete neue Zeilen enthalten, verwenden Sie die ESCAPE-Option des COPY-Befehls.

  • Überprüfen Sie, ob alle einfachen und doppelten Anführungszeichen korrekt übereinstimmen.

  • Überprüfen Sie, ob Gleitkomma-Zeichenfolgen das Gleitkomma-Standardformat, beispielsweise 12.123, oder ein exponentielles Format, beispielsweise 1.0E4, aufweisen.

  • Überprüfen Sie, ob alle Zeitstempel- und Datumszeichenfolgen die Spezifikationen für befolgen DATEFORMAT- und TIMEFORMAT-Zeichenfolgen. Das standardmäßige Zeitstempelformat ist YYYY-MM-DD hh:mm:ss, und das Standard-Datumsformat ist. YYYY-MM-DD

  • Weitere Informationen zu Grenzen und Einschränkungen für einzelne Datentypen finden Sie unter Datentypen. Weitere Informationen zu Fehlern für Multibyte-Zeichen finden Sie unter . Fehler beim Laden von Multibyte-Zeichen