Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Data-Quality-API
Die Data-Quality-API beschreibt die Data-Quality-Datentypen und umfasst die API zum Erstellen, Löschen oder Aktualisieren von Datenqualitätsregelsätzen, -Ausführungen und -Bewertungen.
Datentypen
DataSource Struktur
Eine Datenquelle (eine AWS Glue Tabelle), für die Sie Datenqualitätsergebnisse wünschen.
Felder
-
GlueTable– Ein GlueTable-Objekt.Eine AWS Glue Tabelle.
-
DataQualityGlueTable– Ein DataQualityGlueTable-Objekt.Eine AWS Glue Tabelle für Datenqualitätsoperationen.
DataQualityRulesetListDetails Struktur
Beschreibt einen Datenqualitätsregelsatz, der von GetDataQualityRuleset zurückgegeben wurde.
Felder
-
Name— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Der Name des Regelsatzes für die Datenqualität.
-
Description– Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.Eine Beschreibung des Regelsatzes für die Datenqualität.
-
CreatedOn– Zeitstempel.Das Datum und die Uhrzeit, zu der der Datenqualitätsregelsatz erstellt wurde.
-
LastModifiedOn– Zeitstempel.Das Datum und die Uhrzeit der letzten Änderung des Regelsatzes für die Datenqualität.
-
TargetTable– Ein DataQualityTargetTable-Objekt.Ein Objekt, das eine AWS Glue Tabelle darstellt.
-
RecommendationRunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.Wenn ein Regelsatz aus einer Empfehlungsausführung erstellt wurde, wird diese Ausführungs-ID generiert, um die beiden miteinander zu verknüpfen.
-
RuleCount– Zahl (Ganzzahl).Die Anzahl der Regeln im Regelsatz.
DataQualityTargetTable Struktur
Ein Objekt, das eine AWS Glue Tabelle darstellt.
Felder
-
TableName— Erforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.Der Name der AWS Glue Tabelle.
-
DatabaseName— Erforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.Der Name der Datenbank, in der die AWS Glue Tabelle existiert.
-
CatalogId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.Die Katalog-ID, in der die AWS Glue Tabelle existiert.
DataQualityRulesetEvaluationRunDescription Struktur
Beschreibt das Ausführungsergebnis zur Auswertung des Datenqualitätsregelsatzes.
Felder
-
RunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Die dieser Ausführung zugeordnete eindeutige Kennung.
-
Status— UTF-8 Zeichenfolge (gültige Werte:RUNNING| |FINISHED|FAILED|PENDING_EXECUTION|TIMED_OUT|CANCELING|CANCELED|RECEIVED_BY_TASKRUNNER).Der Status für diese Ausführung.
-
StartedOn– Zeitstempel.Das Datum und die Uhrzeit, zu der die Ausführung gestartet wurde.
-
DataSource– Ein DataSource-Objekt.Die dem Lauf zugeordnete Datenquelle (eine AWS Glue Tabelle).
DataQualityRulesetEvaluationRunFilter Struktur
Die Filterkriterien.
Felder
-
DataSource– Erforderlich: Ein DataSource-Objekt.Filter basierend auf einer Datenquelle (einer AWS Glue Tabelle), die dem Lauf zugeordnet ist.
-
StartedBefore– Zeitstempel.Filtert Ergebnisse nach Ausführungen, die vor diesem Zeitpunkt begonnen haben.
-
StartedAfter– Zeitstempel.Filtert Ergebnisse nach Ausführungen, die nach diesem Zeitpunkt begonnen haben.
-
RulesetName— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.Filtert die Ergebnisse nach Läufen, die einem bestimmten Regelsatznamen zugeordnet sind.
DataQualityEvaluationRunAdditionalRunOptions Struktur
Zusätzliche Ausführungsoptionen, die Sie für eine Ausführung der Auswertung angeben können.
Felder
-
CloudWatchMetricsEnabled– Boolesch.Ob CloudWatch Metriken aktiviert werden sollen oder nicht.
-
ResultsS3Prefix— UTF-8 Zeichenfolge.Präfix für Amazon S3 zum Speichern von Ergebnissen.
-
CompositeRuleEvaluationMethod— UTF-8 Zeichenfolge (gültige Werte:COLUMN|ROW).Legen Sie die Bewertungsmethode für zusammengesetzte Regeln im Regelsatz auf fest ROW/COLUMN
-
CustomLogGroupPrefix— UTF-8 Zeichenfolge.Ein benutzerdefiniertes Präfix für die Namen der CloudWatch Protokollgruppen. Wenn diese Option angegeben ist, werden Testlaufprotokolle in
<CustomLogGroupPrefix>/errorund<CustomLogGroupPrefix>/outputnicht in die Standard/aws-glue/data-quality/error- und/aws-glue/data-quality/outputProtokollgruppen geschrieben. Der Gesamtname der Protokollgruppe, einschließlich des Suffixes (/erroroder/output), darf 512 Zeichen nicht überschreiten.
DataQualityRuleRecommendationRunDescription Struktur
Beschreibt das Ergebnis einer Empfehlungsausführung einer Datenqualitätsregel.
Felder
-
RunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Die dieser Ausführung zugeordnete eindeutige Kennung.
-
Status— UTF-8 Zeichenfolge (gültige Werte:RUNNING| |FINISHED|FAILED|PENDING_EXECUTION|TIMED_OUT|CANCELING|CANCELED|RECEIVED_BY_TASKRUNNER).Der Status für diese Ausführung.
-
StartedOn– Zeitstempel.Das Datum und die Uhrzeit, zu der diese Ausführung gestartet wurde.
-
DataSource– Ein DataSource-Objekt.Die Datenquelle (AWS Glue Tabelle), die dem Empfehlungslauf zugeordnet ist.
DataQualityRuleRecommendationRunFilter Struktur
Ein Filter zum Auflisten von Empfehlungsausführungen zu Datenqualität.
Felder
-
DataSource– Erforderlich: Ein DataSource-Objekt.Filter basierend auf einer angegebenen Datenquelle (AWS Glue Tabelle).
-
StartedBefore– Zeitstempel.Filtert basierend auf der Zeit für Ergebnisse, die vor der angegebenen Zeit gestartet wurden.
-
StartedAfter– Zeitstempel.Filtert basierend auf der Zeit für Ergebnisse, die nach der angegebenen Zeit gestartet wurden.
DataQualityResult Struktur
Beschreibt ein Datenqualitätsergebnis.
Felder
-
ResultId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Eine eindeutige Ergebnis-ID für das Datenqualitätsergebnis.
-
ProfileId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Die Profil-ID für das Datenqualitätsergebnis.
-
Score– Zahl (Double), nicht mehr als 1,0.Ein aggregierter Datenqualitätswert. Stellt das Verhältnis der Regeln dar, die an die Gesamtzahl der Regeln übergeben wurden.
-
DataSource– Ein DataSource-Objekt.Die Tabelle, die dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.
-
RulesetName— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Der Name des Regelsatzes, der dem Datenqualitätsergebnis zugeordnet ist.
-
EvaluationContext— UTF-8 Zeichenfolge.Im Kontext eines Jobs in AWS Glue Studio wird in der Regel jedem Knoten auf der Arbeitsfläche ein Name zugewiesen, und Datenqualitätsknoten haben Namen. Bei mehreren Knoten kann das
evaluationContextdie Knoten unterscheiden. -
StartedOn– Zeitstempel.Das Datum und die Uhrzeit, zu der diese Datenqualitätsausführung gestartet wurde.
-
CompletedOn– Zeitstempel.Das Datum und die Uhrzeit, zu der diese Datenqualitätsausführung abgeschlossen wurde.
-
JobName— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.Der Auftragsname, der dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.
-
JobRunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Die Auftragsausführungs-ID, die dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.
-
RulesetEvaluationRunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Die eindeutige Ausführungs-ID für die Regelsatzauswertung für dieses Datenqualitätsergebnis.
-
RuleResults– Ein Array mit DataQualityRuleResult-Objekten, nicht mehr als 2000 Strukturen.Eine Liste von
DataQualityRuleResult-Objekten, die die Ergebnisse für jede Regel darstellen. -
AnalyzerResults– Ein Array mit DataQualityAnalyzerResult-Objekten, nicht mehr als 2000 Strukturen.Eine Liste von
DataQualityAnalyzerResult-Objekten, die die Ergebnisse für jede Analysator darstellen. -
Observations– Ein Array mit DataQualityObservation-Objekten, nicht mehr als 50 Strukturen.Eine Liste von
DataQualityObservation-Objekten, die die Beobachtungen darstellen, die nach der Auswertung der Regeln und Analysatoren generiert wurden. -
AggregatedMetrics– Ein DataQualityAggregatedMetrics-Objekt.Eine Zusammenfassung der
DataQualityAggregatedMetricsObjekte mit der Gesamtzahl der verarbeiteten Zeilen und Regeln, einschließlich ihrer pass/fail Statistiken, die auf Ergebnissen auf Zeilenebene basieren.
DataQualityAnalyzerResult Struktur
Beschreibt das Ergebnis der Bewertung eines Datenqualitätsanalysators.
Felder
-
Name— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Der Name des Datenqualitätsanalysators.
-
Description— UTF-8 Zeichenfolge, nicht mehr als 2048 Byte lang, entspricht derURI address multi-line string pattern.Eine Beschreibung des Datenqualitätsanalysators.
-
EvaluationMessage— UTF-8 Zeichenfolge, nicht mehr als 2048 Byte lang, entspricht. URI address multi-line string patternEine Bewertungsmeldung.
-
EvaluatedMetrics– Ein Map-Array von Schlüssel-Wert-Paaren.Jeder Schlüssel ist eine UTF-8 Zeichenfolge, die nicht weniger als 1 oder mehr als 255 Byte lang ist und der Single-line string pattern entspricht.
Jeder Wert ist eine Zahl (doppelt).
Eine Zuordnung der Metriken, die der Auswertung des Analysators zugewiesen sind.
DataQualityObservation Struktur
Beschreibt die Beobachtung, die nach Auswertung der Regeln und Analysatoren generiert wurde.
Felder
-
Description— UTF-8 Zeichenfolge, nicht mehr als 2048 Byte lang, entspricht. URI address multi-line string patternEine Beschreibung der Datenqualitätsbeobachtung.
-
MetricBasedObservation– Ein MetricBasedObservation-Objekt.Ein Objekt vom Typ
MetricBasedObservation, das die Beobachtung darstellt, die auf ausgewerteten Datenqualitätsmetriken basiert.
MetricBasedObservation Struktur
Beschreibt die metrikbasierte Beobachtung, die auf der Grundlage ausgewerteter Datenqualitätsmetriken generiert wurde.
Felder
-
MetricName— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Der Name der Datenqualitätsmetrik, die zur Generierung der Beobachtung verwendet wurde.
-
StatisticId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Die Statistik-ID.
-
MetricValues– Ein DataQualityMetricValues-Objekt.Ein Objekt vom Typ
DataQualityMetricValues, das die Analyse des Werts der Datenqualitätsmetrik darstellt. -
NewRules— Ein Array von UTF-8 Zeichenketten.Eine Liste neuer Datenqualitätsregeln, die im Rahmen der Beobachtung auf der Grundlage des Werts der Datenqualitätsmetrik generiert wurden.
DataQualityMetricValues Struktur
Beschreibt den Wert der Datenqualitätsmetrik gemäß der Analyse von Verlaufsdaten.
Felder
-
ActualValue– Nummer (doppelt).Der tatsächliche Wert der Datenqualitätsmetrik.
-
ExpectedValue– Nummer (doppelt).Der erwartete Wert der Datenqualitätsmetrik gemäß der Analyse von Verlaufsdaten.
-
LowerLimit– Nummer (doppelt).Die Untergrenze des Werts der Datenqualitätsmetrik gemäß der Analyse von Verlaufsdaten.
-
UpperLimit– Nummer (doppelt).Die Obergrenze des Werts der Datenqualitätsmetrik gemäß der Analyse von Verlaufsdaten.
DataQualityRuleResult Struktur
Beschreibt das Ergebnis der Auswertung einer Datenqualitätsregel.
Felder
-
Name— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Der Name der Datenqualitätsregel.
-
Description— UTF-8 Zeichenfolge, nicht mehr als 2048 Byte lang, entspricht derURI address multi-line string pattern.Eine Beschreibung der Datenqualitätsregel.
-
EvaluationMessage— UTF-8 Zeichenfolge, nicht mehr als 2048 Byte lang, entspricht. URI address multi-line string patternEine Bewertungsmeldung.
-
Result— UTF-8 Zeichenfolge (gültige Werte:PASS|FAIL|ERROR).Ein Status „Bestanden“ oder „Nicht bestanden“ für die Regel.
-
EvaluatedMetrics– Ein Map-Array von Schlüssel-Wert-Paaren.Jeder Schlüssel ist eine UTF-8 Zeichenfolge, die nicht weniger als 1 oder mehr als 255 Byte lang ist und der entsprichtSingle-line string pattern.
Jeder Wert ist eine Zahl (doppelt).
Eine Zuordnung der Metriken, die der Auswertung der Regel zugewiesen sind.
-
EvaluatedRule— UTF-8 Zeichenfolge, nicht mehr als 2048 Byte lang, entspricht. URI address multi-line string patternDie ausgewertete Regel.
-
RuleMetrics– Ein Map-Array von Schlüssel-Wert-Paaren.Jeder Schlüssel ist eine UTF-8 Zeichenfolge, die nicht weniger als 1 oder mehr als 255 Byte lang ist und der Single-line string pattern entspricht.
Jeder Wert ist eine Zahl (doppelt).
Eine Zuordnung der Metriken, die der Auswertung der Regel zugewiesen sind, basierend auf den Ergebnissen auf Zeilenebene.
DataQualityResultDescription Struktur
Beschreibt ein Datenqualitätsergebnis.
Felder
-
ResultId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Die eindeutige Ergebnis-ID für dieses Datenqualitätsergebnis.
-
DataSource– Ein DataSource-Objekt.Der dem Datenqualitätsergebnis zugeordnete Tabellenname.
-
JobName— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Der dem Datenqualitätsergebnis zugeordnete Auftragsname.
-
JobRunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Die Auftragsausführungs-ID, die dem Datenqualitätsergebnis zugeordnet ist.
-
StartedOn– Zeitstempel.Die Uhrzeit, zu der die Ausführung für dieses Datenqualitätsergebnis gestartet wurde.
DataQualityResultFilterCriteria Struktur
Kriterien, die für die Rückgabe von Datenqualitätsergebnissen verwendet werden.
Felder
-
DataSource– Ein DataSource-Objekt.Filtert Ergebnisse nach der angegebenen Datenquelle. Zum Beispiel das Abrufen aller Ergebnisse für eine AWS Glue Tabelle.
-
JobName— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht. Single-line string patternFiltert Ergebnisse nach dem angegebenen Auftragsnamen.
-
JobRunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Filtert Ergebnisse nach der angegebenen Auftragsausführung-ID.
-
StartedAfter– Zeitstempel.Filtert Ergebnisse nach Ausführungen, die nach diesem Zeitpunkt begonnen haben.
-
StartedBefore– Zeitstempel.Filtert Ergebnisse nach Ausführungen, die vor diesem Zeitpunkt begonnen haben.
DataQualityRulesetFilterCriteria Struktur
Die Kriterien, die zum Filtern von Datenqualitätsregelsätzen verwendet werden.
Felder
-
Name— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Der Name der Regelsatz-Filterkriterien.
-
Description– Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.Die Beschreibung der Regelsatz-Filterkriterien.
-
CreatedBefore– Zeitstempel.Filtert nach Regelsätzen, die vor diesem Datum erstellt wurden.
-
CreatedAfter– Zeitstempel.Filtert nach Regelsätzen, die nach diesem Datum erstellt wurden.
-
LastModifiedBefore– Zeitstempel.Filtert nach Regelsätzen, die zuletzt vor diesem Datum geändert wurden.
-
LastModifiedAfter– Zeitstempel.Filter nach Regelsätzen, die zuletzt nach diesem Datum geändert wurden.
-
TargetTable– Ein DataQualityTargetTable-Objekt.Der Name und der Datenbankname der Zieltabelle.
DataQualityAggregatedMetrics Struktur
Eine Zusammenfassung der Metriken, die die Gesamtzahl der verarbeiteten Zeilen und Regeln zeigt, einschließlich ihrer pass/fail Statistiken, die auf Ergebnissen auf Zeilenebene basieren.
Felder
-
TotalRowsProcessed– Nummer (doppelt).Die Gesamtzahl der Zeilen, die bei der Datenqualitätsbewertung verarbeitet wurden.
-
TotalRowsPassed– Nummer (doppelt).Die Gesamtzahl der Zeilen, für die alle geltenden Datenqualitätsregeln erfolgreich angewendet wurden.
-
TotalRowsFailed– Nummer (doppelt).Die Gesamtzahl der Zeilen, für die eine oder mehrere Datenqualitätsregeln nicht erfolgreich angewendet wurden.
-
TotalRulesProcessed– Nummer (doppelt).Die Gesamtzahl der Datenqualitätsregeln, die bewertet wurden.
-
TotalRulesPassed– Nummer (doppelt).Die Gesamtzahl der Datenqualitätsregeln, die ihre Bewertungskriterien erfüllt haben.
-
TotalRulesFailed– Nummer (doppelt).Die Gesamtzahl der Datenqualitätsregeln, die ihre Bewertungskriterien nicht erfüllt haben.
StatisticAnnotation Struktur
Eine statistische Anmerkung.
Felder
-
ProfileId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Die Profil-ID.
-
StatisticId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Die Statistik-ID.
-
StatisticRecordedOn– Zeitstempel.Der Zeitstempel, zu dem die mit Anmerkungen versehene Statistik aufgezeichnet wurde.
-
InclusionAnnotation– Ein TimestampedInclusionAnnotation-Objekt.Die Einfügungsanmerkung, die auf die Statistik angewendet wurde.
TimestampedInclusionAnnotation Struktur
Eine Einfügungsanmerkung mit Zeitstempel.
Felder
-
Value— UTF-8 Zeichenfolge (gültige Werte:INCLUDE|EXCLUDE).Der Wert der Einfügungsanmerkung.
-
LastModifiedOn– Zeitstempel.Der Zeitstempel, zu dem die Einfügungsanmerkung zuletzt geändert wurde.
AnnotationError Struktur
Eine fehlgeschlagene Anmerkung.
Felder
-
ProfileId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Die Profil-ID für die fehlgeschlagene Anmerkung.
-
StatisticId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Die Statistik-ID für die fehlgeschlagene Anmerkung.
-
FailureReason– Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.Der Grund, warum die Anmerkung fehlgeschlagen ist.
DatapointInclusionAnnotation Struktur
Eine Einfügungsanmerkung.
Felder
-
ProfileId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Die ID des Datenqualitätsprofils, zu dem die Statistik gehört.
-
StatisticId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Die Statistik-ID.
-
InclusionAnnotation— UTF-8 Zeichenfolge (gültige Werte:INCLUDE|EXCLUDE).Der Wert der Einfügungsanmerkung, die auf die Statistik angewendet wurde.
StatisticSummaryList Liste
Eine Liste von StatisticSummary.
Ein Array von StatisticSummary-Objekten.
Eine Liste von StatisticSummary.
StatisticSummary Struktur
Zusammenfassende Informationen zu einer Statistik.
Felder
-
StatisticId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Die Statistik-ID.
-
ProfileId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Die Profil-ID.
-
RunIdentifier– Ein RunIdentifier-Objekt.Die Ausführungs-ID.
-
StatisticName— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derCustom string pattern #16.Der Name der Statistik.
-
DoubleValue– Nummer (doppelt).Der Wert der Statistik.
-
EvaluationLevel— UTF-8 Zeichenfolge (gültige Werte:Dataset="DATASET"|Column="COLUMN"|Multicolumn="MULTICOLUMN").Die Bewertungsebene der Statistik. Mögliche Werte:
Dataset,Column,Multicolumn. -
ColumnsReferenced— Ein Array von UTF-8 Zeichenketten.Die Liste der Spalten, auf die in der Statistik verwiesen wird.
-
ReferencedDatasets— Ein Array von UTF-8 Zeichenketten.Die Liste der Datensätze, auf die in der Statistik verwiesen wird.
-
StatisticProperties– Ein Map-Array von Schlüssel-Wert-Paaren.Jeder Schlüssel ist eine UTF-8 Zeichenfolge, die nicht weniger als 1 oder mehr als 255 Byte lang ist und der entsprichtSingle-line string pattern.
Jeder Wert ist eine Beschreibungszeichenfolge, die nicht länger als 2 048 Byte ist und mit URI address multi-line string pattern übereinstimmt.
Eine
StatisticPropertiesMap, die eineNameStringundDescriptionStringenthalten -
RecordedOn– Zeitstempel.Der Zeitstempel, zu dem die Statistik aufgezeichnet wurde.
-
InclusionAnnotation– Ein TimestampedInclusionAnnotation-Objekt.Die Einfügungsanmerkung für die Statistik.
RunIdentifier Struktur
Eine Ausführungs-ID.
Felder
-
RunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Die Ausführungs-ID.
-
JobRunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Die Auftragsausführungs-ID.
StatisticModelResult Struktur
Das Ergebnis des statistischen Modells.
Felder
-
LowerBound– Nummer (doppelt).Die Untergrenze.
-
UpperBound– Nummer (doppelt).Die Obergrenze.
-
PredictedValue– Nummer (doppelt).Der vorhergesagte Wert.
-
ActualValue– Nummer (doppelt).Der tatsächliche Wert.
-
Date– Zeitstempel.Das Datum.
-
InclusionAnnotation— UTF-8 Zeichenfolge (gültige Werte:INCLUDE|EXCLUDE).Die Einfügungsanmerkung.
DataQualityGlueTable Struktur
Die Datenbank und Tabelle in der AWS Glue Data Catalog , die für Eingabe- oder Ausgabedaten für Datenqualitätsoperationen verwendet werden.
Felder
-
DatabaseName— Erforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.Ein Datenbankname im AWS Glue Data Catalog.
-
TableName— Erforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.Ein Tabellenname im AWS Glue Data Catalog.
-
CatalogId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Eine eindeutige Kennung für AWS Glue Data Catalog.
-
ConnectionName— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Der Name der zu löschenden Verbindung zu AWS Glue Data Catalog.
-
AdditionalOptions– Ein Map-Array von Schlüssel-Wert-Paaren, nicht weniger als 1 oder mehr als 10 Paare.Jeder Schlüssel ist eine UTF-8 Zeichenfolge, die nicht weniger als 1 oder mehr als 255 Byte lang ist und der entsprichtSingle-line string pattern.
Jeder Wert ist eine Beschreibungszeichenfolge, die nicht länger als 2 048 Byte ist und mit URI address multi-line string pattern übereinstimmt.
Zusätzliche Optionen für die Tabelle. Derzeit werden zwei Schlüssel unterstützt:
-
pushDownPredicate: zum Filtern nach Partitionen, ohne alle Dateien in Ihrem Datensatz auflisten und lesen zu müssen. -
catalogPartitionPredicate: zur Verwendung des serverseitigen Partition-Pruning mithilfe von Partitionsindizes in der AWS Glue Data Catalog.
-
-
PreProcessingQuery— UTF-8 Zeichenfolge, nicht mehr als 51200 Byte lang, entspricht. URI address multi-line string patternSQL-Abfrage im SparkSQL-Format, mit der die Daten für die Tabelle vorverarbeitet werden können AWS Glue Data Catalog, bevor der Datenqualitätsvorgang ausgeführt wird.
Operationen
StartDataQualityRulesetEvaluationRun Aktion (Python: start_data_quality_ruleset_evaluation_run)
CancelDataQualityRulesetEvaluationRun Aktion (Python: cancel_data_quality_ruleset_evaluation_run)
GetDataQualityRulesetEvaluationRun Aktion (Python: get_data_quality_ruleset_evaluation_run)
ListDataQualityRulesetEvaluationRuns Aktion (Python: list_data_quality_ruleset_evaluation_runs)
StartDataQualityRuleRecommendationRun Aktion (Python: start_data_quality_rule_recommendation_run)
CancelDataQualityRuleRecommendationRun Aktion (Python: cancel_data_quality_rule_recommendation_run)
GetDataQualityRuleRecommendationRun Aktion (Python: get_data_quality_rule_recommendation_run)
ListDataQualityRuleRecommendationRuns Aktion (Python: list_data_quality_rule_recommendation_runs)
GetDataQualityResult Aktion (Python: get_data_quality_result)
BatchGetDataQualityResult Aktion (Python: batch_get_data_quality_result)
ListDataQualityResults Aktion (Python: list_data_quality_results)
CreateDataQualityRuleset Aktion (Python: create_data_quality_ruleset)
DeleteDataQualityRuleset Aktion (Python: delete_data_quality_ruleset)
GetDataQualityRuleset Aktion (Python: get_data_quality_ruleset)
ListDataQualityRulesets Aktion (Python: list_data_quality_rulesets)
UpdateDataQualityRuleset Aktion (Python: update_data_quality_ruleset)
ListDataQualityStatistics Aktion (Python: list_data_quality_statistics)
BatchPutDataQualityStatisticAnnotation Aktion (Python: batch_put_data_quality_statistic_annotation)
GetDataQualityModelResult Aktion (Python: get_data_quality_model_result)
ListDataQualityStatisticAnnotations Aktion (Python: list_data_quality_statistic_annotations)
PutDataQualityProfileAnnotation Aktion (Python: put_data_quality_profile_annotation)
StartDataQualityRulesetEvaluationRun Aktion (Python: start_data_quality_ruleset_evaluation_run)
Sobald Sie eine Regelsatzdefinition haben (entweder empfohlen oder Ihre eigene), rufen Sie diese Operation auf, um den Regelsatz anhand einer Datenquelle (Tabelle) auszuwerten.AWS Glue Die Auswertung berechnet Ergebnisse, die Sie mit der GetDataQualityResult-API abrufen können.
Anforderung
-
DataSource– Erforderlich: Ein DataSource-Objekt.Die diesem Lauf zugeordnete Datenquelle (AWS Glue Tabelle).
-
Role— Erforderlich: UTF-8 Zeichenfolge.Eine bereitgestellte IAM Rolle, um die Ergebnisse des Laufs zu verschlüsseln.
-
NumberOfWorkers– Zahl (Ganzzahl).Die Anzahl der
G.1X-Worker, die in der Ausführung verwendet werden sollen. Der Standardwert ist 5. -
Timeout– Zahl (ganze Zahl), mindestens 1.Das Timeout für eine Ausführung in Minuten. Dies ist die maximale Zeitspanne, in der eine Ausführung Ressourcen verbrauchen kann, bevor diese beendet wird und in den
TIMEOUT-Status wechselt. Der Standardwert beträgt 2 880 Minuten (48 Stunden). -
ClientToken— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht. Single-line string patternWird für Idempotenz verwendet und sollte auf eine zufällige ID (z. B. eine UUID) festgelegt werden, um zu vermeiden, dass mehrere Instances der gleichen Ressource erstellt oder gestartet werden.
-
AdditionalRunOptions– Ein DataQualityEvaluationRunAdditionalRunOptions-Objekt.Zusätzliche Ausführungsoptionen, die Sie für eine Ausführung der Auswertung angeben können.
-
RulesetNames— Erforderlich: Ein Array von UTF-8 Zeichenketten, nicht weniger als 1 oder mehr als 10 Zeichenketten.Eine Liste von Regelsatznamen.
-
AdditionalDataSources– Ein Map-Array von Schlüssel-Wert-Paaren.Jeder Schlüssel ist eine UTF-8 Zeichenfolge, die nicht weniger als 1 oder mehr als 255 Byte lang ist und der entsprichtSingle-line string pattern.
Jeder Wert ist ein A DataSource-Objekt.
Eine Zuordnung von Zeichenfolgen zu zusätzlichen Datenquellen, die Sie für eine Ausführung der Auswertung angeben können.
Antwort
-
RunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Die dieser Ausführung zugeordnete eindeutige Kennung.
Fehler
InvalidInputExceptionEntityNotFoundExceptionOperationTimeoutExceptionInternalServiceExceptionConflictException
CancelDataQualityRulesetEvaluationRun Aktion (Python: cancel_data_quality_ruleset_evaluation_run)
Bricht eine Ausführung ab, bei der ein Regelsatz anhand einer Datenquelle ausgewertet wird.
Anforderung
-
RunId— Erforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht. Single-line string patternDie dieser Ausführung zugeordnete eindeutige Kennung.
Antwort
Keine Antwortparameter.
Fehler
EntityNotFoundExceptionInvalidInputExceptionOperationTimeoutExceptionInternalServiceException
GetDataQualityRulesetEvaluationRun Aktion (Python: get_data_quality_ruleset_evaluation_run)
Ruft eine bestimmte Ausführung ab, bei der ein Regelsatz anhand einer Datenquelle ausgewertet wird.
Anforderung
-
RunId— Erforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht. Single-line string patternDie dieser Ausführung zugeordnete eindeutige Kennung.
Antwort
-
RunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Die dieser Ausführung zugeordnete eindeutige Kennung.
-
DataSource– Ein DataSource-Objekt.Die Datenquelle (eine AWS Glue Tabelle), die mit diesem Evaluierungslauf verknüpft ist.
-
Role— UTF-8 Zeichenfolge.Eine IAM Rolle, die bereitgestellt wird, um die Ergebnisse des Laufs zu verschlüsseln.
-
NumberOfWorkers– Zahl (Ganzzahl).Die Anzahl der
G.1X-Worker, die in der Ausführung verwendet werden sollen. Der Standardwert ist 5. -
Timeout– Zahl (ganze Zahl), mindestens 1.Das Timeout für eine Ausführung in Minuten. Dies ist die maximale Zeitspanne, in der eine Ausführung Ressourcen verbrauchen kann, bevor diese beendet wird und in den
TIMEOUT-Status wechselt. Der Standardwert beträgt 2 880 Minuten (48 Stunden). -
AdditionalRunOptions– Ein DataQualityEvaluationRunAdditionalRunOptions-Objekt.Zusätzliche Ausführungsoptionen, die Sie für eine Ausführung der Auswertung angeben können.
-
Status— UTF-8 Zeichenfolge (gültige Werte:RUNNING| |FINISHED|FAILED|PENDING_EXECUTION| |TIMED_OUT|CANCELINGCANCELED|RECEIVED_BY_TASKRUNNER).Der Status für diese Ausführung.
-
ErrorString— UTF-8 Zeichenfolge.Die Fehlerzeichenfolgen, die der Ausführung zugeordnet sind.
-
StartedOn– Zeitstempel.Das Datum und die Uhrzeit, zu der diese Ausführung gestartet wurde.
-
LastModifiedOn– Zeitstempel.Ein Zeitstempel. Der letzte Zeitpunkt, an dem diese Empfehlungsausführung für die Datenqualitätsregel geändert wurde.
-
CompletedOn– Zeitstempel.Das Datum und die Uhrzeit, zu der diese Ausführung abgeschlossen wurde.
-
ExecutionTime– Zahl (Ganzzahl).Die Zeit (in Sekunden), in der durch die Ausführung Ressourcen verbraucht wurden.
-
RulesetNames— Ein Array von UTF-8 Zeichenketten, nicht weniger als 1 oder mehr als 10 Zeichenketten.Eine Liste von Regelsatznamen für die Ausführung. Dieser Parameter akzeptiert derzeit nur einen Regelsatznamen.
-
ResultIds— Ein Array von UTF-8 Zeichenketten, nicht weniger als 1 oder mehr als 10 Zeichenketten.Eine Liste von Ergebnis-IDs für die Datenqualitätsergebnisse für die Ausführung.
-
AdditionalDataSources– Ein Map-Array von Schlüssel-Wert-Paaren.Jeder Schlüssel ist eine UTF-8 Zeichenfolge, die nicht weniger als 1 oder mehr als 255 Byte lang ist und der entsprichtSingle-line string pattern.
Jeder Wert ist ein A DataSource-Objekt.
Eine Zuordnung von Zeichenfolgen zu zusätzlichen Datenquellen, die Sie für eine Ausführung der Auswertung angeben können.
Fehler
EntityNotFoundExceptionInvalidInputExceptionOperationTimeoutExceptionInternalServiceException
ListDataQualityRulesetEvaluationRuns Aktion (Python: list_data_quality_ruleset_evaluation_runs)
Listet alle Ausführungen auf, die den Filterkriterien entsprechen, bei denen ein Regelsatz anhand einer Datenquelle ausgewertet wird.
Anforderung
-
Filter– Ein DataQualityRulesetEvaluationRunFilter-Objekt.Die Filterkriterien.
-
NextTokenUTF-8 — Zeichenfolge.Ein paginiertes Token zum Ausgleich der Ergebnisse.
-
MaxResults– Zahl (Ganzzahl), nicht kleiner als 1 oder größer als 1000.Die maximale Anzahl der auszugebenden Ergebnisse.
Antwort
-
Runs– Ein Array mit DataQualityRulesetEvaluationRunDescription-Objekten.Eine Liste von
DataQualityRulesetEvaluationRunDescription-Objekten, die Ausführungen von Datenqualitätsregelsätzen darstellen. -
NextToken— UTF-8 Zeichenfolge.Ein Paginierungs-Token, falls mehr Ergebnisse verfügbar sind.
Fehler
InvalidInputExceptionOperationTimeoutExceptionInternalServiceException
StartDataQualityRuleRecommendationRun Aktion (Python: start_data_quality_rule_recommendation_run)
Startet einen Empfehlungslauf, der zum Generieren von Regeln verwendet wird, wenn Sie nicht wissen, welche Regeln Sie schreiben sollen. AWS Glue Data Quality analysiert die Daten und gibt Empfehlungen für einen möglichen Regelsatz ab. Sie können dann den Regelsatz auswerten und den generierten Regelsatz nach Ihren Wünschen ändern.
Empfehlungsausführungen werden nach 90 Tagen automatisch gelöscht.
Anforderung
Die Anforderung der Empfehlungsanfrage für die Datenqualitätsregel.
-
DataSource– Erforderlich: Ein DataSource-Objekt.Die diesem Lauf zugeordnete Datenquelle (AWS Glue Tabelle).
-
Role— Erforderlich: UTF-8 Zeichenfolge.Eine bereitgestellte IAM Rolle, um die Ergebnisse des Laufs zu verschlüsseln.
-
NumberOfWorkers– Zahl (Ganzzahl).Die Anzahl der
G.1X-Worker, die in der Ausführung verwendet werden sollen. Der Standardwert ist 5. -
Timeout– Zahl (ganze Zahl), mindestens 1.Das Timeout für eine Ausführung in Minuten. Dies ist die maximale Zeitspanne, in der eine Ausführung Ressourcen verbrauchen kann, bevor diese beendet wird und in den
TIMEOUT-Status wechselt. Der Standardwert beträgt 2 880 Minuten (48 Stunden). -
CreatedRulesetName— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht. Single-line string patternEin Name für den Regelsatz.
-
DataQualitySecurityConfiguration— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Der Name der Sicherheitskonfiguration, die mit der Option für die Datenqualitätsverschlüsselung erstellt wurde.
-
ClientToken— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Wird für Idempotenz verwendet und sollte auf eine zufällige ID (z. B. eine UUID) festgelegt werden, um zu vermeiden, dass mehrere Instances der gleichen Ressource erstellt oder gestartet werden.
Antwort
-
RunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Die dieser Ausführung zugeordnete eindeutige Kennung.
Fehler
InvalidInputExceptionOperationTimeoutExceptionInternalServiceExceptionConflictException
CancelDataQualityRuleRecommendationRun Aktion (Python: cancel_data_quality_rule_recommendation_run)
Bricht die angegebene Empfehlungsausführung ab, die zum Generieren von Regeln verwendet wurde.
Anforderung
-
RunId— Erforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht. Single-line string patternDie dieser Ausführung zugeordnete eindeutige Kennung.
Antwort
Keine Antwortparameter.
Fehler
EntityNotFoundExceptionInvalidInputExceptionOperationTimeoutExceptionInternalServiceException
GetDataQualityRuleRecommendationRun Aktion (Python: get_data_quality_rule_recommendation_run)
Ruft die angegebene Empfehlungsausführung ab, die zum Generieren von Regeln verwendet wurde.
Anforderung
-
RunId— Erforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht. Single-line string patternDie dieser Ausführung zugeordnete eindeutige Kennung.
Antwort
Die Antwort für die Empfehlungsausführung für die Datenqualitätsregel.
-
RunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Die dieser Ausführung zugeordnete eindeutige Kennung.
-
DataSource– Ein DataSource-Objekt.Die diesem Lauf zugeordnete Datenquelle (eine AWS Glue Tabelle).
-
Role— UTF-8 Zeichenfolge.Eine IAM Rolle, die bereitgestellt wird, um die Ergebnisse des Laufs zu verschlüsseln.
-
NumberOfWorkers– Zahl (Ganzzahl).Die Anzahl der
G.1X-Worker, die in der Ausführung verwendet werden sollen. Der Standardwert ist 5. -
Timeout– Zahl (ganze Zahl), mindestens 1.Das Timeout für eine Ausführung in Minuten. Dies ist die maximale Zeitspanne, in der eine Ausführung Ressourcen verbrauchen kann, bevor diese beendet wird und in den
TIMEOUT-Status wechselt. Der Standardwert beträgt 2 880 Minuten (48 Stunden). -
Status— UTF-8 Zeichenfolge (gültige Werte:RUNNING| |FINISHED|FAILED|PENDING_EXECUTION| |TIMED_OUT|CANCELINGCANCELED|RECEIVED_BY_TASKRUNNER).Der Status für diese Ausführung.
-
ErrorString— UTF-8 Zeichenfolge.Die Fehlerzeichenfolgen, die der Ausführung zugeordnet sind.
-
StartedOn– Zeitstempel.Das Datum und die Uhrzeit, zu der diese Ausführung gestartet wurde.
-
LastModifiedOn– Zeitstempel.Ein Zeitstempel. Der letzte Zeitpunkt, an dem diese Empfehlungsausführung für die Datenqualitätsregel geändert wurde.
-
CompletedOn– Zeitstempel.Das Datum und die Uhrzeit, zu der diese Ausführung abgeschlossen wurde.
-
ExecutionTime– Zahl (Ganzzahl).Die Zeit (in Sekunden), in der durch die Ausführung Ressourcen verbraucht wurden.
-
RecommendedRuleset— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 65536 Byte lang.Wenn die Empfehlungsausführung einer Startregel abgeschlossen ist, wird ein empfohlener Regelsatz (ein Satz von Regeln) erstellt. Dieses Mitglied verfügt über diese Regeln im Format der Definitionssprache für Datenqualität (DQDL).
-
CreatedRulesetName— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht der. Single-line string patternDer Name des Regelsatzes, der durch die Ausführung erstellt wurde.
-
DataQualitySecurityConfiguration— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Der Name der Sicherheitskonfiguration, die mit der Option für die Datenqualitätsverschlüsselung erstellt wurde.
Fehler
EntityNotFoundExceptionInvalidInputExceptionOperationTimeoutExceptionInternalServiceException
ListDataQualityRuleRecommendationRuns Aktion (Python: list_data_quality_rule_recommendation_runs)
Listet die Empfehlungsausführungen auf, die die Filterkriterien erfüllen.
Anforderung
-
Filter– Ein DataQualityRuleRecommendationRunFilter-Objekt.Die Filterkriterien.
-
NextTokenUTF-8 — Zeichenfolge.Ein paginiertes Token zum Ausgleich der Ergebnisse.
-
MaxResults– Zahl (Ganzzahl), nicht kleiner als 1 oder größer als 1000.Die maximale Anzahl der auszugebenden Ergebnisse.
Antwort
-
Runs– Ein Array mit DataQualityRuleRecommendationRunDescription-Objekten.Eine Liste von
DataQualityRuleRecommendationRunDescription-Objekten. -
NextToken— UTF-8 Zeichenfolge.Ein Paginierungs-Token, falls mehr Ergebnisse verfügbar sind.
Fehler
InvalidInputExceptionOperationTimeoutExceptionInternalServiceException
GetDataQualityResult Aktion (Python: get_data_quality_result)
Ruft das Ergebnis einer Auswertung einer Datenqualitätsregel ab.
Anforderung
-
ResultId— Erforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht. Single-line string patternEine eindeutige Ergebnis-ID für das Datenqualitätsergebnis.
Antwort
Die Antwort für das Datenqualitätsergebnis.
-
ResultId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Eine eindeutige Ergebnis-ID für das Datenqualitätsergebnis.
-
ProfileId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Die Profil-ID für das Datenqualitätsergebnis.
-
Score– Zahl (Double), nicht mehr als 1,0.Ein aggregierter Datenqualitätswert. Stellt das Verhältnis der Regeln dar, die an die Gesamtzahl der Regeln übergeben wurden.
-
DataSource– Ein DataSource-Objekt.Die Tabelle, die dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.
-
RulesetName— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Der Name des Regelsatzes, der dem Datenqualitätsergebnis zugeordnet ist.
-
EvaluationContext— UTF-8 Zeichenfolge.Im Kontext eines Jobs in AWS Glue Studio wird in der Regel jedem Knoten auf der Arbeitsfläche ein Name zugewiesen, und Datenqualitätsknoten haben Namen. Bei mehreren Knoten kann das
evaluationContextdie Knoten unterscheiden. -
StartedOn– Zeitstempel.Das Datum und die Uhrzeit, zu der die Ausführung für dieses Datenqualitätsergebnis gestartet wurde.
-
CompletedOn– Zeitstempel.Das Datum und die Uhrzeit, zu der die Ausführung für dieses Datenqualitätsergebnis abgeschlossen wurde.
-
JobName— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.Der Auftragsname, der dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.
-
JobRunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Die Auftragsausführungs-ID, die dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.
-
RulesetEvaluationRunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Die eindeutige Ausführungs-ID, die der Regelsatzauswertung zugeordnet ist.
-
RuleResults– Ein Array mit DataQualityRuleResult-Objekten, nicht mehr als 2000 Strukturen.Eine Liste von
DataQualityRuleResult-Objekten, die die Ergebnisse für jede Regel darstellen. -
AnalyzerResults– Ein Array mit DataQualityAnalyzerResult-Objekten, nicht mehr als 2000 Strukturen.Eine Liste von
DataQualityAnalyzerResult-Objekten, die die Ergebnisse für jede Analysator darstellen. -
Observations– Ein Array mit DataQualityObservation-Objekten, nicht mehr als 50 Strukturen.Eine Liste von
DataQualityObservation-Objekten, die die Beobachtungen darstellen, die nach der Auswertung der Regeln und Analysatoren generiert wurden. -
AggregatedMetrics– Ein DataQualityAggregatedMetrics-Objekt.Eine Zusammenfassung der
DataQualityAggregatedMetricsObjekte mit der Gesamtzahl der verarbeiteten Zeilen und Regeln, einschließlich ihrer pass/fail Statistiken, die auf Ergebnissen auf Zeilenebene basieren.
Fehler
InvalidInputExceptionOperationTimeoutExceptionInternalServiceExceptionEntityNotFoundException
BatchGetDataQualityResult Aktion (Python: batch_get_data_quality_result)
Ruft eine Liste mit Datenqualitätsergebnissen für die angegebenen Ergebnis-IDs ab.
Anforderung
-
ResultIds— Erforderlich: Ein Array von UTF-8 Zeichenketten, nicht weniger als 1 oder mehr als 100 Zeichenketten.Eine Liste mit eindeutigen Ergebnis-IDs für die Datenqualitätsergebnisse.
Antwort
-
Results– Erforderlich: Ein Array mit DataQualityResult-Objekten.Eine Liste von
DataQualityResult-Objekten, die die Datenqualitätsergebnisse darstellen. -
ResultsNotFound— Ein Array von UTF-8 Zeichenketten, nicht weniger als 1 oder mehr als 100 Zeichenketten.Eine Liste mit Ergebnis-IDs, für die keine Ergebnisse gefunden wurden.
Fehler
InvalidInputExceptionOperationTimeoutExceptionInternalServiceException
ListDataQualityResults Aktion (Python: list_data_quality_results)
Gibt alle Ausführungsergebnisse der Datenqualität für Ihr Konto zurück.
Anforderung
-
Filter– Ein DataQualityResultFilterCriteria-Objekt.Die Filterkriterien.
-
NextTokenUTF-8 — Zeichenfolge.Ein paginiertes Token zum Ausgleich der Ergebnisse.
-
MaxResults– Zahl (Ganzzahl), nicht kleiner als 1 oder größer als 1000.Die maximale Anzahl der auszugebenden Ergebnisse.
Antwort
-
Results– Erforderlich: Ein Array mit DataQualityResultDescription-Objekten.Eine Liste von
DataQualityResultDescription-Objekten. -
NextToken— UTF-8 Zeichenfolge.Ein Paginierungs-Token, falls mehr Ergebnisse verfügbar sind.
Fehler
InvalidInputExceptionOperationTimeoutExceptionInternalServiceException
CreateDataQualityRuleset Aktion (Python: create_data_quality_ruleset)
Erstellt einen Regelsatz für die Datenqualität mit DQDL-Regeln, die auf eine angegebene Tabelle angewendet werden. AWS Glue
Sie erstellen den Regelsatz mit der Definitionssprache für Datenqualität (DQDL). Weitere Informationen finden Sie im AWS Glue Entwicklerhandbuch.
Anforderung
Eine Anforderung zum Erstellen eines Datenqualitätsregelsatzes.
-
Name— Erforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.Ein eindeutiger Name für den Datenqualitätsregelsatz.
-
Description– Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.Eine Beschreibung des Regelsatzes für die Datenqualität.
-
Ruleset— Erforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 65536 Byte lang.Ein Regelsatz der Definitionssprache für Datenqualität (DQDL). Weitere Informationen finden Sie im AWS Glue Entwicklerhandbuch.
-
Tags– Ein Map-Array von Schlüssel-Wert-Paaren, nicht mehr als 50 Paare.Jeder Schlüssel ist eine UTF-8 Zeichenfolge, die nicht weniger als 1 oder mehr als 128 Byte lang ist.
Jeder Wert ist eine UTF-8 Zeichenfolge, die nicht länger als 256 Byte ist.
Eine Liste von Tags, die auf den Datenqualitätsregelsatz angewendet werden.
-
TargetTable– Ein DataQualityTargetTable-Objekt.Eine Zieltabelle, die dem Datenqualitätsregelsatz zugeordnet ist.
-
RecommendationRunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.Eine eindeutige Ausführungs-ID für die Empfehlungsausführung.
-
DataQualitySecurityConfiguration— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Der Name der Sicherheitskonfiguration, die mit der Option für die Datenqualitätsverschlüsselung erstellt wurde.
-
ClientToken— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Wird für Idempotenz verwendet und sollte auf eine zufällige ID (z. B. eine UUID) festgelegt werden, um zu vermeiden, dass mehrere Instances der gleichen Ressource erstellt oder gestartet werden.
Antwort
-
Name— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Ein eindeutiger Name für den Datenqualitätsregelsatz.
Fehler
InvalidInputExceptionAlreadyExistsExceptionOperationTimeoutExceptionInternalServiceExceptionResourceNumberLimitExceededException
DeleteDataQualityRuleset Aktion (Python: delete_data_quality_ruleset)
Löscht einen Datenqualitätsregelsatz.
Anforderung
-
Name— Erforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht. Single-line string patternEin eindeutiger Name für den Datenqualitätsregelsatz.
Antwort
Keine Antwortparameter.
Fehler
EntityNotFoundExceptionInvalidInputExceptionOperationTimeoutExceptionInternalServiceException
GetDataQualityRuleset Aktion (Python: get_data_quality_ruleset)
Gibt einen vorhandenen Regelsatz nach Kennung oder Name zurück.
Anforderung
-
Name— Erforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht. Single-line string patternDer Name des Regelsatzes.
Antwort
Gibt die Antwort für den Regelsatz für die Datenqualität zurück.
-
Name— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Der Name des Regelsatzes.
-
Description– Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.Eine Beschreibung des Regelsatzes.
-
Ruleset— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 65536 Byte lang.Ein Regelsatz der Definitionssprache für Datenqualität (DQDL). Weitere Informationen finden Sie im AWS Glue Entwicklerhandbuch.
-
TargetTable– Ein DataQualityTargetTable-Objekt.Der Name und der Datenbankname der Zieltabelle.
-
CreatedOn– Zeitstempel.Ein Zeitstempel. Die Uhrzeit und das Datum, an dem dieser Datenqualitätsregelsatz erstellt wurde.
-
LastModifiedOn– Zeitstempel.Ein Zeitstempel. Der letzte Zeitpunkt, an dem dieser Datenqualitätsregelsatz geändert wurde.
-
RecommendationRunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.Wenn ein Regelsatz aus einer Empfehlungsausführung erstellt wurde, wird diese Ausführungs-ID generiert, um die beiden miteinander zu verknüpfen.
-
DataQualitySecurityConfiguration— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Der Name der Sicherheitskonfiguration, die mit der Option für die Datenqualitätsverschlüsselung erstellt wurde.
Fehler
EntityNotFoundExceptionInvalidInputExceptionOperationTimeoutExceptionInternalServiceException
ListDataQualityRulesets Aktion (Python: list_data_quality_rulesets)
Gibt eine paginierte Liste von Regelsätzen für die angegebene Tabellenliste zurück. AWS Glue
Anforderung
-
NextToken— Zeichenfolge. UTF-8Ein paginiertes Token zum Ausgleich der Ergebnisse.
-
MaxResults– Zahl (Ganzzahl), nicht kleiner als 1 oder größer als 1000.Die maximale Anzahl der auszugebenden Ergebnisse.
-
Filter– Ein DataQualityRulesetFilterCriteria-Objekt.Die Filterkriterien.
-
Tags– Ein Map-Array von Schlüssel-Wert-Paaren, nicht mehr als 50 Paare.Jeder Schlüssel ist eine UTF-8 Zeichenfolge, die nicht weniger als 1 oder mehr als 128 Byte lang ist.
Jeder Wert ist eine UTF-8 Zeichenfolge, die nicht länger als 256 Byte ist.
Eine Liste mit Tags für Schlüsselwertpaare.
Antwort
-
Rulesets– Ein Array mit DataQualityRulesetListDetails-Objekten.Eine paginierte Liste von Regelsätzen für die angegebene Tabellenliste. AWS Glue
-
NextToken— Zeichenfolge. UTF-8Ein Paginierungs-Token, falls mehr Ergebnisse verfügbar sind.
Fehler
EntityNotFoundExceptionInvalidInputExceptionOperationTimeoutExceptionInternalServiceException
UpdateDataQualityRuleset Aktion (Python: update_data_quality_ruleset)
Aktualisiert den angegebenen Datenqualitätsregelsatz.
Anforderung
-
Name— Erforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht. Single-line string patternDer Name des Regelsatzes für die Datenqualität.
-
Description– Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.Eine Beschreibung des Regelsatzes.
-
Ruleset— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 65536 Byte lang.Ein Regelsatz der Definitionssprache für Datenqualität (DQDL). Weitere Informationen finden Sie im AWS Glue Entwicklerhandbuch.
Antwort
-
Name— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.Der Name des Regelsatzes für die Datenqualität.
-
Description– Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.Eine Beschreibung des Regelsatzes.
-
Ruleset— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 65536 Byte lang.Ein Regelsatz der Definitionssprache für Datenqualität (DQDL). Weitere Informationen finden Sie im AWS Glue Entwicklerhandbuch.
Fehler
EntityNotFoundExceptionAlreadyExistsExceptionIdempotentParameterMismatchExceptionInvalidInputExceptionOperationTimeoutExceptionInternalServiceExceptionResourceNumberLimitExceededException
ListDataQualityStatistics Aktion (Python: list_data_quality_statistics)
Ruft eine Liste mit Datenqualitätsstatistiken ab.
Anforderung
-
StatisticId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht. Single-line string patternDie Statistik-ID.
-
ProfileId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Die Profil-ID.
-
TimestampFilter– Ein TimestampFilter-Objekt.Ein Zeitstempelfilter.
-
MaxResults– Zahl (Ganzzahl), nicht kleiner als 1 oder größer als 1000.Die maximale Anzahl der Ergebnisse, die bei dieser Anfrage zurückzugeben sind.
-
NextToken— UTF-8 Zeichenfolge.Ein Paginierungstoken zum Anfordern der nächsten Ergebnisseite.
Antwort
-
Statistics– Ein Array mit StatisticSummary-Objekten.Ein
StatisticSummaryList -
NextToken— UTF-8 Zeichenfolge.Ein Paginierungstoken zum Anfordern der nächsten Ergebnisseite.
Fehler
EntityNotFoundExceptionInvalidInputExceptionInternalServiceException
TimestampFilter Struktur
Ein Zeitstempelfilter.
Felder
-
RecordedBefore– Zeitstempel.Der Zeitstempel, vor dem Statistiken in die Ergebnisse aufgenommen werden sollen.
-
RecordedAfter– Zeitstempel.Der Zeitstempel, nach dem Statistiken in die Ergebnisse aufgenommen werden sollen.
CreateDataQualityRulesetRequest Struktur
Eine Anforderung zum Erstellen eines Datenqualitätsregelsatzes.
Felder
-
Name— Erforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.Ein eindeutiger Name für den Datenqualitätsregelsatz.
-
Description– Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.Eine Beschreibung des Regelsatzes für die Datenqualität.
-
Ruleset— Erforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 65536 Byte lang.Ein Regelsatz der Definitionssprache für Datenqualität (DQDL). Weitere Informationen finden Sie im AWS Glue Entwicklerhandbuch.
-
Tags– Ein Map-Array von Schlüssel-Wert-Paaren, nicht mehr als 50 Paare.Jeder Schlüssel ist eine UTF-8 Zeichenfolge, die nicht weniger als 1 oder mehr als 128 Byte lang ist.
Jeder Wert ist eine UTF-8 Zeichenfolge, die nicht länger als 256 Byte ist.
Eine Liste von Tags, die auf den Datenqualitätsregelsatz angewendet werden.
-
TargetTable– Ein DataQualityTargetTable-Objekt.Eine Zieltabelle, die dem Datenqualitätsregelsatz zugeordnet ist.
-
RecommendationRunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.Eine eindeutige Ausführungs-ID für die Empfehlungsausführung.
-
DataQualitySecurityConfiguration— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Der Name der Sicherheitskonfiguration, die mit der Option für die Datenqualitätsverschlüsselung erstellt wurde.
-
ClientToken— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Wird für Idempotenz verwendet und sollte auf eine zufällige ID (z. B. eine UUID) festgelegt werden, um zu vermeiden, dass mehrere Instances der gleichen Ressource erstellt oder gestartet werden.
GetDataQualityRulesetResponse Struktur
Gibt die Antwort für den Regelsatz für die Datenqualität zurück.
Felder
-
Name— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Der Name des Regelsatzes.
-
Description– Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.Eine Beschreibung des Regelsatzes.
-
Ruleset— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 65536 Byte lang.Ein Regelsatz der Definitionssprache für Datenqualität (DQDL). Weitere Informationen finden Sie im AWS Glue Entwicklerhandbuch.
-
TargetTable– Ein DataQualityTargetTable-Objekt.Der Name und der Datenbankname der Zieltabelle.
-
CreatedOn– Zeitstempel.Ein Zeitstempel. Die Uhrzeit und das Datum, an dem dieser Datenqualitätsregelsatz erstellt wurde.
-
LastModifiedOn– Zeitstempel.Ein Zeitstempel. Der letzte Zeitpunkt, an dem dieser Datenqualitätsregelsatz geändert wurde.
-
RecommendationRunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.Wenn ein Regelsatz aus einer Empfehlungsausführung erstellt wurde, wird diese Ausführungs-ID generiert, um die beiden miteinander zu verknüpfen.
-
DataQualitySecurityConfiguration— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Der Name der Sicherheitskonfiguration, die mit der Option für die Datenqualitätsverschlüsselung erstellt wurde.
GetDataQualityResultResponse Struktur
Die Antwort für das Datenqualitätsergebnis.
Felder
-
ResultId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Eine eindeutige Ergebnis-ID für das Datenqualitätsergebnis.
-
ProfileId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Die Profil-ID für das Datenqualitätsergebnis.
-
Score– Zahl (Double), nicht mehr als 1,0.Ein aggregierter Datenqualitätswert. Stellt das Verhältnis der Regeln dar, die an die Gesamtzahl der Regeln übergeben wurden.
-
DataSource– Ein DataSource-Objekt.Die Tabelle, die dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.
-
RulesetName— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Der Name des Regelsatzes, der dem Datenqualitätsergebnis zugeordnet ist.
-
EvaluationContext— UTF-8 Zeichenfolge.Im Kontext eines Jobs in AWS Glue Studio wird in der Regel jedem Knoten auf der Arbeitsfläche ein Name zugewiesen, und Datenqualitätsknoten haben Namen. Bei mehreren Knoten kann das
evaluationContextdie Knoten unterscheiden. -
StartedOn– Zeitstempel.Das Datum und die Uhrzeit, zu der die Ausführung für dieses Datenqualitätsergebnis gestartet wurde.
-
CompletedOn– Zeitstempel.Das Datum und die Uhrzeit, zu der die Ausführung für dieses Datenqualitätsergebnis abgeschlossen wurde.
-
JobName— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.Der Auftragsname, der dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.
-
JobRunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Die Auftragsausführungs-ID, die dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.
-
RulesetEvaluationRunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Die eindeutige Ausführungs-ID, die der Regelsatzauswertung zugeordnet ist.
-
RuleResults– Ein Array mit DataQualityRuleResult-Objekten, nicht mehr als 2000 Strukturen.Eine Liste von
DataQualityRuleResult-Objekten, die die Ergebnisse für jede Regel darstellen. -
AnalyzerResults– Ein Array mit DataQualityAnalyzerResult-Objekten, nicht mehr als 2000 Strukturen.Eine Liste von
DataQualityAnalyzerResult-Objekten, die die Ergebnisse für jede Analysator darstellen. -
Observations– Ein Array mit DataQualityObservation-Objekten, nicht mehr als 50 Strukturen.Eine Liste von
DataQualityObservation-Objekten, die die Beobachtungen darstellen, die nach der Auswertung der Regeln und Analysatoren generiert wurden. -
AggregatedMetrics– Ein DataQualityAggregatedMetrics-Objekt.Eine Zusammenfassung der
DataQualityAggregatedMetricsObjekte mit der Gesamtzahl der verarbeiteten Zeilen und Regeln, einschließlich ihrer pass/fail Statistiken, die auf Ergebnissen auf Zeilenebene basieren.
StartDataQualityRuleRecommendationRunRequest Struktur
Die Anforderung der Empfehlungsanfrage für die Datenqualitätsregel.
Felder
-
DataSource– Erforderlich: Ein DataSource-Objekt.Die mit diesem Lauf verknüpfte Datenquelle (AWS Glue Tabelle).
-
Role— Erforderlich: UTF-8 Zeichenfolge.Eine bereitgestellte IAM Rolle, um die Ergebnisse des Laufs zu verschlüsseln.
-
NumberOfWorkers– Zahl (Ganzzahl).Die Anzahl der
G.1X-Worker, die in der Ausführung verwendet werden sollen. Der Standardwert ist 5. -
Timeout– Zahl (ganze Zahl), mindestens 1.Das Timeout für eine Ausführung in Minuten. Dies ist die maximale Zeitspanne, in der eine Ausführung Ressourcen verbrauchen kann, bevor diese beendet wird und in den
TIMEOUT-Status wechselt. Der Standardwert beträgt 2 880 Minuten (48 Stunden). -
CreatedRulesetName— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht. Single-line string patternEin Name für den Regelsatz.
-
DataQualitySecurityConfiguration— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Der Name der Sicherheitskonfiguration, die mit der Option für die Datenqualitätsverschlüsselung erstellt wurde.
-
ClientToken— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Wird für Idempotenz verwendet und sollte auf eine zufällige ID (z. B. eine UUID) festgelegt werden, um zu vermeiden, dass mehrere Instances der gleichen Ressource erstellt oder gestartet werden.
GetDataQualityRuleRecommendationRunResponse Struktur
Die Antwort für die Empfehlungsausführung für die Datenqualitätsregel.
Felder
-
RunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Die dieser Ausführung zugeordnete eindeutige Kennung.
-
DataSource– Ein DataSource-Objekt.Die diesem Lauf zugeordnete Datenquelle (eine AWS Glue Tabelle).
-
Role— UTF-8 Zeichenfolge.Eine IAM Rolle, die bereitgestellt wird, um die Ergebnisse des Laufs zu verschlüsseln.
-
NumberOfWorkers– Zahl (Ganzzahl).Die Anzahl der
G.1X-Worker, die in der Ausführung verwendet werden sollen. Der Standardwert ist 5. -
Timeout– Zahl (ganze Zahl), mindestens 1.Das Timeout für eine Ausführung in Minuten. Dies ist die maximale Zeitspanne, in der eine Ausführung Ressourcen verbrauchen kann, bevor diese beendet wird und in den
TIMEOUT-Status wechselt. Der Standardwert beträgt 2 880 Minuten (48 Stunden). -
Status— UTF-8 Zeichenfolge (gültige Werte:RUNNING| |FINISHED|FAILED|PENDING_EXECUTION| |TIMED_OUT|CANCELINGCANCELED|RECEIVED_BY_TASKRUNNER).Der Status für diese Ausführung.
-
ErrorString— UTF-8 Zeichenfolge.Die Fehlerzeichenfolgen, die der Ausführung zugeordnet sind.
-
StartedOn– Zeitstempel.Das Datum und die Uhrzeit, zu der diese Ausführung gestartet wurde.
-
LastModifiedOn– Zeitstempel.Ein Zeitstempel. Der letzte Zeitpunkt, an dem diese Empfehlungsausführung für die Datenqualitätsregel geändert wurde.
-
CompletedOn– Zeitstempel.Das Datum und die Uhrzeit, zu der diese Ausführung abgeschlossen wurde.
-
ExecutionTime– Zahl (Ganzzahl).Die Zeit (in Sekunden), in der durch die Ausführung Ressourcen verbraucht wurden.
-
RecommendedRuleset— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 65536 Byte lang.Wenn die Empfehlungsausführung einer Startregel abgeschlossen ist, wird ein empfohlener Regelsatz (ein Satz von Regeln) erstellt. Dieses Mitglied verfügt über diese Regeln im Format der Definitionssprache für Datenqualität (DQDL).
-
CreatedRulesetName— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht der. Single-line string patternDer Name des Regelsatzes, der durch die Ausführung erstellt wurde.
-
DataQualitySecurityConfiguration— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Der Name der Sicherheitskonfiguration, die mit der Option für die Datenqualitätsverschlüsselung erstellt wurde.
BatchPutDataQualityStatisticAnnotation Aktion (Python: batch_put_data_quality_statistic_annotation)
Versehen Sie Datenpunkte für eine bestimmte Datenqualitätsstatistik im Zeitverlauf mit Anmerkungen. Die API benötigt sowohl ProfileID als auch StatisticID als Teil der Eingabe. InclusionAnnotation Die API funktioniert nur für eine einzelne statisticId in mehreren Profilen.
Anforderung
-
InclusionAnnotations– Erforderlich: Ein Array mit DatapointInclusionAnnotation-Objekten.Eine
DatapointInclusionAnnotation-Liste. Die InclusionAnnotations müssen eine ProfileID und eine StatisticID enthalten. Wenn es mehrere gibt InclusionAnnotations, muss sich die Liste auf eine einzelne StatisticID für mehrere ProfileIDs beziehen. -
ClientToken— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht. Single-line string patternClient-Token.
Antwort
-
FailedInclusionAnnotations– Ein Array mit AnnotationError-Objekten.Eine
AnnotationError-Liste.
Fehler
EntityNotFoundExceptionInvalidInputExceptionInternalServiceExceptionResourceNumberLimitExceededException
GetDataQualityModel Aktion (Python: get_data_quality_model)
Rufen Sie den Trainingsstatus des Modells zusammen mit weiteren Informationen (,,) ab. CompletedOn StartedOn FailureReason
Anforderung
-
StatisticId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.Die Statistik-ID.
-
ProfileId— Erforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.Die Profil-ID.
Antwort
-
Status— UTF-8 Zeichenfolge (gültige Werte:RUNNING|SUCCEEDED|FAILED).Der Trainingsstatus des Datenqualitätsmodells.
-
StartedOn– Zeitstempel.Der Zeitstempel, zu dem das Datenqualitätsmodell-Training gestartet wurde.
-
CompletedOn– Zeitstempel.Der Zeitstempel, zu dem das Datenqualitätsmodell-Training abgeschlossen ist.
-
FailureReason— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.Der Grund für das Fehlschlagen des Trainings.
Fehler
EntityNotFoundExceptionInvalidInputExceptionOperationTimeoutExceptionInternalServiceException
GetDataQualityModelResult Aktion (Python: get_data_quality_model_result)
Ruft die Vorhersagen einer Statistik für eine bestimmte Profil-ID ab.
Anforderung
-
StatisticId— Erforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht. Single-line string patternDie Statistik-ID.
-
ProfileId— Erforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.Die Profil-ID.
Antwort
-
CompletedOn– Zeitstempel.Der Zeitstempel, zu dem das Datenqualitätsmodell-Training abgeschlossen ist.
-
Model– Ein Array mit StatisticModelResult-Objekten.Eine Liste von
StatisticModelResult
Fehler
EntityNotFoundExceptionInvalidInputExceptionOperationTimeoutExceptionInternalServiceException
ListDataQualityStatisticAnnotations Aktion (Python: list_data_quality_statistic_annotations)
Ruft die Anmerkungen für eine Datenqualitätsstatistik ab.
Anforderung
-
StatisticId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht der. Single-line string patternDie Statistik-ID.
-
ProfileId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.Die Profil-ID.
-
TimestampFilter– Ein TimestampFilter-Objekt.Ein Zeitstempelfilter.
-
MaxResults– Zahl (Ganzzahl), nicht kleiner als 1 oder größer als 1000.Die maximale Anzahl der Ergebnisse, die bei dieser Anfrage zurückzugeben sind.
-
NextToken— UTF-8 Zeichenfolge.Ein Paginierungstoken zum Abruf des nächsten Ergebnissatzes.
Antwort
-
Annotations– Ein Array mit StatisticAnnotation-Objekten.Eine Liste von
StatisticAnnotation, die auf die Statistik angewendet wurden -
NextToken— UTF-8 Zeichenfolge.Ein Paginierungstoken zum Abruf des nächsten Ergebnissatzes.
Fehler
InvalidInputExceptionInternalServiceException
PutDataQualityProfileAnnotation Aktion (Python: put_data_quality_profile_annotation)
Versehen Sie alle Datenpunkte für ein Profil mit Anmerkungen.
Anforderung
-
ProfileId— Erforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht. Single-line string patternDie ID des Profils zur Überwachung der Datenqualität, das mit Anmerkungen versehen werden soll.
-
InclusionAnnotation— Erforderlich: UTF-8 Zeichenfolge (gültige Werte:INCLUDE|EXCLUDE).Der Wert der Einfügungsanmerkung, der auf das Profil angewendet werden soll.
Antwort
Keine Antwortparameter.
Fehler
EntityNotFoundExceptionInvalidInputExceptionInternalServiceException