View a markdown version of this page

Data-Quality-API - AWS Glue
 —  Datentypen  —DataSourceDataQualityRulesetListDetailsDataQualityTargetTableDataQualityRulesetEvaluationRunDescriptionDataQualityRulesetEvaluationRunFilterDataQualityEvaluationRunAdditionalRunOptionsDataQualityRuleRecommendationRunDescriptionDataQualityRuleRecommendationRunFilterDataQualityResultDataQualityAnalyzerResultDataQualityObservationMetricBasedObservationDataQualityMetricValuesDataQualityRuleResultDataQualityResultDescriptionDataQualityResultFilterCriteriaDataQualityRulesetFilterCriteriaDataQualityAggregatedMetricsStatisticAnnotationTimestampedInclusionAnnotationAnnotationErrorDatapointInclusionAnnotationStatisticSummaryListStatisticSummaryRunIdentifierStatisticModelResultDataQualityGlueTable —  Operationen  —StartDataQualityRulesetEvaluationRun (start_data_quality_ruleset_evaluation_run)CancelDataQualityRulesetEvaluationRun (cancel_data_quality_ruleset_evaluation_run)GetDataQualityRulesetEvaluationRun (get_data_quality_ruleset_evaluation_run)ListDataQualityRulesetEvaluationRuns (list_data_quality_ruleset_evaluation_runs)StartDataQualityRuleRecommendationRun (start_data_quality_rule_recommendation_run)CancelDataQualityRuleRecommendationRun (cancel_data_quality_rule_recommendation_run)GetDataQualityRuleRecommendationRun (get_data_quality_rule_recommendation_run)ListDataQualityRuleRecommendationRuns (list_data_quality_rule_recommendation_runs)GetDataQualityResult (get_data_quality_result)BatchGetDataQualityResult (batch_get_data_quality_result)ListDataQualityResults (list_data_quality_results)CreateDataQualityRuleset (create_data_quality_ruleset)DeleteDataQualityRuleset (delete_data_quality_ruleset)GetDataQualityRuleset (get_data_quality_ruleset)ListDataQualityRulesets (list_data_quality_rulesets)UpdateDataQualityRuleset (update_data_quality_ruleset)ListDataQualityStatistics (list_data_quality_statistics)TimestampFilterCreateDataQualityRulesetRequestGetDataQualityRulesetResponseGetDataQualityResultResponseStartDataQualityRuleRecommendationRunRequestGetDataQualityRuleRecommendationRunResponseBatchPutDataQualityStatisticAnnotation (batch_put_data_quality_statistic_annotation)GetDataQualityModel (get_data_quality_model)GetDataQualityModelResult (get_data_quality_model_result)ListDataQualityStatisticAnnotations (list_data_quality_statistic_annotations)PutDataQualityProfileAnnotation (put_data_quality_profile_annotation)

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Data-Quality-API

Die Data-Quality-API beschreibt die Data-Quality-Datentypen und umfasst die API zum Erstellen, Löschen oder Aktualisieren von Datenqualitätsregelsätzen, -Ausführungen und -Bewertungen.

Datentypen

DataSource Struktur

Eine Datenquelle (eine AWS Glue Tabelle), für die Sie Datenqualitätsergebnisse wünschen.

Felder
  • GlueTable – Ein GlueTable-Objekt.

    Eine AWS Glue Tabelle.

  • DataQualityGlueTable – Ein DataQualityGlueTable-Objekt.

    Eine AWS Glue Tabelle für Datenqualitätsoperationen.

DataQualityRulesetListDetails Struktur

Beschreibt einen Datenqualitätsregelsatz, der von GetDataQualityRuleset zurückgegeben wurde.

Felder
  • Name— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Der Name des Regelsatzes für die Datenqualität.

  • Description – Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

    Eine Beschreibung des Regelsatzes für die Datenqualität.

  • CreatedOn – Zeitstempel.

    Das Datum und die Uhrzeit, zu der der Datenqualitätsregelsatz erstellt wurde.

  • LastModifiedOn – Zeitstempel.

    Das Datum und die Uhrzeit der letzten Änderung des Regelsatzes für die Datenqualität.

  • TargetTable – Ein DataQualityTargetTable-Objekt.

    Ein Objekt, das eine AWS Glue Tabelle darstellt.

  • RecommendationRunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.

    Wenn ein Regelsatz aus einer Empfehlungsausführung erstellt wurde, wird diese Ausführungs-ID generiert, um die beiden miteinander zu verknüpfen.

  • RuleCount – Zahl (Ganzzahl).

    Die Anzahl der Regeln im Regelsatz.

DataQualityTargetTable Struktur

Ein Objekt, das eine AWS Glue Tabelle darstellt.

Felder
  • TableNameErforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.

    Der Name der AWS Glue Tabelle.

  • DatabaseNameErforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.

    Der Name der Datenbank, in der die AWS Glue Tabelle existiert.

  • CatalogId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.

    Die Katalog-ID, in der die AWS Glue Tabelle existiert.

DataQualityRulesetEvaluationRunDescription Struktur

Beschreibt das Ausführungsergebnis zur Auswertung des Datenqualitätsregelsatzes.

Felder
  • RunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Die dieser Ausführung zugeordnete eindeutige Kennung.

  • Status— UTF-8 Zeichenfolge (gültige Werte: RUNNING | | FINISHED | FAILED | PENDING_EXECUTION | TIMED_OUT | CANCELING | CANCELED |RECEIVED_BY_TASKRUNNER).

    Der Status für diese Ausführung.

  • StartedOn – Zeitstempel.

    Das Datum und die Uhrzeit, zu der die Ausführung gestartet wurde.

  • DataSource – Ein DataSource-Objekt.

    Die dem Lauf zugeordnete Datenquelle (eine AWS Glue Tabelle).

DataQualityRulesetEvaluationRunFilter Struktur

Die Filterkriterien.

Felder
  • DataSourceErforderlich: Ein DataSource-Objekt.

    Filter basierend auf einer Datenquelle (einer AWS Glue Tabelle), die dem Lauf zugeordnet ist.

  • StartedBefore – Zeitstempel.

    Filtert Ergebnisse nach Ausführungen, die vor diesem Zeitpunkt begonnen haben.

  • StartedAfter – Zeitstempel.

    Filtert Ergebnisse nach Ausführungen, die nach diesem Zeitpunkt begonnen haben.

  • RulesetName— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.

    Filtert die Ergebnisse nach Läufen, die einem bestimmten Regelsatznamen zugeordnet sind.

DataQualityEvaluationRunAdditionalRunOptions Struktur

Zusätzliche Ausführungsoptionen, die Sie für eine Ausführung der Auswertung angeben können.

Felder
  • CloudWatchMetricsEnabled – Boolesch.

    Ob CloudWatch Metriken aktiviert werden sollen oder nicht.

  • ResultsS3Prefix— UTF-8 Zeichenfolge.

    Präfix für Amazon S3 zum Speichern von Ergebnissen.

  • CompositeRuleEvaluationMethod— UTF-8 Zeichenfolge (gültige Werte: COLUMN |ROW).

    Legen Sie die Bewertungsmethode für zusammengesetzte Regeln im Regelsatz auf fest ROW/COLUMN

  • CustomLogGroupPrefix— UTF-8 Zeichenfolge.

    Ein benutzerdefiniertes Präfix für die Namen der CloudWatch Protokollgruppen. Wenn diese Option angegeben ist, werden Testlaufprotokolle in <CustomLogGroupPrefix>/error und <CustomLogGroupPrefix>/output nicht in die Standard /aws-glue/data-quality/error - und /aws-glue/data-quality/output Protokollgruppen geschrieben. Der Gesamtname der Protokollgruppe, einschließlich des Suffixes (/erroroder/output), darf 512 Zeichen nicht überschreiten.

DataQualityRuleRecommendationRunDescription Struktur

Beschreibt das Ergebnis einer Empfehlungsausführung einer Datenqualitätsregel.

Felder
  • RunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Die dieser Ausführung zugeordnete eindeutige Kennung.

  • Status— UTF-8 Zeichenfolge (gültige Werte: RUNNING | | FINISHED | FAILED | PENDING_EXECUTION | TIMED_OUT | CANCELING | CANCELED |RECEIVED_BY_TASKRUNNER).

    Der Status für diese Ausführung.

  • StartedOn – Zeitstempel.

    Das Datum und die Uhrzeit, zu der diese Ausführung gestartet wurde.

  • DataSource – Ein DataSource-Objekt.

    Die Datenquelle (AWS Glue Tabelle), die dem Empfehlungslauf zugeordnet ist.

DataQualityRuleRecommendationRunFilter Struktur

Ein Filter zum Auflisten von Empfehlungsausführungen zu Datenqualität.

Felder
  • DataSourceErforderlich: Ein DataSource-Objekt.

    Filter basierend auf einer angegebenen Datenquelle (AWS Glue Tabelle).

  • StartedBefore – Zeitstempel.

    Filtert basierend auf der Zeit für Ergebnisse, die vor der angegebenen Zeit gestartet wurden.

  • StartedAfter – Zeitstempel.

    Filtert basierend auf der Zeit für Ergebnisse, die nach der angegebenen Zeit gestartet wurden.

DataQualityResult Struktur

Beschreibt ein Datenqualitätsergebnis.

Felder
  • ResultId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Eine eindeutige Ergebnis-ID für das Datenqualitätsergebnis.

  • ProfileId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Die Profil-ID für das Datenqualitätsergebnis.

  • Score – Zahl (Double), nicht mehr als 1,0.

    Ein aggregierter Datenqualitätswert. Stellt das Verhältnis der Regeln dar, die an die Gesamtzahl der Regeln übergeben wurden.

  • DataSource – Ein DataSource-Objekt.

    Die Tabelle, die dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.

  • RulesetName— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Der Name des Regelsatzes, der dem Datenqualitätsergebnis zugeordnet ist.

  • EvaluationContext— UTF-8 Zeichenfolge.

    Im Kontext eines Jobs in AWS Glue Studio wird in der Regel jedem Knoten auf der Arbeitsfläche ein Name zugewiesen, und Datenqualitätsknoten haben Namen. Bei mehreren Knoten kann das evaluationContext die Knoten unterscheiden.

  • StartedOn – Zeitstempel.

    Das Datum und die Uhrzeit, zu der diese Datenqualitätsausführung gestartet wurde.

  • CompletedOn – Zeitstempel.

    Das Datum und die Uhrzeit, zu der diese Datenqualitätsausführung abgeschlossen wurde.

  • JobName— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.

    Der Auftragsname, der dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.

  • JobRunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Die Auftragsausführungs-ID, die dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.

  • RulesetEvaluationRunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Die eindeutige Ausführungs-ID für die Regelsatzauswertung für dieses Datenqualitätsergebnis.

  • RuleResults – Ein Array mit DataQualityRuleResult-Objekten, nicht mehr als 2000 Strukturen.

    Eine Liste von DataQualityRuleResult-Objekten, die die Ergebnisse für jede Regel darstellen.

  • AnalyzerResults – Ein Array mit DataQualityAnalyzerResult-Objekten, nicht mehr als 2000 Strukturen.

    Eine Liste von DataQualityAnalyzerResult-Objekten, die die Ergebnisse für jede Analysator darstellen.

  • Observations – Ein Array mit DataQualityObservation-Objekten, nicht mehr als 50 Strukturen.

    Eine Liste von DataQualityObservation-Objekten, die die Beobachtungen darstellen, die nach der Auswertung der Regeln und Analysatoren generiert wurden.

  • AggregatedMetrics – Ein DataQualityAggregatedMetrics-Objekt.

    Eine Zusammenfassung der DataQualityAggregatedMetrics Objekte mit der Gesamtzahl der verarbeiteten Zeilen und Regeln, einschließlich ihrer pass/fail Statistiken, die auf Ergebnissen auf Zeilenebene basieren.

DataQualityAnalyzerResult Struktur

Beschreibt das Ergebnis der Bewertung eines Datenqualitätsanalysators.

Felder
  • Name— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Der Name des Datenqualitätsanalysators.

  • Description— UTF-8 Zeichenfolge, nicht mehr als 2048 Byte lang, entspricht derURI address multi-line string pattern.

    Eine Beschreibung des Datenqualitätsanalysators.

  • EvaluationMessage— UTF-8 Zeichenfolge, nicht mehr als 2048 Byte lang, entspricht. URI address multi-line string pattern

    Eine Bewertungsmeldung.

  • EvaluatedMetrics – Ein Map-Array von Schlüssel-Wert-Paaren.

    Jeder Schlüssel ist eine UTF-8 Zeichenfolge, die nicht weniger als 1 oder mehr als 255 Byte lang ist und der Single-line string pattern entspricht.

    Jeder Wert ist eine Zahl (doppelt).

    Eine Zuordnung der Metriken, die der Auswertung des Analysators zugewiesen sind.

DataQualityObservation Struktur

Beschreibt die Beobachtung, die nach Auswertung der Regeln und Analysatoren generiert wurde.

Felder
  • Description— UTF-8 Zeichenfolge, nicht mehr als 2048 Byte lang, entspricht. URI address multi-line string pattern

    Eine Beschreibung der Datenqualitätsbeobachtung.

  • MetricBasedObservation – Ein MetricBasedObservation-Objekt.

    Ein Objekt vom Typ MetricBasedObservation, das die Beobachtung darstellt, die auf ausgewerteten Datenqualitätsmetriken basiert.

MetricBasedObservation Struktur

Beschreibt die metrikbasierte Beobachtung, die auf der Grundlage ausgewerteter Datenqualitätsmetriken generiert wurde.

Felder
  • MetricName— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Der Name der Datenqualitätsmetrik, die zur Generierung der Beobachtung verwendet wurde.

  • StatisticId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Die Statistik-ID.

  • MetricValues – Ein DataQualityMetricValues-Objekt.

    Ein Objekt vom Typ DataQualityMetricValues, das die Analyse des Werts der Datenqualitätsmetrik darstellt.

  • NewRules— Ein Array von UTF-8 Zeichenketten.

    Eine Liste neuer Datenqualitätsregeln, die im Rahmen der Beobachtung auf der Grundlage des Werts der Datenqualitätsmetrik generiert wurden.

DataQualityMetricValues Struktur

Beschreibt den Wert der Datenqualitätsmetrik gemäß der Analyse von Verlaufsdaten.

Felder
  • ActualValue – Nummer (doppelt).

    Der tatsächliche Wert der Datenqualitätsmetrik.

  • ExpectedValue – Nummer (doppelt).

    Der erwartete Wert der Datenqualitätsmetrik gemäß der Analyse von Verlaufsdaten.

  • LowerLimit – Nummer (doppelt).

    Die Untergrenze des Werts der Datenqualitätsmetrik gemäß der Analyse von Verlaufsdaten.

  • UpperLimit – Nummer (doppelt).

    Die Obergrenze des Werts der Datenqualitätsmetrik gemäß der Analyse von Verlaufsdaten.

DataQualityRuleResult Struktur

Beschreibt das Ergebnis der Auswertung einer Datenqualitätsregel.

Felder
  • Name— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Der Name der Datenqualitätsregel.

  • Description— UTF-8 Zeichenfolge, nicht mehr als 2048 Byte lang, entspricht derURI address multi-line string pattern.

    Eine Beschreibung der Datenqualitätsregel.

  • EvaluationMessage— UTF-8 Zeichenfolge, nicht mehr als 2048 Byte lang, entspricht. URI address multi-line string pattern

    Eine Bewertungsmeldung.

  • Result— UTF-8 Zeichenfolge (gültige Werte: PASS | FAIL |ERROR).

    Ein Status „Bestanden“ oder „Nicht bestanden“ für die Regel.

  • EvaluatedMetrics – Ein Map-Array von Schlüssel-Wert-Paaren.

    Jeder Schlüssel ist eine UTF-8 Zeichenfolge, die nicht weniger als 1 oder mehr als 255 Byte lang ist und der entsprichtSingle-line string pattern.

    Jeder Wert ist eine Zahl (doppelt).

    Eine Zuordnung der Metriken, die der Auswertung der Regel zugewiesen sind.

  • EvaluatedRule— UTF-8 Zeichenfolge, nicht mehr als 2048 Byte lang, entspricht. URI address multi-line string pattern

    Die ausgewertete Regel.

  • RuleMetrics – Ein Map-Array von Schlüssel-Wert-Paaren.

    Jeder Schlüssel ist eine UTF-8 Zeichenfolge, die nicht weniger als 1 oder mehr als 255 Byte lang ist und der Single-line string pattern entspricht.

    Jeder Wert ist eine Zahl (doppelt).

    Eine Zuordnung der Metriken, die der Auswertung der Regel zugewiesen sind, basierend auf den Ergebnissen auf Zeilenebene.

DataQualityResultDescription Struktur

Beschreibt ein Datenqualitätsergebnis.

Felder
  • ResultId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Die eindeutige Ergebnis-ID für dieses Datenqualitätsergebnis.

  • DataSource – Ein DataSource-Objekt.

    Der dem Datenqualitätsergebnis zugeordnete Tabellenname.

  • JobName— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Der dem Datenqualitätsergebnis zugeordnete Auftragsname.

  • JobRunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Die Auftragsausführungs-ID, die dem Datenqualitätsergebnis zugeordnet ist.

  • StartedOn – Zeitstempel.

    Die Uhrzeit, zu der die Ausführung für dieses Datenqualitätsergebnis gestartet wurde.

DataQualityResultFilterCriteria Struktur

Kriterien, die für die Rückgabe von Datenqualitätsergebnissen verwendet werden.

Felder
  • DataSource – Ein DataSource-Objekt.

    Filtert Ergebnisse nach der angegebenen Datenquelle. Zum Beispiel das Abrufen aller Ergebnisse für eine AWS Glue Tabelle.

  • JobName— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht. Single-line string pattern

    Filtert Ergebnisse nach dem angegebenen Auftragsnamen.

  • JobRunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Filtert Ergebnisse nach der angegebenen Auftragsausführung-ID.

  • StartedAfter – Zeitstempel.

    Filtert Ergebnisse nach Ausführungen, die nach diesem Zeitpunkt begonnen haben.

  • StartedBefore – Zeitstempel.

    Filtert Ergebnisse nach Ausführungen, die vor diesem Zeitpunkt begonnen haben.

DataQualityRulesetFilterCriteria Struktur

Die Kriterien, die zum Filtern von Datenqualitätsregelsätzen verwendet werden.

Felder
  • Name— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Der Name der Regelsatz-Filterkriterien.

  • Description – Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

    Die Beschreibung der Regelsatz-Filterkriterien.

  • CreatedBefore – Zeitstempel.

    Filtert nach Regelsätzen, die vor diesem Datum erstellt wurden.

  • CreatedAfter – Zeitstempel.

    Filtert nach Regelsätzen, die nach diesem Datum erstellt wurden.

  • LastModifiedBefore – Zeitstempel.

    Filtert nach Regelsätzen, die zuletzt vor diesem Datum geändert wurden.

  • LastModifiedAfter – Zeitstempel.

    Filter nach Regelsätzen, die zuletzt nach diesem Datum geändert wurden.

  • TargetTable – Ein DataQualityTargetTable-Objekt.

    Der Name und der Datenbankname der Zieltabelle.

DataQualityAggregatedMetrics Struktur

Eine Zusammenfassung der Metriken, die die Gesamtzahl der verarbeiteten Zeilen und Regeln zeigt, einschließlich ihrer pass/fail Statistiken, die auf Ergebnissen auf Zeilenebene basieren.

Felder
  • TotalRowsProcessed – Nummer (doppelt).

    Die Gesamtzahl der Zeilen, die bei der Datenqualitätsbewertung verarbeitet wurden.

  • TotalRowsPassed – Nummer (doppelt).

    Die Gesamtzahl der Zeilen, für die alle geltenden Datenqualitätsregeln erfolgreich angewendet wurden.

  • TotalRowsFailed – Nummer (doppelt).

    Die Gesamtzahl der Zeilen, für die eine oder mehrere Datenqualitätsregeln nicht erfolgreich angewendet wurden.

  • TotalRulesProcessed – Nummer (doppelt).

    Die Gesamtzahl der Datenqualitätsregeln, die bewertet wurden.

  • TotalRulesPassed – Nummer (doppelt).

    Die Gesamtzahl der Datenqualitätsregeln, die ihre Bewertungskriterien erfüllt haben.

  • TotalRulesFailed – Nummer (doppelt).

    Die Gesamtzahl der Datenqualitätsregeln, die ihre Bewertungskriterien nicht erfüllt haben.

StatisticAnnotation Struktur

Eine statistische Anmerkung.

Felder
  • ProfileId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Die Profil-ID.

  • StatisticId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Die Statistik-ID.

  • StatisticRecordedOn – Zeitstempel.

    Der Zeitstempel, zu dem die mit Anmerkungen versehene Statistik aufgezeichnet wurde.

  • InclusionAnnotation – Ein TimestampedInclusionAnnotation-Objekt.

    Die Einfügungsanmerkung, die auf die Statistik angewendet wurde.

TimestampedInclusionAnnotation Struktur

Eine Einfügungsanmerkung mit Zeitstempel.

Felder
  • Value— UTF-8 Zeichenfolge (gültige Werte: INCLUDE |EXCLUDE).

    Der Wert der Einfügungsanmerkung.

  • LastModifiedOn – Zeitstempel.

    Der Zeitstempel, zu dem die Einfügungsanmerkung zuletzt geändert wurde.

AnnotationError Struktur

Eine fehlgeschlagene Anmerkung.

Felder
  • ProfileId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Die Profil-ID für die fehlgeschlagene Anmerkung.

  • StatisticId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Die Statistik-ID für die fehlgeschlagene Anmerkung.

  • FailureReason – Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

    Der Grund, warum die Anmerkung fehlgeschlagen ist.

DatapointInclusionAnnotation Struktur

Eine Einfügungsanmerkung.

Felder
  • ProfileId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Die ID des Datenqualitätsprofils, zu dem die Statistik gehört.

  • StatisticId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Die Statistik-ID.

  • InclusionAnnotation— UTF-8 Zeichenfolge (gültige Werte: INCLUDE |EXCLUDE).

    Der Wert der Einfügungsanmerkung, die auf die Statistik angewendet wurde.

StatisticSummaryList Liste

Eine Liste von StatisticSummary.

Ein Array von StatisticSummary-Objekten.

Eine Liste von StatisticSummary.

StatisticSummary Struktur

Zusammenfassende Informationen zu einer Statistik.

Felder
  • StatisticId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Die Statistik-ID.

  • ProfileId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Die Profil-ID.

  • RunIdentifier – Ein RunIdentifier-Objekt.

    Die Ausführungs-ID.

  • StatisticName— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derCustom string pattern #16.

    Der Name der Statistik.

  • DoubleValue – Nummer (doppelt).

    Der Wert der Statistik.

  • EvaluationLevel— UTF-8 Zeichenfolge (gültige Werte: Dataset="DATASET" | Column="COLUMN" |Multicolumn="MULTICOLUMN").

    Die Bewertungsebene der Statistik. Mögliche Werte: Dataset, Column, Multicolumn.

  • ColumnsReferenced— Ein Array von UTF-8 Zeichenketten.

    Die Liste der Spalten, auf die in der Statistik verwiesen wird.

  • ReferencedDatasets— Ein Array von UTF-8 Zeichenketten.

    Die Liste der Datensätze, auf die in der Statistik verwiesen wird.

  • StatisticProperties – Ein Map-Array von Schlüssel-Wert-Paaren.

    Jeder Schlüssel ist eine UTF-8 Zeichenfolge, die nicht weniger als 1 oder mehr als 255 Byte lang ist und der entsprichtSingle-line string pattern.

    Jeder Wert ist eine Beschreibungszeichenfolge, die nicht länger als 2 048 Byte ist und mit URI address multi-line string pattern übereinstimmt.

    Eine StatisticPropertiesMap, die eine NameString und DescriptionString enthalten

  • RecordedOn – Zeitstempel.

    Der Zeitstempel, zu dem die Statistik aufgezeichnet wurde.

  • InclusionAnnotation – Ein TimestampedInclusionAnnotation-Objekt.

    Die Einfügungsanmerkung für die Statistik.

RunIdentifier Struktur

Eine Ausführungs-ID.

Felder
  • RunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Die Ausführungs-ID.

  • JobRunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Die Auftragsausführungs-ID.

StatisticModelResult Struktur

Das Ergebnis des statistischen Modells.

Felder
  • LowerBound – Nummer (doppelt).

    Die Untergrenze.

  • UpperBound – Nummer (doppelt).

    Die Obergrenze.

  • PredictedValue – Nummer (doppelt).

    Der vorhergesagte Wert.

  • ActualValue – Nummer (doppelt).

    Der tatsächliche Wert.

  • Date – Zeitstempel.

    Das Datum.

  • InclusionAnnotation— UTF-8 Zeichenfolge (gültige Werte: INCLUDE |EXCLUDE).

    Die Einfügungsanmerkung.

DataQualityGlueTable Struktur

Die Datenbank und Tabelle in der AWS Glue Data Catalog , die für Eingabe- oder Ausgabedaten für Datenqualitätsoperationen verwendet werden.

Felder
  • DatabaseNameErforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.

    Ein Datenbankname im AWS Glue Data Catalog.

  • TableNameErforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.

    Ein Tabellenname im AWS Glue Data Catalog.

  • CatalogId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Eine eindeutige Kennung für AWS Glue Data Catalog.

  • ConnectionName— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Der Name der zu löschenden Verbindung zu AWS Glue Data Catalog.

  • AdditionalOptions – Ein Map-Array von Schlüssel-Wert-Paaren, nicht weniger als 1 oder mehr als 10 Paare.

    Jeder Schlüssel ist eine UTF-8 Zeichenfolge, die nicht weniger als 1 oder mehr als 255 Byte lang ist und der entsprichtSingle-line string pattern.

    Jeder Wert ist eine Beschreibungszeichenfolge, die nicht länger als 2 048 Byte ist und mit URI address multi-line string pattern übereinstimmt.

    Zusätzliche Optionen für die Tabelle. Derzeit werden zwei Schlüssel unterstützt:

    • pushDownPredicate: zum Filtern nach Partitionen, ohne alle Dateien in Ihrem Datensatz auflisten und lesen zu müssen.

    • catalogPartitionPredicate: zur Verwendung des serverseitigen Partition-Pruning mithilfe von Partitionsindizes in der AWS Glue Data Catalog.

  • PreProcessingQuery— UTF-8 Zeichenfolge, nicht mehr als 51200 Byte lang, entspricht. URI address multi-line string pattern

    SQL-Abfrage im SparkSQL-Format, mit der die Daten für die Tabelle vorverarbeitet werden können AWS Glue Data Catalog, bevor der Datenqualitätsvorgang ausgeführt wird.

Operationen

StartDataQualityRulesetEvaluationRun Aktion (Python: start_data_quality_ruleset_evaluation_run)

Sobald Sie eine Regelsatzdefinition haben (entweder empfohlen oder Ihre eigene), rufen Sie diese Operation auf, um den Regelsatz anhand einer Datenquelle (Tabelle) auszuwerten.AWS Glue Die Auswertung berechnet Ergebnisse, die Sie mit der GetDataQualityResult-API abrufen können.

Anforderung
  • DataSourceErforderlich: Ein DataSource-Objekt.

    Die diesem Lauf zugeordnete Datenquelle (AWS Glue Tabelle).

  • RoleErforderlich: UTF-8 Zeichenfolge.

    Eine bereitgestellte IAM Rolle, um die Ergebnisse des Laufs zu verschlüsseln.

  • NumberOfWorkers – Zahl (Ganzzahl).

    Die Anzahl der G.1X-Worker, die in der Ausführung verwendet werden sollen. Der Standardwert ist 5.

  • Timeout – Zahl (ganze Zahl), mindestens 1.

    Das Timeout für eine Ausführung in Minuten. Dies ist die maximale Zeitspanne, in der eine Ausführung Ressourcen verbrauchen kann, bevor diese beendet wird und in den TIMEOUT-Status wechselt. Der Standardwert beträgt 2 880 Minuten (48 Stunden).

  • ClientToken— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht. Single-line string pattern

    Wird für Idempotenz verwendet und sollte auf eine zufällige ID (z. B. eine UUID) festgelegt werden, um zu vermeiden, dass mehrere Instances der gleichen Ressource erstellt oder gestartet werden.

  • AdditionalRunOptions – Ein DataQualityEvaluationRunAdditionalRunOptions-Objekt.

    Zusätzliche Ausführungsoptionen, die Sie für eine Ausführung der Auswertung angeben können.

  • RulesetNamesErforderlich: Ein Array von UTF-8 Zeichenketten, nicht weniger als 1 oder mehr als 10 Zeichenketten.

    Eine Liste von Regelsatznamen.

  • AdditionalDataSources – Ein Map-Array von Schlüssel-Wert-Paaren.

    Jeder Schlüssel ist eine UTF-8 Zeichenfolge, die nicht weniger als 1 oder mehr als 255 Byte lang ist und der entsprichtSingle-line string pattern.

    Jeder Wert ist ein A DataSource-Objekt.

    Eine Zuordnung von Zeichenfolgen zu zusätzlichen Datenquellen, die Sie für eine Ausführung der Auswertung angeben können.

Antwort
  • RunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Die dieser Ausführung zugeordnete eindeutige Kennung.

Fehler
  • InvalidInputException

  • EntityNotFoundException

  • OperationTimeoutException

  • InternalServiceException

  • ConflictException

CancelDataQualityRulesetEvaluationRun Aktion (Python: cancel_data_quality_ruleset_evaluation_run)

Bricht eine Ausführung ab, bei der ein Regelsatz anhand einer Datenquelle ausgewertet wird.

Anforderung
  • RunIdErforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht. Single-line string pattern

    Die dieser Ausführung zugeordnete eindeutige Kennung.

Antwort
  • Keine Antwortparameter.

Fehler
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

GetDataQualityRulesetEvaluationRun Aktion (Python: get_data_quality_ruleset_evaluation_run)

Ruft eine bestimmte Ausführung ab, bei der ein Regelsatz anhand einer Datenquelle ausgewertet wird.

Anforderung
  • RunIdErforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht. Single-line string pattern

    Die dieser Ausführung zugeordnete eindeutige Kennung.

Antwort
  • RunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Die dieser Ausführung zugeordnete eindeutige Kennung.

  • DataSource – Ein DataSource-Objekt.

    Die Datenquelle (eine AWS Glue Tabelle), die mit diesem Evaluierungslauf verknüpft ist.

  • Role— UTF-8 Zeichenfolge.

    Eine IAM Rolle, die bereitgestellt wird, um die Ergebnisse des Laufs zu verschlüsseln.

  • NumberOfWorkers – Zahl (Ganzzahl).

    Die Anzahl der G.1X-Worker, die in der Ausführung verwendet werden sollen. Der Standardwert ist 5.

  • Timeout – Zahl (ganze Zahl), mindestens 1.

    Das Timeout für eine Ausführung in Minuten. Dies ist die maximale Zeitspanne, in der eine Ausführung Ressourcen verbrauchen kann, bevor diese beendet wird und in den TIMEOUT-Status wechselt. Der Standardwert beträgt 2 880 Minuten (48 Stunden).

  • AdditionalRunOptions – Ein DataQualityEvaluationRunAdditionalRunOptions-Objekt.

    Zusätzliche Ausführungsoptionen, die Sie für eine Ausführung der Auswertung angeben können.

  • Status— UTF-8 Zeichenfolge (gültige Werte: RUNNING | | FINISHED | FAILED | PENDING_EXECUTION | | TIMED_OUT | CANCELING CANCELED |RECEIVED_BY_TASKRUNNER).

    Der Status für diese Ausführung.

  • ErrorString— UTF-8 Zeichenfolge.

    Die Fehlerzeichenfolgen, die der Ausführung zugeordnet sind.

  • StartedOn – Zeitstempel.

    Das Datum und die Uhrzeit, zu der diese Ausführung gestartet wurde.

  • LastModifiedOn – Zeitstempel.

    Ein Zeitstempel. Der letzte Zeitpunkt, an dem diese Empfehlungsausführung für die Datenqualitätsregel geändert wurde.

  • CompletedOn – Zeitstempel.

    Das Datum und die Uhrzeit, zu der diese Ausführung abgeschlossen wurde.

  • ExecutionTime – Zahl (Ganzzahl).

    Die Zeit (in Sekunden), in der durch die Ausführung Ressourcen verbraucht wurden.

  • RulesetNames— Ein Array von UTF-8 Zeichenketten, nicht weniger als 1 oder mehr als 10 Zeichenketten.

    Eine Liste von Regelsatznamen für die Ausführung. Dieser Parameter akzeptiert derzeit nur einen Regelsatznamen.

  • ResultIds— Ein Array von UTF-8 Zeichenketten, nicht weniger als 1 oder mehr als 10 Zeichenketten.

    Eine Liste von Ergebnis-IDs für die Datenqualitätsergebnisse für die Ausführung.

  • AdditionalDataSources – Ein Map-Array von Schlüssel-Wert-Paaren.

    Jeder Schlüssel ist eine UTF-8 Zeichenfolge, die nicht weniger als 1 oder mehr als 255 Byte lang ist und der entsprichtSingle-line string pattern.

    Jeder Wert ist ein A DataSource-Objekt.

    Eine Zuordnung von Zeichenfolgen zu zusätzlichen Datenquellen, die Sie für eine Ausführung der Auswertung angeben können.

Fehler
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

ListDataQualityRulesetEvaluationRuns Aktion (Python: list_data_quality_ruleset_evaluation_runs)

Listet alle Ausführungen auf, die den Filterkriterien entsprechen, bei denen ein Regelsatz anhand einer Datenquelle ausgewertet wird.

Anforderung
  • Filter – Ein DataQualityRulesetEvaluationRunFilter-Objekt.

    Die Filterkriterien.

  • NextToken UTF-8 — Zeichenfolge.

    Ein paginiertes Token zum Ausgleich der Ergebnisse.

  • MaxResults – Zahl (Ganzzahl), nicht kleiner als 1 oder größer als 1000.

    Die maximale Anzahl der auszugebenden Ergebnisse.

Antwort
  • Runs – Ein Array mit DataQualityRulesetEvaluationRunDescription-Objekten.

    Eine Liste von DataQualityRulesetEvaluationRunDescription-Objekten, die Ausführungen von Datenqualitätsregelsätzen darstellen.

  • NextToken— UTF-8 Zeichenfolge.

    Ein Paginierungs-Token, falls mehr Ergebnisse verfügbar sind.

Fehler
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

StartDataQualityRuleRecommendationRun Aktion (Python: start_data_quality_rule_recommendation_run)

Startet einen Empfehlungslauf, der zum Generieren von Regeln verwendet wird, wenn Sie nicht wissen, welche Regeln Sie schreiben sollen. AWS Glue Data Quality analysiert die Daten und gibt Empfehlungen für einen möglichen Regelsatz ab. Sie können dann den Regelsatz auswerten und den generierten Regelsatz nach Ihren Wünschen ändern.

Empfehlungsausführungen werden nach 90 Tagen automatisch gelöscht.

Anforderung

Die Anforderung der Empfehlungsanfrage für die Datenqualitätsregel.

  • DataSourceErforderlich: Ein DataSource-Objekt.

    Die diesem Lauf zugeordnete Datenquelle (AWS Glue Tabelle).

  • RoleErforderlich: UTF-8 Zeichenfolge.

    Eine bereitgestellte IAM Rolle, um die Ergebnisse des Laufs zu verschlüsseln.

  • NumberOfWorkers – Zahl (Ganzzahl).

    Die Anzahl der G.1X-Worker, die in der Ausführung verwendet werden sollen. Der Standardwert ist 5.

  • Timeout – Zahl (ganze Zahl), mindestens 1.

    Das Timeout für eine Ausführung in Minuten. Dies ist die maximale Zeitspanne, in der eine Ausführung Ressourcen verbrauchen kann, bevor diese beendet wird und in den TIMEOUT-Status wechselt. Der Standardwert beträgt 2 880 Minuten (48 Stunden).

  • CreatedRulesetName— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht. Single-line string pattern

    Ein Name für den Regelsatz.

  • DataQualitySecurityConfiguration— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Der Name der Sicherheitskonfiguration, die mit der Option für die Datenqualitätsverschlüsselung erstellt wurde.

  • ClientToken— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Wird für Idempotenz verwendet und sollte auf eine zufällige ID (z. B. eine UUID) festgelegt werden, um zu vermeiden, dass mehrere Instances der gleichen Ressource erstellt oder gestartet werden.

Antwort
  • RunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Die dieser Ausführung zugeordnete eindeutige Kennung.

Fehler
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

  • ConflictException

CancelDataQualityRuleRecommendationRun Aktion (Python: cancel_data_quality_rule_recommendation_run)

Bricht die angegebene Empfehlungsausführung ab, die zum Generieren von Regeln verwendet wurde.

Anforderung
  • RunIdErforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht. Single-line string pattern

    Die dieser Ausführung zugeordnete eindeutige Kennung.

Antwort
  • Keine Antwortparameter.

Fehler
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

GetDataQualityRuleRecommendationRun Aktion (Python: get_data_quality_rule_recommendation_run)

Ruft die angegebene Empfehlungsausführung ab, die zum Generieren von Regeln verwendet wurde.

Anforderung
  • RunIdErforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht. Single-line string pattern

    Die dieser Ausführung zugeordnete eindeutige Kennung.

Antwort

Die Antwort für die Empfehlungsausführung für die Datenqualitätsregel.

  • RunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Die dieser Ausführung zugeordnete eindeutige Kennung.

  • DataSource – Ein DataSource-Objekt.

    Die diesem Lauf zugeordnete Datenquelle (eine AWS Glue Tabelle).

  • Role— UTF-8 Zeichenfolge.

    Eine IAM Rolle, die bereitgestellt wird, um die Ergebnisse des Laufs zu verschlüsseln.

  • NumberOfWorkers – Zahl (Ganzzahl).

    Die Anzahl der G.1X-Worker, die in der Ausführung verwendet werden sollen. Der Standardwert ist 5.

  • Timeout – Zahl (ganze Zahl), mindestens 1.

    Das Timeout für eine Ausführung in Minuten. Dies ist die maximale Zeitspanne, in der eine Ausführung Ressourcen verbrauchen kann, bevor diese beendet wird und in den TIMEOUT-Status wechselt. Der Standardwert beträgt 2 880 Minuten (48 Stunden).

  • Status— UTF-8 Zeichenfolge (gültige Werte: RUNNING | | FINISHED | FAILED | PENDING_EXECUTION | | TIMED_OUT | CANCELING CANCELED |RECEIVED_BY_TASKRUNNER).

    Der Status für diese Ausführung.

  • ErrorString— UTF-8 Zeichenfolge.

    Die Fehlerzeichenfolgen, die der Ausführung zugeordnet sind.

  • StartedOn – Zeitstempel.

    Das Datum und die Uhrzeit, zu der diese Ausführung gestartet wurde.

  • LastModifiedOn – Zeitstempel.

    Ein Zeitstempel. Der letzte Zeitpunkt, an dem diese Empfehlungsausführung für die Datenqualitätsregel geändert wurde.

  • CompletedOn – Zeitstempel.

    Das Datum und die Uhrzeit, zu der diese Ausführung abgeschlossen wurde.

  • ExecutionTime – Zahl (Ganzzahl).

    Die Zeit (in Sekunden), in der durch die Ausführung Ressourcen verbraucht wurden.

  • RecommendedRuleset— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 65536 Byte lang.

    Wenn die Empfehlungsausführung einer Startregel abgeschlossen ist, wird ein empfohlener Regelsatz (ein Satz von Regeln) erstellt. Dieses Mitglied verfügt über diese Regeln im Format der Definitionssprache für Datenqualität (DQDL).

  • CreatedRulesetName— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht der. Single-line string pattern

    Der Name des Regelsatzes, der durch die Ausführung erstellt wurde.

  • DataQualitySecurityConfiguration— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Der Name der Sicherheitskonfiguration, die mit der Option für die Datenqualitätsverschlüsselung erstellt wurde.

Fehler
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

ListDataQualityRuleRecommendationRuns Aktion (Python: list_data_quality_rule_recommendation_runs)

Listet die Empfehlungsausführungen auf, die die Filterkriterien erfüllen.

Anforderung
  • Filter – Ein DataQualityRuleRecommendationRunFilter-Objekt.

    Die Filterkriterien.

  • NextToken UTF-8 — Zeichenfolge.

    Ein paginiertes Token zum Ausgleich der Ergebnisse.

  • MaxResults – Zahl (Ganzzahl), nicht kleiner als 1 oder größer als 1000.

    Die maximale Anzahl der auszugebenden Ergebnisse.

Antwort
  • Runs – Ein Array mit DataQualityRuleRecommendationRunDescription-Objekten.

    Eine Liste von DataQualityRuleRecommendationRunDescription-Objekten.

  • NextToken— UTF-8 Zeichenfolge.

    Ein Paginierungs-Token, falls mehr Ergebnisse verfügbar sind.

Fehler
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

GetDataQualityResult Aktion (Python: get_data_quality_result)

Ruft das Ergebnis einer Auswertung einer Datenqualitätsregel ab.

Anforderung
  • ResultIdErforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht. Single-line string pattern

    Eine eindeutige Ergebnis-ID für das Datenqualitätsergebnis.

Antwort

Die Antwort für das Datenqualitätsergebnis.

  • ResultId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Eine eindeutige Ergebnis-ID für das Datenqualitätsergebnis.

  • ProfileId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Die Profil-ID für das Datenqualitätsergebnis.

  • Score – Zahl (Double), nicht mehr als 1,0.

    Ein aggregierter Datenqualitätswert. Stellt das Verhältnis der Regeln dar, die an die Gesamtzahl der Regeln übergeben wurden.

  • DataSource – Ein DataSource-Objekt.

    Die Tabelle, die dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.

  • RulesetName— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Der Name des Regelsatzes, der dem Datenqualitätsergebnis zugeordnet ist.

  • EvaluationContext— UTF-8 Zeichenfolge.

    Im Kontext eines Jobs in AWS Glue Studio wird in der Regel jedem Knoten auf der Arbeitsfläche ein Name zugewiesen, und Datenqualitätsknoten haben Namen. Bei mehreren Knoten kann das evaluationContext die Knoten unterscheiden.

  • StartedOn – Zeitstempel.

    Das Datum und die Uhrzeit, zu der die Ausführung für dieses Datenqualitätsergebnis gestartet wurde.

  • CompletedOn – Zeitstempel.

    Das Datum und die Uhrzeit, zu der die Ausführung für dieses Datenqualitätsergebnis abgeschlossen wurde.

  • JobName— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.

    Der Auftragsname, der dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.

  • JobRunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Die Auftragsausführungs-ID, die dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.

  • RulesetEvaluationRunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Die eindeutige Ausführungs-ID, die der Regelsatzauswertung zugeordnet ist.

  • RuleResults – Ein Array mit DataQualityRuleResult-Objekten, nicht mehr als 2000 Strukturen.

    Eine Liste von DataQualityRuleResult-Objekten, die die Ergebnisse für jede Regel darstellen.

  • AnalyzerResults – Ein Array mit DataQualityAnalyzerResult-Objekten, nicht mehr als 2000 Strukturen.

    Eine Liste von DataQualityAnalyzerResult-Objekten, die die Ergebnisse für jede Analysator darstellen.

  • Observations – Ein Array mit DataQualityObservation-Objekten, nicht mehr als 50 Strukturen.

    Eine Liste von DataQualityObservation-Objekten, die die Beobachtungen darstellen, die nach der Auswertung der Regeln und Analysatoren generiert wurden.

  • AggregatedMetrics – Ein DataQualityAggregatedMetrics-Objekt.

    Eine Zusammenfassung der DataQualityAggregatedMetrics Objekte mit der Gesamtzahl der verarbeiteten Zeilen und Regeln, einschließlich ihrer pass/fail Statistiken, die auf Ergebnissen auf Zeilenebene basieren.

Fehler
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

  • EntityNotFoundException

BatchGetDataQualityResult Aktion (Python: batch_get_data_quality_result)

Ruft eine Liste mit Datenqualitätsergebnissen für die angegebenen Ergebnis-IDs ab.

Anforderung
  • ResultIdsErforderlich: Ein Array von UTF-8 Zeichenketten, nicht weniger als 1 oder mehr als 100 Zeichenketten.

    Eine Liste mit eindeutigen Ergebnis-IDs für die Datenqualitätsergebnisse.

Antwort
  • ResultsErforderlich: Ein Array mit DataQualityResult-Objekten.

    Eine Liste von DataQualityResult-Objekten, die die Datenqualitätsergebnisse darstellen.

  • ResultsNotFound— Ein Array von UTF-8 Zeichenketten, nicht weniger als 1 oder mehr als 100 Zeichenketten.

    Eine Liste mit Ergebnis-IDs, für die keine Ergebnisse gefunden wurden.

Fehler
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

ListDataQualityResults Aktion (Python: list_data_quality_results)

Gibt alle Ausführungsergebnisse der Datenqualität für Ihr Konto zurück.

Anforderung
  • Filter – Ein DataQualityResultFilterCriteria-Objekt.

    Die Filterkriterien.

  • NextToken UTF-8 — Zeichenfolge.

    Ein paginiertes Token zum Ausgleich der Ergebnisse.

  • MaxResults – Zahl (Ganzzahl), nicht kleiner als 1 oder größer als 1000.

    Die maximale Anzahl der auszugebenden Ergebnisse.

Antwort
  • ResultsErforderlich: Ein Array mit DataQualityResultDescription-Objekten.

    Eine Liste von DataQualityResultDescription-Objekten.

  • NextToken— UTF-8 Zeichenfolge.

    Ein Paginierungs-Token, falls mehr Ergebnisse verfügbar sind.

Fehler
  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

CreateDataQualityRuleset Aktion (Python: create_data_quality_ruleset)

Erstellt einen Regelsatz für die Datenqualität mit DQDL-Regeln, die auf eine angegebene Tabelle angewendet werden. AWS Glue

Sie erstellen den Regelsatz mit der Definitionssprache für Datenqualität (DQDL). Weitere Informationen finden Sie im AWS Glue Entwicklerhandbuch.

Anforderung

Eine Anforderung zum Erstellen eines Datenqualitätsregelsatzes.

  • NameErforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.

    Ein eindeutiger Name für den Datenqualitätsregelsatz.

  • Description – Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

    Eine Beschreibung des Regelsatzes für die Datenqualität.

  • RulesetErforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 65536 Byte lang.

    Ein Regelsatz der Definitionssprache für Datenqualität (DQDL). Weitere Informationen finden Sie im AWS Glue Entwicklerhandbuch.

  • Tags – Ein Map-Array von Schlüssel-Wert-Paaren, nicht mehr als 50 Paare.

    Jeder Schlüssel ist eine UTF-8 Zeichenfolge, die nicht weniger als 1 oder mehr als 128 Byte lang ist.

    Jeder Wert ist eine UTF-8 Zeichenfolge, die nicht länger als 256 Byte ist.

    Eine Liste von Tags, die auf den Datenqualitätsregelsatz angewendet werden.

  • TargetTable – Ein DataQualityTargetTable-Objekt.

    Eine Zieltabelle, die dem Datenqualitätsregelsatz zugeordnet ist.

  • RecommendationRunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.

    Eine eindeutige Ausführungs-ID für die Empfehlungsausführung.

  • DataQualitySecurityConfiguration— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Der Name der Sicherheitskonfiguration, die mit der Option für die Datenqualitätsverschlüsselung erstellt wurde.

  • ClientToken— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Wird für Idempotenz verwendet und sollte auf eine zufällige ID (z. B. eine UUID) festgelegt werden, um zu vermeiden, dass mehrere Instances der gleichen Ressource erstellt oder gestartet werden.

Antwort
  • Name— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Ein eindeutiger Name für den Datenqualitätsregelsatz.

Fehler
  • InvalidInputException

  • AlreadyExistsException

  • OperationTimeoutException

  • InternalServiceException

  • ResourceNumberLimitExceededException

DeleteDataQualityRuleset Aktion (Python: delete_data_quality_ruleset)

Löscht einen Datenqualitätsregelsatz.

Anforderung
  • NameErforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht. Single-line string pattern

    Ein eindeutiger Name für den Datenqualitätsregelsatz.

Antwort
  • Keine Antwortparameter.

Fehler
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

GetDataQualityRuleset Aktion (Python: get_data_quality_ruleset)

Gibt einen vorhandenen Regelsatz nach Kennung oder Name zurück.

Anforderung
  • NameErforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht. Single-line string pattern

    Der Name des Regelsatzes.

Antwort

Gibt die Antwort für den Regelsatz für die Datenqualität zurück.

  • Name— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Der Name des Regelsatzes.

  • Description – Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

    Eine Beschreibung des Regelsatzes.

  • Ruleset— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 65536 Byte lang.

    Ein Regelsatz der Definitionssprache für Datenqualität (DQDL). Weitere Informationen finden Sie im AWS Glue Entwicklerhandbuch.

  • TargetTable – Ein DataQualityTargetTable-Objekt.

    Der Name und der Datenbankname der Zieltabelle.

  • CreatedOn – Zeitstempel.

    Ein Zeitstempel. Die Uhrzeit und das Datum, an dem dieser Datenqualitätsregelsatz erstellt wurde.

  • LastModifiedOn – Zeitstempel.

    Ein Zeitstempel. Der letzte Zeitpunkt, an dem dieser Datenqualitätsregelsatz geändert wurde.

  • RecommendationRunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.

    Wenn ein Regelsatz aus einer Empfehlungsausführung erstellt wurde, wird diese Ausführungs-ID generiert, um die beiden miteinander zu verknüpfen.

  • DataQualitySecurityConfiguration— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Der Name der Sicherheitskonfiguration, die mit der Option für die Datenqualitätsverschlüsselung erstellt wurde.

Fehler
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

ListDataQualityRulesets Aktion (Python: list_data_quality_rulesets)

Gibt eine paginierte Liste von Regelsätzen für die angegebene Tabellenliste zurück. AWS Glue

Anforderung
  • NextToken— Zeichenfolge. UTF-8

    Ein paginiertes Token zum Ausgleich der Ergebnisse.

  • MaxResults – Zahl (Ganzzahl), nicht kleiner als 1 oder größer als 1000.

    Die maximale Anzahl der auszugebenden Ergebnisse.

  • Filter – Ein DataQualityRulesetFilterCriteria-Objekt.

    Die Filterkriterien.

  • Tags – Ein Map-Array von Schlüssel-Wert-Paaren, nicht mehr als 50 Paare.

    Jeder Schlüssel ist eine UTF-8 Zeichenfolge, die nicht weniger als 1 oder mehr als 128 Byte lang ist.

    Jeder Wert ist eine UTF-8 Zeichenfolge, die nicht länger als 256 Byte ist.

    Eine Liste mit Tags für Schlüsselwertpaare.

Antwort
  • Rulesets – Ein Array mit DataQualityRulesetListDetails-Objekten.

    Eine paginierte Liste von Regelsätzen für die angegebene Tabellenliste. AWS Glue

  • NextToken— Zeichenfolge. UTF-8

    Ein Paginierungs-Token, falls mehr Ergebnisse verfügbar sind.

Fehler
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

UpdateDataQualityRuleset Aktion (Python: update_data_quality_ruleset)

Aktualisiert den angegebenen Datenqualitätsregelsatz.

Anforderung
  • NameErforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht. Single-line string pattern

    Der Name des Regelsatzes für die Datenqualität.

  • Description – Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

    Eine Beschreibung des Regelsatzes.

  • Ruleset— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 65536 Byte lang.

    Ein Regelsatz der Definitionssprache für Datenqualität (DQDL). Weitere Informationen finden Sie im AWS Glue Entwicklerhandbuch.

Antwort
  • Name— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.

    Der Name des Regelsatzes für die Datenqualität.

  • Description – Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

    Eine Beschreibung des Regelsatzes.

  • Ruleset— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 65536 Byte lang.

    Ein Regelsatz der Definitionssprache für Datenqualität (DQDL). Weitere Informationen finden Sie im AWS Glue Entwicklerhandbuch.

Fehler
  • EntityNotFoundException

  • AlreadyExistsException

  • IdempotentParameterMismatchException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

  • ResourceNumberLimitExceededException

ListDataQualityStatistics Aktion (Python: list_data_quality_statistics)

Ruft eine Liste mit Datenqualitätsstatistiken ab.

Anforderung
  • StatisticId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht. Single-line string pattern

    Die Statistik-ID.

  • ProfileId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Die Profil-ID.

  • TimestampFilter – Ein TimestampFilter-Objekt.

    Ein Zeitstempelfilter.

  • MaxResults – Zahl (Ganzzahl), nicht kleiner als 1 oder größer als 1000.

    Die maximale Anzahl der Ergebnisse, die bei dieser Anfrage zurückzugeben sind.

  • NextToken— UTF-8 Zeichenfolge.

    Ein Paginierungstoken zum Anfordern der nächsten Ergebnisseite.

Antwort
  • Statistics – Ein Array mit StatisticSummary-Objekten.

    Ein StatisticSummaryList

  • NextToken— UTF-8 Zeichenfolge.

    Ein Paginierungstoken zum Anfordern der nächsten Ergebnisseite.

Fehler
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

TimestampFilter Struktur

Ein Zeitstempelfilter.

Felder
  • RecordedBefore – Zeitstempel.

    Der Zeitstempel, vor dem Statistiken in die Ergebnisse aufgenommen werden sollen.

  • RecordedAfter – Zeitstempel.

    Der Zeitstempel, nach dem Statistiken in die Ergebnisse aufgenommen werden sollen.

CreateDataQualityRulesetRequest Struktur

Eine Anforderung zum Erstellen eines Datenqualitätsregelsatzes.

Felder
  • NameErforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.

    Ein eindeutiger Name für den Datenqualitätsregelsatz.

  • Description – Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

    Eine Beschreibung des Regelsatzes für die Datenqualität.

  • RulesetErforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 65536 Byte lang.

    Ein Regelsatz der Definitionssprache für Datenqualität (DQDL). Weitere Informationen finden Sie im AWS Glue Entwicklerhandbuch.

  • Tags – Ein Map-Array von Schlüssel-Wert-Paaren, nicht mehr als 50 Paare.

    Jeder Schlüssel ist eine UTF-8 Zeichenfolge, die nicht weniger als 1 oder mehr als 128 Byte lang ist.

    Jeder Wert ist eine UTF-8 Zeichenfolge, die nicht länger als 256 Byte ist.

    Eine Liste von Tags, die auf den Datenqualitätsregelsatz angewendet werden.

  • TargetTable – Ein DataQualityTargetTable-Objekt.

    Eine Zieltabelle, die dem Datenqualitätsregelsatz zugeordnet ist.

  • RecommendationRunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.

    Eine eindeutige Ausführungs-ID für die Empfehlungsausführung.

  • DataQualitySecurityConfiguration— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Der Name der Sicherheitskonfiguration, die mit der Option für die Datenqualitätsverschlüsselung erstellt wurde.

  • ClientToken— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Wird für Idempotenz verwendet und sollte auf eine zufällige ID (z. B. eine UUID) festgelegt werden, um zu vermeiden, dass mehrere Instances der gleichen Ressource erstellt oder gestartet werden.

GetDataQualityRulesetResponse Struktur

Gibt die Antwort für den Regelsatz für die Datenqualität zurück.

Felder
  • Name— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Der Name des Regelsatzes.

  • Description – Beschreibende Zeichenfolge, nicht mehr als 2048 Bytes lang, passend zum URI address multi-line string pattern.

    Eine Beschreibung des Regelsatzes.

  • Ruleset— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 65536 Byte lang.

    Ein Regelsatz der Definitionssprache für Datenqualität (DQDL). Weitere Informationen finden Sie im AWS Glue Entwicklerhandbuch.

  • TargetTable – Ein DataQualityTargetTable-Objekt.

    Der Name und der Datenbankname der Zieltabelle.

  • CreatedOn – Zeitstempel.

    Ein Zeitstempel. Die Uhrzeit und das Datum, an dem dieser Datenqualitätsregelsatz erstellt wurde.

  • LastModifiedOn – Zeitstempel.

    Ein Zeitstempel. Der letzte Zeitpunkt, an dem dieser Datenqualitätsregelsatz geändert wurde.

  • RecommendationRunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.

    Wenn ein Regelsatz aus einer Empfehlungsausführung erstellt wurde, wird diese Ausführungs-ID generiert, um die beiden miteinander zu verknüpfen.

  • DataQualitySecurityConfiguration— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Der Name der Sicherheitskonfiguration, die mit der Option für die Datenqualitätsverschlüsselung erstellt wurde.

GetDataQualityResultResponse Struktur

Die Antwort für das Datenqualitätsergebnis.

Felder
  • ResultId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Eine eindeutige Ergebnis-ID für das Datenqualitätsergebnis.

  • ProfileId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Die Profil-ID für das Datenqualitätsergebnis.

  • Score – Zahl (Double), nicht mehr als 1,0.

    Ein aggregierter Datenqualitätswert. Stellt das Verhältnis der Regeln dar, die an die Gesamtzahl der Regeln übergeben wurden.

  • DataSource – Ein DataSource-Objekt.

    Die Tabelle, die dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.

  • RulesetName— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Der Name des Regelsatzes, der dem Datenqualitätsergebnis zugeordnet ist.

  • EvaluationContext— UTF-8 Zeichenfolge.

    Im Kontext eines Jobs in AWS Glue Studio wird in der Regel jedem Knoten auf der Arbeitsfläche ein Name zugewiesen, und Datenqualitätsknoten haben Namen. Bei mehreren Knoten kann das evaluationContext die Knoten unterscheiden.

  • StartedOn – Zeitstempel.

    Das Datum und die Uhrzeit, zu der die Ausführung für dieses Datenqualitätsergebnis gestartet wurde.

  • CompletedOn – Zeitstempel.

    Das Datum und die Uhrzeit, zu der die Ausführung für dieses Datenqualitätsergebnis abgeschlossen wurde.

  • JobName— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.

    Der Auftragsname, der dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.

  • JobRunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Die Auftragsausführungs-ID, die dem Datenqualitätsergebnis zugeordnet ist, falls vorhanden.

  • RulesetEvaluationRunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Die eindeutige Ausführungs-ID, die der Regelsatzauswertung zugeordnet ist.

  • RuleResults – Ein Array mit DataQualityRuleResult-Objekten, nicht mehr als 2000 Strukturen.

    Eine Liste von DataQualityRuleResult-Objekten, die die Ergebnisse für jede Regel darstellen.

  • AnalyzerResults – Ein Array mit DataQualityAnalyzerResult-Objekten, nicht mehr als 2000 Strukturen.

    Eine Liste von DataQualityAnalyzerResult-Objekten, die die Ergebnisse für jede Analysator darstellen.

  • Observations – Ein Array mit DataQualityObservation-Objekten, nicht mehr als 50 Strukturen.

    Eine Liste von DataQualityObservation-Objekten, die die Beobachtungen darstellen, die nach der Auswertung der Regeln und Analysatoren generiert wurden.

  • AggregatedMetrics – Ein DataQualityAggregatedMetrics-Objekt.

    Eine Zusammenfassung der DataQualityAggregatedMetrics Objekte mit der Gesamtzahl der verarbeiteten Zeilen und Regeln, einschließlich ihrer pass/fail Statistiken, die auf Ergebnissen auf Zeilenebene basieren.

StartDataQualityRuleRecommendationRunRequest Struktur

Die Anforderung der Empfehlungsanfrage für die Datenqualitätsregel.

Felder
  • DataSourceErforderlich: Ein DataSource-Objekt.

    Die mit diesem Lauf verknüpfte Datenquelle (AWS Glue Tabelle).

  • RoleErforderlich: UTF-8 Zeichenfolge.

    Eine bereitgestellte IAM Rolle, um die Ergebnisse des Laufs zu verschlüsseln.

  • NumberOfWorkers – Zahl (Ganzzahl).

    Die Anzahl der G.1X-Worker, die in der Ausführung verwendet werden sollen. Der Standardwert ist 5.

  • Timeout – Zahl (ganze Zahl), mindestens 1.

    Das Timeout für eine Ausführung in Minuten. Dies ist die maximale Zeitspanne, in der eine Ausführung Ressourcen verbrauchen kann, bevor diese beendet wird und in den TIMEOUT-Status wechselt. Der Standardwert beträgt 2 880 Minuten (48 Stunden).

  • CreatedRulesetName— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht. Single-line string pattern

    Ein Name für den Regelsatz.

  • DataQualitySecurityConfiguration— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Der Name der Sicherheitskonfiguration, die mit der Option für die Datenqualitätsverschlüsselung erstellt wurde.

  • ClientToken— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Wird für Idempotenz verwendet und sollte auf eine zufällige ID (z. B. eine UUID) festgelegt werden, um zu vermeiden, dass mehrere Instances der gleichen Ressource erstellt oder gestartet werden.

GetDataQualityRuleRecommendationRunResponse Struktur

Die Antwort für die Empfehlungsausführung für die Datenqualitätsregel.

Felder
  • RunId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Die dieser Ausführung zugeordnete eindeutige Kennung.

  • DataSource – Ein DataSource-Objekt.

    Die diesem Lauf zugeordnete Datenquelle (eine AWS Glue Tabelle).

  • Role— UTF-8 Zeichenfolge.

    Eine IAM Rolle, die bereitgestellt wird, um die Ergebnisse des Laufs zu verschlüsseln.

  • NumberOfWorkers – Zahl (Ganzzahl).

    Die Anzahl der G.1X-Worker, die in der Ausführung verwendet werden sollen. Der Standardwert ist 5.

  • Timeout – Zahl (ganze Zahl), mindestens 1.

    Das Timeout für eine Ausführung in Minuten. Dies ist die maximale Zeitspanne, in der eine Ausführung Ressourcen verbrauchen kann, bevor diese beendet wird und in den TIMEOUT-Status wechselt. Der Standardwert beträgt 2 880 Minuten (48 Stunden).

  • Status— UTF-8 Zeichenfolge (gültige Werte: RUNNING | | FINISHED | FAILED | PENDING_EXECUTION | | TIMED_OUT | CANCELING CANCELED |RECEIVED_BY_TASKRUNNER).

    Der Status für diese Ausführung.

  • ErrorString— UTF-8 Zeichenfolge.

    Die Fehlerzeichenfolgen, die der Ausführung zugeordnet sind.

  • StartedOn – Zeitstempel.

    Das Datum und die Uhrzeit, zu der diese Ausführung gestartet wurde.

  • LastModifiedOn – Zeitstempel.

    Ein Zeitstempel. Der letzte Zeitpunkt, an dem diese Empfehlungsausführung für die Datenqualitätsregel geändert wurde.

  • CompletedOn – Zeitstempel.

    Das Datum und die Uhrzeit, zu der diese Ausführung abgeschlossen wurde.

  • ExecutionTime – Zahl (Ganzzahl).

    Die Zeit (in Sekunden), in der durch die Ausführung Ressourcen verbraucht wurden.

  • RecommendedRuleset— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 65536 Byte lang.

    Wenn die Empfehlungsausführung einer Startregel abgeschlossen ist, wird ein empfohlener Regelsatz (ein Satz von Regeln) erstellt. Dieses Mitglied verfügt über diese Regeln im Format der Definitionssprache für Datenqualität (DQDL).

  • CreatedRulesetName— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht der. Single-line string pattern

    Der Name des Regelsatzes, der durch die Ausführung erstellt wurde.

  • DataQualitySecurityConfiguration— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Der Name der Sicherheitskonfiguration, die mit der Option für die Datenqualitätsverschlüsselung erstellt wurde.

BatchPutDataQualityStatisticAnnotation Aktion (Python: batch_put_data_quality_statistic_annotation)

Versehen Sie Datenpunkte für eine bestimmte Datenqualitätsstatistik im Zeitverlauf mit Anmerkungen. Die API benötigt sowohl ProfileID als auch StatisticID als Teil der Eingabe. InclusionAnnotation Die API funktioniert nur für eine einzelne statisticId in mehreren Profilen.

Anforderung
  • InclusionAnnotationsErforderlich: Ein Array mit DatapointInclusionAnnotation-Objekten.

    Eine DatapointInclusionAnnotation-Liste. Die InclusionAnnotations müssen eine ProfileID und eine StatisticID enthalten. Wenn es mehrere gibt InclusionAnnotations, muss sich die Liste auf eine einzelne StatisticID für mehrere ProfileIDs beziehen.

  • ClientToken— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht. Single-line string pattern

    Client-Token.

Antwort
  • FailedInclusionAnnotations – Ein Array mit AnnotationError-Objekten.

    Eine AnnotationError-Liste.

Fehler
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException

  • ResourceNumberLimitExceededException

GetDataQualityModel Aktion (Python: get_data_quality_model)

Rufen Sie den Trainingsstatus des Modells zusammen mit weiteren Informationen (,,) ab. CompletedOn StartedOn FailureReason

Anforderung
  • StatisticId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.

    Die Statistik-ID.

  • ProfileIdErforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.

    Die Profil-ID.

Antwort
  • Status— UTF-8 Zeichenfolge (gültige Werte: RUNNING | SUCCEEDED |FAILED).

    Der Trainingsstatus des Datenqualitätsmodells.

  • StartedOn – Zeitstempel.

    Der Zeitstempel, zu dem das Datenqualitätsmodell-Training gestartet wurde.

  • CompletedOn – Zeitstempel.

    Der Zeitstempel, zu dem das Datenqualitätsmodell-Training abgeschlossen ist.

  • FailureReason— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.

    Der Grund für das Fehlschlagen des Trainings.

Fehler
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

GetDataQualityModelResult Aktion (Python: get_data_quality_model_result)

Ruft die Vorhersagen einer Statistik für eine bestimmte Profil-ID ab.

Anforderung
  • StatisticIdErforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht. Single-line string pattern

    Die Statistik-ID.

  • ProfileIdErforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entsprichtSingle-line string pattern.

    Die Profil-ID.

Antwort
  • CompletedOn – Zeitstempel.

    Der Zeitstempel, zu dem das Datenqualitätsmodell-Training abgeschlossen ist.

  • Model – Ein Array mit StatisticModelResult-Objekten.

    Eine Liste von StatisticModelResult

Fehler
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

ListDataQualityStatisticAnnotations Aktion (Python: list_data_quality_statistic_annotations)

Ruft die Anmerkungen für eine Datenqualitätsstatistik ab.

Anforderung
  • StatisticId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht der. Single-line string pattern

    Die Statistik-ID.

  • ProfileId— UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht derSingle-line string pattern.

    Die Profil-ID.

  • TimestampFilter – Ein TimestampFilter-Objekt.

    Ein Zeitstempelfilter.

  • MaxResults – Zahl (Ganzzahl), nicht kleiner als 1 oder größer als 1000.

    Die maximale Anzahl der Ergebnisse, die bei dieser Anfrage zurückzugeben sind.

  • NextToken— UTF-8 Zeichenfolge.

    Ein Paginierungstoken zum Abruf des nächsten Ergebnissatzes.

Antwort
  • Annotations – Ein Array mit StatisticAnnotation-Objekten.

    Eine Liste von StatisticAnnotation, die auf die Statistik angewendet wurden

  • NextToken— UTF-8 Zeichenfolge.

    Ein Paginierungstoken zum Abruf des nächsten Ergebnissatzes.

Fehler
  • InvalidInputException

  • InternalServiceException

PutDataQualityProfileAnnotation Aktion (Python: put_data_quality_profile_annotation)

Versehen Sie alle Datenpunkte für ein Profil mit Anmerkungen.

Anforderung
  • ProfileIdErforderlich: UTF-8 Zeichenfolge, nicht weniger als 1 oder mehr als 255 Byte lang, entspricht. Single-line string pattern

    Die ID des Profils zur Überwachung der Datenqualität, das mit Anmerkungen versehen werden soll.

  • InclusionAnnotationErforderlich: UTF-8 Zeichenfolge (gültige Werte: INCLUDE |EXCLUDE).

    Der Wert der Einfügungsanmerkung, der auf das Profil angewendet werden soll.

Antwort
  • Keine Antwortparameter.

Fehler
  • EntityNotFoundException

  • InvalidInputException

  • InternalServiceException