Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
MonthName classe
La transformation MonthName crée une colonne contenant le nom du mois, à partir d’une chaîne représentant une date.
Exemple
from pyspark.context import SparkContext from pyspark.sql import SparkSession from awsgluedi.transforms import * sc = SparkContext() spark = SparkSession(sc) spark.conf.set("spark.sql.legacy.timeParserPolicy", "LEGACY") input_df = spark.createDataFrame( [ ("20-2018-12",), ("2018-20-12",), ("20182012",), ("12202018",), ("20122018",), ("20-12-2018",), ("12/20/2018",), ("02/02/02",), ("02 02 2009",), ("02/02/2009",), ("August/02/2009",), ("02/june/2009",), ("02/2020/june",), ("2013-02-21 06:35:45.658505",), ("August 02 2009",), ("2013/02/21",), (None,), ], ["column_1"], ) try: df_output = datetime_functions.MonthName.apply( data_frame=input_df, spark_context=sc, source_column="column_1", target_column="target_column" ) df_output.show() except: print("Unexpected Error happened ") raise
Output
Le résultat sera :
``` +------------+------------+ | column_1|target_column| +------------+------------+ |20-2018-12 | December | |2018-20-12 | null | | 20182012| null | | 12202018| null | | 20122018| null | |20-12-2018 | December | |12/20/2018 | December | | 02/02/02 | February | |02 02 2009 | February | |02/02/2009 | February | |August/02/2009| August | |02/june/2009| null | |02/2020/june| null | |2013-02-21 06:35:45.658505| February | |August 02 2009| August | | 2013/02/21| February | | null | null | +------------+------------+ ```
La transformation MonthName prend la valeur `source_column` `"column_1"` et la valeur `target_column` `"target_column"`. Il tente d'extraire le nom du mois à partir des date/time chaînes de la colonne `"column_1"` et le place dans la colonne `"target_column"`. Si le format de la date/time chaîne n'est pas reconnu ou ne peut pas être analysée, la valeur « target_column » est définie sur « null`.
La transformation extrait avec succès le nom du mois à partir de différents date/time formats, tels que « 20-12-2018 », « 20/12/2018 », « 02/02/2009 », « 2013-02-21 06:35:45.658 505 » et « 02 août 2009 ».
Méthodes
__call__(spark_context, data_frame, target_column, source_column=None, value=None)
La transformation MonthName crée une colonne contenant le nom du mois, à partir d’une chaîne représentant une date.
-
source_column: nom d’une colonne existante. -
value: chaîne de caractères à évaluer. -
target_column: nom de la colonne qui vient d’être créée.
apply(cls, *args, **kwargs)
Hérité de GlueTransform s'appliquent.
name(cls)
Hérité de GlueTransform name.
describeArgs(cls)
Hérité de GlueTransform describeArgs.
describeReturn(cls)
Hérité de GlueTransform describeReturn.
describeTransform(cls)
Hérité de GlueTransform describeTransform.
describeErrors(cls)
Hérité de GlueTransform describeErrors.
describe(cls)
Hérité de GlueTransform describe.