make_date(year, month, day)
Описание
Функция make_date()
создает дату из отдельных компонентов (год, месяц, день).
Параметры
year
: Column - столбец с годомmonth
: Column - столбец с месяцем (1-12)day
: Column - столбец с днем месяца (1-31)
Возвращаемое значение
Date - созданное значение даты
Пример использования
from pyspark.sql.functions import make_date
from pyspark.sql import SparkSession
# Создаем SparkSession
spark = SparkSession.builder.appName("make_date_example").getOrCreate()
# Создаем DataFrame
data = [
(2023, 1, 1),
(2023, 2, 1),
(2023, 3, 1)
]
df = spark.createDataFrame(data, ["year", "month", "day"])
# Создаем дату из компонентов
result = df.select(
"year", "month", "day",
make_date("year", "month", "day").alias("date")
).show()
# Результат:
# +----+-----+---+----------+
# |year|month|day|date |
# +----+-----+---+----------+
# |2023|1 |1 |2023-01-01|
# |2023|2 |1 |2023-02-01|
# |2023|3 |1 |2023-03-01|
# +----+-----+---+----------+
Примечания
- Для создания timestamp используйте
make_timestamp()
- Для создания timestamp с учетом часового пояса используйте
make_timestamp_ltz()
- Для создания timestamp без учета часового пояса используйте
make_timestamp_ntz()
- Для преобразования строки в дату используйте
to_date()