date_format
Теги: datetime functions pyspark
Описание
Функция date_format()
форматирует дату или временную метку в строку согласно указанному формату.
Параметры
col
: Column - столбец с датой или временной меткойformat
: String - строка формата
Возвращаемое значение
Column - отформатированная строка
Пример
from pyspark.sql import SparkSession
from pyspark.sql.functions import date_format, current_timestamp
# Создаем Spark сессию
spark = SparkSession.builder.appName("date_format_example").getOrCreate()
# Создаем DataFrame с текущей временной меткой
df = spark.range(1).withColumn("timestamp", current_timestamp())
# Форматируем дату разными способами
df = df.withColumn("date1", date_format("timestamp", "yyyy-MM-dd"))
df = df.withColumn("date2", date_format("timestamp", "dd/MM/yyyy"))
df = df.withColumn("time", date_format("timestamp", "HH:mm:ss"))
df.show(truncate=False)
# Вывод:
# +---+-----------------------+----------+----------+--------+
# |id |timestamp |date1 |date2 |time |
# +---+-----------------------+----------+----------+--------+
# |0 |2024-03-14 15:30:45.123|2024-03-14|14/03/2024|15:30:45|
# +---+-----------------------+----------+----------+--------+
Примечания
- Поддерживает стандартные паттерны форматирования даты и времени
- Основные паттерны:
- yyyy - год
- MM - месяц
- dd - день
- HH - час (24-часовой формат)
- mm - минуты
- ss - секунды
- Возвращает NULL, если входное значение NULL
- Полезно для преобразования дат в читаемый формат