Skip to content

date_format

Теги: datetime functions pyspark

Описание

Функция date_format() форматирует дату или временную метку в строку согласно указанному формату.

Параметры

  • col: Column - столбец с датой или временной меткой
  • format: String - строка формата

Возвращаемое значение

Column - отформатированная строка

Пример

from pyspark.sql import SparkSession
from pyspark.sql.functions import date_format, current_timestamp

# Создаем Spark сессию
spark = SparkSession.builder.appName("date_format_example").getOrCreate()

# Создаем DataFrame с текущей временной меткой
df = spark.range(1).withColumn("timestamp", current_timestamp())

# Форматируем дату разными способами
df = df.withColumn("date1", date_format("timestamp", "yyyy-MM-dd"))
df = df.withColumn("date2", date_format("timestamp", "dd/MM/yyyy"))
df = df.withColumn("time", date_format("timestamp", "HH:mm:ss"))
df.show(truncate=False)

# Вывод:
# +---+-----------------------+----------+----------+--------+
# |id |timestamp             |date1     |date2     |time    |
# +---+-----------------------+----------+----------+--------+
# |0  |2024-03-14 15:30:45.123|2024-03-14|14/03/2024|15:30:45|
# +---+-----------------------+----------+----------+--------+

Примечания

  • Поддерживает стандартные паттерны форматирования даты и времени
  • Основные паттерны:
  • yyyy - год
  • MM - месяц
  • dd - день
  • HH - час (24-часовой формат)
  • mm - минуты
  • ss - секунды
  • Возвращает NULL, если входное значение NULL
  • Полезно для преобразования дат в читаемый формат