year

year(col)

year - извлекает год из заданной даты или колонки с типом timestamp.

Параметры
col: Column or str. колонка или значение содержащая дату или timestamp
Возвращает
Column возвращает год как целое число.

year example

from pyspark.sql import SparkSession
from pyspark.sql.functions import  to_date, year

# Создание сессии Spark
spark = SparkSession.builder.appName("years_example").getOrCreate()

# Пример данных
data = [("2022-01-01",)]
df = spark.createDataFrame(data, ["date_str"])

#  Извлечения года  из даты
df_with_subtracted_years = df.withColumn("year", year(col("date_str")))

# Отображение результата
df_with_subtracted_years.show(truncate=False)

pyspark year

Добавлено в версии1.5.0.
Обновлено в версии3.4.0.