to_timestamp_ntz(col, format=None)
Описание
Функция to_timestamp_ntz()
преобразует строку в timestamp без учета часового пояса (no time zone).
Параметры
col
: Column - столбец со строкой для преобразованияformat
: String - формат даты и времени (опционально)
Возвращаемое значение
Timestamp - преобразованное значение даты и времени без учета часового пояса
Пример использования
from pyspark.sql.functions import to_timestamp_ntz
from pyspark.sql import SparkSession
# Создаем SparkSession
spark = SparkSession.builder.appName("to_timestamp_ntz_example").getOrCreate()
# Создаем DataFrame
data = [
("2023-01-01 12:00:00"),
("2023-02-01 15:30:00"),
("2023-03-01 18:45:00")
]
df = spark.createDataFrame(data, ["date_str"])
# Преобразуем строки в timestamp без учета часового пояса
result = df.select(
"date_str",
to_timestamp_ntz("date_str").alias("timestamp_ntz")
).show()
# Результат:
# +-------------------+-------------------+
# |date_str |timestamp_ntz |
# +-------------------+-------------------+
# |2023-01-01 12:00:00|2023-01-01 12:00:00|
# |2023-02-01 15:30:00|2023-02-01 15:30:00|
# |2023-03-01 18:45:00|2023-03-01 18:45:00|
# +-------------------+-------------------+
Примечания
- Для преобразования с учетом часового пояса используйте
to_timestamp_ltz()
- Для преобразования в timestamp используйте
to_timestamp()
- Для преобразования в дату используйте
to_date()
- Для форматирования даты и времени используйте
date_format()