to_string
Теги: string functions pyspark
Описание
Функция to_string()
преобразует входное значение в строку.
Параметры
col
: Column - входной столбец любого типа
Возвращаемое значение
Column - строковое представление входного значения
Пример
from pyspark.sql import SparkSession
from pyspark.sql.functions import to_string
# Создаем Spark сессию
spark = SparkSession.builder.appName("to_string_example").getOrCreate()
# Создаем DataFrame с разными типами данных
data = [(1,), (3.14,), (True,), (None,)]
df = spark.createDataFrame(data, ["value"])
# Преобразуем в строки
df = df.withColumn("string_value", to_string("value"))
df.show()
# Вывод:
# +-----+------------+
# |value|string_value|
# +-----+------------+
# | 1| 1|
# | 3.14| 3.14|
# | true| true|
# | null| null|
# +-----+------------+
Примечания
- Преобразует значения любого типа в строку
- Для NULL возвращает строку "null"
- Для чисел сохраняет точность
- Для boolean возвращает "true" или "false"
- Полезно для конкатенации с другими строками
- Для форматирования чисел используйте format_number