binary
Описание
Функция binary()
преобразует входное значение в бинарный тип данных.
Параметры
col
: Column - входной столбец (строка или число)
Возвращаемое значение
Column - бинарное представление входного значения
Пример
from pyspark.sql import SparkSession
from pyspark.sql.functions import binary, hex
# Создаем Spark сессию
spark = SparkSession.builder.appName("binary_example").getOrCreate()
# Создаем DataFrame с тестовыми данными
data = [("Hello",), ("World",)]
df = spark.createDataFrame(data, ["text"])
# Преобразуем в бинарный формат
df = df.withColumn("binary", binary("text"))
# Для отображения используем hex
df = df.withColumn("hex_view", hex("binary"))
df.show()
# Вывод:
# +-----+--------------------+----------+
# | text| binary| hex_view|
# +-----+--------------------+----------+
# |Hello|[48 65 6C 6C 6F] |48656C6C6F|
# |World|[57 6F 72 6C 64] |576F726C64|
# +-----+--------------------+----------+
Примечания
- Преобразует строки в их бинарное представление
- Для чисел преобразует их строковое представление
- Возвращает NULL, если входное значение NULL
- Полезно для работы с бинарными данными
- Для обратного преобразования используйте to_string
- Для шестнадцатеричного представления используйте hex