to_binary(expr, format)
Описание
Функция to_binary()
преобразует строку в бинарные данные с учетом формата.
Параметры
expr
: Column - строка для преобразованияformat
: String - формат исходных данных ("hex", "base64", "utf-8")
Возвращаемое значение
Binary - бинарные данные
Пример использования
from pyspark.sql.functions import to_binary, lit
from pyspark.sql import SparkSession
# Создаем SparkSession
spark = SparkSession.builder.appName("to_binary_example").getOrCreate()
# Создаем DataFrame со строками
data = [("48656c6c6f",), ("576f726c64",)]
df = spark.createDataFrame(data, ["hex"])
# Преобразуем hex в бинарные данные
result = df.select(
to_binary("hex", lit("hex")).alias("binary")
).show(truncate=False)
# Результат:
# +------------------+
# |binary |
# +------------------+
# |[48 65 6C 6C 6F] |
# |[57 6F 72 6C 64] |
# +------------------+
Примечания
- Поддерживаемые форматы: "hex", "base64", "utf-8"
- Для преобразования в строку используйте
to_string()
- Для преобразования в число используйте
to_number()
- Для работы с бинарными данными используйте
binary()