Skip to content

to_binary(expr, format)

Описание

Функция to_binary() преобразует строку в бинарные данные с учетом формата.

Параметры

  • expr: Column - строка для преобразования
  • format: String - формат исходных данных ("hex", "base64", "utf-8")

Возвращаемое значение

Binary - бинарные данные

Пример использования

from pyspark.sql.functions import to_binary, lit
from pyspark.sql import SparkSession

# Создаем SparkSession
spark = SparkSession.builder.appName("to_binary_example").getOrCreate()

# Создаем DataFrame со строками
data = [("48656c6c6f",), ("576f726c64",)]
df = spark.createDataFrame(data, ["hex"])

# Преобразуем hex в бинарные данные
result = df.select(
    to_binary("hex", lit("hex")).alias("binary")
).show(truncate=False)

# Результат:
# +------------------+
# |binary            |
# +------------------+
# |[48 65 6C 6C 6F] |
# |[57 6F 72 6C 64] |
# +------------------+

Примечания

  • Поддерживаемые форматы: "hex", "base64", "utf-8"
  • Для преобразования в строку используйте to_string()
  • Для преобразования в число используйте to_number()
  • Для работы с бинарными данными используйте binary()