Skip to content

binary

Описание

Функция binary() преобразует входное значение в бинарный тип данных.

Параметры

  • col: Column - входной столбец (строка или число)

Возвращаемое значение

Column - бинарное представление входного значения

Пример

from pyspark.sql import SparkSession
from pyspark.sql.functions import binary, hex

# Создаем Spark сессию
spark = SparkSession.builder.appName("binary_example").getOrCreate()

# Создаем DataFrame с тестовыми данными
data = [("Hello",), ("World",)]
df = spark.createDataFrame(data, ["text"])

# Преобразуем в бинарный формат
df = df.withColumn("binary", binary("text"))
# Для отображения используем hex
df = df.withColumn("hex_view", hex("binary"))
df.show()

# Вывод:
# +-----+--------------------+----------+
# | text|              binary|  hex_view|
# +-----+--------------------+----------+
# |Hello|[48 65 6C 6C 6F]   |48656C6C6F|
# |World|[57 6F 72 6C 64]   |576F726C64|
# +-----+--------------------+----------+

Примечания

  • Преобразует строки в их бинарное представление
  • Для чисел преобразует их строковое представление
  • Возвращает NULL, если входное значение NULL
  • Полезно для работы с бинарными данными
  • Для обратного преобразования используйте to_string
  • Для шестнадцатеричного представления используйте hex