Skip to content

unbase64(col)

Описание

Функция unbase64() декодирует строку из формата Base64 в бинарные данные.

Параметры

  • col: Column - столбец со строками в формате Base64

Возвращаемое значение

Binary - декодированные бинарные данные

Пример использования

from pyspark.sql.functions import unbase64, base64
from pyspark.sql import SparkSession

# Создаем SparkSession
spark = SparkSession.builder.appName("unbase64_example").getOrCreate()

# Создаем DataFrame
data = [
    ("SGVsbG8="),  # "Hello" в Base64
    ("U3Bhcms="),  # "Spark" в Base64
    ("UHlTcGFyaw==")  # "PySpark" в Base64
]
df = spark.createDataFrame(data, ["base64_text"])

# Декодируем строки из Base64
result = df.select(
    "base64_text",
    unbase64("base64_text").alias("decoded")
).show()

# Результат:
# +------------+-------+
# |base64_text |decoded|
# +------------+-------+
# |SGVsbG8=    |Hello  |
# |U3Bhcms=    |Spark  |
# |UHlTcGFyaw==|PySpark|
# +------------+-------+

Примечания

  • NULL значения возвращают NULL
  • Для кодирования в Base64 используйте base64()
  • Некорректные строки Base64 могут вызвать ошибку
  • Функция возвращает бинарные данные, которые могут быть преобразованы в строку с помощью cast()