unbase64(col)
Описание
Функция unbase64()
декодирует строку из формата Base64 в бинарные данные.
Параметры
col
: Column - столбец со строками в формате Base64
Возвращаемое значение
Binary - декодированные бинарные данные
Пример использования
from pyspark.sql.functions import unbase64, base64
from pyspark.sql import SparkSession
# Создаем SparkSession
spark = SparkSession.builder.appName("unbase64_example").getOrCreate()
# Создаем DataFrame
data = [
("SGVsbG8="), # "Hello" в Base64
("U3Bhcms="), # "Spark" в Base64
("UHlTcGFyaw==") # "PySpark" в Base64
]
df = spark.createDataFrame(data, ["base64_text"])
# Декодируем строки из Base64
result = df.select(
"base64_text",
unbase64("base64_text").alias("decoded")
).show()
# Результат:
# +------------+-------+
# |base64_text |decoded|
# +------------+-------+
# |SGVsbG8= |Hello |
# |U3Bhcms= |Spark |
# |UHlTcGFyaw==|PySpark|
# +------------+-------+