url_decode(str)
Описание
Функция url_decode()
декодирует URL-строку, преобразуя процентное представление символов обратно в их оригинальную форму.
Параметры
str
: Column - URL-строка для декодирования
Возвращаемое значение
Column - декодированная строка
Пример использования
from pyspark.sql.functions import url_decode, col
from pyspark.sql import SparkSession
# Создаем SparkSession
spark = SparkSession.builder.appName("url_decode_example").getOrCreate()
# Создаем DataFrame с закодированными URL-строками
data = [
("Hello%20World%21"),
("%D0%9F%D1%80%D0%B8%D0%B2%D0%B5%D1%82%2C%20%D0%BC%D0%B8%D1%80%21"),
("https%3A%2F%2Fexample.com%2Fpath%3Fparam%3Dvalue")
]
df = spark.createDataFrame(data, ["encoded"])
# Декодируем URL-строки
result = df.withColumn(
"decoded",
url_decode("encoded")
)
result.show(truncate=False)
# Результат:
# +--------------------------------------------------+----------------------------------+
# |encoded |decoded |
# +--------------------------------------------------+----------------------------------+
# |Hello%20World%21 |Hello World! |
# |%D0%9F%D1%80%D0%B8%D0%B2%D0%B5%D1%82%2C%20%D0%BC%D0%B8%D1%80%21|Привет, мир! |
# |https%3A%2F%2Fexample.com%2Fpath%3Fparam%3Dvalue |https://example.com/path?param=value|
# +--------------------------------------------------+----------------------------------+
Примечания
- Возвращает NULL, если входная строка NULL
- Декодирует все процентные последовательности, включая пробелы, кириллицу и специальные символы URL
- Полезно для:
- Обработки URL-параметров
- Чтения закодированных данных
- Восстановления оригинальных строк
- Связанные функции:
url_encode()
- кодирование строки в URL-форматdecode()
- декодирование строки из указанной кодировки