Skip to content

url_decode(str)

Описание

Функция url_decode() декодирует URL-строку, преобразуя процентное представление символов обратно в их оригинальную форму.

Параметры

  • str: Column - URL-строка для декодирования

Возвращаемое значение

Column - декодированная строка

Пример использования

from pyspark.sql.functions import url_decode, col
from pyspark.sql import SparkSession

# Создаем SparkSession
spark = SparkSession.builder.appName("url_decode_example").getOrCreate()

# Создаем DataFrame с закодированными URL-строками
data = [
    ("Hello%20World%21"),
    ("%D0%9F%D1%80%D0%B8%D0%B2%D0%B5%D1%82%2C%20%D0%BC%D0%B8%D1%80%21"),
    ("https%3A%2F%2Fexample.com%2Fpath%3Fparam%3Dvalue")
]
df = spark.createDataFrame(data, ["encoded"])

# Декодируем URL-строки
result = df.withColumn(
    "decoded",
    url_decode("encoded")
)
result.show(truncate=False)

# Результат:
# +--------------------------------------------------+----------------------------------+
# |encoded                                           |decoded                           |
# +--------------------------------------------------+----------------------------------+
# |Hello%20World%21                                  |Hello World!                      |
# |%D0%9F%D1%80%D0%B8%D0%B2%D0%B5%D1%82%2C%20%D0%BC%D0%B8%D1%80%21|Привет, мир!                      |
# |https%3A%2F%2Fexample.com%2Fpath%3Fparam%3Dvalue |https://example.com/path?param=value|
# +--------------------------------------------------+----------------------------------+

Примечания

  • Возвращает NULL, если входная строка NULL
  • Декодирует все процентные последовательности, включая пробелы, кириллицу и специальные символы URL
  • Полезно для:
  • Обработки URL-параметров
  • Чтения закодированных данных
  • Восстановления оригинальных строк
  • Связанные функции:
  • url_encode() - кодирование строки в URL-формат
  • decode() - декодирование строки из указанной кодировки