Skip to content

url_encode(str)

Описание

Функция url_encode() кодирует строку в формат URL, заменяя специальные символы на их процентное представление.

Параметры

  • str: Column - строка для кодирования

Возвращаемое значение

Column - закодированная URL-строка

Пример использования

from pyspark.sql.functions import url_encode, col
from pyspark.sql import SparkSession

# Создаем SparkSession
spark = SparkSession.builder.appName("url_encode_example").getOrCreate()

# Создаем DataFrame со строками для кодирования
data = [
    ("Hello World!"),
    ("Привет, мир!"),
    ("https://example.com/path?param=value")
]
df = spark.createDataFrame(data, ["text"])

# Кодируем строки в URL-формат
result = df.withColumn(
    "encoded",
    url_encode("text")
)
result.show(truncate=False)

# Результат:
# +----------------------------------+----------------------------------+
# |text                              |encoded                           |
# +----------------------------------+----------------------------------+
# |Hello World!                      |Hello%20World%21                  |
# |Привет, мир!                      |%D0%9F%D1%80%D0%B8%D0%B2%D0%B5...|
# |https://example.com/path?param=value|https%3A%2F%2Fexample.com%2Fpath%3Fparam%3Dvalue|
# +----------------------------------+----------------------------------+

Примечания

  • Возвращает NULL, если входная строка NULL
  • Кодирует все специальные символы, включая пробелы, кириллицу и специальные символы URL
  • Полезно для:
  • Подготовки URL-адресов
  • Кодирования параметров запроса
  • Обработки пользовательского ввода
  • Связанные функции:
  • url_decode() - декодирование URL-строки
  • encode() - кодирование строки в указанной кодировке