url_encode(str)
Описание
Функция url_encode()
кодирует строку в формат URL, заменяя специальные символы на их процентное представление.
Параметры
str
: Column - строка для кодирования
Возвращаемое значение
Column - закодированная URL-строка
Пример использования
from pyspark.sql.functions import url_encode, col
from pyspark.sql import SparkSession
# Создаем SparkSession
spark = SparkSession.builder.appName("url_encode_example").getOrCreate()
# Создаем DataFrame со строками для кодирования
data = [
("Hello World!"),
("Привет, мир!"),
("https://example.com/path?param=value")
]
df = spark.createDataFrame(data, ["text"])
# Кодируем строки в URL-формат
result = df.withColumn(
"encoded",
url_encode("text")
)
result.show(truncate=False)
# Результат:
# +----------------------------------+----------------------------------+
# |text |encoded |
# +----------------------------------+----------------------------------+
# |Hello World! |Hello%20World%21 |
# |Привет, мир! |%D0%9F%D1%80%D0%B8%D0%B2%D0%B5...|
# |https://example.com/path?param=value|https%3A%2F%2Fexample.com%2Fpath%3Fparam%3Dvalue|
# +----------------------------------+----------------------------------+
Примечания
- Возвращает NULL, если входная строка NULL
- Кодирует все специальные символы, включая пробелы, кириллицу и специальные символы URL
- Полезно для:
- Подготовки URL-адресов
- Кодирования параметров запроса
- Обработки пользовательского ввода
- Связанные функции:
url_decode()
- декодирование URL-строкиencode()
- кодирование строки в указанной кодировке