lower(col)
Описание
Функция lower()
преобразует все символы строки в нижний регистр. Это синоним функции lcase()
.
Параметры
col
: string или Column - строка для преобразования
Возвращаемое значение
String - строка в нижнем регистре
Пример использования
from pyspark.sql.functions import lower
# Создаем DataFrame
df = spark.createDataFrame([
("Hello World",),
("HELLO WORLD",),
("hElLo wOrLd",),
("Привет Мир",),
("",),
(None,)
], ["text"])
# Применяем lower
df.select(
"text",
lower("text").alias("lowercase")
).show(truncate=False)
# Результат:
# +-----------+-----------+
# |text |lowercase |
# +-----------+-----------+
# |Hello World|hello world| # Все символы в нижнем регистре
# |HELLO WORLD|hello world| # Все символы в нижнем регистре
# |hElLo wOrLd|hello world| # Все символы в нижнем регистре
# |Привет Мир |привет мир | # Кириллица также преобразуется
# | | | # Пустая строка
# |null |null | # NULL значение
# +-----------+-----------+
Примечания
- Преобразует все символы в нижний регистр
- Поддерживает Unicode символы
- Для пустой строки возвращается пустая строка
- Для NULL значений возвращается NULL
- Это синоним функции
lcase()
- Для преобразования в верхний регистр используйте
upper()
- Для преобразования первой буквы каждого слова в верхний регистр используйте
initcap()