initcap(col)
Описание
Функция initcap()
преобразует первую букву каждого слова в строке в верхний регистр, а остальные буквы - в нижний регистр. Слова разделяются пробелами.
Параметры
col
: string или Column - строка для преобразования
Возвращаемое значение
String - строка с первой заглавной буквой в каждом слове
Пример использования
from pyspark.sql.functions import initcap
# Создаем DataFrame
df = spark.createDataFrame([
("hello world",),
("HELLO WORLD",),
("hElLo wOrLd",),
("this is a test",),
("",),
(None,)
], ["text"])
# Применяем initcap
df.select(
"text",
initcap("text").alias("initcapped")
).show(truncate=False)
# Результат:
# +--------------+--------------+
# |text |initcapped |
# +--------------+--------------+
# |hello world |Hello World | # Все слова с заглавной буквы
# |HELLO WORLD |Hello World | # Регистр нормализован
# |hElLo wOrLd |Hello World | # Регистр нормализован
# |this is a test|This Is A Test| # Каждое слово с заглавной
# | | | # Пустая строка
# |null |null | # NULL значение
# +--------------+--------------+
Примечания
- Слова разделяются пробелами
- Первая буква каждого слова преобразуется в верхний регистр
- Остальные буквы преобразуются в нижний регистр
- Для пустой строки возвращается пустая строка
- Для NULL значений возвращается NULL
- Функция полезна для нормализации имен и заголовков
- Для преобразования всей строки в верхний регистр используйте
upper()
- Для преобразования всей строки в нижний регистр используйте
lower()