Skip to content

initcap(col)

Описание

Функция initcap() преобразует первую букву каждого слова в строке в верхний регистр, а остальные буквы - в нижний регистр. Слова разделяются пробелами.

Параметры

  • col: string или Column - строка для преобразования

Возвращаемое значение

String - строка с первой заглавной буквой в каждом слове

Пример использования

from pyspark.sql.functions import initcap

# Создаем DataFrame
df = spark.createDataFrame([
    ("hello world",),
    ("HELLO WORLD",),
    ("hElLo wOrLd",),
    ("this is a test",),
    ("",),
    (None,)
], ["text"])

# Применяем initcap
df.select(
    "text",
    initcap("text").alias("initcapped")
).show(truncate=False)

# Результат:
# +--------------+--------------+
# |text          |initcapped    |
# +--------------+--------------+
# |hello world   |Hello World   |  # Все слова с заглавной буквы
# |HELLO WORLD   |Hello World   |  # Регистр нормализован
# |hElLo wOrLd   |Hello World   |  # Регистр нормализован
# |this is a test|This Is A Test|  # Каждое слово с заглавной
# |              |              |  # Пустая строка
# |null          |null          |  # NULL значение
# +--------------+--------------+

Примечания

  • Слова разделяются пробелами
  • Первая буква каждого слова преобразуется в верхний регистр
  • Остальные буквы преобразуются в нижний регистр
  • Для пустой строки возвращается пустая строка
  • Для NULL значений возвращается NULL
  • Функция полезна для нормализации имен и заголовков
  • Для преобразования всей строки в верхний регистр используйте upper()
  • Для преобразования всей строки в нижний регистр используйте lower()