char_length(col)
Описание
Функция char_length()
возвращает длину строки в символах.
Параметры
col
: Column - столбец со строками, длину которых нужно вычислить
Возвращаемое значение
Integer - количество символов в строке
Пример использования
from pyspark.sql.functions import char_length
from pyspark.sql import SparkSession
# Создаем SparkSession
spark = SparkSession.builder.appName("char_length_example").getOrCreate()
# Создаем DataFrame
data = [
("Hello"),
("Spark"),
("PySpark")
]
df = spark.createDataFrame(data, ["text"])
# Вычисляем длину строк
result = df.select(
"text",
char_length("text").alias("length")
).show()
# Результат:
# +-------+------+
# |text |length|
# +-------+------+
# |Hello |5 |
# |Spark |5 |
# |PySpark|7 |
# +-------+------+
Примечания
- Для вычисления длины в байтах используйте
length()
- Функция учитывает все символы, включая пробелы
- NULL значения возвращают NULL