rpad(col, len, pad)
Описание
Функция rpad()
дополняет строку справа указанным символом до заданной длины.
Параметры
col
: Column - столбец со строками для дополненияlen
: Integer - желаемая длина строки после дополненияpad
: String - символ для дополнения (по умолчанию пробел)
Возвращаемое значение
String - дополненная строка
Пример использования
from pyspark.sql.functions import rpad
from pyspark.sql import SparkSession
# Создаем SparkSession
spark = SparkSession.builder.appName("rpad_example").getOrCreate()
# Создаем DataFrame
data = [
("Hello"),
("Spark"),
("PySpark")
]
df = spark.createDataFrame(data, ["text"])
# Дополняем строки справа до длины 10
result = df.select(
"text",
rpad("text", 10).alias("rpad_space"),
rpad("text", 10, "*").alias("rpad_star")
).show()
# Результат:
# +-------+-----------+----------+
# |text |rpad_space |rpad_star |
# +-------+-----------+----------+
# |Hello |Hello |Hello*****|
# |Spark |Spark |Spark*****|
# |PySpark|PySpark |PySpark***|
# +-------+-----------+----------+
Примечания
- Если длина строки больше или равна
len
, строка возвращается без изменений - Если
len
отрицательный, возвращается NULL - NULL значения возвращают NULL
- Для дополнения слева используйте
lpad()