array_repeat

array_repeat(col,count)

array_repeat - создает массив, содержащий столбец, повторяющийся несколько раз.

Параметры
col: Column or str. элемент для повторения :count: Column or str or int, число повторов
Возвращает
Column новый массив содержащий первый массив поавторенный несколько раз.

array_repeat example

from pyspark.sql import SparkSession
from pyspark.sql.functions import  array_repeat

# Создание сессии Spark
spark = SparkSession.builder.appName("array_repeat_example").getOrCreate()

# Пример данных
data = [([1, 1],), ([1, 5],), ([1,  None],), ([],), (None,)]
df = spark.createDataFrame(data, ["values"])

# повторяемы массив
df_with_array_repeat = df.withColumn("array_repeat", array_repeat("values", 2))

# Отображение результата
df_with_array_repeat.show(truncate=False)
+---------+----------------------+
|values   |array_repeat          |
+---------+----------------------+
|[1, 1]   |[[1, 1], [1, 1]]      |
|[1, 5]   |[[1, 5], [1, 5]]      |
|[1, NULL]|[[1, NULL], [1, NULL]]|
|[]       |[[], []]              |
|NULL     |[NULL, NULL]          |
+---------+----------------------+

pyspark array_repeat

Добавлено в версии2.4.0.
Обновлено в версии3.4.0.