Title here
Summary here
array_repeat(col,count)
array_repeat
- создает массив, содержащий столбец, повторяющийся несколько раз.
col
: Column or str. элемент для повторения
:count
: Column or str or int, число повторовColumn
новый массив содержащий первый массив поавторенный несколько раз.from pyspark.sql import SparkSession
from pyspark.sql.functions import array_repeat
# Создание сессии Spark
spark = SparkSession.builder.appName("array_repeat_example").getOrCreate()
# Пример данных
data = [([1, 1],), ([1, 5],), ([1, None],), ([],), (None,)]
df = spark.createDataFrame(data, ["values"])
# повторяемы массив
df_with_array_repeat = df.withColumn("array_repeat", array_repeat("values", 2))
# Отображение результата
df_with_array_repeat.show(truncate=False)
+---------+----------------------+
|values |array_repeat |
+---------+----------------------+
|[1, 1] |[[1, 1], [1, 1]] |
|[1, 5] |[[1, 5], [1, 5]] |
|[1, NULL]|[[1, NULL], [1, NULL]]|
|[] |[[], []] |
|NULL |[NULL, NULL] |
+---------+----------------------+
pyspark array_repeat
Добавлено в версии | 2.4.0. |
Обновлено в версии | 3.4.0. |