array_prepend

array_prepend(col,value)

array_prepend - добавляет новый элемент в начало массива

Параметры
col: Column or str. столбец содержащий массив
value: новый элемент
Возвращает
Column новый массив

Пример


from pyspark.sql import SparkSession
from pyspark.sql.functions import array, array_prepend

# Создание сессии Spark
spark = SparkSession.builder.appName("array_prepend_example").getOrCreate()

# Пример данных
data = [([1, 2, 3],), ([4, 5, 6, 7,1],), ([4, None, None, None],), ([],), ([None]),]
df = spark.createDataFrame(data, ["values"])
# добавление нового элемента в начало массива
df_with_array_size = df.withColumn("array_prepend", array_prepend("values", 1))

# Отображение результата
df_with_array_size.show(truncate=False)

+---------------------+------------------------+
|values               |array_prepend           |
+---------------------+------------------------+
|[1, 2, 3]            |[1, 1, 2, 3]            |
|[4, 5, 6, 7, 1]      |[1, 4, 5, 6, 7, 1]      |
|[4, NULL, NULL, NULL]|[1, 4, NULL, NULL, NULL]|
|[]                   |[1]                     |
|NULL                 |NULL                    |
+---------------------+------------------------+

pyspark array_prepend

Добавлено в версии3.5.0.