Title here
Summary here
array_prepend(col,value)
array_prepend
- добавляет новый элемент в начало массива
col
: Column or str. столбец содержащий массивvalue
: новый элементColumn
новый массив
from pyspark.sql import SparkSession
from pyspark.sql.functions import array, array_prepend
# Создание сессии Spark
spark = SparkSession.builder.appName("array_prepend_example").getOrCreate()
# Пример данных
data = [([1, 2, 3],), ([4, 5, 6, 7,1],), ([4, None, None, None],), ([],), ([None]),]
df = spark.createDataFrame(data, ["values"])
# добавление нового элемента в начало массива
df_with_array_size = df.withColumn("array_prepend", array_prepend("values", 1))
# Отображение результата
df_with_array_size.show(truncate=False)
+---------------------+------------------------+
|values |array_prepend |
+---------------------+------------------------+
|[1, 2, 3] |[1, 1, 2, 3] |
|[4, 5, 6, 7, 1] |[1, 4, 5, 6, 7, 1] |
|[4, NULL, NULL, NULL]|[1, 4, NULL, NULL, NULL]|
|[] |[1] |
|NULL |NULL |
+---------------------+------------------------+
pyspark array_prepend
Добавлено в версии | 3.5.0. |