Title here
Summary here
array_size(col)
array_size
- Возвращает количество элементов в массиве.col
: Column or str. Массив, для которого нужно определить размер.Column
Количество элементов в массиве.from pyspark.sql import SparkSession
from pyspark.sql.functions import array, array_size
# Создание сессии Spark
spark = SparkSession.builder.appName("array_size_example").getOrCreate()
# Пример данных
data = [([1, 2, 3],), ([4, 5, 6, 7],), ([4, None, None, None],), ([],), ([None]),]
df = spark.createDataFrame(data, ["values"])
# Получение размера массивов
df_with_array_size = df.withColumn("array_length", array_size("values"))
# Отображение результата
df_with_array_size.show(truncate=False)
from pyspark.sql import SparkSession
from pyspark.sql.functions import array, array_size
# Создание сессии Spark
spark = SparkSession.builder.appName("array_size_example").getOrCreate()
# Пример данных
data = [([1, 2, 3],), ([4, 5, 6, 7],), ([4, None, None, None],), ([],), ([None]),]
df = spark.createDataFrame(data, ["values"])
# Получение размера массивов
df_with_array_size = df.withColumn("array_length", array_size("values"))
# Отображение результата
df_with_array_size.show(truncate=False)
output
+---------------------+------------+
|values |array_length|
+---------------------+------------+
|[1, 2, 3] |3 |
|[4, 5, 6, 7] |4 |
|[4, NULL, NULL, NULL]|4 |
|[] |0 |
|NULL |NULL |
+---------------------+------------+
pyspark array_size
Добавлено в версии | 3.5.0. |