Title here
Summary here
array_min(col)
array_min
- возвращает минимальное значение массива.
col
: Column or str. Столбец содержащий массивColumn
Минимальное значение массива.from pyspark.sql import SparkSession
from pyspark.sql.functions import array_min
# Создание сессии Spark
spark = SparkSession.builder.appName("array_min_example").getOrCreate()
# Пример данных
data = [(1, [1, 2, 3]), (2, [6, 5, 4],)]
df = spark.createDataFrame(data, ["id", "array"])
# Нахождение минимального элемента массива
df_with_min = df.withColumn("max", array_min("array"))
# Отображение результата
df_with_min.show()
+---+---------+---+
| id| array|max|
+---+---------+---+
| 1|[1, 2, 3]| 1|
| 2|[6, 5, 4]| 4|
+---+---------+---+
pyspark array_min
Добавлено в версии | 2.4.0. |
Обновлено в версии | 3.4.0. |