array_min

array_min(col)

array_min - возвращает минимальное значение массива.

Параметры
col: Column or str. Столбец содержащий массив
Возвращает
Column Минимальное значение массива.

array_min example

from pyspark.sql import SparkSession
from pyspark.sql.functions import array_min

# Создание сессии Spark
spark = SparkSession.builder.appName("array_min_example").getOrCreate()

# Пример данных
data = [(1, [1, 2, 3]),  (2, [6, 5, 4],)]
df = spark.createDataFrame(data, ["id", "array"])

# Нахождение минимального элемента массива
df_with_min = df.withColumn("max", array_min("array"))

# Отображение результата
df_with_min.show()

+---+---------+---+
| id|    array|max|
+---+---------+---+
|  1|[1, 2, 3]|  1|
|  2|[6, 5, 4]|  4|
+---+---------+---+

pyspark array_min

Добавлено в версии2.4.0.
Обновлено в версии3.4.0.