array_max

array_max(col)

array_max - возвращает максимальное значение массива.

Параметры
col: Column or str. Столбец содержащий массив
Возвращает
Column - максимальное значение массива

array_max example


from pyspark.sql import SparkSession
from pyspark.sql.functions import array_max

# Создание сессии Spark
spark = SparkSession.builder.appName("array_max_example").getOrCreate()

# Пример данных
data = [(1, [1, 2, 3]),  (2, [6, 5, 4],)]
df = spark.createDataFrame(data, ["id", "array"])

# Нахождение максимального элемента массива
df_with_max = df.withColumn("max", array_max("array"))

# Отображение результата
df_with_max.show()

+---+---------+---+
| id|    array|max|
+---+---------+---+
|  1|[1, 2, 3]|  3|
|  2|[6, 5, 4]|  6|
+---+---------+---+

pyspark array_max

Добавлено в версии2.4.0.
Обновлено в версии3.4.0.