Title here
Summary here
array_max(col)
array_max
- возвращает максимальное значение массива.
col
: Column or str. Столбец содержащий массивColumn
- максимальное значение массива
from pyspark.sql import SparkSession
from pyspark.sql.functions import array_max
# Создание сессии Spark
spark = SparkSession.builder.appName("array_max_example").getOrCreate()
# Пример данных
data = [(1, [1, 2, 3]), (2, [6, 5, 4],)]
df = spark.createDataFrame(data, ["id", "array"])
# Нахождение максимального элемента массива
df_with_max = df.withColumn("max", array_max("array"))
# Отображение результата
df_with_max.show()
+---+---------+---+
| id| array|max|
+---+---------+---+
| 1|[1, 2, 3]| 3|
| 2|[6, 5, 4]| 6|
+---+---------+---+
pyspark array_max
Добавлено в версии | 2.4.0. |
Обновлено в версии | 3.4.0. |