sum

sum(col)

sum - возвращает сумму всех значений в выражении

Параметры
col: Column or str. целевая колонка или выражение
Возвращает
Column столбец вычисленных результатов.

sum example

from pyspark.sql import SparkSession
from pyspark.sql.functions import sum

spark = SparkSession.builder.getOrCreate()

data = [(1, 10),
        (2, 15),
        (3, 20),
        (4, 5),
        (5, 12)]

df = spark.createDataFrame(data, ["id", "value"])

total_sum = df.select(sum("value").alias("total_sum"))

total_sum.show()

+---------+
|total_sum|
+---------+
|       62|
+---------+

pyspark sum

Добавлено в версии1.3.0.
Обновлено в версии3.4.0.