Title here
Summary here
sum(col)
sum
- возвращает сумму всех значений в выражении
col
: Column or str. целевая колонка или выражениеColumn
столбец вычисленных результатов.from pyspark.sql import SparkSession
from pyspark.sql.functions import sum
spark = SparkSession.builder.getOrCreate()
data = [(1, 10),
(2, 15),
(3, 20),
(4, 5),
(5, 12)]
df = spark.createDataFrame(data, ["id", "value"])
total_sum = df.select(sum("value").alias("total_sum"))
total_sum.show()
+---------+
|total_sum|
+---------+
| 62|
+---------+
pyspark sum
Добавлено в версии | 1.3.0. |
Обновлено в версии | 3.4.0. |