every(col)
Описание
Функция every() возвращает TRUE, если все значения в столбце равны TRUE. Это агрегатная функция, которая должна использоваться с groupBy(). Функция является синонимом для bool_and().
Параметры
col: Column - столбец с булевыми значениями
Возвращаемое значение
Boolean - TRUE, если все значения TRUE, иначе FALSE
Пример использования
from pyspark.sql.functions import every
from pyspark.sql import SparkSession
# Создаем SparkSession
spark = SparkSession.builder.appName("every_example").getOrCreate()
# Создаем DataFrame
data = [
("A", True),
("A", True),
("A", True),
("B", True),
("B", False),
("B", True),
("B", None)
]
df = spark.createDataFrame(data, ["group", "value"])
# Проверяем, все ли значения TRUE
result = df.groupBy("group").agg(
every("value").alias("all_true")
).show()
# Результат:
# +-----+--------+
# |group|all_true|
# +-----+--------+
# |A |true |
# |B |false |
# +-----+--------+
Примечания
- NULL значения игнорируются при вычислении
- Функция является синонимом для
bool_and() - Для проверки наличия хотя бы одного TRUE значения используйте
some()илиbool_or() - Для подсчета TRUE значений используйте
count_if()