bool_and(col)
Описание
Функция bool_and()
возвращает TRUE, если все значения в столбце равны TRUE. Это агрегатная функция, которая должна использоваться с groupBy()
. Функция является синонимом для every()
.
Параметры
col
: Column - столбец с булевыми значениями
Возвращаемое значение
Boolean - TRUE, если все значения TRUE, иначе FALSE
Пример использования
from pyspark.sql.functions import bool_and
from pyspark.sql import SparkSession
# Создаем SparkSession
spark = SparkSession.builder.appName("bool_and_example").getOrCreate()
# Создаем DataFrame
data = [
("A", True),
("A", True),
("A", True),
("B", True),
("B", False),
("B", True),
("B", None)
]
df = spark.createDataFrame(data, ["group", "value"])
# Проверяем, все ли значения TRUE
result = df.groupBy("group").agg(
bool_and("value").alias("all_true")
).show()
# Результат:
# +-----+--------+
# |group|all_true|
# +-----+--------+
# |A |true |
# |B |false |
# +-----+--------+
Примечания
- NULL значения игнорируются при вычислении
- Функция является синонимом для
every()
- Для проверки наличия хотя бы одного TRUE значения используйте
bool_or()
илиsome()
- Для подсчета TRUE значений используйте
count_if()