bool_and(col)
Описание
Функция bool_and() возвращает TRUE, если все значения в столбце равны TRUE. Это агрегатная функция, которая должна использоваться с groupBy(). Функция является синонимом для every().
Параметры
col: Column - столбец с булевыми значениями
Возвращаемое значение
Boolean - TRUE, если все значения TRUE, иначе FALSE
Пример использования
from pyspark.sql.functions import bool_and
from pyspark.sql import SparkSession
# Создаем SparkSession
spark = SparkSession.builder.appName("bool_and_example").getOrCreate()
# Создаем DataFrame
data = [
("A", True),
("A", True),
("A", True),
("B", True),
("B", False),
("B", True),
("B", None)
]
df = spark.createDataFrame(data, ["group", "value"])
# Проверяем, все ли значения TRUE
result = df.groupBy("group").agg(
bool_and("value").alias("all_true")
).show()
# Результат:
# +-----+--------+
# |group|all_true|
# +-----+--------+
# |A |true |
# |B |false |
# +-----+--------+
Примечания
- NULL значения игнорируются при вычислении
- Функция является синонимом для
every() - Для проверки наличия хотя бы одного TRUE значения используйте
bool_or()илиsome() - Для подсчета TRUE значений используйте
count_if()