Skip to content

bool_or(col)

Описание

Функция bool_or() возвращает TRUE, если хотя бы одно значение в столбце равно TRUE. Это агрегатная функция, которая должна использоваться с groupBy(). Функция является синонимом для some().

Параметры

  • col: Column - столбец с булевыми значениями

Возвращаемое значение

Boolean - TRUE, если хотя бы одно значение TRUE, иначе FALSE

Пример использования

from pyspark.sql.functions import bool_or
from pyspark.sql import SparkSession

# Создаем SparkSession
spark = SparkSession.builder.appName("bool_or_example").getOrCreate()

# Создаем DataFrame
data = [
    ("A", True),
    ("A", False),
    ("A", False),
    ("B", False),
    ("B", False),
    ("B", True),
    ("B", None)
]
df = spark.createDataFrame(data, ["group", "value"])

# Проверяем, есть ли хотя бы одно TRUE значение
result = df.groupBy("group").agg(
    bool_or("value").alias("has_true")
).show()

# Результат:
# +-----+--------+
# |group|has_true|
# +-----+--------+
# |A    |true    |
# |B    |true    |
# +-----+--------+

Примечания

  • NULL значения игнорируются при вычислении
  • Функция является синонимом для some()
  • Для проверки, все ли значения TRUE, используйте bool_and() или every()
  • Для подсчета TRUE значений используйте count_if()