bitmap_count(bitmap)
Описание
Функция bitmap_count()
подсчитывает количество установленных битов в битовой карте.
Параметры
bitmap
: Column - столбец с битовыми картами
Возвращаемое значение
Long - количество установленных битов
Пример использования
from pyspark.sql.functions import bitmap_construct_agg, bitmap_count
from pyspark.sql import SparkSession
# Создаем SparkSession
spark = SparkSession.builder.appName("bitmap_count_example").getOrCreate()
# Создаем DataFrame с числами
data = [
(1,),
(2,),
(3,),
(4,),
(5,)
]
df = spark.createDataFrame(data, ["number"])
# Создаем битовую карту и подсчитываем биты
result = df.select(
bitmap_count(bitmap_construct_agg("number")).alias("bit_count")
).show(truncate=False)
# Результат:
# +---------+
# |bit_count|
# +---------+
# |5 |
# +---------+
Примечания
- NULL значения возвращают NULL
- Для работы с битовыми картами также используйте:
bitmap_construct_agg()
для создания битовой картыbitmap_or_agg()
для объединения битовых картbitwise_not()
для инвертирования битовbitwiseNOT()
для инвертирования битов (альтернативный синтаксис)