Skip to content

bitmap_construct_agg(col)

Описание

Функция bitmap_construct_agg() создает битовую карту из значений столбца, используя агрегацию.

Параметры

  • col: Column - столбец с целочисленными значениями

Возвращаемое значение

Binary - битовая карта в виде бинарных данных

Пример использования

from pyspark.sql.functions import bitmap_construct_agg
from pyspark.sql import SparkSession

# Создаем SparkSession
spark = SparkSession.builder.appName("bitmap_construct_agg_example").getOrCreate()

# Создаем DataFrame с числами
data = [
    (1,),
    (2,),
    (3,),
    (4,),
    (5,)
]
df = spark.createDataFrame(data, ["number"])

# Создаем битовую карту из чисел
result = df.select(
    bitmap_construct_agg("number").alias("bitmap")
).show(truncate=False)

# Результат:
# +------------------+
# |bitmap            |
# +------------------+
# |[binary data]     |
# +------------------+

Примечания

  • NULL значения игнорируются
  • Входные значения должны быть целыми числами
  • Для работы с битовыми картами также используйте:
  • bitmap_count() для подсчета установленных битов
  • bitmap_or_agg() для объединения битовых карт
  • bitwise_not() для инвертирования битов
  • bitwiseNOT() для инвертирования битов (альтернативный синтаксис)