bitmap_construct_agg(col)
Описание
Функция bitmap_construct_agg()
создает битовую карту из значений столбца, используя агрегацию.
Параметры
col
: Column - столбец с целочисленными значениями
Возвращаемое значение
Binary - битовая карта в виде бинарных данных
Пример использования
from pyspark.sql.functions import bitmap_construct_agg
from pyspark.sql import SparkSession
# Создаем SparkSession
spark = SparkSession.builder.appName("bitmap_construct_agg_example").getOrCreate()
# Создаем DataFrame с числами
data = [
(1,),
(2,),
(3,),
(4,),
(5,)
]
df = spark.createDataFrame(data, ["number"])
# Создаем битовую карту из чисел
result = df.select(
bitmap_construct_agg("number").alias("bitmap")
).show(truncate=False)
# Результат:
# +------------------+
# |bitmap |
# +------------------+
# |[binary data] |
# +------------------+
Примечания
- NULL значения игнорируются
- Входные значения должны быть целыми числами
- Для работы с битовыми картами также используйте:
bitmap_count()
для подсчета установленных битовbitmap_or_agg()
для объединения битовых картbitwise_not()
для инвертирования битовbitwiseNOT()
для инвертирования битов (альтернативный синтаксис)