monotonically_increasing_id()
Описание
Функция monotonically_increasing_id()
генерирует монотонно возрастающий уникальный идентификатор для каждой строки.
Параметры
Нет параметров
Возвращаемое значение
Long - уникальный идентификатор
Пример использования
from pyspark.sql.functions import monotonically_increasing_id
from pyspark.sql import SparkSession
# Создаем SparkSession
spark = SparkSession.builder.appName("monotonically_increasing_id_example").getOrCreate()
# Создаем DataFrame с данными
data = [("John", 25), ("Alice", 30), ("Bob", 35)]
df = spark.createDataFrame(data, ["name", "age"])
# Добавляем уникальный идентификатор
result = df.select(
monotonically_increasing_id().alias("id"),
"name",
"age"
).show()
# Результат:
# +---+-----+---+
# |id |name |age|
# +---+-----+---+
# |0 |John |25 |
# |1 |Alice|30 |
# |2 |Bob |35 |
# +---+-----+---+
Примечания
- Идентификаторы монотонно возрастают, но могут иметь пропуски
- Идентификаторы уникальны в пределах DataFrame
- Для генерации последовательных чисел используйте
row_number()
- Для генерации UUID используйте
uuid()