rand(seed=None)
Описание
Функция rand() генерирует случайное число с равномерным распределением в диапазоне [0, 1).
Параметры
seed: Long - начальное значение для генератора случайных чисел (опционально)
Возвращаемое значение
Double - случайное число в диапазоне [0, 1)
Пример использования
from pyspark.sql.functions import rand
from pyspark.sql import SparkSession
# Создаем SparkSession
spark = SparkSession.builder.appName("rand_example").getOrCreate()
# Создаем DataFrame
data = [("A",), ("B",), ("C",)]
df = spark.createDataFrame(data, ["id"])
# Генерируем случайные числа
result = df.select(
    "id",
    rand().alias("random1"),
    rand(42).alias("random2")
).show()
# Результат:
# +---+-------------------+-------------------+
# |id |random1            |random2            |
# +---+-------------------+-------------------+
# |A  |0.7308781907032909|0.3745401188473625 |
# |B  |0.41008081149220166|0.9507143064099162 |
# |C  |0.20751949359438045|0.7319939418114051 |
# +---+-------------------+-------------------+