rand(seed=None)

Описание

Функция rand() генерирует случайное число с равномерным распределением в диапазоне [0, 1).

Параметры

seed: Long - начальное значение для генератора случайных чисел (опционально)

Возвращаемое значение

Double - случайное число в диапазоне [0, 1)

Пример использования

from pyspark.sql.functions import rand
from pyspark.sql import SparkSession

# Создаем SparkSession
spark = SparkSession.builder.appName("rand_example").getOrCreate()

# Создаем DataFrame
data = [("A",), ("B",), ("C",)]
df = spark.createDataFrame(data, ["id"])

# Генерируем случайные числа
result = df.select(
    "id",
    rand().alias("random1"),
    rand(42).alias("random2")
).show()

# Результат:
# +---+-------------------+-------------------+
# |id |random1            |random2            |
# +---+-------------------+-------------------+
# |A  |0.7308781907032909|0.3745401188473625 |
# |B  |0.41008081149220166|0.9507143064099162 |
# |C  |0.20751949359438045|0.7319939418114051 |
# +---+-------------------+-------------------+

Примечания

При одинаковом начальном значении (seed) функция будет генерировать одинаковую последовательность случайных чисел
Для генерации случайных целых чисел используйте randn()
Для генерации случайных чисел с нормальным распределением используйте randn()
Для округления чисел используйте round()