rand(seed=None)
Описание
Функция rand()
генерирует случайное число с равномерным распределением в диапазоне [0, 1).
Параметры
seed
: Long - начальное значение для генератора случайных чисел (опционально)
Возвращаемое значение
Double - случайное число в диапазоне [0, 1)
Пример использования
from pyspark.sql.functions import rand
from pyspark.sql import SparkSession
# Создаем SparkSession
spark = SparkSession.builder.appName("rand_example").getOrCreate()
# Создаем DataFrame
data = [("A",), ("B",), ("C",)]
df = spark.createDataFrame(data, ["id"])
# Генерируем случайные числа
result = df.select(
"id",
rand().alias("random1"),
rand(42).alias("random2")
).show()
# Результат:
# +---+-------------------+-------------------+
# |id |random1 |random2 |
# +---+-------------------+-------------------+
# |A |0.7308781907032909|0.3745401188473625 |
# |B |0.41008081149220166|0.9507143064099162 |
# |C |0.20751949359438045|0.7319939418114051 |
# +---+-------------------+-------------------+