randn(seed=None)
Описание
Функция randn() генерирует случайное число с нормальным распределением (среднее = 0, стандартное отклонение = 1).
Параметры
seed: Long - начальное значение для генератора случайных чисел (опционально)
Возвращаемое значение
Double - случайное число с нормальным распределением
Пример использования
from pyspark.sql.functions import randn
from pyspark.sql import SparkSession
# Создаем SparkSession
spark = SparkSession.builder.appName("randn_example").getOrCreate()
# Создаем DataFrame
data = [("A",), ("B",), ("C",)]
df = spark.createDataFrame(data, ["id"])
# Генерируем случайные числа
result = df.select(
    "id",
    randn().alias("random1"),
    randn(42).alias("random2")
).show()
# Результат:
# +---+-------------------+-------------------+
# |id |random1            |random2            |
# +---+-------------------+-------------------+
# |A  |-0.2341533747233357|1.5792128155073915 |
# |B  |0.5425600425855925 |-0.4976480227539201|
# |C  |-1.9132802446544876|1.6514361958300326 |
# +---+-------------------+-------------------+