nanvl(col1, col2)
Описание
Функция nanvl() возвращает первое значение, если оно не NaN, иначе возвращает второе значение.
Параметры
col1: Column - первое значениеcol2: Column - второе значение
Возвращаемое значение
Тип данных первого значения
Пример использования
from pyspark.sql.functions import nanvl, lit
from pyspark.sql import SparkSession
import math
# Создаем SparkSession
spark = SparkSession.builder.appName("nanvl_example").getOrCreate()
# Создаем DataFrame с NaN значениями
data = [
    (float('nan'), 1.0),
    (2.0, float('nan')),
    (3.0, 4.0)
]
df = spark.createDataFrame(data, ["col1", "col2"])
# Заменяем NaN на альтернативные значения
result = df.select(
    nanvl("col1", "col2").alias("result")
).show()
# Результат:
# +------+
# |result|
# +------+
# |1.0   |
# |2.0   |
# |3.0   |
# +------+