nanvl(col1, col2)
Описание
Функция nanvl()
возвращает первое значение, если оно не NaN, иначе возвращает второе значение.
Параметры
col1
: Column - первое значениеcol2
: Column - второе значение
Возвращаемое значение
Тип данных первого значения
Пример использования
from pyspark.sql.functions import nanvl, lit
from pyspark.sql import SparkSession
import math
# Создаем SparkSession
spark = SparkSession.builder.appName("nanvl_example").getOrCreate()
# Создаем DataFrame с NaN значениями
data = [
(float('nan'), 1.0),
(2.0, float('nan')),
(3.0, 4.0)
]
df = spark.createDataFrame(data, ["col1", "col2"])
# Заменяем NaN на альтернативные значения
result = df.select(
nanvl("col1", "col2").alias("result")
).show()
# Результат:
# +------+
# |result|
# +------+
# |1.0 |
# |2.0 |
# |3.0 |
# +------+