isnotnan(col)
Описание
Функция isnotnan()
проверяет, не является ли значение NaN (Not a Number). Возвращает true, если значение не является NaN, и false в противном случае.
Параметры
col
: Column - столбец для проверки
Возвращаемое значение
Column - boolean значение (true, если значение не NaN, false в противном случае)
Пример использования
from pyspark.sql import SparkSession
from pyspark.sql.functions import isnotnan, lit
import numpy as np
# Создаем SparkSession
spark = SparkSession.builder.appName("isnotnan_example").getOrCreate()
# Создаем DataFrame с данными
data = [
(1.0,),
(float('nan'),),
(3.0,),
(float('inf'),),
(None,)
]
df = spark.createDataFrame(data, ["value"])
# Проверяем, какие значения не являются NaN
result = df.withColumn("is_not_nan", isnotnan("value"))
result.show()
# Результат:
# +-----+-----------+
# |value|is_not_nan|
# +-----+-----------+
# | 1.0| true|
# | NaN| false|
# | 3.0| true|
# | Inf| true|
# | null| null|
# +-----+-----------+
Примечания
- Возвращает null, если входное значение null
- Полезно для:
- Фильтрации NaN значений
- Проверки качества данных
- Обработки специальных значений
- Связанные функции:
isnan()
- проверяет, является ли значение NaNisnull()
- проверяет, является ли значение NULLisnotnull()
- проверяет, не является ли значение NULL