Skip to content

asc_nulls_first(col)

Описание

Функция asc_nulls_first() используется для сортировки данных в порядке возрастания, при этом NULL значения помещаются в начало результата.

Параметры

  • col: Column - столбец для сортировки

Возвращаемое значение

Column - столбец с примененной сортировкой по возрастанию с NULL значениями в начале

Пример использования

from pyspark.sql.functions import asc_nulls_first

# Создаем DataFrame
df = spark.createDataFrame([
    (1, "John", 25),
    (2, "Jane", 30),
    (3, "Bob", 35),
    (4, "Alice", 28),
    (5, None, 40),
    (6, None, 22)
], ["id", "name", "age"])

# Сортируем по имени в порядке возрастания с NULL значениями в начале
df.orderBy(asc_nulls_first("name")).show()

# Результат:
# +---+-----+---+
# | id| name|age|
# +---+-----+---+
# |  5| null| 40|
# |  6| null| 22|
# |  4|Alice| 28|
# |  3|  Bob| 35|
# |  2| Jane| 30|
# |  1| John| 25|
# +---+-----+---+

# Сортируем по возрасту в порядке возрастания с NULL значениями в начале
df.orderBy(asc_nulls_first("age")).show()

# Результат:
# +---+-----+---+
# | id| name|age|
# +---+-----+---+
# |  6| null| 22|
# |  1| John| 25|
# |  4|Alice| 28|
# |  2| Jane| 30|
# |  3|  Bob| 35|
# |  5| null| 40|
# +---+-----+---+

Примечания

  • NULL значения сортируются в начале (NULLS FIRST)
  • Для сортировки NULL значений в конце используйте asc_nulls_last()
  • Для сортировки по убыванию используйте desc_nulls_first() или desc_nulls_last()
  • Функция часто используется в комбинации с orderBy() или sort()
  • Можно использовать для сортировки по нескольким столбцам