asc(col)
Описание
Функция asc()
используется для сортировки данных в порядке возрастания. Это синоним функции asc_nulls_last()
.
Параметры
col
: Column - столбец для сортировки
Возвращаемое значение
Column - столбец с примененной сортировкой по возрастанию
Пример использования
from pyspark.sql.functions import asc
# Создаем DataFrame
df = spark.createDataFrame([
(1, "John", 25),
(2, "Jane", 30),
(3, "Bob", 35),
(4, "Alice", 28),
(5, None, 40),
(6, None, 22)
], ["id", "name", "age"])
# Сортируем по имени в порядке возрастания
df.orderBy(asc("name")).show()
# Результат:
# +---+-----+---+
# | id| name|age|
# +---+-----+---+
# | 4|Alice| 28|
# | 3| Bob| 35|
# | 2| Jane| 30|
# | 1| John| 25|
# | 5| null| 40|
# | 6| null| 22|
# +---+-----+---+
# Сортируем по возрасту в порядке возрастания
df.orderBy(asc("age")).show()
# Результат:
# +---+-----+---+
# | id| name|age|
# +---+-----+---+
# | 6| null| 22|
# | 1| John| 25|
# | 4|Alice| 28|
# | 2| Jane| 30|
# | 3| Bob| 35|
# | 5| null| 40|
# +---+-----+---+
Примечания
- NULL значения сортируются в конце (NULLS LAST)
- Это синоним функции
asc_nulls_last()
- Для сортировки NULL значений в начале используйте
asc_nulls_first()
- Для сортировки по убыванию используйте
desc()
илиdesc_nulls_first()
- Функция часто используется в комбинации с
orderBy()
илиsort()
- Можно использовать для сортировки по нескольким столбцам