Skip to content

col(colName)

Описание

Функция col() создает объект Column по имени столбца. Это один из основных способов ссылаться на столбцы в DataFrame.

Параметры

  • colName: String - имя столбца

Возвращаемое значение

Column - объект столбца

Пример использования

from pyspark.sql import SparkSession
from pyspark.sql.functions import col

# Создаем SparkSession
spark = SparkSession.builder.appName("col_example").getOrCreate()

# Создаем DataFrame
data = [
    ("A", 100),
    ("B", 200),
    ("C", 300)
]
df = spark.createDataFrame(data, ["name", "value"])

# Используем col() для ссылки на столбцы
result = df.select(
    col("name"),
    col("value") * 2
).show()

# Результат:
# +----+-----+
# |name|value|
# +----+-----+
# |   A|  200|
# |   B|  400|
# |   C|  600|
# +----+-----+

Примечания

  • Функция col() эквивалентна использованию df["column_name"]
  • Для создания литерала используйте lit()
  • Для создания столбца из выражения используйте expr()
  • Для создания столбца из SQL-выражения используйте sql()