col(colName)
Описание
Функция col()
создает объект Column по имени столбца. Это один из основных способов ссылаться на столбцы в DataFrame.
Параметры
colName
: String - имя столбца
Возвращаемое значение
Column - объект столбца
Пример использования
from pyspark.sql import SparkSession
from pyspark.sql.functions import col
# Создаем SparkSession
spark = SparkSession.builder.appName("col_example").getOrCreate()
# Создаем DataFrame
data = [
("A", 100),
("B", 200),
("C", 300)
]
df = spark.createDataFrame(data, ["name", "value"])
# Используем col() для ссылки на столбцы
result = df.select(
col("name"),
col("value") * 2
).show()
# Результат:
# +----+-----+
# |name|value|
# +----+-----+
# | A| 200|
# | B| 400|
# | C| 600|
# +----+-----+