startswith(col, prefix)
Описание
Функция startswith()
проверяет, начинается ли строка с указанного префикса.
Параметры
col
: Column - столбец со строками для проверкиprefix
: String - префикс для проверки
Возвращаемое значение
Boolean - TRUE, если строка начинается с указанного префикса, иначе FALSE
Пример использования
from pyspark.sql.functions import startswith
from pyspark.sql import SparkSession
# Создаем SparkSession
spark = SparkSession.builder.appName("startswith_example").getOrCreate()
# Создаем DataFrame
data = [
("Hello World"),
("Spark SQL"),
("Python Spark")
]
df = spark.createDataFrame(data, ["text"])
# Проверяем, начинаются ли строки с "Hello" или "Spark"
result = df.select(
"text",
startswith("text", "Hello").alias("starts_with_hello"),
startswith("text", "Spark").alias("starts_with_spark")
).show()
# Результат:
# +------------+-----------------+----------------+
# |text |starts_with_hello|starts_with_spark|
# +------------+-----------------+----------------+
# |Hello World |true |false |
# |Spark SQL |false |true |
# |Python Spark|false |false |
# +------------+-----------------+----------------+
Примечания
- Функция чувствительна к регистру
- NULL значения возвращают NULL
- Для проверки окончания строки используйте
endswith()
- Для поиска подстроки в любом месте строки используйте
contains()