Skip to content

startswith(col, prefix)

Описание

Функция startswith() проверяет, начинается ли строка с указанного префикса.

Параметры

  • col: Column - столбец со строками для проверки
  • prefix: String - префикс для проверки

Возвращаемое значение

Boolean - TRUE, если строка начинается с указанного префикса, иначе FALSE

Пример использования

from pyspark.sql.functions import startswith
from pyspark.sql import SparkSession

# Создаем SparkSession
spark = SparkSession.builder.appName("startswith_example").getOrCreate()

# Создаем DataFrame
data = [
    ("Hello World"),
    ("Spark SQL"),
    ("Python Spark")
]
df = spark.createDataFrame(data, ["text"])

# Проверяем, начинаются ли строки с "Hello" или "Spark"
result = df.select(
    "text",
    startswith("text", "Hello").alias("starts_with_hello"),
    startswith("text", "Spark").alias("starts_with_spark")
).show()

# Результат:
# +------------+-----------------+----------------+
# |text        |starts_with_hello|starts_with_spark|
# +------------+-----------------+----------------+
# |Hello World |true            |false           |
# |Spark SQL   |false           |true            |
# |Python Spark|false           |false           |
# +------------+-----------------+----------------+

Примечания

  • Функция чувствительна к регистру
  • NULL значения возвращают NULL
  • Для проверки окончания строки используйте endswith()
  • Для поиска подстроки в любом месте строки используйте contains()