Skip to content

input_file_block_start()

Описание

Функция input_file_block_start() возвращает начальную позицию текущего блока входного файла в байтах.

Параметры

Функция не принимает параметров.

Возвращаемое значение

Long - начальная позиция текущего блока входного файла в байтах

Пример использования

from pyspark.sql.functions import input_file_block_start
from pyspark.sql import SparkSession

# Создаем SparkSession
spark = SparkSession.builder.appName("input_file_block_start_example").getOrCreate()

# Читаем файл и получаем начальную позицию блока
df = spark.read.text("path/to/file.txt")
result = df.select(input_file_block_start().alias("block_start")).show()

# Результат:
# +------------+
# |block_start|
# +------------+
# |0          |
# +------------+

Примечания

  • Возвращает позицию блока только при чтении файлов
  • Для работы с файлами также используйте:
  • input_file_block_length() для получения длины блока
  • input_file_name() для получения имени входного файла