input_file_block_start()
Описание
Функция input_file_block_start()
возвращает начальную позицию текущего блока входного файла в байтах.
Параметры
Функция не принимает параметров.
Возвращаемое значение
Long - начальная позиция текущего блока входного файла в байтах
Пример использования
from pyspark.sql.functions import input_file_block_start
from pyspark.sql import SparkSession
# Создаем SparkSession
spark = SparkSession.builder.appName("input_file_block_start_example").getOrCreate()
# Читаем файл и получаем начальную позицию блока
df = spark.read.text("path/to/file.txt")
result = df.select(input_file_block_start().alias("block_start")).show()
# Результат:
# +------------+
# |block_start|
# +------------+
# |0 |
# +------------+
Примечания
- Возвращает позицию блока только при чтении файлов
- Для работы с файлами также используйте:
input_file_block_length()
для получения длины блокаinput_file_name()
для получения имени входного файла