파이썬 PDF 파일 내 텍스트를 파일명으로 변경
·
개발/Python
PDF 가 위치한 디렉토리를 설정하고, 위치에 pdf 파일을 떨궈줍니다. pdf 에 위치한 파일이 파일 내 인덱스에 위치한 텍스트를 인식하여 파일이름으로 변경하는 작업입니다. import PyPDF2 import os # 페이지 인덱스 설정 def extract_text_from_page(pdf_path, page_number, start_index, end_index): text = '' with open(pdf_path, 'rb') as file: reader = PyPDF2.PdfReader(file) page = reader.pages[page_number - 1] # 페이지 인덱스는 0부터 시작하므로 1을 빼줍니다. page_text = page.extract_text() text += page..