5 библиотек для работы с PDF в Python
Индивидуальное, дистанционное обучение программирование
подробнее
ReportLab - библиотека в основном ориентированная на точное создание PDF-документов. Доступна свободно как версия с открытым исходным кодом.
www.reportlab.com
Pdfrw - анализатор PDF на основе Python для чтения и записи PDF-документов. Точно воспроизводит векторные форматы. Вместе с ReportLab он помогает повторно использовать части существующих PDF-файлов в новых PDF-файлах, созданных с помощью ReportLab.
www.pypi.org/project/pdfrw
PyPDF2 - библиотека для извлечения информации из pdf документов, разделения документов, объединения документов, добавления водяных знаков.
www.pypi.org/project/PyPDF2
Tabula-py - простая оболочка Python для tabula-java, она может читать таблицы из PDF-файлов и преобразовывать их в Pandas DataFrames. Также позволяет конвертировать файл PDF в файл CSV,TSV,JSON.
www.github.com/chezou/tabula-py
PDFQuery – быстрая, удобную библиотека. Её цель - извлекать данные из наборов PDF-файлов, используя как можно меньше кода.
www.github.com/jcushman/pdfquery
Смотреть видео
Возврат к списку