+7 771 559 26 76
sguruapp@gmail.com
facebook vk instagram Одноклассники youtube

5 библиотек для работы с PDF в Python


5 библиотек для работы с PDF в Python

ReportLab - библиотека в основном ориентированная на точное создание PDF-документов. Доступна свободно как версия с открытым исходным кодом.
www.reportlab.com

Pdfrw - анализатор PDF на основе Python для чтения и записи PDF-документов. Точно воспроизводит векторные форматы. Вместе с ReportLab он помогает повторно использовать части существующих PDF-файлов в новых PDF-файлах, созданных с помощью ReportLab.
www.pypi.org/project/pdfrw

PyPDF2 - библиотека для извлечения информации из pdf документов, разделения документов, объединения документов, добавления водяных знаков.
www.pypi.org/project/PyPDF2

Tabula-py - простая оболочка Python для tabula-java, она может читать таблицы из PDF-файлов и преобразовывать их в Pandas DataFrames. Также позволяет конвертировать файл PDF в файл CSV,TSV,JSON.
www.github.com/chezou/tabula-py

PDFQuery – быстрая, удобную библиотека. Её цель - извлекать данные из наборов PDF-файлов, используя как можно меньше кода.
www.github.com/jcushman/pdfquery

Возврат к списку