Рубрики
Без рубрики

Python PDF серии – введение в Metapdf

Получите практические, реальные навыки Python на наших ресурсах и пути

Автор оригинала: Mike Driscoll.

При исследовании библиотек PDF для Python я наткнулся на другой маленький проект под названием Metapdf Отказ Согласно его веб-сайту, Metapdf – это Легкая библиотека Python, оптимизированная для добычи и вставки метаданных, и она является быстрой оберткой по отличной библиотеке PypDF. Он работает, быстро ищет последние 2048 байтов PDF PDF перед анализом таблицы XREF, предлагая повышение производительности на 50-60% над непосредственным распределением линии таблицы по линии Отказ Я не совсем уверен, насколько это будет полезно, но давайте попробуем это и посмотрим, что может сделать Metapdf.

Получение и использование Metapdf

Процесс установки Metapdf довольно прост. Просто используйте easy_install или pip, чтобы установить его. Далее нам нужно написать маленький скрипт, чтобы увидеть, как он работает. Вот тот, который основан на странице GitHub Metapdf:

Здесь я бегу против руководства пользователя ReportLab PDF. Обратите внимание, что у оригинала была опечатка, где он использовал что-то, называемое «читать», чтобы открыть файл. Это не будет работать, если вы не затенетесь открыть , Я предполагаю. В любом случае, вывод этого скрипта выглядит следующим образом:

Я действительно не понимаю, как автор изменился на этом документе, но я уверен, что я не автор. Я действительно не понимаю, почему в ключевых полях входят в ключевые поля. Глядя на исходный код для этого модуля, кажется бы, что это все, что может сделать. Это немного разочаровывает. Может быть, привлекая внимание к этой библиотеке, мы можем заставить разработчику написать еще несколько функциональных возможностей?