Извлечение таблиц из pdf
При обработке pdf-файлов часто можно встретить таблицы. И не все инструменты способны их адекватно обработать и извлечь. В этой статье предлагается способ извлечения с помощью библиотеки Camelot. Он даёт возможность извлечь таблицы в виде pandas DataFrame для дальнейшей обработки, а также экспортировать таблицу в форматы csv, JSON, Excel и HTML.
Подробнее:
https://uproger.com/izvlechenie-tablicz-iz-pdf-s-pomoshhyu-camelot/
#camelot #pdf
При обработке pdf-файлов часто можно встретить таблицы. И не все инструменты способны их адекватно обработать и извлечь. В этой статье предлагается способ извлечения с помощью библиотеки Camelot. Он даёт возможность извлечь таблицы в виде pandas DataFrame для дальнейшей обработки, а также экспортировать таблицу в форматы csv, JSON, Excel и HTML.
Подробнее:
https://uproger.com/izvlechenie-tablicz-iz-pdf-s-pomoshhyu-camelot/
#camelot #pdf
👍8❤1🔥1