Chunkr - це відкрите API-рішення для інтелектуальної обробки документів. Воно дозволяє конвертувати PDF, PPT, Word та зображення у структуровані чанки, готові для використання в RAG/LLM системах. Основні можливості включають:
• Аналіз макету документа
• OCR з визначенням меж тексту
• Генерація структурованого HTML та markdown
• Налаштування обробки за допомогою VLM
Chunkr надає Python SDK для зручної інтеграції. Проект має подвійну ліцензію - AGPL-3.0 та комерційну. Для корпоративного використання доступна підтримка розгортання.
#Python, #AI, #OCR
@sourcefuture
• Аналіз макету документа
• OCR з визначенням меж тексту
• Генерація структурованого HTML та markdown
• Налаштування обробки за допомогою VLM
Chunkr надає Python SDK для зручної інтеграції. Проект має подвійну ліцензію - AGPL-3.0 та комерційну. Для корпоративного використання доступна підтримка розгортання.
#Python, #AI, #OCR
@sourcefuture
👍3