Follow

Kreuzberg — это современная библиотека на Python, предназначенная для извлечения текста из различных форматов документов, включая PDF, изображения и офисные файлы, с простым асинхронным интерфейсом.

Она не требует подключения к внешним API и способна работать без GPU, что позволяет экономить ресурсы.

Библиотека поддерживает современные технологии Python, такие как async/await, и предоставляет открытые лицензии для использования и модификации.

Kreuzberg отлично подходит для приложений Retrieval Augmented Generation и совместима с Docker и сервер-less функциями.

github.com/Goldziher/kreuzberg

Sign in to participate in the conversation
Qoto Mastodon

QOTO: Question Others to Teach Ourselves
An inclusive, Academic Freedom, instance
All cultures welcome.
Hate speech and harassment strictly forbidden.