WebScrapBook — это расширение для браузеров, позволяющее сохранять веб-страницы в различных форматах с возможностью настройки параметров для удобного доступа и редактирования.

🚀

Основанное на старом дополнении Firefox ScrapBook X, оно совместимо с браузерами на основе Chromium и Firefox, а также с мобильными устройствами.

Расширение предоставляет пользователям возможность захватывать веб-страницы как на локальное устройство, так и на сервер, что делает работу с контентом более гибкой и удобной.

github.com/danny0838/webscrapb

WebScrapBook: Обзор, Возможности и Сравнение
**WebScrapBook** — это расширение для браузеров, позволяющее сохранять веб-страницы в различных форматах. Оно является **преемником ScrapBook X** и совместимо с **Firefox, Chromium-браузерами (Chrome, Edge, Opera, Vivaldi и др.)** и мобильными устройствами.
🔹 Основные возможности WebScrapBook:
**Гибкие способы сохранения**
Захват всей веб-страницы, её части или только текстового содержимого.
Сохранение в формате **HTML, Markdown, MAFF, ZIP и WARC**.
Возможность автоматического скачивания вложений (изображений, скриптов, CSS).
**Локальное и серверное хранение**
Можно сохранять страницы **на локальный диск** или **на сервер** (с поддержкой WebDAV).
Интеграция с **backend-приложением PyWebScrapBook** для расширенной функциональности.
**Редактирование и организация**
Можно **аннотировать и редактировать** сохранённый контент.
Гибкая система **тегов, папок и поиска** по сохранённым данным.
**Автоматизация и расширенные настройки**
Возможность **массового захвата** страниц.
Настройка **фильтров захвата** (например, игнорировать рекламу, исключать скрипты).
Опция **зеркального копирования сайтов** для создания автономных архивов.
🔍 Сравнение WebScrapBook с аналогами
Функция WebScrapBook SingleFile Evernote Web Clipper Pocket Сохранение всей страницы ✅ ✅ ❌ (только текст) ❌ (только ссылки) Поддержка HTML/Markdown ✅ ❌ ❌ ❌ Локальное хранение ✅ ✅ ❌ (в облаке) ❌ (в облаке) Возможность редактирования ✅ ❌ ✅ ❌ Поддержка серверного хранения ✅ ❌ ✅ ✅
**Вывод**:
**WebScrapBook** — лучший выбор, если вам нужно **полное сохранение страниц с возможностью редактирования**.
**SingleFile** хорош, если требуется просто сохранить страницу в один файл HTML без изменений.
**Evernote Web Clipper** удобен для тех, кто работает с заметками и использует облачное хранилище.
**Pocket** подойдёт для быстрого сохранения ссылок, но не самих страниц.
📌 Примеры использования
✔ **Исследователи и студенты** могут сохранять статьи, редактировать их и организовывать материалы по темам.
✔ **Журналисты и блогеры** могут архивировать источники информации, чтобы они не исчезли со временем.
✔ **Разработчики и UX-дизайнеры** могут сохранять версии страниц для последующего анализа.
✔ **Авторы технической документации** могут собирать полезные материалы для справочных файлов.
📂 **GitHub проекта:** WebScrapBook
🔧 **Backend для сервера:** PyWebScrapBook
Если у вас есть вопросы или хотите узнать больше про другие инструменты — спрашивайте! 😊

Follow

📌 Где и как WebScrapBook хранит данные?
WebScrapBook использует **локальное хранилище** или **серверное хранилище**, в зависимости от настроек пользователя.
🔹 **Локальное хранилище** (по умолчанию)
При сохранении веб-страницы данные хранятся в **указанной папке** на диске в виде файлов и каталогов.
**Путь по умолчанию:**
В Windows: `C:\Users\<имя пользователя>\Downloads\scrapbook`
В Linux/macOS: `/home/<имя пользователя>/Downloads/scrapbook`
Можно изменить путь в настройках расширения.
**Структура файлов:**
`index.html` — сохранённая веб-страница.
`index.md` — если сохранение в Markdown.
`resources/` — папка с изображениями, стилями и скриптами.
`meta.json` — метаданные страницы (дата сохранения, URL, теги и т. д.).
🔹 **Серверное хранилище** (при использовании PyWebScrapBook)
Если настроен **сервер PyWebScrapBook**, данные хранятся **на WebDAV-сервере** или в **локальном каталоге сервера**.
**Формат хранения**: аналогичен локальному, но с возможностью поиска и управления через браузер.
**Преимущества**:
✔ Удалённый доступ к сохранённым страницам.
✔ Возможность работы в команде.
✔ Интеграция с веб-архивами.
📊 Сколько места занимает WebScrapBook?
Зависит от количества и типа сохранённых страниц.
Тип контента Средний размер **Простая текстовая страница** 50–200 КБ **Страница с картинками** 500 КБ – 3 МБ **Страница с видео/аудио** 5–50 МБ **Зеркало небольшого сайта** 100–500 МБ **Большой архив сайтов** 1 ГБ+
🔹 **Оптимизация**: можно отключить загрузку ненужных ресурсов (JS, шрифтов, CSS), чтобы уменьшить размер файлов.
Если есть дополнительные вопросы — спрашивайте! 🚀

Sign in to participate in the conversation
Qoto Mastodon

QOTO: Question Others to Teach Ourselves
An inclusive, Academic Freedom, instance
All cultures welcome.
Hate speech and harassment strictly forbidden.