12.12.2009

Организация сохраняемых из сети веб-страниц с помощью расширения Firefox - Scrapbook

Scrapbook - расширение Firefox назначением которого является сохранение веб страниц и организация полученного материала.
В переводе с англ. Scrapbook - записки, альбом, альбом для наклеивания вырезок. Именно последнее значение, как мне кажется, наиболее точно подходит для отражения функционала расширения.

Сохранять web страницы можно разными способами. Можно просто сохранять страницы в папки, однако это не удобно, если нужно сохранять не просто текст, но и графику, в этом случае все объекты встроенные в страницу сохраняются в отдельную папку.
Можно использовать расширения UnMHT и Mozilla Archive Format позволяющие сохранять страницы вместе с встроенными объектами в один файл MHT (Internet Explorer's format) и открывать сохраненные файлы.


Вышеперечисленные способы пригодны только в том случае, если количество сохраненного материала невелико, - от нескольких десятков до сотни страниц. С увеличением объема появляется проблема каталогизации и поиска в сохраненном материале.

Именно упорядочивание, организация и поиск в сохраненных материалах являются главными козырями Scrapbook. Поскольку ScrapBook работает в Firefox то приложение получается кроссплатформенным, - поддерживаются три основные операционные системы: Linux, Mac OS и Windows.

Вот, что пишет сам разработчик:
ScrapBook это личное хранилище, позволяющее сохранять: web страницы полностью, сайты, части сайтов, фрагменты текста, PDF-файлы, фильмы и все, что вы собираете в путешествиях по Web.
По умолчанию материалы сохраняются в папке личного профайла Firefox, что делает их недоступными для других пользователей системы.

Как правило перед пользователем интенсивно работающим в сети возникает дилемма: либо отмеченные интересные веб-страницы добавить в закладки, но при этом утратить доступ к материалу off-line, или сохранить их на жестком диске, но утратить адрес первоисточника.
ScrapBook решает эту проблему и пользователь избавляется от множества разбросанных файлов и папок, теперь все находится в одном месте и в структуруированном виде. Кроме этого при добавлении в блокнот ScrapBook страницы сохраняется адрес источника, время и дата, возможно добавить комментарий к каждой сохраненной странице.

ScrapBook позволяет выборочно захватывать нужные фрагменты интересующего материала:
  • выделенный текст;
  • всю страницу;
  • страницу с или без встроенных объектов (изображения, стили CSS, скрипты JavaScript, аудиофайлы, видеофайлы, pdf документы, MS Word документы и др.;
  • страницу со всеми связанными страницами на различную глубину.

Установить ScrapBook можно отсюда.

После установки и перезапуска Firefox в главном меню программы появляется пункт "ScrapBook". Кроме того в контекстном меню появляются три пункта меню:
  • "Захватить веб-страницу" (с выбором каталога);
  • "Захватить веб-страницу как...." (откроется окно, в котором возможно изменить название сохраняемой страницы, выбрать каталог для сохранения, добавить комментарий, выбрать нужно ли сохранять встроенные объекты, выбрать уровень захвата страницы);
  • "Добавить в закладки ScrapBook" (с выбором каталога), сохраненные ссылки помечаются зеленым цветом указывая, что доступны только в режиме on-line.

Просмотреть сохраненные страницы можно либо вызвав в главном меню Firefox пункт ScrapBook, либо, что более удобно, нажав комбинацию "Alt + K" вызвать боковую панель, с помощью которой можно управлять содержимым ScrapBook, просматривать сохраненный материал и редактировать сохраненные страницы.

ScrapBook позволяет редактировать содержание сохраненных страниц:
  • добавлять/удалить комментарии, которые видны только в свойствах страницы;
  • добавлять/удалить примечания, которые отображаются в слое над текстом сохраненной страницы;
  • помечать "маркером" выделенные фрагменты текста;
  • удалить со страницы все теги "SCRIPT" и "IFRAME";
  • присоединить ссылку к выделенному объекту;
  • присоединить файл к выделенному объекту;
  • присоединить файл к выделенному фрагменту;
  • удалить все типы подсветок;
  • удалить все типы подсветок в выделенном;
  • удалить выделенный фрагмент;
  • >с помощью кнопки "Dom+" удалить ненужные фрагменты страницы - банеры, таблицы, рисунки и т.п.;
  • отменить внесенные изменения;
  • сохранить внесенные изменения.

Кроме того с помощью меню инструменты, который находиться в верхней части боковой панели можно:
  • посмотреть количество занимаемого места блокнотом, что становиться важно после длительного использования;
  • вызвать окно управлениями каталогов, с помощью которого можно добавлять, удалять, переименовывать папки, импортировать и экспортировать материалы, объединять веб-страницы;
  • сохранять дерево веб-страниц в виде html;
  • восстанавливать веб-альбомы;
  • сортировать дерево веб-страниц;
  • добавлять сразу несколько закладок: закладки из открытых вкладок, закладки из всех ссылки на странице, закладки из файла html, закладки из выделенных ссылок.
Одной из самых важных и востребованных функций является поиск в сохраненных веб-альбомам. Искать можно по заголовку, по времени, по комментариям, по всему, с использованием шаблонов, с учетом регистра.

Есть еще одна функция, которая важна для некоторых пользователей, но отсутствует в ScrapBook - синхронизация каталога ScrapBook на нескольких компьютерах. К счастью эта функция легко решается с помощью сторонних приложений: Dropbox, Ubuntu One.
Установив сервисы Ubuntu One (для Ubuntu) или Dropbox (для других дистрибутивов) получим автоматическую синхронизацию каталога ScrapBook на настольном компьютере, ноутбуке, на рабочем месте. А быстро перенести материалы можно просто упаковав каталог ScrapBook на машине источнике и распаковав на машине назначения, предварительно установив на нее ScrapBook. Кстати, каталог, куда будут сохраняться веб-альбомы ScrapBook можно изменить. Я, например, сейчас поместил его в каталог Ubuntu One.

Таким образом, рассмотрев возможности расширения, можно сделать вывод, что по функционалу и удобству использования у ScrapBook пока нет конкурентов. Остается надеяться, что авторы сделают порт расширения и для Google Chrome, тогда коллекция станет еще и кроссбраузерной.