среда, 11 марта 2015 г.

Так и не нашел сервис хранения страниц Интернет... Пришлось писать самому

Всем доброго начала рабочего года! С прошедшими праздниками и рождеством! Они выдались для меня довольно насыщенными, в том числе и потому, что удалось частично реализовать давно задуманную идею — сделать сервис для хранения различной информации из Интернет. Система базируется на электронной почте. Принцип ее работы прост — достаточно отправить одну или несколько ссылок на специальный адрес, и через минуту в электронную почту в едином письме придут все эти страницы без рекламы и прочей информации, не нужной мне для долговременного хранения. Мне было бы интересно, если бы читатели моего блога тоже попробовали воспользоваться сервисом, и подсказали, что в нем плохо, и что хорошо.


Прежде всего — как я дошел до жизни такой. Задача сохранения информации  уже давно стояла остро для меня. Мне нужен был сервис, который позволял бы следующее:
  • Архивировать статьи из Интернета с картинками
  • Иметь возможность осуществлять удобный поиск по ним
  • Иметь возможность передать кому-либо эти статьи
  • Хочу иметь доступ с любого компьютера без установки какого-либо приложения
  • Процедура сохранения должна быть максимально упрощена, и занимать секунды (не хочется загружать личный кабинет, входить в него и пр.)
  • Должна быть процедура offline чтения материалов
  • Должна быть возможность делать подборки — то есть иметь в рамках единого файла сводную информацию из разных источников.
Я пробовал разные способы, но все они меня чем-то не устраивали.
  • Заносить страницы в «Избранное» средствами браузера не позволяет осуществлять по этим страницам поиск.
  • Записывать страницы локально на папку компьютера — не иметь доступа к ним с других устройств. Плюс что делать — если я сижу за чужим компьютером?
  • Два раза пытался начать пользоваться Evernote — но не пошло. Слишком много действий надо совершить для простой, в общем-то, задачи.
  • Не мои способы: сохранять на странице в LiveJournal или в файлах Word в той или иной степени неудобны и долги.
А если вспомнить — какой самый простой способ поделиться с друзьями интересным материалом? Можно сколь угодно долго обсуждать достоинства разных систем или приложений, но что делает большинство людей? Копирует ссылку и отправляет ее по почте или через Skype. Примерно тоже самое теперь делаю и я — только себе любимому :) . И вот каким образом.
Шаг 1. Копирую в новое письмо (неважно, на смартфонах или на компьютере), перечень ссылок с разных мест (в данном примере хочу собрать нужную тематику — о Samsung Galaxy Note II). Затем отправляю письмо на адрес add@save2mail.com.
Шаг 2. Получаю на тот адрес, с которого отправил запрос — длиииииииинное письмо, в котором содержатся все статьи с этих ссылок.
В общем-то — это все. Хотя изначально план по функциям ставил перед собой богатый, больше за праздники ничего сделать не успел. Буду теперь пользоваться и смотреть — нужны они для меня или нет.
В почтовом клиенте я настроил правило (выискивать в заголовке строку «S2M:»), при срабатывании которого все такие письма попадают в специальную папку, где можно их повторно прочитать. Картинки жестко «вшиты» в тело письма, то есть даже если они пропадут с исходного адреса — уже не страшно. С помощью встроенных средств поиска почтового клиента легко делать мгновенный поиск любой сложности.
Пока я своим сервисом пользуюсь достаточно интенсивно. Ситуации для себя выделяю следующие.
  1. Перед уходом с работы теперь не нужно сначала открыть интересные статьи на смартфоне, а просто просматриваю новостные ленты по диагонали и копирую ссылки на заголовки в письмо. Затем уже в метро спокойно читаю текст, не отвлекаясь на плохо работающий 3G.
  2. На Новый год подарили фотовспышку. На следующий день быстро поиском нашел много статей на эту тему, которые сбросил себе на сервис. Потом уже тихо сидел в уголке и обстоятельно читал все подряд на смартфоне.
  3. По роду занятий часто требуется искать различную статистику. Теперь я ее сохраняю в почту, и когда надо, легко ищу ее.
Минусы: не читаются страницы LiveJournal, поскольку те ведут политику борьбы с ботами и блокируют все попытки войти в обход браузеров. Затем — библиотека, которую я использую для распознавания содержательной части страницы HTML, распознает не все. Особенно плохо — короткие статьи. Похоже, она использует частотный анализ. Есть проблема с MS Outlook — он не показывает картинки. Но в остальном, вроде должно работать. :)
Что произойдет, если страница не распознается, а в браузере ее уже закрыли? Не страшно. Письмо все-равно придет, и в нем будет ссылка на исходный сайт. Так что придется сохранять его как-то по иному.
В заключении — просьба. Если кому-то такой способ хранения информации покажется удобным, попробуйте его, и отпишите в комментариях к этой статье свои впечатления. Мне это будет очень интересно!
PS: Кроме написанного выше, больше пока ничего не работает. Поэтому те функции, ссылки на которые есть в электронном письме — можно не читать, и не пытаться их вызывать. :(
Поделиться заметкой
Опубликовать в Google Plus 
Опубликовать в LiveJournal 
Опубликовать в Мой Мир 
Опубликовать в Одноклассники 
Опубликовать Вконтакте
Материалы по теме:

Комментариев: 11

  • Alex
    11 января 2013 в 13:16
    Работает!
    весьма приятный сервис.
    Обычно пользуюсь greader — но для задачи сохранения/отложенного чтения произвольной страницу он не подходит.
    Буду пользоваться =)
    Stan_1
    Спасибо! :)
  • Александр
    31 января 2013 в 10:34
    библиотека, которую я использую
    для распознавания содержательной части страницы
    а можете уточнить что за библиотека?
    Stan_1
    Readability. Более правильная — на питоне, но я использовал какой-то порт на php
  • Александр
    31 января 2013 в 11:03
    На ipad я использую приложение pocket. В сафари стала нормально работать функция сохранения для отложенного чтения, так что им тоже пользуюсь.
    Предлагаемая вами идея очень интересна. А можно ли получить доступ к бета версии?
    Stan_1
    Web-сайта под проект нет. А бетта-версия — работает. Просто отправьте ссылки на адрес add@saved2mail.com
    Александр
    В add@saved2mail.com буква d лишняя.
    А разработка букмарклета у вас в планах есть? Ну чтобы было удобно прямо из браузера отправлять ссылки за меньшее число кликов.
    Stan_1
    Да, правильный адрес add@save2mail.com. букмарклет пока не планирую. Это пока получается дорогой проект с точки зрения докручивания, поэтому я не уверен в его скором разивитии, хотя до ума довести хочу. Но скорее всего летом.
  • Александр
    11 ноября 2013 в 11:38
    Ваш способ более универсальный, конечно. Но позволю себе упомянуть о возможности сохранять для дальнейшего автономного просмотра страниц один проверенный способ: браузер FireFox + дополнение SrapBook. Повторяю, он не такой универсальный, как Ваш, но надежный с точки зрения корректности сохранения и отображения. Вся страница вместе с картинками сохраняется в отдельную папку. Имеется возможность затем экспортировать сохраненные страницы в альбомы произвольным образом. Каждая страница — в отдельной папке.
    Stan_1
    Согласен. Вообще говоря мой способ имеет очень существенный недостаток — он практически неприемлим для тех, у кого не дектопные клиенты почты, а скажем, веб-лиенты mail.ru или gmail.
  • vik74
    26 января 2014 в 12:10
    Очень хороший способ, давно уж интересуюсь подобной системой. Хотелось бы попробовать, но не понял, где зарегистрировать подобный адрес @save2mail.com
    Подскажите пожалуйста.

0 коммент.:

Отправить комментарий