среда, 18 февраля 2015 г.

WordsFromText: как читать на английском с удовольствием

WordsFromText: как читать на английском с удовольствием

Чтение в оригинале для многих является проблемой. Обилие незнакомых слов усложняет восприятие текста и приводит к потере энтузиазма. Такое происходит, когда сложность текста превосходит ваш текущий уровень, или когда вы читаете текст не по вашей тематике. Технари могут без проблем общаться на рабочие темы, но пасуют перед статьями о политике, музыке и серьёзной художественной литературой.

Цель нашего сервиса — решить эту проблему.

Несколько лет назад мы писали на Хабре об этом сервисе. Идея нашла отклик, сайт приобрел постоянных пользователей, хотя в то время сервис мог только показывать статистику слов из текста. За последние месяцы сервис стал умнее.

Как мы переводим слова

Ключевая цель сервиса — дать людям возможность читать и смотреть в оригинале то, что им интересно. И при этом максимально упростить работу с незнакомыми словами.

Поэтому мы сделали 2 вещи.

Первое — мы переводим незнакомые вам слова прямо в тексте. Переводы зависят от части речи. Это позволяет не выкатывать словарную статью, а дать ёмкий короткий перевод. Например:

Перевод зависит от части речи

Второе — мы позволяем пользователям самим загружать текст книги или статьи. Сайт работает с txtdoc,docxpspdffb2epubmobisrt. Можно скормить сервису URL: сайт автоматически выделит содержимое статьи и предложит его прочитать с переводом незнакомых слов.

Такой подход приносит удовольствие от чтения и пользу. Перевод незнакомых слов делает чтение удобнее, легче. Заодно расширяется диапазон текстов, которые вы можете читать. Загружаете вы интересное или полезное по работе. Текст не прошёл через призму восприятия переводчика — это особенно важно для художественной литературы.

Это непосредственная польза, которую приносит чтение оригинального текста на сервисе. Но есть и другой аспект — обучение языку.

Как мы помогаем учить язык


Первое и главное обучение уже состоит в том, что вы читаете текст в оригинале. У вас в памяти откладываются выражения, сочетания слов. Вы привыкаете воспринимать английский текст. Но это обучение, если можно так сказать, пассивное.

Ещё сайт помогает накапливать словарный запас. Ради этого мы сделали несколько инструментов.

Инструмент 1. Статистика слов из текста.

Статистика слов

Сайт анализирует, какие слова встречаются чаще. Учите в первую очередь слова из топа — они с большей вероятностью вам пригодятся.

Также сайт показывает контекст употребления слова, чтобы не заучивать его тупо, а видеть перед собой пример употребления. Контекст берётся из вашего же текста.

Инструмент 2. Постраничная статистика и переходы от чтения к изучению слов.

Учить слова со страниц 6-10

Если вы загрузили большую книгу, то общая статистика достаточно бесполезна: там будет слишком много слов. Причём все сразу они не нужны.

Поэтому каждые несколько страниц текста мы предлагаем вам перейти к изучению слов и посмотреть/поучить слова с ближайших страниц. Когда вы подойдёте к концу диапазона, сайт предложит вам повторить слова из только что прочитанного текста.

Страница у нас — это около 1800 знаков, что соответствует странице в бумажной книге. Вы сами выбираете число страниц, через которое сайт предлагает вам поучить слова.

Непосредственно для изучения слов предназначены инструменты 3 и 4.

Инструмент 3. Экспорт слов.

Экспорт слов

Экспортируйте слова в такие приложения и сервисы как AnkiMemrise и др. Это популярные методы заучивания слов, основанные на повторении карточек со словами. Они используют умные алгоритмы, которые управляют частотой повторения слов для более надёжного запоминания.

Мы написали подробную инструкцию по экспорту слов для тех, кто любит такой метод заучивания.

Инструмент 4. Печать слов.

Печать слов

Есть люди, которым проще распечатать листок со словами и поучить их в свободное время или в дороге. Им подойдёт наша возможность печати слов.

Видео-формат


У нас можно не только читать. Наша новая возможность — работа с видео. Можно загрузить субтитры и затем скачать их обратно с переводом незнакомых вам слов.

Субтитры в Light Alloy

Субтитры в VLC для Mac

Подобные переводы в субтитрах не научат вас многому, если вы будете бегло читать русский текст. Поэтому не ленитесь останавливать время от времени проигрыватель, чтобы внимательно прочитать и осознать неизвестное слово.

Как сайт узнаёт, какие слова вы знаете?


Вы сами отмечаете известные слова и слова к изучению.

Статусы слов

Есть 2 метода, как значительно ускорить этот процесс.

1. В топе самых часто используемых слов вам, скорее всего, будет почти всё известно. Не кликайте по каждому слову, а используйте Shift:

Использование Shift (анимация)

2. Загрузите книгу или статью, в которой вам всё понятно, и отметьте все слова как известные.

Что ещё


Пожалуй, для первой статьи достаточно.

Мы не описали ещё много возможностей — в первую очередь, про взаимодействие с текстом и про личный словарь. Если кому-то сервис показался интересным, посмотрите видео, в котором мы эту тему полностью раскрываем. Либо просто попробуйте это на сервисе.

Сайт адаптивный. Он одинаково хорошо работает с телефона, планшета и компьютера. Мы очень тщательно за этим следим.

Оплата и месячный trial


Недавно мы ввели платную подписку на доступ к новым возможностям сайта. Старые фичи (если кто из читателей пользовался сайтом в 2011–2014 году) мы оставили бесплатными.

Оплата — 320 рублей за 3 месяца, либо 160 рублей за месяц. Мы надеемся, что эти деньги помогут нам дальше поддерживать и развивать проект.

Всем доступен одномесячный пробный период. Нам кажется, что этого времени вполне достаточно для оценки того, полезен ли сервис настолько, чтобы его оплатить.

Если не будет желания платить, вы всё равно сможете загружать свои тексты во всех форматах, смотреть статистику слов, печатать слова с переводами и вести личный словарь.

Итак


Будем рады, если сервис окажется вам полезным.

Пишите в комментариях, что бы вы в первую очередь улучшили — будем улучшать. У нас есть список идей по сайту: idea.wordsfromtext.com. Мы стараемся прислушиваться к пользователям. Например, из этого списка идей нами сейчас сделано приблизительно 35 из 76, причём из них много «не мелочей».

На ближайший месяц у нас запланирована большая работа со словарями: мы улучшим короткие переводы, добавим подробный англо-русский и англо-английский словари.

Сайт:
http://wordsfromtext.com/

Как эффективно начать пользоваться сайтом:
http://wordsfromtext.com/start/
+35
8666
158
dm9 35,3 G+

Комментарии (35)

+5
JetHedgehog#
Идея очень крутая! Но зачем загружать тексты на сайт? Допустим, я читаю статью в инете. Это много кликов. Почему бы не сделать расширение для браузера, которое автоматически все сделает в рамках всей страницы? Будет достаточно одного клика, очень удобно.
+1
dm9#
Спасибо за комментарий. Идея правильная, вот тут её даже предлагали уже.

Нам нужно провести кое-какие оптимизационные работы (чтобы отдельный абзац обрабатывался 0,1 секунду, а не 6), и потом мы это обязательно сделаем. В принципе, там ничего сложного, просто пока задачу отложили. Так что обязательно будет.
+2
lexasss#
А если говорить о недосягаемом идеале, то приложение должно само следить за тем как юзер читает текст, само обнаруживать что возникли проблемы с пониманием, и предложить удобный перевод, в правильном месте в правильное время. Ну тот есть нужен ай–трекер, как в iDict или Text 2.0

Пример на 1:20
+3
rboots#
Заказывали — получайте chrome.google.com/webstore/detail/alfa-dictionary/mmcaaoocamgidcgcegagpmbllgabcfgm плагин для Google Chrome.

Можно вести список знакомых слов и подсвечивать на странице только незнакомые, а можно просто использовать как словарь для чтения.

Сделал когда-то для себя, исходники тут github.com/zarly/alfa-dictionary свободные для изменений.
+2
ncix#
А как насчет мобильного приложения?
+1
dm9#
Активно думаем.

Очень не хочется делать отдельное нативное приложение, так как интерфейсная логика в некоторых местах очень сложна, и дублировать её в нескольких кодовых базах — самоубийство. Думаю разобраться с PhoneGap и сделать приложение на тех же скриптах, что используется на основном сайте — просто с другим источником данных (чтобы работало кеширование текстов для работы offline). Если у кого есть подобный опыт — буду рад, если поделитесь.
+3
Invision#
Имхо, делайте нативное. Сколько уже раз мы обжигались на всяких этих кроссплатформенных фрейворках — не передать. Проблема в том, что если приложение сложнее, чем представленные на сайте примеры использования SDK (а чаще всего так и есть), то из «кроссплатформенного» кода всегда будут отсылки на нативные SDK. И вот уже приложение становится не таким уж и кроссплатформенным, и с кучей костылей. Саппорт превращается в дикий ужас, а если фреймворк еще периодически ломает обратную совместимость, то становится вообще невесело. Бывали случаи, когда у версий приложений в итоге оставалось только 20%-30% общего кроссплатформенного кода, и это не криворукость программистов :)

Конечно, есть ситуации, когда у разработчиков уже есть наработанный годами код/паттерны/сниппеты/workarounds для платформы (например, у меня есть такие для Corona SDK, Marmalade SDK, немного для приложений на Sencha ExtJS). В этом случае использование фреймворка часто окупается. Но если до этого вы никогда не писали, скажем, под PhoneGap или что другое, то скорее всего время разработки будет таким же (или даже больше), как если бы разрабатывать нативные версии приложений. Или программист (специалист по данному фреймворку) может уволиться, и придется искать замену, что гораздо легче в случае нативных приложений.

Для себя мы придерживаемся примерно следующей стратегии: «Кросплатформенность для игр — да, да и еще раз да. Кроссплатформенность для приложений — нет, нет, и никогда больше».
+3
ncix#
Соглашусь с предыдущим комментатором, сфера эффективного применения кросс-платформенного мобильного ПО реально узка. Играет роль как производительность, так и специфика под каждую платформу, которая вынуждает держать несколько наборов костылей.
Второй момент — мобильный интерфейс скорее всего не получится скопипастить с настольного и чтобы получилось также удобно. Очень много специфики управления и отображения на маленьком экране. То что удобно на десктопе может быть ужасно на смарте.
Может быть маркетинговый смысл сделать исключительно приложение-браузер. Т.е. размещение в маркете приводит вам дополнительных клиентов, но показываем им тот же сайт. Как краткосрочный инструмент увеличения рынка сгодится. Но при условии появления полноценных мобильных приложений в будущем.
+2
sourcerer#
А другие языки будут?
+2
dm9#
Сроков сказать не могу, но в первую очередь будет немецкий (так как я его знаю в достаточной мере).

Основное, что нужно для добавления языка — это таггер, т. е. программа, которая определяет части речи в тексте. Если кто-то знает подобные разработки для немецкого языка, напишите, это сильно ускорит процесс — у меня не доходят руки провести нормальное исследование на эту тему.
+1
sourcerer#
Это же восхитительно! Успехов вам!
+3
Lerg#
Основная проблема при изучении английских текстов в том, что простого перевода слов недостаточно. Это работает для простого языка, в полноценных так скажем предложениях если просто перевести все слова понятно ничего не будет. Поэтому такие сервисы подходят не для изучения языка, а для его закрепления.
Был какой-то сервис, где можно читать книги в двух языках сразу. Там перевод профессиональный и правильный и такой метод подходит для изучения языка.
В ваш же сервис нужно добавить определение грамматики (пассивный залог, времена), phrasal verbs и идиомы.
+1
dm9#
Фразовые глаголы и перевод устоявшихся связок (of course, as well as, a lot of) мы скоро сделаем. Пассивный залог и времена — это, конечно, уже круче планка.
+2
olegkrasnov#
Не забудьте про идиомы. Это вообще самое важное, что может быть в словаре. Словарик от лингвалео умеет их переводить.
+2
dm9#
Скоро сделаем «неразрывные» идиомы — т. е. из слов, идущих подряд. Если идиома разносится по предложению — это будет чуть позже. Кстати, надо посмотреть, как такие случаи обрабатывает L.Leo.
+2
onatsko#
Спасибо за сервис, по описанию как раз то, что нужно. :) попробую!
+1
lasalas#
UX — отстой. Почему вы решили, что мешанина из английских и русских слов раскрашенная как новогодняя елка с кучей лишних кликов позволят читать с удовольствием?

Для чтения с удовольствием:
  • подчеркивание (dashes) для новых/неизвестных слов
  • всплывающая подсказка при наведении указателя (для мобильных — при тапе)
  • в подсказке: перевод (несколько вариантов) и кнопка «учить» (иконка)
  • все слова от начала и до выбранного сразу помечаются как известные
  • возможность отмены (на всякий случай)
  • возможность получить перевод слова помеченного как известное (выделением, например)
  • весь прочий сервис (выбор варианта перевода, части речи и т.п.) вынести в режим изучения слов
  • в режим изучения показывать контексты употреблени слова в текстах


Надеюсь, принцип понятен: человек читает, натыкается на непонятное слово, получает перевод, отмечает его для изучения (если требуется), читает дальше…
+2
joher#
На мой взгляд, при прочтении художественной литературы выделение и какие-то операции очень сильно отвлекают от главного — самой книги. Для технических статей это не так критично, но все равно иногда приходиться перечитывать целый абзац и впечатления несколько смазываются.
+1
dm9#
Да, идея как раз была в том, чтобы избавиться от лишних кликов и иметь всё сразу перед глазами. Собственно, даже слова рекомендуется отмечать заранее (для ближайших нескольких страниц), чтобы потом не отвлекаться на это.
+2
lasalas#
Допустим я только начал пользоваться сервисом, загрузил книгу. Пусть в книге в 5000 слов (морфем). Из них новых для меня может быть 100. И ради того, чтобы их вычленить и заучить, нужно ~10'000 раз ткнуть мышью? Это называется «избавиться от лишних кликов»?
+1
dm9#
Думаю, что для таких случаев мы сделаем 3 режима чтения:
1) Показывать перевод новых слов и слов к изучению
2) Показывать перевод только слов к изучению
3) Не показывать переводы

1 и 3 сейчас есть на сайте. Для вашего случая, мне кажется, хорошо подойдёт 2.

А чтобы 5000-100 = 4900 раз не кликать мышкой (забыл умножить на 2?), уже сейчас после прочтения книги и отмечания слов к изучению вы можете перейти в список слов, отфильтровать их по статусу «новое» и все скопом загнать в «известные». Используя клавишу Shift, как описано в статье, это можно будет сделать быстро.
+2
lasalas#
Перевел все слова в известные — стало гораздо лучше. Сервис очень полезный. Спасибо!
+1
dm9#
Думаю, то, что вы описываете, сделано уже в нескольких плагинах. Например, выше в комменте rboots такое описывается. У нас сценарий другой. Идея как раз в том, чтобы видеть всё сразу.

Идею «все слова от начала и до выбранного сразу помечаются как известные» взял на вооружение.

Смену части речи и перевода нельзя делать при изучении (на другом экране), так как
1) это зависит от контекста, то есть часто должно редактироваться «in place»;
2) неверно определяющаяся лемма или перевод дико бесят при чтении, и проще один раз их исправить сразу при чтении.

Контексты (агрегированные по текстам) показывать скоро будем.
+1
lasalas#
Кстати, отдельно заучивать имеет смысл лишь те слова, которые редко повторяются в тесте, а встречающиеся часто пользователь к концу чтения и так запомнит.
+1
joher#
А нет ли оффлайн сервиса по переводу статьи, книги. Не всегда есть доступ к интернету а чиать хочется. Монетизация данного подхода тоже понятна. Отлично былобы интегрировать такую возможность в мобильное приложение.
+1
dm9#
Мобильное приложение — понятно, я выше отвечал. А пока его нет — что вы подразумеваете под оффлайн сервисом? У меня была идея тупо отправлять текст с переводом незнакомых слов на email. Кому-то из читающих этот коммент это будет полезно?
+2
onatsko#
думаю такая возможность могла бы заинтересовать.

я часто нахожу статьи, а читаю их полностью позже — отправляя ссылку на статью себе на почту. Почта от самого себя получает ярлык «Разобрать» и когда приходит время — просто читаешь статью.
Так что если бы на Вашем сайте была такая услуга, ней можно было бы пользоваться.

з.ы. можно не только в почту, можно ещё сделать отправку в Evernote
+1
joher#
Не совсем точно выразился, прошу прощения. Я имел ввиду загрузить на сайт книгу, он бы ее пережевал с учетом моих познаний отмеченных на сайте и выдала в любом из читаемых форматов уже с переводом незнакомых мне слов, что бы можно было этот файз загрузить и наслаждаться книгой уже в оффлайне.
+3
rboots#
Хотел сегодня заплатить вам, поддержать, а вы Яндекс Деньги временно не принимаете
+1
dm9#
Мы только подключились, они ещё не активировали наш сайт. Надеюсь, скоро заработает.
+2
masterL#
Предложение: при экспорте в Анки также добавить в карточки озвучку и картинку
+1
dm9#
Может быть, кто-нибудь подскажет, где легально взять озвучку? Я готов даже на разовый платёж в разумных пределах. Все генераторы речи — полный отстой. Проверочное слово — normal. Подавляющее большинство синтезаторов речи выдаёт какой-то «номил» (включая Google Translate, кстати). Даже не верится, что нет озвучки, сделанной живыми людьми и доступной по Creative Commons. Но найти не получилось.
+1
DrReiz#
В режиме «study words from next 5 pages» хочется по каждому слову видеть сколько еще оно встретится во всей книге, чтобы принять решение — выучить его или забить. И, соответственно, сортировку — сначала по кол-ву в следующих 5 страницах, а если совпадает, то по кол-ву во всей книге.
+1
DrReiz#
В общих My words хочется слова сортировать не только по алфавиту, но и по тому, сколько раз они встретились во всех книгах.
+1
lasalas#
Почему некоторые (вполне нормальные) слова в тексте бывают неактивны (невозможно открыть форму перевода)? Например: «and his blood-oxygen levels plummeted again.»

0 коммент.:

Отправить комментарий