The Ebook. Книга об электронных книгах (Прохоренков) - страница 46

Для ускорения процесса редактирования текста используется «распределённый метод» — части документа распределяются между группой корректоров. Этот способ позволяет вычитать книгу полностью за несколько минут, но не всем под силу организация такого процесса. Обычно используется веб-интерфейс, без необходимости устанавливать дополнительное программное обеспечение на множество компьютеров.

Для вычитки текста не обязательны профессиональные лингвисты. Обычно этим занимаются люди, наделённые вниманием и наблюдательностью. Важна не столько грамотность, сколько умение сравнивать печатный и электронный текст между собой, замечать разницу в технических опечатках, разницу между буквами и цифрами.

Художественная литература может считываться только для поиска орфографических ошибок.

В «OCR мастерских» небольшого размера «работают» парами. Обычно специалист по OCR является организатором процесса и сотрудничает с одним или группой корректоров. Группа существует на особом сочетании характеров и возможностей. При переходе к другому типу распространения готовых электронных книг, «мастерская» может распадаться, часть группы придерживается идеологических взглядов на свою деятельность.

В момент зарождения электронных книг, OCR-щики первыми протоптали дорожку для читателей к бесплатным библиотекам и собрали для них контент. Если библиотеки известны массовому читателю, то наполняли эти библиотеки не магазинные копии книг, а частные коллекции OCR.

Среди специалистов по распознаванию текста есть профессиональные объединения, свой кодекс, честь и прочее. Самой известной в отечественной истории была «OCR-группа Вадима Ершова», которая располагалась по адресу publ.lib.ru и работала изначально только для библиотеки Мошкова (других не существовало). Впоследствии форум группы Ершова стал местом сбора и общения профессионалов в области OCR.

Время идёт. Меняются приоритеты, интересы и источники оцифровки книг. Интерес к книжному распознаванию стал меньше и перешёл в профессиональное русло. Доля собственной оцифровки в бесплатных библиотеках значительно ниже доли копирования или «заимствования» готового материала. Поэтому, если кого-то интересует собственная оцифровка, то обычно это редкие и детские книги.

В последнее время часто оцифровывают с экрана компьютера, без использования сканера для бумажных книг. Таких любителей не много и пока это работает как «спортивный интерес» по взлому защищённых цифровых изданий.

Обычный читатель может самостоятельно оцифровать книгу, читать и вычитывать её в электронном виде. Частной заинтересованности в этом мало, слишком трудоёмко. Интерес быстро перерастает в «желание поделиться» оцифрованной книгой со всеми в Интернет. Так рождаются потоки новых книг и мелкие частные библиотеки. Хобби становится профессиональным занятием.