Описание работы пакета OOoFBTools. Создание книг FB2 (Кузнецов) - страница 30

А. Text Corrector – Корректор текста документа

Для работы с корректором текста надо вызвать его диалог, который выглядит так:

Все выбранные опции автоматически запоминаются, и при следующем вызове Корректора они будут автоматически установлены.


А.1. Описание некоторых опций

Многие опции Корректора Текста интуитивно понятны. Некоторые, требующие пояснения, опишем подробнее.

А.1.1. Удалить разрывы для дефисов и переносов слов

Очень важная опция! Очень часто требуется исправить текст, который содержит слова с дефисами и переносами, разорванными символом абзаца. В ручную – долго и утомительно.

Данная опция имеет 3 режима работы:

1. Обрабатывать только разорванные дефисы.

2. Дефисы и удаление из слов только символа без переноса (-).

3. Дефисы и удаление из слов разрыва: и переноса (-) и абзаца ().

Т.е. разорванные дефисы обрабатываются во всех трех режимах – удаляется разрыв, а в двух последних режима еще и обрабатываются слова, не обязательно содержащие дефисы, но разорванные на переносе.

Поиск и корректура осуществляется везде – в тексте, в таблицах, в текстовых врезках и в сносках.

Рассмотрим каждый режим.

1. Обрабатывать только разорванные дефисы

Есть два вида слов с дефисом: предлоги, местоимения и т. д. (все-таки, во-первых, ты-то, из-за…) и другие слова (белым-бело, сестра-хозяйка, по-хорошему, иди-ка…). Таких слов сотни, тысячи… Если составить полный список всех этих слов, и «загрузить» его в Корректор для сравнения всех найденных в тексте дефисных слов с разрывами, то на сравнение только одного слова из книги понадобится несколько часов! Поэтому, в Корректоре механизм распознавания таких дефисных слов сделан следующим образом:

1. Правая или левая часть найденного в тексте слова с разорванным дефисом (или переносом) сравнивается со словами-шаблонами, которые в большой вероятностью принадлежат словам с дефисами: «-то», «-ка», «-таки», «-ли», «по-», «кое-», «кой-», «из-», «во-», «в-». Если есть соответствие, то Корректор удаляет разрыв – символ ¶, оставляя при этом дефис, или символ «минус» – смотря, что стояло.

Конечно, есть вероятность того, что в тексте встретится не дефисное слово, соответствующее этому алгоритму, а просто слово с разорванным переносом (например: «по-¶шли», «доло-¶то»), и, вместо «-¶» удалится только «¶», но такая вероятность мала. Во всяком случае, потом текст можно «прогнать» ручным инструментом поиска слов с дефисом, и удалить символ "-" там, где он остался. Но – лучше такой алгоритм, чем…

2. И левая, и правая части найденного слова с разорванным дефисом (или переносом) сравниваются с полным шаблоном: «как-никак», «какой-никакой». Если есть соответствие, то Корректор удаляет разрыв – символ ¶, оставляя при этом дефис, или символ «минус» – смотря, что стояло. Список этих полных шаблоном по мере развития Корректора может расти.