Описание работы пакета OOoFBTools. Создание книг FB2 (Кузнецов) - страница 31

3. Составлен список слов, правая дефисная часть которых – либо слово «нибудь», либо – «либо». Вот этот список (он со временем может пополниться): "где", "откуда", "зачем", "почему", "отчего", "кто", "как", "когда", "какой", "какого", "какому", "каком", "какая", "какую", "какое", "какого", "какие", "каких", "каким", "кем", "кого", "кому", "ком", "куда", "что", "чем", "чём", "чему", "чей", "чья", "чьего", "чьему", "чьей", "чьи", "чьих", "чьими", "чье", "чьё", "чего", "сколько", "скольких", "скольким", "сколькими".

Когда Корректор нашел в тексте разорванный абзацем дефис, то он определяет правую часть, если это – «нибудь» или «либо», то далее следует проверка по вышеназванному списку. Если есть соответствие, то Корректор удаляет разрыв – символ ¶, оставляя при этом дефис, или символ «минус» – смотря, что стояло.

Если же этого соответствия не было, то найденное в тексте слово «не считается» дефисным, а просто с разорванным переносом (например, смот-¶ри), и в этом режиме обработки игнорируется.

2. Дефисы и удаление из слов только символа ¶ без переноса (-)

Все, что было написано для режима «Обрабатывать только разорванные дефисы» работает и в этом режиме. Только в дополнение к этому, удаляется не только разрыв дефисных слов, но и слова с разорванными переносами не игнорируются, и из них удаляется только символ «¶». Символ «-» не трогается. Этот режим удобен для исправления разрывов не только дефисов, но и слов, типа «давным-давно», «сестра-хозяйка», «белый-белый» и т. п. Например, слово «давным-¶давно» станет «давным-давно», а «смот-¶ри» – «смот-ри». В первом случае получили то, что и надо, а во втором – нет. Текст после коррекции можно «прогнать» ручным инструментом поиска слов с дефисом, и удалить «-» там, где он остался. Универсальный алгоритм предусматривал бы сравнение со списком из тысяч слов в разных склонениях и временных формах, и требовал бы часы, на отработку. Поэтому, этот алгоритм проще, хотя и не все корректно обрабатывает.

3. Дефисы и удаление из слов разрыва: и переноса (-) и абзаца (¶)

Все, что было написано для режима «Обрабатывать только разорванные дефисы» работает и в этом режиме.

Этот режим похож на описанный выше, с одним лишь отличием. Удаляется не только разрыв дефисных слов, но и оба символа разрыва «-¶» в слова с разорванными переносами. Например, слово «давным-¶давно» станет «давнымдавно», а «смот-¶ри» – «смотри». В первом случае получили не то, что надо, а во втором – именно то, что надо.

Таблица сравнения результата работы 3-х режимов коррекции