Цифровой журнал «Компьютерра» № 186 (Журнал «Компьютерра») - страница 27

Мы понимали, что нужно писать резидентную программу, которая позволила бы сделать словарь, «всплывающий» поверх окон Word или Excel и показывающий на экране перевод. TSR-программирование, надо сказать, тогда казалось чем-то фантастичным: эта техника толком нигде не была описана, книжек о ней почти не было (помню, первые из них появились в Доме научно-технической книги на Ленинском проспекте), знания передавались фактически из уст в уста.


Д. З. Резидентное программирование всегда было «на грани фола»: формально ведь этим заниматься было нельзя, по спецификациям MS DOS это было запрещено. Только некоторые инструменты внутри операционной системы позволяли резидентным программам переключать на себя обработку прерываний — и эти механизмы не были нигде задокументированы, их опытным путём обнаруживали отдельные люди. Я лично хорошо помню, что мы, наблюдая за работой таких «гуру», часто слышали просьбу: «А теперь, пожалуйста, отвернитесь». Всё было именно на таком уровне неизвестности. И достичь того, чтобы резидентные программы работали «без запинки», было действительно чем-то из области фантастики.

Д. Я. Сейчас мы продолжаем заниматься «магией» — только теперь в иной плоскости. Теперь эта «ворожба» посвящена поиску способов вычленить факты из естественного языка.

Д. З. Есть мнение, что такой подход, как «интерлингва» (вычленение смысла из фразы на одном языке, а затем перевод этой мысли на другой язык), в принципе неправилен. Как относиться к таким суждениям? Я знаю много людей, которые идеально владеют двумя иностранными языками (или языками программирования): они используют именно технику интерлингвистики. Но ведь семантика — это всегда сумма коммуникации в данный момент и коммуникативного опыта. А у программы такого опыта нет…

Д. Я. В разных культурах существует большая часть пересекающихся языково независимых понятий, которые укладываются в определённую иерархию. Существует множество академических исследований и проектов по этому поводу, а коммерческих попыток свести все понятия языка к универсальному дереву понятий и использовать его совместно с синтаксисом языка и статистикой не было.

Фактически это иерархия с собранными в ней сущностями, между которыми есть отношения близости. Одни из них — родительские, другие — дочерние; это деление образует основную структуру. Если наполнить основную «ёлку» иерархии массой существующих в языке семантических классов, то любой новый класс сможет занять чёткое место в этой системе. Качество «пристраивания» нового элемента при этом определяется минимумом новых связей, которые будут необходимы, чтобы покрыть все возможности применения этого концепта в реальном мире. Скажем, для концепта «зрелость» соседствующими элементами будут «зрелый»/«незрелый», «зелёный»/«перезрелый», «гнилой» и так далее.