Заклинатель джиннов (Ахманов) - страница 14

Я не хотел мозолить коллегам глаза. Сами понимаете: военкомат – святое дело; после него нормальный кадр должен кейфовать, вкушать шашлык и чебуреки, лечить нервы горячительным, а не шататься у служебных мест.

Итак, я поднялся по лестнице, прошел по коридору с грязноватыми стенами и выщербленным паркетом в елочку, миновал кафедры новейшей истории России, просто истории России и истории политических учений (все три – догнивающие останки бывшей кафедры истории КПСС); срезал угол у лекционного зала, где кто-то бубнил о скифах и сарматах, и уперся в скромную дверь с надписью: «Кафедра древних культур». Эти культуры делились тут натрое: греко-римская, древнеславянская и все остальные. Бянус относился к остальным. Предметом его интереса были до-колумбовы цивилизации Месоамерики – ольмеки, толтеки, ацтеки и прочие инки да майя. В данное время он занимался расшифровкой узелковых письмен и жаждал осуществить этот научный подвиг с помощью какой-нибудь подходящей программы.

Разумеется, речь шла не о том, чтобы подать на вход закодированные условными символами тексты и получить на выходе индейский эквивалент «Одиссеи» или, скажем, «Слова о полку Игореве». Чудес на свете не бывает, и все обычные программы-переводчики могут работать лишь при наличии словаря и правил, фиксирующих соответствия между грамматическими конструкциями двух языков, – иными словами, эти языки должны быть вам известны. Если же язык мертв и существует лишь в виде непонятной письменности, иероглифов ронго-ронго или узелков на цветных веревочках, то разобраться с ним не проще, чем побеседовать с дельфином. В таких случаях ищут билингву – двуязычную надпись на какой-нибудь стеле вроде Розетского камня, где сообщается об одном и том же на двух языках, знакомом и неизвестном. Но если вы имеете дело с древней Америкой и Океанией, то этот метод неприменим – ведь в те края не добирались ни финикийцы, ни эллины, ни латиняне.

Тут надо идти тропинками поизвилистей, сплетая точный математический метод с эмпирикой и счастливой догадкой. На первом этапе неведомый текст, представленный набором символов, подвергают кластерному анализу, цель которого – распознать устойчиво повторяющиеся кластеры или смысловые группы. Предположим, что это слова или числа; чем больше таких кластеров вы ухитритесь найти, тем более полный словарь получится в результате. Разумеется, вам неизвестно, что означают все эти слова, но одни из них повторяются часто, другие – реже, а третьи – совсем редко. Это, само собой, примитивное качественное описание, а количественным будет частотная характеристика распределения кластеров, их статистический вес в текстах. Когда такая функция получена, вы можете предположить, что чаще всего повторяются слова «царь», «бог», «маис», «жертва» и, к примеру, «зарезать». Сообщив о своих догадках компьютеру, отправляйтесь пить кофе, ибо теперь начнется долгий и муторный процесс: перестановка значений между словами, их идентификация и попытка на этой основе разобраться с предложенным текстом. Возможно, через пару часов или суток вы получите одну-единственную осмысленную фразу, что-то вроде: «царь… бог… маис… жертва». Пляшите – ведь это великое достижение! Теперь вам осталось только заполнить пропуски между словами (конечно, от фонаря) и прочитать: «Царь возблагодарил богов за щедрый урожай маиса и повелел принести им жертву».