Книга о странном (Киви) - страница 85

Пионером здесь стала британская интернет-компания Autonomy, для интеллектуального поиска информации созданная математиком (и ныне миллиардером) Майком Линчем. Программное обеспечение Autonomy, построенное на базе байесовых оценок, позволяет компьютерам «понимать» содержание неструктурированной информации, такой как текстовые участки веб-страниц или электронная почта. Например, с помощью байесовского аппарата по контексту достаточно элементарно подбирается нужная информация о реке Амазонке, а не о мифических племенах воинственных женщин или об онлайновом супермагазине с тем же названием Amazon. Просто по той причине, что контекст документа будет включать упоминания о джунглях, деревьях и Южной Америке.

Лежащая в основе Autonomy технология DRE (Dynamic Reasoning Engine) по сути дела сводит воедино вероятностные методы Томаса Байеса и труды Клода Шеннона по теории информации. Формулы Байеса связаны с вычислением вероятностных связей между многими переменными и определением их взаимовлияния. Используя эту технику и компьютерные мощности, удается выявлять связи между различными элементами информации. Поняв основной смысл текста (или другого информационного носителя), система Autonomy приступает к следующему шагу и использует теорию Шеннона, согласно которой чем менее часто встречается информация, тем она более информативна.

Майк Линч с редкостным апломбом любит заявлять, что «лишь 10 человек в мире знают, как все это (байесовы оценки) применять, причем треть таких людей работает на меня». Вряд ли стоит воспринимать слова математика-предпринимателя всерьез, скорее это так – работа на публику и раздувание щек, что называется, бизнеса ради. Байесовский математический аппарат разработан сейчас весьма мощно, и технологии на его основе применяются во множестве других компаний.

Например, корпорация Oracle использует теорию Байеса в своем новом ПО для баз данных, где с ее помощью выявляются характерные тенденции в сложных массивах данных, а также вносится столь популярная ныне «персонализация» в маркетинговые кампании. В корпорации Microsoft этот же статистический аппарат заложен в программы выявления неполадок в новой ОС WinXP, а еще ранее – был использован при создании для пакета MS Office столь доставшего всех своими ненужными советами «мистера Скрепки» (Mr Clippy). Этого надоедливого мультяшного субъекта, как известно, впоследствии задвинули подальше, дабы не раздражать без нужды клиентов. Впрочем, научному авторитету Томаса Байеса суетливый «Скрепыш» вряд ли нанес хоть какой-то урон.