Совместимость. Как контролировать искусственный интеллект (Рассел) - страница 193

Допустим, я играю в настольную игру «Монополия» со своим сыном Джорджем. Моя фишка попадает на «Посещение», а Джорджу принадлежит желтый набор, имущество которого находится в 16, 17 и 19 полях от «Посещения». Следует ли ему купить дома для желтого набора сейчас, чтобы мне пришлось платить ему завышенную арендную плату в случае попадания на эти поля, или лучше подождать следующего круга? Это зависит от вероятности выпадения поля из желтого набора в нынешнем круге.

Вот правила бросания костей в «Монополии»: выбрасываются две кости, и фишка передвигается в соответствии с выпавшей суммой; при выпадении дублей игрок снова бросает кости и делает ход; если вторично выпадают дубли, игрок бросает кости и ходит в третий раз (однако, если и третий бросок оказывается дублем, игрок отправляется в тюрьму). Итак, я могу выбросить, скажем, 4–4, затем 5–4, всего 17, или 2–2, затем 2–2, затем 6–2, всего 16. Как и прежде, я просто складываю вероятности всех миров, в которых попадаю на желтое. К сожалению, таких миров много. В общей сложности, можно выбросить до шести костей, и миры исчисляются тысячами. Более того, броски уже не независимы, поскольку второго броска не будет, если первый не окажется дублем. В то же время если зафиксировать ценность первой пары костей, то ценность второй пары будет независимой. Можно ли учесть подобную зависимость?

Байесовы сети

В начале 1980-х гг. Джуда Перл предложил формальный язык под названием Байесовы сети, который позволяет во многих ситуациях реального мира отображать вероятность очень большого числа результатов в очень сжатой форме[353].



На рис. 18 представлена Байесова сеть, описывающая бросание костей в «Монополии». Единственные вероятности, которые нужно подставить, это равные 1/6 вероятности выпадения значений 1, 2, 3, 4, 5, 6 в отдельных бросках кости (D1, D2 и т. д.), а именно — 36 номеров вместо нескольких тысяч. Для объяснения точных значений сети нужна кое-какая математика[354], но основная мысль состоит в том, что стрелки обозначают отношения зависимости — например, значение Дубли12 зависит от значений D1 и D2. Аналогично значения D3 и D4 (следующий бросок двух костей) зависят от Дубли12, потому что если Дубли12 имеет значение ложно, то D3 и D4 равны 0 (то есть отсутствию следующего хода).

Как и в случае пропозиционной логики, существуют алгоритмы, способные ответить на любой вопрос по любой Байесовой сети, для которой имеются данные. Например, мы можем спросить, какова вероятность попадания на желтое, которая, оказывается, составляет около 3,88 %. (Это значит, что Джордж может подождать, прежде чем покупать дома для желтого набора.) Мы можем задать чуть более амбициозный вопрос о вероятности события