Совместимость. Как контролировать искусственный интеллект (Рассел) - страница 185

Как это происходит? На основании чего мы направляем ход своих мыслей? Ответ заключается в том, что вычисление ценно лишь постольку, поскольку повышает качество ваших решений. Процесс выбора вычислений называется метарассуждением, что означает рассуждение о рассуждении. Как действия можно выбирать рационально, исходя из ожидаемой ценности, так и вычисления. Это так называемое рациональное метарассуждение[338]. Оно строится на очень простой идее:

Выполняйте те вычисления, которые обеспечат наибольшее ожидаемое повышение качества решения, и прекращайте их, когда затраты (выраженные во времени) превысят ожидаемое улучшение.

Вот и все. Никаких новомодных алгоритмов! Этот простой принцип обеспечивает эффективное вычислительное поведение применительно к широкому спектру задач, включая шахматы и го. Представляется вероятным, что наш мозг реализует похожий процесс, что объясняет, почему нам не нужно изучать новые алгоритмы рассуждения, привязанные к конкретной игре, всякий раз, как мы учимся играть в новую игру.

Разумеется, исследование дерева возможностей, вырастающего в будущее из нынешнего состояния, не единственный путь к решению. Часто более разумно двигаться ретроспективно от цели. Например, наличие лося на дороге предполагает цель избежать столкновения с лосем, что, в свою очередь, предполагает три возможных действия: резко повернуть налево, резко повернуть направо или ударить по тормозам. Не предполагаются такие действия, как обмен евро на фунты стерлингов или помещение черного камня в центр доски. Таким образом, цели оказывают на наше мышление прекрасный эффект фокусировки. Никакие современные игровые программы не используют это преимущество; на самом деле они в массе своей рассматривают все возможные допустимые действия. Это одна из (многих) причин того, что я не боюсь, что AlphaZero захватит мир.

Заглянем дальше

Предположим, вы решили сделать определенный ход на доске для игры в го. Прекрасно! Теперь вы должны совершить его на практике. В реальном мире для этого нужно протянуть руку к чаше с камнями, взять камень, расположить руку над выбранным местом и положить камень точно на обозначенную точку, спокойно или эмоционально, в зависимости от того, как это принято в го.

Каждая из этих стадий, в свою очередь, состоит из сложного взаимодействия команд восприятия и двигательного контроля, включающего мышцы и нервы руки и глаз. Пока вы тянетесь за камнем, нужно следить, чтобы тело не потеряло равновесие из-за смещения центра тяжести. Тот факт, что вам не нужно участие сознания для выбора этих действий, не означает, что они не выбираются вашим мозгом. Например, в чаше может быть много камней, но ваша рука — на самом деле ваш мозг, обрабатывающий сенсорную информацию, — все равно должна выбрать, какой из них взять.