Совместимость. Как контролировать искусственный интеллект (Рассел) - страница 186

Практически все, что мы делаем, устроено подобным образом. Когда мы ведем машину, мы можем выбрать перестроиться в левый ряд, но это действие включает несколько других: посмотреть в зеркало и налево через плечо, иногда скорректировать скорость и повернуть рулевое колесо, одновременно следя за ходом маневра, пока он не будет завершен. Во время разговора обыденный ответ, например «хорошо, я сверюсь с календарем и перезвоню вам», предполагает произнесение 16 слогов, каждый из которых требует нескольких сотен точно скоординированных команд двигательного контроля мышцам языка, губ, челюсти, гортани и органов дыхания. Когда вы говорите на своем родном языке, это автоматический процесс, что очень похоже на выполнение вспомогательных подпрограмм компьютерной программы. То, что эти сложные последовательности действий могут стать обыденными и автоматическими, выступая в роли единых действий в еще более комплексных процессах, является фундаментальной характеристикой человеческой когнитивной системы. Если приходится произносить слова на языке, которым хуже владеешь, — например, спрашивая дорогу на Шебжешин по-польски, — то вспоминаешь о том периоде жизни, когда чтение и письмо были сложными задачами, требующими мыслительных усилий и большой практики.

Итак, реальная задача, стоящая перед вашим мозгом, состоит не в выборе хода на доске для го, а в отправке команд двигательного контроля мышцам. Если переключить внимание с уровня ходов го на уровень команд двигательного контроля, проблема выглядит совершенно иначе. Человеческий мозг может посылать команды примерно каждые 100 мс. У нас примерно 600 мышц, следовательно, теоретический максимум составляет около 6000 выполнений действий в секунду, 20 млн в час, 200 млрд в год, 20 трлн за всю жизнь. Используйте их мудро!

Допустим, мы пытаемся применить алгоритм типа AlphaZero для решения проблемы принятия решения на этом уровне. Играя в го, AlphaZero смотрит вперед ходов на 50. Однако 50 шагов команд двигательного контроля дают вам всего несколько секунд проникновения в будущее! Недостаточно для 20 млн команд двигательного контроля в ходе часового матча в го и совершенно точно слишком мало для триллиона (col1¦0¦) шагов, совершаемых в процессе написания диссертации на соискание степени PhD. Таким образом, хотя AlphaGo заглядывает в партию го дальше любого человека, эта способность, похоже, не помогает в реальном мире. Это не та возможность заглянуть вперед, что нам нужна.

Я, разумеется, не утверждаю, что для написания диссертации необходимо заранее спланировать триллион мышечных действий. Сначала составляются лишь весьма абстрактные планы: скажем, выбор университета в Беркли или другом месте, выбор научного руководителя или темы исследования, обращение за финансированием, получение студенческой визы, переезд в выбранный город, проведение исследований и т. д. Чтобы сделать выбор, вы просто размышляете необходимое количество времени, пока решение не станет ясным. Если выполнимость некоторых абстрактных шагов, скажем, получения визы, неясна, вы еще думаете, возможно, собираете информацию, то есть делаете план более конкретным в деталях: это может быть выбор типа визы, на который вы имеете право, сбор необходимых документов и подача заявления. На рис. 17 показан абстрактный план и уточнение шага «Получить визу» из трех шагов. Когда наступает время выполнять план, его начальные шаги должны быть уточнены по всей цепочке вплоть до примитивного уровня, чтобы ваше тело могло их осуществить.