Тем не менее алгоритмы, заточенные под стандартную проблему многорукого бандита, пригождаются и в беспокойном мире. Такие методы, как индекс Гиттинса или верхний доверительный предел, предлагают довольно верные решения, особенно если выигрыш не слишком меняется с течением времени. А большинство выгод в этом мире сегодня гораздо более статичны, чем когда-либо были. Горсть ягод будет спелой неделю, а потом сгниет, но, как сказал Энди Уорхол, «кола – это кола». Инстинкты, заложенные эволюцией для жизни в постоянном течении, не всегда окажутся нужными в эпоху промышленной стандартизации.
Производные понятия от классической формы проблемы – баланс между исследованием и эксплуатацией, важность интервала, высокая стоимость варианта 0: 0, минимизация сожалений – вкладывают новый смысл не только в задачи, с которыми нам приходится сталкиваться, но и во всю нашу жизнь.
Хотя лабораторные исследования могут быть поучительными и красноречивыми, большинство важнейших задач, которые нам приходится решать, весьма далеки от них. И изучение структуры окружающего нас мира, и формирование прочных социальных связей – пожизненные проекты. Так что весьма поучительно будет понаблюдать, как общая картина раннего исследования и поздней эксплуатации выглядит на протяжении всей жизни.
Один любопытный факт человеческого существования, который стремится понять и объяснить любой психолог, заключается в том, что нам требуются многие годы, чтобы стать опытными и независимыми. Карибу и газели должны быть готовы убегать от хищников с первого дня жизни, в то время как человеку требуется почти год, чтобы сделать первый шаг. Элисон Гопник, профессор психологии Калифорнийского университета в Беркли и автор книги «Ученый в колыбели», объясняет, почему у людей такой длительный период зависимости: «…это дает нам пройти полный путь развития в решении конфликта между исследованием и эксплуатацией». Как мы могли убедиться, хорошие алгоритмы игры с многорукими бандитами, как правило, склоняют нас на раннем этапе больше к исследованию, а на позднем – к эксплуатации полученных знаний. Но, как пишет Гопник, «существенный недостаток в том, что вы не получите хороший барыш, находясь на стадии разведки». Поэтому детство «дает нам период просто исследовать возможности и не беспокоиться о выгоде, потому что об этом побеспокоятся мамы и папы, бабушки и няни».
Думать о детях как о находящихся на переходном этапе разведки жизненного алгоритма может быть утешительно для родителей дошкольников. (У Тома две дочери дошкольного возраста, и он надеется, что они следуют алгоритму минимизации сожалений.) Но это также дает возможность взглянуть по-новому на рациональность детей. Гопник пишет: «Если вы понаблюдаете за тем, как люди воспринимают детей, станет ясно, что дети совершенно не приспособлены к жизни: если посмотреть на их практические навыки, то вы ужаснетесь. Они не могут завязать шнурки, не имеют понятия о долгосрочном планировании, не умеют долго фокусировать внимание. Это все у детей действительно выходит ужасно». Но беспорядочно жать на кнопки, живо интересоваться новыми игрушками, мгновенно переключаться с одного на другое детям удается отлично. И это именно то, чем они и должны заниматься, если их цель – исследование. Если вы младенец, то засовывать в рот каждый предмет в доме – это все равно что дергать в целях изучения за все рычаги в казино.