Работа с данными в любой сфере (Еременко) - страница 106

Например, для машины D2 ожидаемый выигрыш будет рассчитываться как:

(25 % × $1) + (75 % × $0) = $0,25.

Самый простой способ прикинуть размер ожидаемого выигрыша таков: если вы долго играете на машине D2, а затем усредняете свои результаты по количеству игр, то теоретически среднее значение, которое вы вычисляете, должно быть равно $0,25. В сущности, ожидаемый выигрыш – это ваш теоретический средний выигрыш.

Чем выше ожидаемый выигрыш машины, тем больше у вас шансов выиграть на ней, и наоборот. Ожидаемый выигрыш для всех пяти машин указан на рис. 7.2. В качестве быстрого упражнения проверьте правильность вычислений.



Опять же, эти распределения и ожидаемый выигрыш представлены здесь в качестве примера. Если бы мы заранее знали ожидаемый выигрыш, то пошли бы прямо к пятой машине и постоянно делали ставки на ней, так как в среднем получили бы наилучшие результаты. Реальность такова, что мы сможем узнать этот ожидаемый выигрыш (или приблизиться к его нахождению) только в процессе игры.

Это одна из удивительных сторон науки о данных, и именно поэтому задача о «многоруком бандите» – одна из моих любимых. Разработка лучших решений и построение массива данных для них путем проб и ошибок, исследования и использования напоминают мне о тех методах, которые Алан Тьюринг и команда Блетчли-парка использовали для нахождения кода шифра. В мире бизнеса эти методы часто используются в онлайн-рекламе и маркетинге для тестирования реакции потребителей на различные варианты плакатов, созданных для рекламирования одного продукта.

Машины тоже рискуют

Наша цель при решении задачи о «многоруком бандите» – найти и использовать лучший игровой автомат, а также потратить наименьшее количество времени (и денег) на изучение всех вариантов. Поскольку мы не знаем заранее, какой из «бандитов» лучший, мы получаем то, что известно в математике как риск. По существу, риск – это то, что происходит в ходе эксперимента, когда мы используем неоптимальные методы. В случае с нашими игровыми автоматами в Вегасе игра на неоптимальных машинах сопряжена с риском, определяющимся количественно как разница между оптимальным и неоптимальным результатами. С практической точки зрения риск представляет собой альтернативные издержки изучения игровых автоматов, которых нам удалось бы избежать только с помощью магии. Чем дольше вы исследуете неоптимальные варианты, тем выше риск.

Риск перестает накапливаться, когда мы находим оптимальную машину. Тем не менее существует опасность того, что если мы не будем исследовать все пять «бандитов» достаточно долго, то неоптимальная машина может показаться оптимальной – и из-за нашей спешки риск будет нарастать. Поэтому важно потратить время на изучение, прежде чем переходить к каким-либо выводам. На примере наших пяти распределений мы видим, что D4 также достаточно хороший игровой автомат для получения прибыли. Однако он не является оптимальным. Если бы мы не знали об этих распределениях вероятностей выигрыша и сначала должны были бы исследовать машины, не полностью изучив все пять вариантов, ожидаемый выигрыш от D4, маскирующейся под оптимальный автомат, мог бы ввести нас в заблуждение. Конечно, мы бы продолжали получать деньги, и определенно больше, чем могли бы заработать на машинах 1, 2 и 3, но это был бы не лучший результат из возможных.