В области машинного обучения преимущества медленных перемещений наиболее очевидно проявляются в технике регуляризации, которая получила название ранняя остановка. Когда мы обсуждали данные исследования удовлетворенности браком в Германии, мы сразу же перешли к изучению наиболее подходящих одно-, двух– и девятифакторной моделей. Во многих ситуациях тем не менее настройка параметров для нахождения модели, наиболее подходящей для имеющейся информации, сама по себе становится процессом. Что же произойдет, если мы остановим этот процесс раньше и просто не дадим модели времени, чтобы стать слишком сложной? Опять же, то, что на первый взгляд может показаться неточным и невыверенным, наоборот, становится самостоятельной важной стратегией.
Многие прогнозирующие алгоритмы, к примеру, начинаются с поиска наиболее важного фактора, а не с перехода на многофакторную модель. Лишь после нахождения этого первого фактора они приступают к поискам второго важного фактора, чтобы добавить его в модель, затем ищут следующий и т. д. Их модели можно легко оставить простыми, прекратив этот процесс прежде, чем в игру вступит переподгонка. Похожий подход к прогнозированию рассматривает одну точку данных за раз, при этом модель настроена таким образом, что отчет по каждой новой точке выдается до добавления новых точек данных. В этом случае сложность модели также возрастает постепенно, поэтому избежать переподгонки поможет только своевременная остановка этого процесса.
Такая установка – когда больший временной отрезок прибавляет сложности – характеризует множество стремлений человека. Отводя больше времени на размышление, вы вовсе не гарантируете себе принятие наиболее правильного решения. Однако вы гарантированно будете рассматривать большее количество факторов, больше предположений, больше аргументов «за» и «против» и рискуете столкнуться с переподгонкой.
У Тома был именно такой опыт. Во время своего первого семестра в качестве преподавателя университета он тратил много времени на совершенствование своих лекций – более 10 часов подготовки к каждому часу занятий. Во втором семестре, преподавая у другой группы, он уже не мог отводить столько времени на подготовку и волновался, что дело кончится полным провалом. Однако случилась странная вещь: студентам понравились эти занятия. В сущности, они понравились им гораздо больше, чем лекции первого семестра. Как выяснилось, дело было в том, что Том использовал свой собственный взгляд и суждения в качестве показателей суждений своих студентов. Эта система показателей работала достаточно хорошо в качестве приблизительной оценки, но она не была достойна переподгонки, что объясняло, почему дополнительные часы, потраченные на кропотливое совершенствование материалов, оказались контрпродуктивными.