Существует множество реальных событий, заслуживающих похвалы, подкрепления, которым щедро обмениваются в счастливых семьях. Однако фальшивая или незначимая награда вскоре вызывает негодование даже у маленьких детей и теряет всякую силу в качестве подкрепления. Можно выработать и условное отрицательное подкрепление, которое может быть очень полезным. Дети и многие животные часто моментально реагируют на резкое, громкое слово запрета, которое ничем не сопровождается. Возможно, оно является первичным или безусловным подкреплением. Но некоторые животные — особенно этим славятся кошки — игнорируют окрики и брань. Одна моя подруга совершенно безуспешно пыталась отучить свою кошку царапать кушетку, используя в качестве отрицательного подкрепления возглас «Нет!». Однажды в кухне она уронила большой латунный поднос, случайно упавший почти рядом с кошкой, и, когда раздался громкий грохот подноса, воскликнула: «Нет!». Кошка была страшно напугана, подпрыгнула вверх, подняв шерсть дыбом. В следующий раз, когда кошка начала драть кушетку, хозяйка крикнула: «Нет!», у кошки сделался испуганный вид, и она тотчас же перестала. Двух-трех повторений ставшего условным слова оказалось достаточно, чтобы навсегда прекратить это поведение.
Бытует неправильный взгляд, что если вы начали вырабатывать поведение с помощью положительного подкрепления, то должны продолжать его применение на протяжении всей дельнейшей жизни субъекта, если этого не будет, то поведение исчезнет. Это неверно: постоянное подкрепление необходимо только на стадиях обучения. Вы можете несколько раз вознаградить годовалого ребенка за пользование горшком, но как только поведение заучено, предмет обучения сам о себе позаботится. Мы даем или должны давать начинающему множество подкреплений — обучение ребенка езде на велосипеде идет под настоящий поток: «Правильно, крепче держи руль, у тебя получилось, хорошо!» Но вы будете выглядеть довольно глупо (а ребенок решит, что вы сошли с ума), если вы будете продолжать хвалить его после того как навык установился. Для того чтобы поддерживать уже выученное поведение на определенном уровне надежности, не только не надо подкреплять его все время, а даже, наоборот, следует прекратить регулярные подкрепления и перейти на эпизодическое использование подкрепления, подаваемого в случайном и не предсказуемом порядке. Это и есть то, что психологи называют вариабельным режимом подкрепления.
Вариабельный режим гораздо более эффективен для поддержания поведения, чем постоянный, предсказуемый. Один психолог объяснил это мне так: если у вас машина новая и всегда хорошо заводилась, а однажды, когда вы сели в нее, повернули ключ, она не завелась, то вы, может быть, и попробуете завести ее еще несколько раз, но скоро решите, что что-нибудь не в порядке, и позвоните в гараж. Поведение, состоящее в поворачивании ключа, при отсутствии ожидаемого немедленного подкрепления быстро угаснет. С другой стороны, если у вас вместо машины старая консервная банка, которая еще ни разу не заводилась с первой попытки, и каждый раз требуется целая вечность для того, чтобы привести ее в движение, вы можете продолжать попытки ее завести в течение получаса; ваше поведение по поворачиванию ключа происходит в низковероятностном режиме подкрепления и поэтому сильнейшим образом поддерживается. Если давать дельфину рыбку за каждый прыжок, то скоро прыжки станут невысокими, небрежными, лишь бы отделаться. Если теперь перестать давать рыбу, дельфин тут же перестает прыгать. Но, если после того как животное научилось прыгать за рыбку, начать подкреплять первый прыжок, затем третий и так далее наугад, поведение будет поддерживаться на более высоком уровне: не получив подкрепления, животное станет прыгать чаще, стараясь угадать счастливый номер, и прыжки могут даже усилиться. В свою очередь это позволит подкреплять выборочно наиболее сильные прыжки, — то есть посредством вариативного режима совершенствовать деятельность. Но даже некоторые профессиональные дрессировщики не могут правильно использовать вариативный режим положительного подкрепления; многим эта концепция представляется особенно трудной, не укладывающейся в голове. Нам понято, что нет нужды продолжать наказывать за неправильное поведение, если оно прекратилось, но почему бы не вознаграждать постоянно за правильное поведение.