6905

Нужны ли теории научения

Научная статья

Психология и эзотерика

Нужны ли теории научения В своей работе 1950 г. Скиннер задался вопросом - Нужны ли теории научения? и предположил, что нет. Он определил понятие слова теория. Оно означало "любое объяснение наблюдаемого факта, апеллирующее к событиям, происх...

Русский

2013-01-09

652.5 KB

9 чел.

Нужны ли теории научения

В своей работе 1950 г. Скиннер задался вопросом – Нужны ли теории научения? и предположил, что нет. Он определил понятие слова "теория". Оно означало "любое объяснение наблюдаемого факта, апеллирующее к событиям, происходящим где-то еще, на другом уровне наблюдения, описанным в иных терминах, и измеренным – если измеренным вообще – на основании других параметров" – например, это события в нервной системе, понятийной системе, в сознании. Скиннер утверждает, что теории такого типа не стимулировали хороших исследований в области научения, зато извращали факты, предлагая фальшивые убеждения о состоянии человеческого знания, и вели к использованию методов, от которых следовало отказаться.

Ближе к концу статьи Скиннер обозначил "возможность теории в другом смысле" – как критики методов, данными понятий науки о поведении. Он указывает, что, хотя теоретизирование может вести к новым ожиданиям, это само по себе не достоинство, если эти ожидания не оправдываются. И, хотя есть вероятность того, что кто-то в конце концов выйдет с работоспособной теорией, дающей корректные объяснения, это может произойти после долгих лет проверки непродуктивных теорий различными тривиальными способами. Любая новая ситуация при всех случаях будет исследована, так что действительно нет нужды в теоретизировании. Поведение такой ситуации неизбежно будет приведено к системе, в отсутствие теории.

Холл К.С., Линдсей Г. “Теории личности”

Некоторые базовые допущения, характерные для любой научной деятельности, иногда называются теориями. Пример: природа скорее упорядочена, чем основана на случайности. Некоторые утверждения также относятся к теории на том простом основании, что они пока еще не факты. Ученый может догадаться о результате эксперимента до того, как его осуществил. Предсказание и последующее формулирование результатов может быть построено в тех же терминах и в той же синтаксической аранжировке, и различие заключается в степени уверенности. В этом смысле никакое эмпирическое положение не является абсолютно нетеоретическим в том смысле, что оно никогда не является исчерпывающим, как никакое предсказание не делается абсолютно без данных. Здесь термин "теория" будет относиться не к положениям такого типа, а скорее к объяснению наблюдаемого факта, который апеллирует к событиям, происходящим где-то еще, на ином уровне наблюдения, описанным в иных терминах и измеренных, если это вообще имело место, на основе других показателей.

Три типа теории в сфере научения соответствуют этому определению. Наиболее типичную мы находим в области психофизиологии. Все мы знаем об изменениях, которые, как предполагается, происходят в нервной системе, когда организм научается. Создаются и разрушаются синаптические связи, нарушаются и восстанавливаются электрические поля, накапливаются или уменьшаются концентрации ионов и т.д. Такие утверждения в нейропсихологии не обязательно являются теориями в настоящем смысле. Однако в бихевиоризме, где мы в любом случае рассматриваем, например, выделяет ли организм слюну на звонок колокольчика или реагирует на серый треугольник, или, например, издает «бик», когда видит карту туз, или же любит кого-нибудь, кто напоминает ему мать, все утверждения относительно нервной системы являются теориями в том смысле, что они не выражены теми же терминами и не могут быть подвержены теми же методами наблюдения, что и факты, которые они должны объяснить.

Второй тип теории научения на практике не далек от физиологического, хотя здесь меньше согласия по поводу метода прямого наблюдения. Теории такого типа всегда доминировали в сфере человеческого поведения. Они ссылаются на «психические» явления, говоря, что организм научается вести себя определенным образом, поскольку он «находит что-нибудь привлекательным» или потому, что он «ожидает, что что-нибудь произойдет». Для психолога-менталиста такие поясняющие явления не более теоретичны, чем для нейрофизиолога синаптические связи, однако для бихевиориста они являются теориями потому, что методы и термины, подходящие для объясняемых явлений, отличаются от методов и терминов, подходящих объясняемым явлениям.

В третьем же типе теории научения поясняемые явления непосредственно не наблюдаются. Авторское предложение о том, что аббревиатура ЦНС расшифровывается не как Центральная Нервная Система, а как Концептуальная Нервная Система, похоже, было принято всерьез (в начало). Многие теоретики указывают на то, что они говорят о нервной системе не как о реально существующей структуре, притерпивающей физиологические и биохимические изменения, а только лишь как о системе с определенной динамической результативностью. Число таких теорий очень быстро растет, как и аналогичные действующие версии психических явлений. Просто  определение экспектаций в бихевиоризме имеет преимущество в том, что проблема наблюдения за психикой избегается, а вместе с ней избегается и проблема того, ка́к психическое явление может являться причиной физического явления. Но такие теории не доходят так далеко, чтобы утверждать, что поясняющие явления идентичны  поведенческим фактам, которые те пытаются объяснить. Утверждения о поведении могут подтверждать такую теорию, но они никогда не будут схожи с ней в терминах и синтаксической аранжировке. Хорошим примером этого являются постулаты. Верные постулаты не могут быть фактами. Теоремы же могут быть выведены из них (постулатов), которые будучи экспериментальными утверждениями о поведении, могут или не могут быть подтверждены, однако теоремы не являются теориями в настоящем смысле слова. Постулаты же остаются теориями до конца.

Целью данной работе не является попытка показать, что любая из этих теорий не может быть приведена в хороший научный порядок, или же что события, к которым они обращаются, на самом деле, не могут произойти, или не могут быть изучены ответствующими науками. Было бы безрассудно отрицать достижения теорий такого роды в истории науки. Однако вопрос об их необходимости имеет другой смысл и поэтому стоит это спросить. Если ответ «нет», то тогда можно поспорить с теорией в сфере научения. Ведь бихевиоризм, в конечном счете, должен иметь дело с поведением, в его отношении к определенного рода переменным, поддающимся различным манипуляциям. Теории – будь то нервные, психические или же концептуальные – говорят о прошедших действиях в таких отношениях. Но вместо того, чтобы помочь нам найти и исследовать релевантные переменные, они весьма часто имеют обратное воздействие. Ведь, когда мы приписываем поведение нервному или психическому событиям, реальному или концептуальному, мы склонны забывать, что до сих пор перед нами стоит задача вычислить эти нервные или психические события. А когда мы утверждает, что животное ведет себя заданным образом лишь потому, что ожидает получить еду, то тогда задача вычисления наученного поведения становиться задачей вычисления ожидаемого поведения. Однако, проблема-то, по крайней мере, одинаково сложна, а возможно даже и более трудна. Но мы склонны закрывать на это глаза и использовать теорию для получения одних ответов вместо других – тех, которые бы мы могли получить при дальнейших исследованиях. По этому поводу можно высказать утверждение, что основной функций теории научения было не предлагать подходящее исследование, а создавать ложное чувство безопасности, а так же негарантированную уверенность статусом кво (status quo).

Вероятно, также и исследование, разработанное в рамках теории, будет расточительным. Ведь то, что теория позволяет проводить исследование, еще не доказывает ее ценность, поскольку само исследование не является ценным. Более же бесполезными являются и результаты экспериментов поставленных на основе теории, и уж не стоит говорить о том, сколько сил и умений было на них потрачено. В конечном счете, большинство теорий уже давно опровергнуто, а от большей части исследований, связанных с ними, отказались. Все это могло бы быть оправданно, если бы правильным являлось то, что плодородному исследованию необходима теория, а как раз таки это зачастую и требуется. Ведь существует утверждение, что исследование было бы бесцельным и дезорганизованным без теории, регулирующей ее. Такой взгляд поддерживается рядом психологических текстов, которые берут свои высказывания из логических, а не эмпирических наук, а так же описывают размышления как необходимый этап, входящий в состав гипотезы, вывода (заключения), экспериментального испытания и подтверждения. Но это не то направление, в котором работает большинство ученых. Ведь можно создать значимый эксперимент для других целей, а возможность быть изученным означает то, что такое исследование приведет непосредственно к такому роду информации, которую наука обычно аккумулирует.

По крайней мере стоит рассмотреть альтернативы. Например, сколько может быть сделано без теории? Какие еще возможны виды научной деятельности? И какой свет проливают эти альтернативные методы на  нашу теперешнюю озабоченность теорией?

Было бы противоречивым пытаться ответить на эти вопросы на теоретическом уровне. Поэтому позвольте нам обратиться к некоторым экспериментальным данным (полученным в тех различных областях, в которых на данный момент процветает теория научения) и рассмотреть вопрос о функции теории.

Базовые показатели в научении.

То, что в действительности происходит, когда организм научается – это не простой вопрос. Приверженцы бихевиоризма будут настойчиво утверждать, что процесс научения – это изменение в поведении, но они склонны избегать прямых ссылок на реакции или действия как таковые. «Научение – это приспособление или адаптация к ситуации?» Но из чего складываются эти приспособления и адаптации? Они данные, или являются умозаключениями из данных? «Научение – это совершенствование». Но совершенствование чего? И с чьей точки зрения? «Научение – это восстановление равновесия». Но что находится в равновесии, и каково его место? «Научение – это решение проблем». Но каковы физические измерения: проблема или решение проблемы? Определения такого типа показывают нежелание принять за основные данные то, что наблюдается в эксперименте научения. Отдельные наблюдения кажутся слишком банальными. Количество ошибок уменьшается, но мы не можем сказать, что это и есть научение, а не просто результат научения. Организм сталкивается с критерием десяти успешных испытаний; но случайный критерий находится в разногласии с нашей концепцией всеобщности процесса научения.

Это та стадия, где возникает теория. Если в процессе научения изменялется не время, требуемое, чтобы выбраться из коробки Торндайка, а сила связей, или проводимость нервных путей, или эксцитарный потенциал привычки, то тогда кажется, что проблемы исчезают. Нахождение выхода все быстрее и быстрее не является научением; это только исполнение. Научение продолжается где-то еще в другом месте, в другой системе измерения. И хотя требуемое время зависит от случайных условий, оно часто изменяется дискретно, и подвержена изменению велечины, мы чувствуем уверенность, что сам процесс научения продолжителен, упорядочен, и находится вне системы измерений. Ничего лучше не может проиллюстрировать испытание, чем отход от данных.

Но мы в конечном счете должны вернуться к наблюдаемым данным. Если научение это процесс, – а мы предполагаем, что это так – то оно и должно так проявится в ситуациях, когда мы его изучаем. Даже если основной процесс принадлежит другой системе измерения, то наши измерения должны обладать релевантными и сопоставимыми свойствами. Но трудно найти продуктивные экспериментальные ситуации, особенно если мы принимаем ряд некоторых вероятностных ограничений. Недостаточно лишь только показать систематические изменения в поведении среднестатистической крысы, или обезьяны, или ребенка, поскольку научение – это процесс индивидуального поведения. Недостаточно будет зафиксировать начало и конец научения или несколько дискретных шагов, т.к. серия поперечных срезов не может полностью охватить весь непрерывный процесс. Измерение изменений должны происходить непосредственно из поведения: они не должны быть навязаны поверхностными суждениями успеха или неудачи или внешним признаком завершенности. Но когда мы, имея в виду эти требования, делаем обзор литературы, то находим мало подтверждений теоретическому процессу, в котором мы так комфортно себя чувствуем.

Энергетический уровень или продуктивность поведения, например, не изменяются подходящим образом. В типе поведения, наблюдавшегося в эксперименте Павлова (ответная реакция), может прослеживаться постепенное усиление ответной реакции в процессе научения. Но мы ведь не выкрикиваем наши ответные реакции все громче и громче, когда учим языковой материал, так же и крыса не нажимает на рычаг все сильнее и сильнее, для того, чтобы условия повторились вновь и вновь. В оперантном поведении энергия или сила ответных реакций значительно изменяются только тогда, когда некоторое случайное значение дифференцированно подкрепляется – когда такое изменение является тем, чему научаются.

Появление желательных ответных реакций в противовес нежелательным ответным реакциям, является другой величиной, часто используемой при изучении научения. Лабиринт и ящик Скиннера дают результаты, которые могут быть сведены к этим терминам. Но соотношение желательности к нежелательности в поведении не может привести к постоянно изменяющейся величине в отдельном эксперименте на отдельном организме. Точка, в которой одна ответная реакция превосходит другую, не может дать нам полную картину изменения в любой из этих ответных реакций. Вычисление среднего значения по кривым для нескольких опытов или организмов не решает эту проблему.

Все возрастающее внимание в последнее время было направлено к латентному времени реакции, значение которого, как и энергетического уровня, вызвано свойствами условных и безусловных рефлексов. Но в оперантном поведении, отношение к стимулам иное. Как показывает наблюдение за любым случаем, при определении величины латентного времени реакции принимаются во внимание другие соображения. Большинство оперантых ответных реакций могут проявиться в отсутствии того, что считается релевантным стимулом. В таком случае ответная реакция, вероятно, появится прежде, чем будет предъявлен стимул. Избежать такой преграды путем блокировки рычага так, чтобы организм не мог нажать на него пока не будет представлен стимул, не является решением, так как мы едва ли можем быть довольны временными отношениями, которые были заданы нами в соответствии с нашими ожиданиями. Такое же возражение можно высказать по поводу протекания латентного периода. В типичном эксперименте дверь ящика открыта и измеряется время, которое проходит, прежде чем крыса покинет коробку (выберется). Открытие двери – это не только стимул, но и изменение ситуации, которое делает ответную реакцию впервые возможной. Измеренное время ни в коем случае не такое простое как латентное время реакции и требует другой формулировки. Многое зависит от того, что́ крыса делает в момент предъявления стимула. Некоторые экспериментаторы ждут до того пока крыса не столкнется с дверью, но поступать так, это значит вмешиваться в проводимые измерения. Если, с другой стороны, дверь открыта независимо от того, что делает крыса, то первым важным результатом будет создание благоприятных условий для ожидаемого поведения. В конечном счете, крыса остается вблизи перед дверью. В итоге, полученное более короткое время отсчета вызвано не благодаря сокращению латентного периода реакции, а благодаря созданию обусловливания благоприятного первоначального поведения.

Как можно научить голубя клевать в эту маленькую черную точку в середине белого диска, утопленного на стенке клетки? Когда голубь в первый раз помещается в коробку, то он только осматривается (А). Когда он смотрит в сторону диска (В), то получает подкрепление в виде еды через кормушку, расположенную под диском (С). Шаг за шагом, голубя награждают за то, что он просто смотрит на круг (D), но потом перестают до того момента, пока он не приблизится к диску (Е), а позже делают то же самое, но пока он не клюнет этот диск. Далее, аналогичным способом (не изображенным здесь) голубя научают клевать в черную точку в середине диска (комм. ред.).

Латентный период в отдельном организме не следует за простым процессом научения. Релевантные показатели на этот счет были получены как часть всестороннего изучения времени реакции. Голубь, запертый в ящике, обусловлен клевать диск, утопленный в одну из стен. Еда представляется как подкрепление, путем выставления кормушки через отверстие, расположенное ниже диска. Если ответные реакции подкрепляются только после предъявления стимула, то в остальное время ответные реакции исчезают. Очень короткое время реакции получено путем дифференцированного подкрепления ответных реакций, происходящих вскоре после стимула. Однако так же могут происходить очень быстро и без дифференцированного подкрепления. Наблюдение показывает, что́ это происходит из-за появления успешного эффективного ожидания. Птица становится перед диском готовая клюнуть При оптимальных условиях, без дифференцированного подкрепления, среднее время между стимулом и ответной реакцией будет примерно ⅓ сек. Но это не постоянный латентный период рефлекса, т.к. стимул является скорее подавляющим, чем побуждающим, но зато это прекрасный пример латентного периода, используемого при изучении научения. Дело в том, что эта величина не изменяется непрерывным или упорядоченным способом (систематически). Давая, например, птице больше еды, мы создаем такие условия, при которых она не всегда дает ответную реакцию. Но зато те ответные реакции, которые происходят, показывают приблизительно то же самое время реакции ан стимул (рис. 1, средний график). При угасании, что особенно интересно, наблюдается частичное угасание латентных периодов, т.к. отсутствие подкрепления создает эмоциональное обусловливание. Некоторые ответные реакции происходят быстрее, другие запаздывают, однако их наиболее общее значение остается неизменным (рис. 1, нижний график). Более длинные латентные периоды легко объясняются при наблюдении. Эмоциональное же поведение, примеры из которого будут приведены позже, вероятно происходит тогда, когда предъявляется сигнал готовности. Часто это не прекращается до того пока не будет предъявлен сигнал «вперед», и как результат – долгое время старта. Так же появляются случаи, когда птица вообще не дает ответных реакций в течении определенного времени. Если мы усредним большое число данных, от одной или нескольких птиц, то мы можем создать то, что будет выглядеть как постепенное удлинение латентного периода. Но данные для отдельного организма не показывают, что процесс непрерывен.

Другой элемент данных, который будет исследован – это интенсивность стимула при котором появляется ответная реакция. К счастью, здесь другая ситуация. Мы изучаем эту интенсивность путем разработки ситуации, в которой ответная реакция может быть свободно повторена, причем выбирается та ответная реакция (например, касание или нажатие на рычаг или ключ), которая может легко наблюдаться и быть подсчитанной. Ответные реакции могут быть записаны на полиграф, но куда более удобной формой является кумулятивная кривая, где интенсивность ответной реакции непосредственно читается по (как) наклону. Интенсивность, при которой в такой ситуации проявляется ответная реакция, ближе подходит к нашему сложившемуся убеждению относительно процесса научения. По мере того, как организм научается, уровень интенсивности возрастает. Но по мере того, как организм разучивается (например, при угасании), уровень интенсивности падает. Различные виды подавляющих стимулов могут быть связаны с управляемостью ответными реакциями с соответствующими изменениями в уровне интенсивности. Изменения в мотивации вызывают ощутимые изменения уровня. Такие же изменения вызывают явления, которые мы называем генерализованной эмоцией. Амплитуда, по которой интенсивность значительно изменяется, может быть настолько большой как примерно отношение 1000:1. В отдельном случае изменения в интенсивности к счастью не такие резкие, так что не имеет смысла усреднять результаты всех случаев. Это значение часто весьма устойчиво: у голубя интенсивность по четыре или пять тысяч ответных реакций в час, может быть сохранена без прерывания целых пятнадцать часов.

Уровень интенсивности процесса ответных реакций, очевидно, единственные показатели, которые значительно варьируются и в ожидаемом направлении при условиях, которые релевантны для «процесса научения». То мы склонны к принятию его как показателя силы связи эксцитарного потенциала и т.д., который мы так долго искали. Однако, однажды завладев таким эффективным показателем, мы можем ощутить небольшую потребность в любом теоретическом конструкте подобного вида. Прогресс в научной сфере обычно дожидается открытия подходящей зависимой переменной. Но пока такая переменна не была открыта, мы обращаемся к теории. Все эти понятия, которые так заметно фигурировали в теории научения, служили главным образом как субституты для получения эффективного и непосредственно наблюдаемого показателя, но как только этот показатель найден, то тогда остается мало оснований для их выживания.

Не случайно, что уровень интенсивности процесса ответных реакций является удачным показателем, потому что он особенно подходит для решения фундаментальной задачи бихевиоризма. Если мы должны предсказать поведение (а, возможно, и контролировать его), то мы должны работать непосредственно с вероятностью ответных реакций. Задача бихевиоризма – оценить эту вероятность и изучить условия, которые ее обуславливают. Сила связи, экспектаций, эксцитатного потенциала и т.д., несут представления о вероятности в наиболее доходчивой форме, но дополнительные свойства, предложенные этими терминами, препятствовали поиску подходящих показателей. Интенсивность процесса ответных реакций – это не величина вероятности, а единственный подходящий показатель в формулировке этих терминов.

Как подтверждают другие научные дисциплины могут, вероятность не легка в обращении. Мы хотим делать утверждения о вероятности возникновении отдельной ответной реакции в будущем, но ведь наши данные находятся в данный момент в форме частотности ответных реакций, которые уже произошли. Возможно, эти ответные реакции были похожи друг на друга и на предсказанную ответную реакцию. Но это поднимает бесконечную проблему единичной ответной реакции и видовой ответной реакции. Какую точно ответную реакцию мы должны принять во внимание в предсказании будущего случая? Конечно же, не ответные реакции, произведенные группой отдельных организмов, –  т.к. такой статистический показатель доставляет больше проблем чем может решить. Рассмотрение частоты повторных ответных реакций в особе требует что-то на подобие того, что было описано в экспериментальной ситуации.

Такое решение проблемы базового показателя основывается на точке зрения, что оперантное поведение – это, по существу, феномен эмиссии. Время ответной реакции и величина ответной реакции не подходят здесь как показатели, поскольку они не берут это в расчет. Такие понятия, применимые к области рефлексов, где все, кроме постоянного контроля, осуществляемого путем вызывания стимулов делает представление о вероятности ответных реакций тривиальным. Рассмотрим, например, случай с латентным временем реакции. В следствии нашей осведомленности с простыми рефлексами мы можем сделать вывод о том, что ответная реакция, вероятность возникновения которой наиболее высока, будет произведена более быстро. Но верно ли это? И что может означать слово «быстро»? Вероятность ответной реакции, так же как и ее предсказание, связана с моментом эмиссии. Это лишь точка во времени, но у нее нет временной величины латентного периода. Само же выполнение может занять время уже после того, как была дана ответная реакция. Но ведь и этот момент возникновения ответно реакции не имеет продолжительности. Поэтому, в самом признании эмиссионного характера ответной реакции и центрального значения вероятности ответной реакции как показателей, латентный период видится несоответствующим нашей нынешней задаче.

Различные возражения были высказаны в отношении использования степени процесса ответных реакций как базовой переменной. Например, такой подход, как может показаться, запрещает нам иметь дело со многими событиями, являющимся уникальными в жизни индивида. Мужчина, например, не решает во время карьерного роста жениться или же пытаться заработать миллион долларов, рискуя при этом погибнуть в «несчастном случае», и часто этого бывает достаточно, чтобы степень ответной реакции была значимой. Но ведь эти действия не являются ответными реакциями. Они не настолько уж и простые отдельные события, чтобы так легко поддаваться предсказанию. Если мы должны предсказать брак, успех, несчастные случаи и т.д. в чем-то большем, чем в просто статистических показателях, то мы должны иметь дело с более мелкими единицами поведения, которые приводят к этим единичным эпизодам и составляют их. Если эти составные части проявляются в повторяющейся форме, то представленное исследование может быть применено. В сфере же научения похожее возражение принимает форму вопроса: как представленное исследование может быть распространено на экспериментальные ситуации, в которых не возможно наблюдать частоты. Но это не значит, что в таких ситуациях нет научения. Понятие вероятности обычно экстраполируется на случаи, в которых не может быть применен частотный анализ. В области поведения мы создаем ситуацию, в которой частоты являются доступными как данные. Но ведь мы используем понятие вероятности при анализе и формулировании примеров, или же еще используем типы поведения, которые не являются восприимчивыми к такому анализу.

Другим возражением является то, что степень ответной реакции – это всего лишь набор латентных периодов, а, следовательно, и вообще не новый показатель. Неверность этого легко показывается. Когда мы измеряем время, протекающее между двумя ответными реакциями, то у нас нет сомнений по поводу того, что делал организм, когда мы завели часы. Мы знаем, что это было лишь выполнение ответной реакции. И это абсолютный ноль – немного отличающийся от произвольной точки, с которой латентный период начал измеряться. Свободное повторение ответных реакций приводит к ритмичному и периодическому показателю, сильно разнящегося с латентным периодом. Множество повторяющихся физических процессов предлагают похожее.

Мы не выбираем степень процесса ответной реакции в качестве базовой величины только из анализа фундаментальной задачи бихевиоризма. И последней попыткой было обращение к его достижению в экспериментальной науке. Материал, который там есть, предлагается как образец того, что может быть сделано. Должен отметить, что это не подразумевается как полная демонстрация, но он должен подтверждать тот факт, что когда мы владеем показателями, которые существенным образом отличаются, то мы маловероятно, что обратимся к теоретическим сущностям, содержащим понятие вероятности ответной реакции.

Почему возникает научение?

Мы можем определить научение как изменение в вероятности ответной реакции, но одновременно с этим, мы должны определить условия, при которых оно возникает. Для этого мы должны изучить некоторые независимые переменные, вероятность ответной реакции которых является функцией. И тогда здесь мы встречаемся уже с другим типом теории научения.

Эффективная лабораторная демонстрация Закона Сохранения (Low of Effect) может быть организованна следующим образом. Голубь, похудевший на 80% от его изначального веса, приучается к небольшой полукруглой клетке в виде амфитеатра, и кормится в течении нескольких дней из кормежки, которую экспериментатор предоставляет, открывая ручной выключатель. Демонстрация состоит в укреплении выбранной ответной реакции через соответствующее подкрепление едой. Например, наблюдая за клеткой через закрепленную на одной из стен шкалу, можно предоставлять еду всякий раз, когда голова голубя поднимается до определенной отметки. Эта отметка, в пределе в несколько минут, подымается все выше и выше, до тех пор, пока голубь не будет ходить по клетке с максимально поднятой головой. На другом примере, птица была обусловлена клевать мрамор, расположенный на полу амфитеатра. Этого можно добиться за несколько минут подкрепляя последовательные шаги. Первый раз еда предоставляется, когда птица просто двигается около мрамора, потом когда она уже смотрит вниз в направлении мрамора, позже – когда она двигает головой по направлению к мрамору, и, наконец, когда она клюет его. Любой, кто это видел, знает, что Закон Сохранения не является теорией. Он лишь просто определяет порядок осуществления действий для изменения вероятности выбранной ответной реакции.

Но, когда мы пытаемся сказать, почему подкрепление получило такой эффект, возникают теории. Cчитается, что научение имеет место из-за того, что подкрепление - приятное, удовлетворяющее, снижающее напряжение и т.д. Обратный процесс затухания объясняется аналогичными теориями. Если уровень реагирования изначально достигает высоких показателей из-за подкрепления, затем, прекращается, реакция наблюдается все реже и реже. Одна из общепринятых теорий объясняет это через доказательство того, что сконструированное состояние подавляет поведение. Это "экспериментальная ингибиция" или "реактивная ингибиция" должно быть приписано другой измерительной системе, т.к ничего на уровне поведения не является аналогичным в противопоставлении возбуждения и подавления. Степень реагирования равномерно возрастает благодаря одним операциям и снижается благодаря другим. Некоторые эффекты в общем интерпретируют как демонстрацию освобождения от подавляющих сил, но может интерпретироваться и  иными путями. Дисингибиция, к примеру это не необходимость раскрытия подавляющей силы, это м.б. и показатель дополнительной силы внесенной внешней переменной. Процесс спонтанного восстановления часто ссылается на поддержку понятия ингибиция и имеет альтернативное определение, кот будет приведено ниже.

Давайте оценим вопрос, почему в научении, имеет место возврат к некоторым данным. Поскольку обусловливание обычно слишком быстрый процесс, для того, чтоб его проследить, процесс же затухания представляет собой более удачный вариант. Число различных типов кривых постоянно получаемых от крыс и голубей получаются благодаря использованию предшествующего подкрепления. Определяя некоторые релевантные условия мы можем ту нишу, которая осталась для теоретических процессов.

Очевидно утверждение о том, что время между обусловливанием и затуханием имеет небольшую силу. Крыса живет слишком недолгую жизнь, в то время как голуби могут жить 10-15 лет и является идеальным объектом. Более пяти лет назад 20 голубей были научены клевать прозрачную кнопку, на которую проецировались сложные зрительные сигналы. Подкрепление зависимо от сохранения высокой и устойчивой степени процесса ответных реакций, а так же от удара клювом в особую деталь визуального сигнала. Эти птицы были выбраны для изучения способности сохранения. Они были перемещены в обычные условия, где, живя по четыре голубя в одной клетке, служили материалом для селекции. Некоторые группы были протестированы на затухание в конце 6 месяцев, одного года, двух лет и 4-х лет. Перед тестом каждая птица помещалась в отдельную клетку. Контролируемый график кормления позволил снизить их вес на 80%. Птица на протяжении нескольких дней питалась в тускло освещенном экспериментальном блоке без кнопки. В течение этого времени эмоциональные реакции на блок исчезли. В день испытания птица была помещена в затемненную коробку. Прозрачная кнопка была предоставлена, но не освещена. Никаких ответных реакций не было произведено. Когда же сигнал проектировался на кнопку, то все четыре птицы давали быструю и экстенсивную ответную реакцию. Рис. 2 показывает наибольшую полученную кривую. Эта птица клевала кнопку в пределах двух секунд после предъявления зрительного сигнала, которого она не видела четыре года, и клевала точно в то местно, на которое давалось дифференцированное подкрепление. Она продолжала давать ответные реакции в течение следующего часа, производя порядка 700 ответных реакций. Это составляет порядка 1/4 и 1/2 ответных реакций, которые бы она произвела, если бы угасание не было задержано на четыре года, но зато во всем остальном кривая на графике довольно типична.

Уровень мотивации является другой переменной, которая так же будет принята во внимание. Пример с эффектом голода был описан где-то в другом месте [3]. Ответная реакция нажатия на рычаг была установлена у восьми крыс с графиком периодического подкрепления. Они питались главным образом своим рационом по выбранным дням, так, чтобы степень процесса ответных реакций в последующие дня была поочередно высокой и низкой. У двух групп по четыре крысы, разделенных на основе их степени ответных реакций, было сохранено периодическое подкрепление при этих условиях. Таким образом, ответная реакция была угашена – в одной группе в выбранные дни, когда их не кормили и они были голодны; в другой – когда их кормили и они были не столь голодны как первая группа (было съедено такое же количество еды как и в неэкспериментальные дни). Результат показан на Рис. 3. Верхний график дает сырые данные. Уровень голода обозначен точками Р на абсциссе – степени, преобладающей в процессе периодического подкрепления. Последующие точки показывают спад при угасании. Если мы умножим самый низкий промежуток кривой на факторы, выбранные для максимального снижения значения точек Р, то полученная кривая, как видно на нижнем графике, будет довольно сильно опущена. Несколько других экспериментов на крысах и голубях так же подтвердили этот общий принцип. Если полученное соотношение процесса ответных реакций преобладает над периодическим подкреплением, то угол последующего угасания кривых показывают такое же соотношение. Уровень голода определяет наклон угасания кривой, а не ее кривизну.

Другая переменная – сложность процесса ответной реакции – особенно уместна, поскольку она была использована для проверки теории реакций угасания. Было предположено, что ответная реакция, требующая значительной энергии, вызовет более сильную ответную реакцию угасания, нежели простое ответное реагирование, и поэтому приведёт к быстрейшему угасанию. Теория говорит о том, что кривая угасания изменяется не только вследствие её наклона. Однако очевидно, что сложность процесса ответной реакции, действует точно так же, как и чувство голода, изменяя наклон. Некоторые исследования были проведены, однако не напечатаны. Голубь подвешивается в куртке, которая ограничивает его крылья и ноги, но оставляет его голову и шею свободными для ответной реакции на стимулы и пищу. Поведение голубя в данной ситуации весьма схоже с поведением птицы, свободно передвигающейся в экспериментальной коробке. Однако использование курточки имеет своим преимуществом то, что ответная реакция на стимул может быть облегчена или усложнена путём регулирования расстояния, которое птица должна преодолеть. В одном эксперименте эти расстояния были выражены в семи равных, но произвольных частях. На расстоянии 7 птица едва ли могла достичь стимула, на расстоянии 3 птица могла достичь стимула без какого-либо ощутимого вытягивания шеи. Периодическое подкрепление определило прямую линию, по которой предоставлялось возможным наблюдать эффект сложности путём быстрой смены местоположения во время эксперимента. Каждая из 5 записей на рисунке 4 охватывает 15-ти минутный экспериментальный период с периодическим подкреплением. Расстояния между птицей и стимулом представлены в виде чисел над записями. Было отмечено, что уровень ответной реакции на расстоянии 7 в общем принципиально низок, в то время как уровень ответной реакции на расстоянии 3 высок. Средние расстояния дали средние наклоны кривых. Также стоит отметить, что изменения при переходе от одной позиции к другой ощущаются сразу же. Если повторяющаяся ответная реакция в сложной ситуации реагирования должно было привести к значительной ответной реакции угасания, то следовало бы ожидать, что уровень ответной реакции понизится при прошествии некоторого времени и возвратится к простым ответным реакциям. И,  наоборот, если простая ответная реакция должна привести к меньшей ответной реакции угасания, то следовало бы ожидать более высокого уровня ответных реакций по прошествии некоторого времени. Ничего похожего не возникает. Более «быстрое угасание сложных ответных реакций» является довольно-таки смутным вопросом. На постоянный наклон что-то воздействует, однако влияния  на кривую может и не быть.

Одним из путей решения вопроса, почему изменяется угасание, является признание того, что угасание – это процесс истощения, сравнимый с потерей тепла от погружения в источник или с падением уровня воды в резервуаре, когда отверстие для слива открыто. Обусловливание составляет предоснову для ответных реакций – «резерв» - которые угасание опустошает. Это, возможно, оправдательное определение на уровне поведения. Теория резерва не обязательно должна восприниматься как полноценная теория, поскольку она не определена в количественном представлении. Операционально она может быть определена как теория вероятностного изменения угасания. И даже так, лингвистически, она утверждает моментальное обусловливание ответных реакций. Но такой подход ни коим образом не является полезным понятием, и не взглядом на то, что угасание – это процесс истощения. Он просто добавляет многое в наблюдаемые факты изменения наклонов кривых угасания определённым образом.

Однако, как бы то ни было существуют две переменные, которые влияют на уровень ответных реакций, а так же действуют во время угасания и влияют на изменение кривой угасания. Одна из них связана с эмоциями. Когда мы не можем подкрепить ответные реакции, которые ранее были подкреплены, мы не только инициируем процесс угасания, но устанавливаем эмоциональное реагирование – возможно, это то, что обычно называют фрустрацией. Голубь воркует в некой опознаваемой модели, быстро носится по клетке, чистит перья, или быстро  хлопает крыльями в позиции готовности, что предполагает поло-ролевое поведение. Такое поведение соревнуется с реагированием на стимул для клевания и, возможно, такого поведения достаточно, для того чтобы объяснить упадок уровня ответных реакций в ранней стадии угасания. Также возможно, что возможность ответных реакций, основанная на лишении пищи, прямо редуцируется как часть эмоциональной реакции. Однако, какой бы природе не принадлежало данное явление, влияние этой переменной сходит на нет уже в ходе адаптации. Повторяющиеся изменения в кривых угасания становятся ровнее и, короче говоря, есть совсем немного доказательств того, что существует эмоциональная модификация уровня ответных реакций.

Вторая переменная имеет гораздо более серьёзное влияние. Максимум ответных реакций во время угасания достигается лишь в случае точнейшего воспроизведения всех обстоятельств, при которых данные ответные реакции были подкреплены. У крысы, наученной в присутствии света, не будет полностью погашаться ответная реакция без  присутствия света. Она будет более быстро давать ответную реакцию при условии появления света. Это так и для других  лабораторных экспериментов. Например, следующий эксперимент. 9 голубей были научены реагировать на жёлтый треугольник под влиянием (Intermittent) подкрепления. В серии, представленной на фигуре 5 птицы  сначала подкреплялись этой моделью в течение 30 минут. Совокупная кривая определённо представляет собой прямую линию, показывающую более чем 1100 ответов на одного голубя в течение этого времени. С того времени как жёлтый треугольник был заменён на красный треугольник, никакие из ответных реакций не были подкреплены. Влияние было чётко определено, со слабым восстановлением в последующие 15 минут. Но когда жёлтый треугольник был помещен обратно, то всё восстановилось: появилась обычная кривая угасания и быстрая ответная реакция. Схожие эксперименты показали, что высота случайного тона, форма модели, необходимой к запоминанию, размер модели, если они присутствуют во время обусловливания, в какой-то мере контролируют уровень ответных реакций во время угасания. Некоторые свойства более влиятельны, чем остальные, и их также возможна количественная оценка. Изменяя ценность некоторых стимулов в случайном порядке во время повторяющихся процессов угасания, можно просчитать коэффициент генерализации в уровнях ответных реакций под влиянием ценности каждого стимула.

Что-то похожее может продолжаться и во время угасания. Давайте предположим, что все ответные реакции на ключ (стимул) были подкреплены и что за каждым следовал короткий период приема пищи. Когда мы гасим поведенческие реакции, мы создаем ситуацию, в которой ответные реакции не подкрепляются, в котором не происходит приема пищи, и в которой, возможно, присутствуют новые эмоциональные ответные реакции. Ситуация может с легкостью быть такой же новой как красный треугольник после желтого. Если оно так, то это может  объяснить падение уровня (интенсивности) во время угасания. Мы могли бы получить ровную кривую, имеющую форму как у кривой угасания, между вертикальными линиями (рис. 5) постепенно сменяя цвет треугольника с желтого на красный. Такое могло бы случиться даже в том случае, если не было другого типа угасания. Эти условия угасания, вероятно, предполагают  растущую новизну в экспериментальной ситуации.  Поэтому ли кривая угасания изгибается?

Некоторые подтверждения исходят  из данных о «спонтанном восстановлении». Даже после продолжительного угасания организм будет часто давать ответные реакции с высокой интенсивностью на, по крайней мере, несколько моментов в начале другой серии опытов. Одна теория утверждает, что это говорит о спонтанном восстановлении после определенного типа торможения, но возможно и другое объяснение. Не важно, как тщательно обращаются с животным, но стимуляция, совпадающая с началом эксперимента, должна быть  сильнее относительно всего того, что происходит в последующей части эксперимента. Ответные реакции, которые были подкреплены в момент помещения организма в экспериментальную ситуацию, или сразу после, также предполагают такой тип стимуляции. В ситуации угасания это присутствует только на протяжении нескольких моментов. В случае восстановления; последующие ответные реакции появляются, как и в ситуации с желтым треугольником. Единственный способ достигнуть полного угасания при стимуляции, которая начала эксперимент – это повторить эксперимент заново.

Другие доказательства эффекта новизны исходят из исследований периодического подкрепления. Тот факт, что прерывающееся подкрепление производит большую кривую угасания, чем непрерывное подкрепление, является неприятной трудностью для тех, кто ожидает простой связи между количеством подкреплений и числом ответных реакций в угасании. Но такая связь в действительности является весьма сложной. Одним из результатов периодического подкрепления является эмоциональные изменения. Это может быть причиной гладкой формы последующих кривых угасания, но не причиной их большего размера. Последнее можно объяснить недостатком новизны в ситуации угасания. В случае периодического подкрепления многие ответные реакции появляются без подкрепления и  без недавнего приема пищи. Следовательно, ситуация угасания не  является полностью новой.

Периодическое подкрепление, тем не менее, не является простым решением. Если мы даем регулярное подкрепление, – скажем, каждую минуту, – то организм вскоре сформирует способность к дифференциации. Небольшая ответая реакция или её отсутствие возникает сразу после подкрепления, так как  стимуляция от еды соотносится с отсутствием последующего подкрепления. Насколько быстро может развиться дифференциация показано на рис. 6, который отражает первые пять кривых, полученных из экспериментов с прерывающимся подкреплением голубя, где каждый экспериментальный период длился 15 минут. В пятом периоде (или примерно после часа периодического подкрепления) дифференциация дает паузу после каждого подкрепления, в результате получается ярко ступенчатая кривая. В результате этой дифференциации птица почти всегда после подкрепления дает быстрые ответные реакции. Это и является основой для другой дифференциации. Быстрые ответные реакции становятся благоприятным стимулирующим условием. Хороший пример действия последующих кривых угасания показан на рис.7.  Ответные реакции этого  голубя подкреплялись один раз каждую минуту в течение ежедневных экспериментальных периодов, длящихся 15 минут в течение несколько недель. Кривая угасания показывает, что птица начинает давать ответные реакции на уровне, превалирующем над предыдущим. Быстрое позитивное ускорение в начале потеряно при сокращении записи. Голубь быстро достигает и поддерживает уровень, который выше общего во время периодического подкрепления. Во время этого периода голубь создает стимулирующее условие, которое вначале оптимально соотносилось с подкреплением. В результате, когда появляется определенное истощение, уровень быстро падает до намного меньшей, но отчетливо стабильной величины и потом практически до нуля. Впоследствии превалируют условия, в которых ответная реакция не нормально подкреплена. Как следствие, птица, скорее всего, не будет давать ответные реакции снова. Если же она дает их, то ситуация немного улучшается; если она продолжает давать ответные реакции, то условия быстро становятся схожими с теми, в которых было получено подкрепление. В случае такого «автокатализа» высокий уровень быстро достигается, и во втором «залпе» производится более 500 ответов. Уровень потом быстро и отчетливо ровно снижается опять до нуля. Эта кривая ни в каком случае не является беспорядочной. Большинство искривлений гладкие. Но “залп” ответов на сорок пятой минуте говорит о значительной остаточной силе, которая, если угасание проявлялось только в виде истощения, должно было проявиться раньше на кривой. Кривая может также показывать, что птица во многом контролировалась предыдущей ложной корреляцией между подкреплением и быстрыми ответами.

Данное предположение может быть проверено путем построения графика подкрепления, в котором отличительное непредвиденное обстоятельство между уровнем ответных реакций и подкреплением невозможно. В одном таком графике, который может быть назван «вариативное подкрепление» один интервал между успешно подкрепленными ответными реакциями настолько короткий, что подкрепленные ответные реакции происходят во время самого длительного периода продолжительностью около двух минут. Другие интервалы распределяются арифметически между этими значениями, среднее значение остается 1 минута. Интервалы располагаются в случайном порядке для составления программы подкрепления. Что касается предыдущей кривой Е на рис. 6, вероятность подкрепления не изменяется согласно данной программе (на Рис.9 показаны кривые ответных реакций, а различные вероятности подкрепления показаны на Рис. 8). Она начинается характерно степени, преобладая ниже вариативного подкрепления и, в отличие от кривой, следующей за обычным периодическим подкреплением, она не ускоряется к более высокой абсолютной степени. Нет никаких доказательств «автократического» создания оптимального стимулирующего обусловливания. Так же, характерно, что нет никаких существенных разрывов или внезапных изменений в степени в любом направлении. Кривая тянется в течение восьми часов, по сравнению с всего неполными двумя часами на Рис. 7, и рассматривается как единый последовательный процесс. Общее число ответных реакций выше, возможно, из-за большего количества времени, позволяющего выделять тепло. Все это может быть объяснено тем фактом, что мы лишили голубя возможности сформировать пару различий, это было основано, во-первых, на стимуляции едой и, во-вторых, на стимуляции быстрых ответных реакций.

Так как самый длинный интервал между подкреплением был только 2 минуты, определенная новизна должна быть представлена как прошедшее время. Это объяснение искривления на рис.8 может быть проверено в некоторой степени другими программами подкрепления, содержащими гораздо более длительные интервалы. Геометрическая прогрессия была построена начиная с 10-и секунд в качестве самого короткого интервала и неоднократно умножаясь в отношении 1.54. Это создало набор интервалов со средней продолжительностью около 5 минут, самый длительный интервал длился более 21 минуты. Этот набор был рандомизирован  в программе подкрепления, повторяющейся каждый час.

В изменении данной программы от арифметической прогрессии, уровни сперва отклонялись во время более длительных периодов, но голуби вскоре смогли поддерживать постоянный уровень ответных реакций. 2 факта в форме, в которой они были записаны, показаны на рис. 9 (отметка возвращалась к нулю после каждой тысячи реакций. Для того чтобы получить единую совокупную кривую, необходимо «обрезать» данные и объединить их вместе, чтобы создать непрерывную линию. Необработанная форма может быть воспроизведена с меньшей ответной реакцией). Каждое подкрепление представлено горизонтальной чертой. Охваченное время составляет около 3-х часов. Данные относятся к 2-м голубям, которые поддерживают различные показатели согласно данной программе подкрепления.

Согласно такому графику, постоянный уровень процесса ответных реакций поддерживается по крайней мере в течение 21 минуты без подкрепления, после чего птицы получают подкрепление. Меньше новизны будет, следовательно, развиваться во время успешного угасания. В кривой 1 рис.10 голубь продемонстрировал несколько вариантов поведения в течение нескольких часов, для каждого из которых применялась геометрическая прогрессия интервалов. Число ответных реакций, возникших при угасании, примерно в 2 раза отличаются, чем на кривой на рис.10 после арифметической прогрессии интервалов со средним значением 1 мин. Дальнейшее воздействие на геометрический график создает более длительные периоды, во время которых уровень значительно не изменяется. Кривая 2 следует за кривой 1 после 2-х и полутора часов дальнейшего неравномерного подкрепления. В день, отраженный на кривой 2, несколько вариативных  подкреплений были изначально даны, и отмечены в начале кривой. Когда подкрепление было прервано, достаточно устойчивый уровень ответных реакций распространился на несколько тысяч реакций. После другого экспериментального ряда на 2 и полтора часа с геометрической прогрессией, была зарегистрирована кривая 3.Этот ряд экспериментов был также начат с короткой серии непоследовательного подкрепления, следовавшей за подкрепленным периодом более чем 6000 неподкрепленных ответных реакций с небольшими изменениями в уровне (А). Может показаться, что нет причины, по которой другие серии, составляющие, возможно, больше чем 5-иминутный интервал и содержащий более длительные исключенные интервалы не приводят к такой прямой линии в дальнейшем.  

В таких нападках на проблему угасания мы создаем график подкрепления, который так походит на условия, которые будут преобладать во время угасания, что на долгий период времени никакого понижения уровня не будет. Другими словами, мы создаем угасание без кривизны. В конце концов, наступает некое истощение, но с ним не обращаются постепенно. Последняя часть Кривой 3 (к сожалению, очень уменьшенной на рисунке) может предложить угасание в незначительной общей кривизне, но это малая часть всего процесса. Запись составлена в основном из серий из нескольких сотен ответных реакций каждая, большинство из которых на приблизительно том же уровне, что и тот, что поддерживался при периодическом подкреплении. Голубь внезапно останавливается; когда он начинает вновь давать ответные реакции, он быстро достигает уровня ответных реакций, при котором его подкрепляли. Это напоминает ошибочную корреляцию между быстрой ответной реакцией и подкреплением при регулярном подкреплении. Мы, конечно, не полностью уничтожили эту корреляцию. И даже хотя более нет дифференциального подкрепления высокого–низкого уровня, практически все подкрепления происходили при константном уровне ответных реакций.

Дальнейшие исследования графика подкрепления, может, и ответит на вопрос, ответственная ли новизна, появляющаяся в ситуации угасания, за кривизну. Могло показаться необходимым сделать условия, преобладающие во время угасания, идентичными условиям, преобладающим во время обусловливания. Но это не возможно, и, поэтому, в таком случае этот вопрос является академическим. Гипотеза, тем временем, не является теорией в настоящем смысле (с. 210), поскольку она не заявляет ничего по поводу параллельного процесса в любом другом универсуме или дискурсе. [4]

Исследования угасания после различных графиков вариативного подкрепления не следует полностью адресовать данной гипотезе. Объект является экономичным описанием условий, превалирующих во время подкрепления и угасания, и отношений между ними. Используя уровень ответных реакций в качестве исходной точки, мы можем обратиться к условиям, которые наблюдаемы и подвергаются манипуляции, и мы можем выразить отношения между ними в объективных терминах. В той степени, в которой наша исходная точка делает это возможным, она уменьшает необходимость теории. Когда мы наблюдаем голубя, дающего 7000 ответных реакций на постоянном уровне без подкрепления, мы вряд ли объясним кривую угасания, содержащую, возможно, несколько сотен ответных реакций посредством обращения к накапливанию торможения ответной реакции или любому другому продукту утомления. Исследования, проводящиеся без приверженности теории, вероятно, принесут изучение угасания в новые области и новые порядки величин. Ускоряя сбор данных, мы ускоряем исчезновение теорий. Если теории не играли роли в замысле эксперимента, нам не нужно сожалеть, наблюдая их исчезновение.

Комплексное научение

Третий тип теории научения иллюстрирован такими терминами, как предпочтение, выбирание, различение, и согласование. Может быть сделано усилие определить их только в терминах поведения, но в традиционной практике они относятся к процессам в другой измерительной системе. Ответная реакция на один из двух имеющихся стимулов может быть названа выбором, но проще сказать, что она является результатом выбора, имея в виду под последним теоретическую доповеденчекую активность. Более напряженнее ментальные процессы являются лучшим примером теорий данного вида; неврологические параллели не были хорошо выработаны. Обращение к теории подтверждается тем фактом, что выбирание (как и различение, согласование, и т.д.) не является отдельной частью поведения. Это не ответная реакция или акт со специфичной топографией. Этот термин характеризует больший сегмент поведение в отношении к другим переменным или событиям. Можем ли мы сформулировать и изучить поведение, к которому данные термины будут применены, не прибегая к теориям, которые в общем дополняют их?

Различение является относительно простым случаем. Предположим, что мы выясняем, что возможность распространения данного вида ответной реакции не значительно нарушается при изменении одного из двух стимулов на другой. Мы затем делаем подкрепление ответной реакции зависящим от присутствия одного из них. Хорошо обоснованный результат заключается в том, что возможность ответной реакции остается высокой при этом стимуле и достигает очень низкой отметки при другом. Мы говорим, что организм теперь различает стимулы. Но различение само по себе не является действием, или обязательно даже уникальным процессом. Проблемы в сфере различения могут быть обозначены другими терминами. Насколько индукция имеет место между стимулами различной силы или классов? Каковы наименьшие различия в стимулах, которые (вызывают) различие в управлении? И так далее. Подобные вопросы не предполагают теоретической активности в других измерительных системах.

Достаточно более детально должно быть рассмотрено поведение в ситуации выбора одного из двух одновременно действующих стимулов. Оно было изучено у голубя путем измерения ответных реакций на два стимула, отличающихся [с.211] по расположению (слева или справа) или по каким-либо свойствам, как цвет, распределенным случайным образом по отношению к расположению. Время от времени подкрепляя ответную реакцию то на один стимул,  то на другой без выделения какого-либо одного из них, мы добились равного соотношения ответных реакций на два стимула. Поведение превращается в простое чередование двух стимулов. Такой результат подтверждает правило о том, что  тенденция к ответной реакции, в конечном счете, соответствует вероятности подкрепления. Допустим, существует устройство, в котором  один или другой рычаг время от времени соединяется  внешним счетчиком с кормушкой, тогда, после нажатия правого рычага вероятность подкрепления при нажатии левого рычага возрастает по сравнению с правым до истечения определенного промежутка времени, в течение которого  счетчик может перекрыть соединение с левым рычагом. Но поведение птицы не соответствует данной вероятности, так как не имеет отношения к математике. Специфическим результатом такой случайности подкрепления является то, что переключение-на-другой-рычаг-и-нажатие подкрепляется чаще, чем нажатие-того-же-рычага-второй-раз. Мы больше не занимаемся просто двумя ответными реакциями. Чтобы анализировать “выбор” мы должны рассматривать отдельную конечную ответную реакцию, нажатие, без внимания к расположению или цвету рычага, а также ответные реакции переключения от одного рычага или цвета к другому.

С данным рассуждением совместимы количественные результаты. Если мы периодически подкрепляем ответные реакции только на правый рычаг, коэффициент реагирования на правый будет возрастать, в то время как на левый падать. Ответная реакция переключения-с-правого-на-левый никогда не подкрепляется, в то время как ответная реакция переключения-с-левого-на-правый подкрепляется время от времени. Когда птица нажимает на правый, не появляется особой тенденции переключиться; когда она нажимает на левый, появляется сильная тенденция переключиться. Намного больше ответных реакций сопровождаются выбором правого рычага. Необходимость рассмотрения поведения переключения ясно проявляется, если мы теперь изменим эти условия на противоположные и будем подкреплять ответные реакции только на левый рычаг. Конечным результатом будет высокий коэффициент реагирования на левый рычаг и низкий коэффициент на правый. При повторном изменении условий на противоположные высокий коэффициент может быть сдвинут обратно на правый рычаг. На графике 11а группа из восьми кривых рассчитывалась в среднюю величину, чтобы проследить эти изменения в течение шести экспериментальных периодов по 45 минут каждый. Начиная со второго дня на графике ответные реакции на правый рычаг (RR) падают до угасания, в то время как ответные реакции на левый рычаг (RL) возрастают посредством периодического подкрепления. Средний коэффициент показывает незначительное изменение [с.212] до тех пор, пока периодическое подкрепление продолжается по тому же расписанию. Средний коэффициент показывает независимость условия силы ответной реакции нажатия от расположения. Распределение ответных реакций между правым и левым зависит от изменения силы ответных реакций. Если бы имело место лишь угасание одной ответной реакции и сопутствующее переобусловливание другой, то кривая средней величины не оставалась бы почти горизонтальной, так как переобусловливание происходит намного быстрее, чем угасание.

Соотношение, с которым птица переключается с одного рычага на другой, зависит от расстояния между ними. Это расстояние выступает как жесткое основание для различия стимулов между двумя рычагами. Оно также устанавливает область действия ответной реакции переключения при изменении условий на противоположные с предполагаемой разницей в сенсорной обратной связи. Оно также ограничивает распространение подкрепления на ответные реакции, которые не должны подкрепляться, так как если рычаги находятся близко друг к другу, то ответная реакция, подкрепленная на одной стороне, может произойти вскоре после предшествующей ответной реакции на другой стороне. На графике 11 два рычага находились на расстоянии около одного инча  (~2,540 см.) друг от друга. Они были, следовательно, довольно похожи в отношении расстояния на экспериментальный ящик. Переключение от одного к другому включало минимум сенсорной обратной связи, а подкрепление ответной реакции на один рычаг могло в скором времени следовать за ответной реакцией на другой. Когда рычаги разделены четырьмя инчами, изменение в силе намного более стремительно. График 12 показывает две кривые, записанные одновременно с отдельного голубя в течение одного экспериментального периода приблизительно в 40 минут. Высокий коэффициент на правый рычаг и низкий коэффициент на левый рычаг были предварительно закреплены. На графике ни одна ответная реакция на правый не была подкреплена, но на левый – подкреплялись каждую минуту, как проиллюстрировано вертикальными штрихами над кривой L. Наклонная R идет на убыль довольно плавно, в то время как L возрастает, также достаточно равномерно, до значения, сопоставимого с начальным значением R. Птица адаптировалась к изменяемым случайным условиям в пределах отдельного экспериментального периода. Средний коэффициент ответных реакций показан пунктирной линией, которая вновь демонстрирует отсутствие значительного изгиба.  

То, что называют "предпочтение" входит в эту формулировку. В любой стадии процесса, показанного на рис. 12, предпочтение могло бы быть выражено в терминах относительных долей ответных реакций на эти два ключа. Это предпочтение, однако, не в ударе по ключу, а в изменении от одного ключа к другому. Вероятность, что птица ударит  ключ не обращая внимание на его идентификационные свойства, она ведет себя независимо от предпочтительной ответной реакции замены одного ключа на другой. Несколько экспериментов обнаружили дополнительное явление. Предпочтение остается установленным, если в подкреплении отказывают. Примером этого является Рис. 13. Он показывает одновременное угасание кривых от двух ключей в течение семи ежедневных экспериментальных периодов по одному часу каждый. До угасания относительная сила ответных реакций изменяющихся к R и изменяющихся к L привела к "предпочтению" для R от приблизительно 3 до 1. Постоянство степени в течение процесса угасания были показаны в фигуре, путем увеличения L через подходящую константу и входы в точки как маленькие круги на R. Если бы угасание изменило предпочтение, то две кривые не могли бы быть добавлены таким способом.

Такие определения различения и выбора позволяют нам иметь дело с тем, что вообще расценивается как намного более сложный процесс - соответствие образцу. Предположим, что мы устанавливаем три полупрозрачных ключа, каждый из которых может быть освещен красным или зеленым светом. Средний ключ функционирует как образец, и мы окрашиваем его или красным или зеленым в случайном порядке. Мы красим стороны двусторонних ключей красным и зеленым цветом, также в случайном порядке. "Проблема" состоит в том, чтобы ударить боковой ключ, который соответствует в цвете среднему ключу.

В таком случае есть только четыре образца с тремя ключами, и возможно, что голубь мог научиться делать соответствующую ответную реакцию на каждый образец. Это не случается, по крайней мере, в пределах временного промежутка экспериментов до настоящего времени. Если мы просто представим ряд параметров настройки трех цветов и укрепим успешные ответные реакции, то голубь ударит сторону ключей без уважения к цвету или  образцу и будет подкрепляться 50 процентов времени.

Это, в действительности, список подкрепления "неподвижного отношения", которое является адекватным поддержать высокую долю ответной реакции. Однако возможно заставить голубя соответствовать образцу, подкрепляя отличительные ответные реакции "нанесения удара по красному  после того, как его стимулировали красным" и "нанесением удара по зеленому после того, как его стимулировали зеленым", гася другие две возможности. Трудность находится в подготовке надлежащего стимулирования во время ответной реакции.

Образец мог бы быть сделан заметным - например, при наличии типового цвета в общем освещении экспериментальной коробки. В таком случае [p. 214] голубь научился бы ударять красные ключи в красном свете и зеленые ключи в зеленом свете (принятие нейтрального освещения фона ключей). Но процедура, которая держится более близко к понятию соответствия, должна побудить голубя "смотреть на образец" посредством отдельного подкрепления.

Мы можем сделать это, предоставляя цвет на среднем ключе сначала, оставляя бесцветными ключи стороны. Ответная реакция на средний ключ тогда подкреплена (во вторую очередь) путем освещения  ключей стороны. Голубь учится делать две ответных реакции в быстрой последовательности - к среднему ключу и затем к одному стороннему ключ. Ответная реакция на боковой ключ следует быстро на визуальное возбуждение от среднего ключа, который является необходимым условием для различения. Успешное соответствие было с готовностью установлено у всех десяти голубях, проверенных с этой техникой. Выбор противоположности также легко устанавливается. Отличительную ответную реакцию "нанесения удара красного после стимуляции красным" очевидно не легче установить чем "нанесение удара красного после стимуляции зеленым".  Когда ответной реакцией являлось реагирование на ключ того же самого цвета, то генерализация предполагала и тот вариант, что птица выберет новый цвет. Это - расширение понятия соответствия, которое еще не было изучено с этим методом.

Даже когда соответствие поведению было хорошо установлено, птица не будет отвечать правильно, если все три ключа будут теперь представлены в то же самое время. Птица не обладает столь сильным поведением, чтобы наблюдать за образцом. Экспериментатор должен сохранить отдельное подкрепление, чтобы держать такое поведение в силе. У обезьян, приматов, и человека окончательный успех в выборе очевидно достаточен, чтобы укрепить и поддержать поведение наблюдения за образцом.  

Возможно, что это различие разновидностей является просто различием во временных отношениях, требуемых для подкрепления. В поведении соответствия выживает неизменный, когда во всем подкреплении отказывают. Промежуточный случай был установлен, в котором только периодически подкрепляется правильная ответная реакция выбора. В одном эксперименте один цвет появился на среднем ключе в течение одной минуты; он был тогда изменен или же не изменен, наугад, на другой цвет. Ответная реакция на этот ключ давала освещение на боковые ключи, один красный и один зеленый цвет, в случайном порядке. Ответ на боковой ключ отключал освещение у обоих боковых ключей, пока средний ключ не был снова нажат. Аппарат делал запись всех ответных реакций выбора на одном графе и всех несоответствий им на другом. Голуби, которые приобрели выборочное поведение под непрерывным подкреплением, успешно поддерживали такое поведение не чаще чем в среднем один раз в минуту. Они могут дать тысячи выборочных ответных реакций в час, получив подкрепление только лишь на шестьдесят из них. Это не обязательно разовьет поведение выбора у простой птицы, поскольку такая проблема может быть решена тремя способами. Птица получит множество подкреплений, если она даст ответную реакцию (1) только на один ключ или (2) только на один цвет, поскольку планирование эксперимента делает любую постоянную ответную реакцию в конечном счете правильной.

\Образец данных, полученных в результате множественных экспериментов данного типа, приведен на рис.14. Несмотря на то, что голубь научился узнавать цвет при постоянном подкреплении, это на самом деле оказалось предпочтением конкретного цвета при условии непрерывного подкрепления. Всегда, когда образец был красным, глубь выбирал и его, и красную клавишу (ключ) и получал подкрепление. Когда образец был зеленым, голубь не реагировал, и боковые (клавиши) не освящались. Результат, показанный в начале графика на рис. 14, является высокой степенью процесса ответных реакций на верхнем график, что отражают совпадающие [с. 215] ответные реакции. (Запись на самом деле скачкообразна, т.к. отражает присутствие или отсутствие красного образца, однако это было утеряно из-за  редукции на рисунке) Цветовое предпочтение, однако, не является решением проблемы противоположностей. Путем смены на эту проблему, стало возможным изменить поведение птицы как показано между двумя вертикальными линиями на рисунке. Верхний изгиб между этими линиями показывает уменьшение совпадений ответных реакций, которые вытекают из предпочтения цвета. Нижний изгиб между теми же линиями показывает развитие реагирования на противоположный цвет и его выбор. На второй вертикальной линии подкрепление снова пришло в соответствие с ожиданием. Верхний изгиб показывает восстановление ожидаемого поведения, в то время как нижний изгиб показывает понижение выбора противоположного цвета. Результатом было решение: голубь выбирал образец, вне зависимости от цвета, а затем, соответствующий боковой ключ. Более светлая линия соединяет возможную (means) серию точек на двух изгибах. Похоже, тут наблюдается та же самая закономерность, что и в случае  выбора: изменения в распределении ответных реакций между двумя ключами не включает общее количество ответных реакций на ключ. Это среднее значение не будет оставаться константным в ошибочном решении, достигнутом с предпочтением цвета, как в начале графика.

Эти эксперименты над высшими процессами были описаны очень кратко. Они не предлагаются как доказательство того, что теории научения необязательны, но они могут предложить альтернативную программу в этой сложной области. Данные в сфере высших психических процессов превышают единичные ответные реакции или одиночные стимульно-реактивные взаимоотношения. Их возможно сформулировать в терминах дифференциации конкурирующих ответных реакций, различения стимула, образования различных последовательностей ответных реакций и т.д. кажется, не существует никакой априорной причины почему полный отчет не возможен без обращения к теоретическим процессам в других системах измерения.

Заключение.

Возможно, работа без теорий в целом – это tour de force, ожидать применения которого как общей практики было бы слишком. Теории – забава.  Вероятно, что наиболее быстрый прогресс на пути к пониманию научения может быть достигнут путем проведения исследований, не направленных на проверку теорий. Адекватный импульс к этому может быть предоставлен тенденцией приобретать данные, показывая систематически организованные изменения, характерные для процесса научения. Приемлемой научной программой является сбор информации данного типа и установление их связей с переменными, выбранными для изучения при применении здравого смысла.   

Такой подход не исключает возможности понимания теории в другом смысле. Над совокупностью однородных (неизменных) взаимосвязей находится [p. 216] необходимость формальной репрезентации данных, редуцированная до минимального количества понятий. Теоретическая конструкция может привести к большей степени обобщенности, чем любое скопление фактов. Такая конструкция не будет, однако, относится к другой системе измерений, и, таким образом, не будет являться частью нашего настоящего определения теорий.

Она не будет мешать нашему поиску функциональных взаимосвязей, поскольку  проблема встает только после нахождения и изучения соответствующих переменных. Хотя это сложно для понимания, однако, это также сложно понять неправильно, и это не будет иметь тех вызывающих возражения эффектов, обсуждавшихся уже в этой статье.

Мы еще пока не готовы к теориям в таком смысле. В настоящий момент мы малоэффективно используем эмпирическое, уже не говоря о рациональном уравнивание. Немногие из представленных здесь графиков могли бы близко совпадать. Однако простейшее предварительное исследование  показывает, что существует множество релевантных переменных, и до тех пор, пока их важность будет экспериментально доказана, уравнение, которое их учитывает, будет иметь столько произвольных констант, что точное совпадение будет являться чем-то само собой разумеющимся и принесет немного достоверности.

Примечание.

[1] Обращение президента, Midwestern Psychological Association, Чикаго, Иллинойс, Май, 1949.

[2] Некоторые из последующих материалов были получены в 1941-42 годах в время совместного  исследования голубей, в котором сотрудничали Keller Breland, Norman Guttman, и W. K. Estes. Некоторые из материалов были выбраны из более поздних, но еще не опубликованных работ по исследованию голубей, проведенных автором в Университете Индианы (Indiana University) и Гарвардском Университете (Harvard University). Ограниченность места не позволяет сообщить все детали в данной статье.

[3] Оно (выполнение), не может быть сокращено либо увеличено. Там, где латентный период производится ˝насильно˝, чтобы минимизировать ценность дифференциального подкрепления, требуется другое объяснение. Несмотря на то, что можно дифференциально подкреплять более энергичное поведение или максимально быстрое окончание поведение после его начала, все же речь о дифференциальном подкреплении ответных реакций с короткими и длинными латентными периодами является бессмысленным. Что мы действительно дифференциально закрепляем, так это (а) ожидание поведения и (б) более энергичную ответную реакцию. Когда мы просим субъекта дать ответную реакцию ˝максимально быстро˝ в эксперименте измерения реакции на стимул, мы по существу спрашиваем  его (a) произвести как можно больше ответных реакций без достижения критерия эмиссии (распространения), (б) не делать ничего другого, и (в) энергично отвечать после дачи стимула. Это приводит к самому минимальному времени между стимулом и реакцией, которое возможно, но это время не обязательно является исходным, да и наши инструкции его не сильно изменяют. Необходима параллельная интерпретация дифференциального подкрепления длительных задержек между стимулом и реакцией. В уже упомянутых экспериментах с голубями, предварительное (начальное) поведение уже обусловлено, что отсрочивает ответные реакции на кнопку до определенного времени. Поведение, которое ˝отмечает время˝, обычно бросается в глаза.

[4] Справедливо, что она (гипотеза) апеллирует к стимуляции, частично сгенерированной поведением самого голубя. Это может быть сложным для спецификации или манипуляции, но это не является теоретическим в настоящем смысле. Насколько мы можем стимулировать идентичное совпадение действий и стимуляции, возможна физическая спецификация.  

[5] Две топографически независимые ответные реакции, способные в то же время на распространение, и, таким образом, не требующие переделки, показывают отдельные процессы восстановления, угасания и комбинирования ответной реакции.


 

А также другие работы, которые могут Вас заинтересовать

51571. Открытый урок «перевод» 97 KB
  I think I believe To my mind In my opinion I gree I do not quite gree I disgree It’s right You re not quite right You re mistken How right you re Excuse me but Would you kindly repet Полилог дискуссия за круглым столом Говорим по очереди S 1 монолог по 2 человека The first trend is the diversity in students. Students hve of course lwys been diverse. Whether in the pst or in the present dy students lern t unique pces show unique personlities nd lern in their own wys. Now more thn ever techers re likely to serve...
51572. ОСНОВНЫЕ ПЕРИОДЫ ЕВРЕЙСКОЙ КУЛЬТУРЫ 49.5 KB
  14 лет Завоевание Земли и раздел ее между коленами Вход в Землю ИзраиляИеhошуа БинНун Книга Иеhошуа история за воевания и раздела земли Период Судей 1З11 вв. Власть Судей не постоянная и не наследственная ГидеонШимшон Самсон Дебора Пророк ШмуэльСамуил Книга Судей история народа в этот периодШмуэльКнига Рут история семьи ДавидаШмуэль Период объединен ного царства 10 в. 80 лет Создание и расцвет объединенного еврейского царства со столицей в Иерусалиме царь Шауль Саул царь Давид царь Шломо СоломонПостроение Первого...
51574. Конструирование диагностико-проектировочной и ценностно-ориентировочной деятельности педагога 183 KB
  Конструирование диагностико проектировочной и ценностноориентировочной деятельности педагога. Ведущие задачи диагностикопроектировочного этапа педагогической деятельности. Задачный характер педагогической деятельности. Коллективное планирование как обязательное условие жизнедеятельности детского коллектива.
51575. Пути повышения рентабельности предприятия (на примере ООО «Телепласт») 1.34 MB
  Рентабельность - это важнейший показатель в экономике. Понимание ее сути, механизмов работы и практического применения в экономической деятельности дает возможность решения многих задач в работе компании.
51577. ПРИМЕРНАЯ СХЕМА ПОСТРОЕНИЯ УРОКА РУССКОГО ЯЗЫКА 78.5 KB
  ПРИМЕРНАЯ СХЕМА ПОСТРОЕНИЯ УРОКА РУССКОГО ЯЗЫКА Урок русского языка достигнет своей цели если он вызовет у учащихся интерес к изучаемому предмету заставит их не только слушать учителя но и активно самостоятельно работать. Нужно исходить из реальных Возможностей всего класса в целом и индивидуальных особенностей отдельных учащихся. Разрабатывая систему уроков особенно важно выделить в ней так называемые трудные случаи на которые должно быть вовремя обращено внимание учащихся. У некоторых учащихся трудности могут встретиться при...