每当讨论操作符条件时,都有助于说相同的语言:
- 强化:旨在增加行为频率的动作
- 惩罚:旨在减少行为频率的动作
- 正面:存在刺激
- 负面:缺乏刺激
这些术语可以形成四个不同的组合(注意:括号中的示例为示例,而非建议!):
- 积极强化:提出刺激以增加行为发生的频率(例如,当狗坐在命令位置时给予治疗)
- 负面增强:消除刺激以增加行为发生的频率(例如,邮递员在狗吠叫之后就消失了)
- 积极惩罚:提出刺激措施以减少行为发生的频率(例如,在地毯上撒尿时打狗)
- 负面惩罚:消除刺激以减少行为发生的频率(例如,当狗跳上你时离开房间)
在实践中,这些可能会变得混乱。例如,用盒子制造噪音是一种旨在降低行为频率的刺激措施,因此从技术上讲,这是积极惩罚的一个例子,但是,如果狗一旦执行正确的行为就停止了噪音的产生,那么您也可以去除刺激措施。增加正确行为的频率,嘿,负增强。
但这以您的狗有正确的行为为前提。您没有指定不希望的行为是什么,或者没有指定您想要强化的替代行为。如果您对噪音的所有处理都试图阻止他做某事,那么您是在提供惩罚而不是消极的强化。
在这两种情况下,部分问题可能是您只使用了主要的强化和惩罚者,即狗不需要学习的强化和惩罚者。例如,食物是主要的补强剂。狗知道食物是一件好事,而无需学习。通过扩展,噪音是主要的惩罚者,因为狗听不舒服。相比之下,次要补强者和惩罚者是那只狗学到的东西。
最典型的例子是巴甫洛夫的钟声,他每次给狗提供食物时都会响。通过始终将主增强器与刺激配对,刺激可以开始充当辅助增强器。也就是说,狗知道铃铛发出食物到达的信号,并会做出相应的反应。
您提到过,当您将狗叫出时,会使用“ no”(希望用严厉的声音,狗非常擅长辨别语调)以及噪音。“不”应该充当次要惩罚者,赞美也可以充当次要强化者。但是您可能无法逐步消除实际的噪声,因为有时只说“不”而不是噪声。
问题是,到现在为止,您的狗已经意识到“没有”没有框的意思是没有主要惩罚者,也就是说,两者没有关系,因此,他不在的时候就可以保存。
我建议您打开一个新问题,描述要阻止的实际行为,我们可能会更好地帮助您找到一种使用整个操作条件范围的方法,以使您的狗了解您想要的东西去做。