3. 도구적 조건형성
어떤 행동을 학습시키는 가장 쉬운 방법 중의 하나는 그 행동이 일어나면 보상 을 주는 것이다. 부모는 아이가 예절 바른 행동을 하면 칭찬을 해 주고, 회사는 실적이 좋은 사원에게 보너스를 지급한다. 그렇게 보상을 받은 행동은 앞으로 더 많이 나타나고 보상받지 못한 행동은 사라지게 된다. 이는 곧 어떤 행동이 학습 될지의 여부는 그 행동의 결과가 무엇이냐에 좌우됨을 의미한다. 이처럼 유기체 가 자신의 행동과 그 결과 사이의 관계를 학습하는 것을 도구적 조건형성 (instrumental conditioning)이라고 부른다. '도구적'이란 말은 어떤 행동이 특정의
결과를 초래하는 도구의 역할을 한다는 의미로 붙여졌다. 이 분야의 중요한 두
선구적 심리학자가 손다이크와 스키너이다.
1) 손다이크와 효과의 법칙
천릿길을 걸어 주인에게 돌아온 개나 문을 열어 달라고 발톱으 로 긁어대는 고양이 같은 지능적인 동물들의 이야기를 한 번쯤은 접해 보았을 것이다. 손다이크(Thorndike, 1898)가 살았던 시대에도 그런 이야기들이 유행했고 심지어 동물이 논리적인 사고를 한다는 주장까지 생겨났다. 그러나 손다이크는 그런 영리한 동물들보다는 자기 동네에서조차 길을 잃어버리는 우둔한 개나 고양이가 훨씬 더 많음을 상기시켰다. 그리고 동물들의 그런 지능적 행동이 실제 로 논리적 사고에 의한 것인지 아니면 다른 유기체의 행동을 모방 한 것인지, 또는 어쩌다 우연히 일어난 것인지 알기 위해서는 동물 들이 전혀 본 적이 없는 새로운 문제를 주고 어떻게 해결하는가를 살펴야 한다고 생각하여 [그림 4-6과 같은 '문제상자(puzzle box)' 들을 고안했다. 이 그림에 소 개된 문제상자는 그 속의 작은 널빤지가 밟힐 때 빗장이 뽑히면서 문이 열리게 되 어 있다.
손다이크는 이 문제상자에 굶주린 고양이를 넣고 바깥에 먹이를 놓아두었다. 그러자 고양이는 우왕좌왕하다가 바닥이나 창살을 할퀴거나 물어뜯기도 하고 먹 이를 향해 창살 사이로 앞발을 내밀어 보기도 하고 야옹거리기도 했다. 얼마 동 안 그렇게 헤매던 고양이는 순전히 우연적으로 널빤지를 밟게 되고 그러면 문이 열려서 빠져 나가 먹이를 먹을 수 있었다. 고양이를 문제상자에 넣고서부터 빠져 나올 때까지를 한 시행으로 볼 때, 시행이 거듭될수록 점진적인 향상이 나타났다. 즉, 잡다한 행동은 줄어들고 점차로 짧은 시간 내에 정확한 반응이 나오게 되었 던 것이다. 많은 시행을 거친 후에 고양이는 문제상자 속에 놓이면 곧바로 빠져 나올 수 있게 되었다.
만약 고양이가 논리적 사고를 한다면 문제상자에서 탈출하는 데 걸리는 반응 잠재시간 곡선은 문제를 이해하고 해결한 시점에서 급강하해야 하며 그 이후로 거의 변화가 없어야 할 것이다. 해결 이후에는 오류(널빤지를 밟는 것 이외의 반 응들)가 나오지 않을 것이기 때문이다. 그러나 [그림 4-7기에서 보듯이 실제 결과 는 그렇지 않았고, 이런 결과는 병아리, 개, 원숭이 등을 사용한 다른 연구에서도 반복되었다. 여러 가지 반응들을 임의적으로 해 보다가 그중 어느 하나가 문제를 해결하게 되면 그 반응이 여러 시행에 걸쳐 점진적으로 습득되는 이런 식의 학습 을 시행착오학습(trial-and-error learning)이라고 부르는데, 이 용어는 강조점이 약간 다르나 도구적 조건형성과 동일한 의미로 쓰인다.
이런 학습에서 작용하는 원리가 손다이크가 이름 붙인 효과의 법칙(law of effect)
이다. 이는 어떤 반응의 강도가 과거에 그 행동이 초래했던 결과(즉, 효과)에 좌우 된다는 것이다. 한 반응은 보상이 뒤따르면 강해지고, 보상이 없거나 처벌이 뒤따 르면 약해진다. 효과의 법칙에 따르면 동물에게서 고차적인 지능적 과정의 존재를 가정할 필요도 없고 동물이 어떤 목표를 성취하기 위해 노력한다고 믿을 필요도 없다. 다만, 동물이 어떤 반응을 하고 그에 잇달아 보상이 오면 이후에도 그 반응 이 더욱 잘 수행될 뿐인 것이다.
2) 스키너와 조작행동
스키너(Skinner, 1938)는 문제상자나 미로보다 훨씬 더 동물행동 을 관찰하기 쉬운 단순한 실험상황을 고안했다. 즉, [그림 4-8]의 스키너 상자(Skinner box)에서는 쥐가 레버(lever)를 누르면 구석에 있는 먹이통에서 먹이알이 나오도록 되어 있다. 실험동물이 비둘 기일 경우에는 레버 대신에 부리로 쏠 수 있는 원반이 벽에 붙어 있다. 동물의 반응은 누가기록기나 컴퓨터로 기록된다. 실험자는 동물이 이 상자 속에서 하는 여러 가지 행동 중 레버 누르기나 원 반 쪼기에 대해서만 먹이를 줌으로써 그런 반응들의 빈도를 높이 는 것이다. 스키너는 동물의 이런 반응들을 그것이 환경에 어떤 조
작을 가하는 것이라는 의미에서 조작행동(operant behavior)이라고 불렀다. 따라
서 도구적 조건형성의 또 다른 용어가 조작적 조건형성(operant conditioning)이다.
3) 강화와 처벌
손다이크는 동물의 행동에 뒤따르는 결과가 만족스러운 것이면 그 행동이 더 강해지고 성가신 것이면 그 행동이 약화된다고 하였다. 그러나 스키너는 만족이 나 성가심 같은 주관적인 용어들을 완전히 객관적인 용어들로 대체하였다. 즉, 특 정 반응을 증강시키는 절차를 강화(reinforcement), 약화시키는 절차를 처벌 (punishment), 그리고 강화와 처벌을 일으키는 자극들을 각각 강화물(reinforcer)과 처벌물(punisher)이라고 불렀던 것이다. 따라서 어떤 자극이 좋은 것으로 보이더 라도 행동을 증강시키지 않으면 강화물이 아니며 혐오적인 것으로 보이더라도 행동을 증강시키면 강화물로 간주된다.
강화와 처벌에는 각각 두 가지 종류가 있다. 반응 후에 자극의 출현이나 자극 강도의 증가가 뒤따르면 정적 강화 또는 정적 처벌, 자극의 제거나 자극 강도의 감소가 뒤따르면 부적 강화 또는 부적 처벌이라고 한다. 예를 들어, 아이의 공부 하는 행동은 부모의 칭찬을 받음으로써 늘어나게 되고(정적 강화), 뜨거운 난로에 손을 댔다가 통증이 오면 난로에 손대는 행동이 줄어들게 되고(정적 처벌), 비가 내릴 때 우산을 쓰면 비를 맞지 않게 됨으로써 우산을 쓰는 행동이 증가하게 된 다(부적 강화). 속도위반을 해서 벌금을 물게 되면(즉, 돈의 감소) 속도위반 행동이 줄어들게 된다(부적 처벌). 부적 처벌은 특정 행동에 대하여 대가 또는 비용을 치 르는 셈이므로 반응대가 또는 반응비용(response cost)이라고도 한다. 부적 강화 와 처벌을 혼동하기 쉬운데, 강화는 행동을 증강, 처벌은 행동을 감소시키는 것임 을 명심하면 쉽게 구분이 될 것이다.
4) 도구적 조건형성의 기능
고전적 조건형성에 의해 학습되는 반응은 대개 불수의적인(involuntary) 것들인 반면, 도구적 조건형성에 의해 학습되는 반응은 대개 수의적(voluntary)인 것들이 다. CR이 유기체로 하여금 CS가 예고하는 사건에 대비하게끔 하는 것처럼 도구 적 반응도 물론 어떤 적응적 기능을 한다. 즉, 효과의 법칙이 의미하는 대로 유기 체는 자신에게 이득을 가져다준 반응들은 앞으로 더 자주 하게 되고, 그렇지 못
한 반응들은 잘 하지 않게 되는 것이다. 예를 들어, 스키너 상자에서 비둘기가 원 반을 쏘는 게 아니라 날개를 퍼덕거려야 먹이가 나온다고 하자. 그러면 비둘기는 원반 쪼기가 아니라 날개 퍼덕거리기를 학습하게 된다.
비둘기나 쥐에게서 얻어진 도구적 조건형성의 법칙들이 인간에게도 적용될까? 한 연구에서는 실험자가 대학생들을 한 사람씩 불러 일상적인 대화를 했는데, 이 대학생들은 자신이 피험자인 줄을 모르는 상태였다. 실험자는 피험자가 “제 생각 으로는.…", "…하다고 생각해요." 또는 "... 한 것 같습니다." 등의 문구를 포함한 문장을 말하면, 즉 자신의 의견을 말하면 "맞아요.", "저도 동의합니다.", 또는 "그렇죠." 등의 응답을 함으로써 강화를 주었다. 인간의 경우에는 음식이나 돈, 상 같 은 물리적인 사물들뿐만 아니라 단순한 언어적 반응도 강화물로 작용할 수 있는데, 이를 언어적 강화(verbal reinforcement)라고 한다.). 그러자 피험자들이 자신의 의견을 말 하는 빈도가 급격하게 증가하였다. 이 결과는 강화가 인간의 행동을 수정하는 데 아주 효과적임을 보여 준다.
도구적 조건형성의 또 다른 기능은 한 유기체가 지금까지 할 수 없었던 전혀 새로운 반응을 학습하게 한다는 것인데, 이는 다음에 나오는 행동의 조성에서 살 펴볼 것이다.
5) 도구적 조건형성의 주요 현상들
고전적 조건형성의 많은 현상들이 도구적 조건형성에서도 유사하게 관찰된다. 따라서 여기서는 도구적 조건형성에만 독특한 현상들을 살펴보자.
(1) 조성
유기체가 어떤 반응을 어떻게 학습하는가는 효과의 법칙이 잘 설명해 준다. 그 런데 효과의 법칙이 작용하려면 학습시키고자 하는 목표반응이 먼저 출현해야 한다. 그래야 그 반응이 강화를 받을 수 있기 때문이다. 그런데 애초부터 나타나 지도 않는 반응은 강화를 받을 수가 없고 따라서 새로운 반응이 학습된다는 것은 불가능하다. 그러면 학습이란 그 유기체가 이미 할 수 있는 여러 반응들 중 어느 것이 더 빈번하게 수행되느냐의 문제가 되고 만다. 효과의 법칙에 기반을 두면서 도 현재 유기체가 할 줄 모르는 새로운 반응을 학습시키는 방법이 조성(shaping, 또는 조형) 또는 계기적 근사법(점진적 접근법, successive approximation)이다. 이는 원
하는 목표반응을 단계적으로 조작해내는 과정이다. 예를 들면, 스키너 상자에 넣 은 쥐는 처음부터 레버 누르기를 하지는 않는다. 쥐에게 이를 학습시키려면 먼저 쥐가 레버 근처로 가면 먹이를 준다. 그러면 곧 쥐는 레버 주변을 맴돌게 되는데, 이제는 쥐가 레버를 향해 몸을 뻗쳐야 먹이를 준다. 그 다음에는 쥐가 앞발로 레 버를 건드려야 먹이를 주고, 마지막으로 레버를 눌러야 먹이를 준다. 그 결과, 쥐 는 애초에는 하지 않았던 레버 누르기 반응을 하게 된다. 비둘기가 탁구를 하거 나 개가 장난감 피아노를 치는 등의 행동을 훈련시킬 때 사용되는 방법이 이 조 성기법이다.
(2) 미신행동
유기체는 좋은 결과를 초래한 반응을 계속하고 나쁜 결과를 초래한 반응을 감 소시킨다. 즉, 유기체는 자신의 반응이 그 결과의 원인인 것처럼 행동하는 것이 다. 그런데 만약 어떤 반응에 강화가 우연히 뒤따르면, 즉 우발적 강화가 주어지 면 어떻게 될까?
스키너 상자에 비둘기를 넣고 반응과는 상관없이 매 15초마다 먹이를 준다고 하자 먹이가 주어지기 직전에 비둘기는 무슨 반응인가를 하고 있을 것이다. 먹이 는 매 15초마다 주어지기 때문에 비둘기의 반응과 강화 사이엔 아무런 인과관계 가 없다. 그러나 효과의 법칙에 의하면, 어떤 반응에 강화가 뒤따르기만 하면 그 반응이 증강되어야 한다. 실제 실험 결과도 그러하다. 즉, 먹이가 주어지기 직전에 우연히 오른쪽으로 돌고 있었던 비둘기는 그 반응이 점차 늘어나 실험이 끝날 즈 음에는 계속 맴돌고 있게 되며, 바닥을 긁고 있었던 비둘기는 계속 바닥 긁기를 하게 되는 것이다. 이처럼 자신의 반응이 실제로 특정 결과를 초래한 원인이 아님 에도 불구하고 마치 그런 것처럼 그 반응을 계속하는 것을 미신행동이라고 한다.
인간도 물론 미신행동을 보인다. 예를 들면, 도박꾼이 주사위를 던지기 전에 항 상 주사위에 입으로 바람을 훅 불어넣는 행동을 한다고 하자. 왜 그럴까? 이 사람 이 이전에 어쩌다가 그런 행동을 하고 나서 주사위를 던졌더니 우연히 돈을 따게 되었던 경험이 있다면, 그 행동은 돈을 땄다는 결과에 의해서 강화를 받았고 따 라서 더 빈번히 일어나게 된 것이라고 설명할 수 있다.
(3) 조건 강화물과 사회적 강화물
어떤 반응을 학습시키는 데 필요한 강화물 중 음식이나 물, 전기충격의 종료 등 은 유기체의 생물학적인 요구를 충족시켜 주는 것이므로 1차 강화물(primary
reinforcer)이라고 불린다. 그런데 학습은 항상 1차 강화물에만 의존하는 것은 아니 다. 어떤 자극들은 유기체의 생물학적 요구와 전혀 상관없지만 1차 강화물과 짝지 어짐으로써 강화력을 획득하게 된다. 이를 조건 강화물(conditioned reinforcer)이라 고 하는데, 그 대표적인 예가 돈이다. 돈이란 쇳조각 또는 종이조각에 불과하지만 음식 등 우리가 원하는 무엇인가와 짝지어져 왔기 때문에 마치 1차 강화물과 같은 힘을 갖게 된 것이다.
조건 강화물과 달리 1차 강화물과 짝지어진 적이 없음에도 불구하고 강화력을 갖고 있는 다른 자극들도 있다. 예컨대, 교사는 단순히 고개를 끄덕여 주거나 “잘 했어." 라는 말만으로도 충분히 학생의 반응을 강화할 수 있다. 사람의 경우에는 이렇게 타인에게서 인정이나 칭찬, 관심을 받는 것이 강력한 강화물로 작용하는 데, 이를 사회적 강화물(social reinforcer)이라 한다.
(4) 강화계획
지금까지 우리는 반응이 나올 때마다 강화가 주어지는 연속 강화의 경우를 주 로 이야기했다. 그러나 실생활에서는 연속강화가 주어지는 경우가 드물다. 농구 선수가 슛을 할 때마다 골인이 되는 것은 아니며, 사자가 사냥을 나갈 때마다 성 공하지는 못한다(실제로 사자의 사냥 성공률은 1/3 정도이다.). 행해진 반응들의 일 부만이 강화를 받는 것을 부분 강화 또는 간헐적 강화라고 한다. 부분 강화에서 는 어떤 식으로 강화를 주는가, 즉 어떤 강화계획(reinforcement schedule)을 사용하 는가에 따라 유기체의 행동이 달라진다.
강화가 각 강화 사이의 시간간격을 기준으로 주어지는가 또는 반응비율을 기 준으로 주어지는가에 따라 강화계획은 크게 네 가지로 나누어진다. 강화를 한 번 받은 후 일정 시간이 지나고 난 후에 행해지는 반응에 대해서 강화가 주어지는 경 우를 고정간격(fixed interval, FID계획이라고 하며, 각각의 강화가 주어지는 시간간격 이 평균을 중심으로 변하는 경우를 변동간격(variable interval, VID계획이라고 한다. 반면에 일정한 수의 반응을 하고 나면 강화가 주어지는 경우를 고정비율(fixed ratio, FR)계획이라고 하며, 강화를 받기 위해 필요한 반응의 수가 평균을 중심으로 변하는 경우를 변동비율(variable interval, VR)계획이라고 한다. [그림 4-9]에서 보는 바와 같이 스키너 상자에서의 동물의 반응은 이런 강화계획에 따라 다른 패턴을 나타낸다. 인간의 행동도 어떤 강화계획이 사용되는가에 따라 변화된다는 증거들 이 있다.
4. 조건형성을 통한 학습의 한계
조건형성의 원리들이 동물과 인간의 모든 행동을 설명할 수 있다고 생각되던 때 가 있었지만 그러한 일반적인 학습원리에 들어맞지 않는 현상들이 발견되었다. 그 런 현상들은 크게 두 가지로 나눌 수 있는데, 첫째는 학습에 있어서의 생물학적인 준비성과 한계이고, 둘째는 인간과 원숭이 등의 주로 고등동물이 보이는 인지학습 이다. 이 절에서는 학습의 생물학적인 준비성과 한계를 보여 주는 두 예를 살펴보 고, 인지학습은 다음 절에서 다룰 것이다.
1) 맛 혐오 학습
전통적으로 고전적 조건형성에서는 어떠한 중성 자극이라도 CS로 사용될 수 있고, 그것이 어떠한 UCS와도 연합될 수 있으며, CS와 UCS 사이의 시간간격은 짧아야 학습이 가능하다고 생각되었다. 그러나 이런 학습원리들과 상충되는 맛 혐
오 학습이란 현상이 발견되었다(Garcia & Koelling, 1966) 쥐들에게 처음 맛보는 단 물을 주고 X-레이를 쪼이면 X-레이 때문에 구토와 복통이 발생한다. 그 후 다시 단물을 주면 이 쥐들은 마치 단물이 구토와 복통을 초래하기라도 한 것처럼 마시 기를 피하게 된다. 사람도 식중독을 일으켰던 음식은 먹기를 꺼리는 맛 혐오 학 습을 나타낸다. 특히 난생 처음으로 맛보았던 음식이 배앓이를 일으켰을 경우에 는 다시는 그 음식을 먹지 않게 될 수 있다.
맛 혐오 학습 절차는 고전적 조건형성의 한 예이다. 즉, 단물에서 나는 단맛이 CS, X-레이로 인한 구토와 복통이 UCS로 작용하고 그로 인한 불쾌감, 고통 또 는 공포가 CR로 습득된다. 그래서 나중에 단물, 즉 CS를 쥐에게 다시 제시하면 불쾌감, 고통 또는 공포가 CR로서 나타나고 따라서 쥐는 그 CS를 회피하게 되는 것이다. 그러나 맛 혐오 학습은 전통적인 학습원리들과 두 가지 면에서 상충된다. 첫째, CS와 UCS 사이의 시간간격이 아주 길어도 학습이 가능하다. 쥐에게 단 물을 제시한 지 몇 초 이내가 아니라 몇 분, 몇 시간, 심지어는 하루가 지나서 구 토와 복통을 일으켜도 학습이 된다. 이는 생물학적 관점에서 보면 쉽게 이해될 수 있다. 일반적으로 번개가 친 후 천둥소리가 들리는 간격이나 맹수의 냄새가 바람을 타고 흘러든 후 맹수가 실제로 공격해 오는 간격은 짧은 반면에 동물이 처음 보는 먹이를 먹고 구토나 복통을 일으키기까지는 긴 시간이 걸린다. 만약 동물이 CS와 UCS의 시간간격이 짧을 때만 학습을 할 수 있다면 먹이와 복통 사 이의 관계는 학습하는 것이 불가능하다. 그러면 한 번 먹고 병이 났던 먹이를 나 중에 또다시 먹게 될 수 있고 그 병이 심하면 죽을 수도 있는 것이다. 따라서 맛 혐오 학습을 못했던 동물들은 진화과정에서 도태되었을 것이다.
둘째, 맛 혐오 학습은 어떠한 CS라도 모든 종류의 UCS와 연합될 수 있다는 전 통적인 학습원리와 상충된다. 예를 들어, 쥐들에게 단물을 주고 나서 X-레이를 쪼이는 대신 전기충격을 준다. 그 후 단물을 다시 제시하면 쥐들은 이를 회피하 지 않고 정상적으로 마신다. X-레이를 UCS로 사용하나 전기충격을 UCS로 사용 하나 고전적 조건형성의 절차상으로는 아무런 차이가 없다. 그럼에도 불구하고 쥐들은 맛을 구토나 복통과는 잘 연관시키지만, 전기충격과는 잘 연관시키지 못 하는 것이다. 이렇게 특정 CS가 특정 UCS와 잘 연합된다는 사실 역시 생물학적 관점에서 이해될 수 있다. 자연환경에서는 쥐가 먹이를 먹고 나서 복통을 일으킬 수는 있어도 전기충격을 받는 일은 없다. 따라서 먹이의 맛과 복통 사이의 관계 를 학습하는 능력은 그 쥐의 생존과 직결되지만, 맛과 전기충격을 연합시킬 수
있는가는 그렇지 않다. 이와 대조적으로, 새들은 먹이를 그 모양과 색깔로 구분하 므로 맛보다는 먹이의 시각적 측면과 복통을 연관시키기 쉽다. 동물들은 이처럼 모든 자극들 사이의 관계를 동등하게 잘 학습하는 게 아니라 그 종이 사는 환경 에 따라 특정 자극들 사이의 관계를 더 잘 학습하게 만드는 생물학적 소인을 갖 고 있는데, 이를 준비성(preparedness)이라 한다.
2) 향본능 표류
도구적 조건형성 연구에서도 어떤 반응이든 강화가 뒤따르면 학습된다는 것이 전통적인 입장이었다. 따라서 동물은 무슨 반응이든지 학습할 수 있어야 한다. 브 렐란드 부부(Breland & Breland, 1966)는 학습심리학적 원리들을 써서 서커스단의 동물들에게 재주부리기를 훈련시켰다. 훈련은 대개 성공하여 수레를 밀며 장을 보 는 돼지가 나오기도 했지만, 아무리 훈련시켜도 학습이 불가능한 경우도 있었다. 유명한 '구두쇠 너구리'의 예를 살펴보자.
브렐란드 부부는 앞발을 사람의 손처럼 잘 사용하는 너구리들에게 저금통에 동전을 저금하는 연기를 시키고자 했다. 먼저 동전을 집는 행동은 쉽게 학습되었 다. 그 다음 단계인 금속상자에 동전을 집어넣는 행동의 학습에서 약간의 문제가 생겼다. 너구리가 동전을 손에서 놓으려 하지 않고 상자의 안쪽 면에 문지르기도 하고, 넣었다가 다시 꺼내서 몇 초 동안 꽉 쥐고 있기도 했던 것이다. 그래도 이 행동은 훈련을 거듭하자 사라졌고, 결국 너구리는 동전을 상자에 집어넣을 수 있 었다. 그런데 동전 두 개를 집어서 상자에 넣는 훈련 단계에서 정말로 큰 문제가 생겼다. 너구리는 동전을 상자에 집어넣으려 하지 않을 뿐 아니라 몇 초 동안, 심 지어는 몇 분 동안 두 동전을 마주 문지르고 나서야(마치 구두쇠처럼) 겨우 상자에 집어넣었던 것이다. 동전을 문지르는 행동은 강화를 받지 못했으므로 효과의 법 칙에 따르면 약화되어야 함에도 불구하고 갈수록 많아져서 결국 이 훈련은 중지 되고 말았다. 왜 너구리가 이 훈련을 마칠 수 없었을까? 너구리는 먹이를 문지른 후 먹는 습성이 있다. 동전을 상자에 넣으면 먹이가 주어지기 때문에 동전은 먹 이와 짝지어지고 따라서 먹이의 속성을 넘겨받아 조건강화물이 된다. 결국 너구 리는 동전들을 먹이처럼 취급하여 본능적인 습성대로 서로 문지르게 되었던 것 이다. 이처럼 학습된 행동이 본능적 행동과 상충되어 와해되는 것을 향본능 표류 instinctual drift)라 한다.
5. 인지학습
조건형성 연구들은 학습이 기계적인 원리들에 따라 이루어지는 아주 수동적이 고 연합적인 과정임을 시사한다. 이런 관점에 따르면 무엇을 학습하는 데는 사고 나 문제해결 과정이 필요 없다. 구구단을 암기하거나 테니스 공 받아치기를 연습 하는 데는 이런 조건형성 원리들이 작용하지만, 우리의 학습 방식이 오로지 조건 형성 원리들에만 따르는 것일까? 기하학적 증명문제의 요점을 파악하거나 자동 차의 엔진이 어떻게 작동하는지를 배우는 경우처럼 복잡한 유형의 학습을 설명 하기 위해서는 사고와 정신활동의 역할이 중요해진다. 자극-반응의 연합을 지배 하는 조건형성 원리들로 설명되기 힘든 이런 유형의 학습을 인지학습(cognitive learning)이라고 부른다.
1) 통찰학습
통찰(insight)이란 문제상황에서 갑작스럽게 문제 해결이 이루어 지는 현상을 이른다. 독일의 심리학자 쾰러(Köhler, 1926)는 침팬지 를 대상으로 통찰학습에 대한 고전적인 연구들을 행하였다. 한 실 험에서 그는 침팬지 우리 속에 상자들과 막대를 넣어놓고 천정에 손이 닿지 않도록 바나나를 매달아 놓았다. 이 상황에서 침팬지들 은 여러 가지 행동들을 해 보다가 포기하는 듯했지만 결국에는 올 바른 해결책을 찾아내곤 했다. 예컨대, 막대로 과일을 쳐서 떨어뜨 리거나, 상자를 바나나 아래로 끌고 가서 받침대로 삼아 올라가서 바나나를 땄다. 쾰러는 바나나를 점점 더 높이 매달아 놓았는데, 그 러자 침팬지들은 상자 위에 또 상자를 쌓아서 바나나를 따는 행동까지도 할 수 있었다([그림 4-10] 참조).
쾰러는 이러한 수행이 특정한 반응경향성이 기계적으로 강화되거나 약화된 결 과가 아니라 문제에 대한 통찰을 얻었기 때문이라고 생각했다. 동물들은 일단 문 제가 해결되면 보통 그 후부터 '자신이 무엇을 하는지를 알고 있는 것' 처럼 유연 한 수행을 계속했으며 더 이상의 실수는 드물었다. 또한 통찰적 해결은 침팬지가 상황을 탐구하는 듯 머리와 눈만 굴리면서 가만히 있다가 갑자기 나타났다. 이
모든 것은 손다이크의 고양이들의 시행착오적 행동과는 아주 다른 것이었다. 게
다가 침팬지들은 한 과제에서 배운 것을 다른 과제에까지 전이(transfer)시킬 수가 있었다. 예컨대, 상자와 막대를 치워 버리면 침팬지는 작은 사다리나 책상을 끌고 와서 받침대로 사용했다. 한 침팬지는 사람(쾰러)을 바나나 아래에 끌고 가서 받 침대로 사용하려고 하기도 했다.
우리는 통찰학습을 일상적으로 경험하기 때문에 그것이 고차적인 학습이라고 당연히 믿지만 통찰학습도 도구적 조건형성의 원리들로 설명할 수 있다고 생각 하는 학자들과 그 증거도 있다(Epstein et al., 1984).
2) 인지도
사람이나 침팬지뿐만 아니라 쥐도 인지학습을 할 수 있다. 도구적 조건형성 연 구에는 문제상자나 스키너 상자 외에도 미로가 많이 사용되는데, 동물은 미로학 습 시에 무엇을 배울까? 조건형성 원리들에 의하면 동물은 미로 속의 자극들에 대해 특정한 반응을 하기를 배운다. 예컨대, T자형 미로에서 먹이가 항상 자의 오른쪽 가지 끝에 있으면 동물은 선택지점에서 오른쪽으로 도는 반응을 학습한 다는 것이다. 효과의 법칙에 따라, 왼쪽으로 도는 반응은 강화를 받지 못하므로 약화되고 오른쪽으로 도는 반응은 강화를 받아 증강된다. 그러나 톨만(Tolman, 1932)은 이러한 견해를 부정하고 동물이 미로에 대한 일종의 정신적인 지도, 즉
인지도(cognitive map)를 습득한다고 주장했다. 다시 말하면 동물은 미로가 어떻게
생겼는가에 대한 지식을 학습한다는 것이다. 톨만의 실험을 보자.
이 실험에 사용된 [그림 4-11]과 같은 미로에는 출발상자에서부터 목표상자까 지 가는 길이가 다른 세 가지 길 A, B, C가 있었다. 훈련 초기에 쥐들은 미로를 탐색하면서 세 길들을 다 거쳐 보는데, 점차로 가장 짧은 B를 선호하고 가장 긴 는 거의 사용하지 않게 되었다. 도구적 조건형성의 용어로 말하면, 길 B로 가는 반응의 강도가 가장 강하고 길 C로 가는 반응의 강도가 가장 약해졌다. 이제 길 B를 [그림 4-11]에서처럼 차단(× 표시 부분)하면 길 B뿐 아니라 길 A도 막혀 버 리게 된다. 길 B가 차단된 후 처음으로 행해진 시행에서는 물론 쥐들이 길 B로 가다가 막혀서 목표상자에 도달하지 못하였다. 그 다음 시행에서는 어떤 일이 일 어날까? 만약 쥐들이 특정 반응만을 학습했다면 그 다음 시행에서 두 번째로 강 한 반응, 즉 길 A로 가는 반응을 해야 할 것이다. 그러나 과반수의 쥐들이 가장 약한 반응, 즉 길 C로 가는 반응을 하였다(Tolman & Honzik, 1930). 이런 결과는 동물이 인지도를 획득한다는 톨만의 주장을 지지하는 것이다.
3) 관찰학습
조건형성 실험에서는 유기체가 대개 학습할 반응들을 직접 수행함으로써 배운 다. 개가 먹이를 받고 침을 흘리지 않으면 CS에 대해 침 흘리는 반응이 학습될 수 없으며, 비둘기가 원반을 쪼는 반응을 하지 않으면 먹이가 주어지지 않으므로 원 반 쪼기가 학습될 수 없다. 그러나 우리가 모든 행동을 실제 수행을 통해 학습해 야 한다면 큰 문제가 생긴다. 효과의 법칙에 따르면, 예컨대 운전을 배우는 사람 은 여러 행동들을 시행착오적으로 하면서 그중 보상받은 몇 가지 행동들을 학습 할 것이다. 차를 움직이는 것은 여러 반응들을 해 보다가 우연히 가속페달을 밟 는 반응을 함으로써 배울 수 있다고 치자. 그러면 차를 정지시키는 것은 어떤가? 브레이크를 밟는 반응을 하기 전에 전조등을 켜거나 기어를 바꾸는 등의 엉뚱한 반응들을 하면 그것이 차를 정지시키는 데 아무 효과가 없다는 것을 배우기도 전에 사고가 나게 마련이다.
유기체가 직접 경험을 하는 대신에 다른 개체들의 반응을 보고 모 방함으로써 학습을 하는 것을 관찰학습(observational learni 또는 대리학습(vicarious learning)이라고 한다. 관찰학습의 대표적인 예로서 반두라(Bandura, 1965)는 [그림 4-12]에서 보는 바와 같이 아동들이 타인의 공격적 행동을 얼마나 잘 모방하는가를 보여 주었다.
지금까지 살펴본 바와 같이 학습이란 단지 학교공부만을 가리키는 것이 아니 며, 유기체의 생활 전반을 지배하는 현상이다. 일상적인 예를 하나 들어 보자. 사 람마다 성격이 제각각이어서, 어떤 소녀들은 애교가 넘치는 반면 무뚝뚝한 소녀 들도 있다. 대개 성격이라는 것은 타고난 특성이라서 고치기 힘든 것으로 이야기
된다. 그렇지만 그런 성격 차이는 그들이 자라면서 서로 다른 행동을 학습했기 때문일 수 있다. 소녀 A는 애교 있는 행동을 할 때마다 부모들이 좋아하고 칭찬 해 준 반면, 소녀 B는 애교 있는 행동을 해도 부모가 무관심하거나 오히려 구박 했다고 하자. 효과의 법칙에 의하면 소녀 A는 애교 있는 행동을 더욱 많이 하게 될 것이고, 소녀 B는 부모의 관심과 칭찬을 이끌어 낼 수 있는 다른 행동(예컨대, 말없이 공부만 열심히 하는)을 모색하게 될 것이다. 즉, 환경으로부터 주어지는 강 화의 차이가 이 두 사람의 성격 차이를 초래했을 수 있다는 것이다. 학습심리학 의 특징은 인간행동의 원인을 성격심리학처럼 개인 내부에서 찾는 것이 아니라 살아온 환경이라는 개인 외부에서 찾는다는 것이다. 이러한 설명 방식의 이점은 개인의 결심이나 의지에 호소함으로써가 아니라 환경을 적절히 변화시킴으로써 사람의 행동을, 따라서 성격도, 변화시킬 수 있다는 것이다.
살아가는 환경이 변화할 때 그 변화에 대처하여 행동을 변화시킬 수 없는 유기 체는 생존경쟁에서 학습능력이 우월한 유기체에게 밀려나 도태되게 된다. 따라서 인간이 이른바 만물의 영장이라는 지금의 위치에 설 수 있게 된 이유 중의 하나는 지구상의 어떤 동물들보다도 뛰어난 학습능력을 지니고 있기 때문일 것이다.
'심리학' 카테고리의 다른 글
단기기억과 장기기억이 다르다? (0) | 2023.05.23 |
---|---|
어떻게 하면 기억을 잘 할수 있을까? (0) | 2023.05.20 |
학습의 정의와 종류란? (0) | 2022.12.05 |
지각 기능이란? (0) | 2022.12.04 |
감각기관은 어떻게 역할을 수행할까? (0) | 2022.12.04 |