수학교육 연구의 목적과 방법(Purposes and Methods of Research in Mathematics Education)

by Lee Yeohyeon
367 views

수학교육 연구의 목적과 방법

Notice of the AMS의 2000년 6,7월 호 641쪽에 있는 글
Alan H. Schoenfeld 씀/ 이여현이 옮김

버드란트 러셀은 수학을 [무엇에 대해 말하고 있는지를 모르거나 혹은 말하고 있는 것이 사실인지를 알 수 없는 과학]으로 정의했다. 수학은 다른 많은 과학분야에 폭넓게 활용되는 것으로 보인다. 따라서 다른 많은 과학자들은 그들이 무엇을 말하고 있는지 모르거나 그들이 말하는 것이 사실인지 모른다.
-Joel Cohen, ``On the nature of mathematical proofs''
수학교육에서 증명(proof)은 없다.
-Henry Pollak

첫 인용문은 농담같고 두 번째 인용문은 진지하다. 그러나 둘 다 수학과 수학교육 사이의 중요한 차이점을 강조하고 있다. 그리고 이는 수학교육의 방법 및 결과의 본질을 이해하기 위해 반드시 이해해야만 하는 차이점이다.

Cohen의 말은 수학의 심각한 측면을 짚고 있다. 예를 들어 여러 기하학을 설명할 때, 정의되지 않은 용어들로 시작한다. 그 다음 논리 규칙에 따라 몇 가지 사실이 참이라면 다른 결과들이 따라 온다는 것을 증명한다. 한편, 용어들은 정의되지 않았다. 즉 ``우리가 무엇에 대해 이야기하는지 결코 알 수 없다.'' 다른 한편으로는 결과들은 분명하다. Gertrude Stein이 말한 바와 같이 증명은 증명이라는 증명이다(A proof is a proof is a proof).

다른 분야는 다른 방식으로 일한다. Pollak의 이야기는 수학교육이 의미없음을 뜻하는 것이 아니라 수학교육의 증거와 논의의 본질이 수학의 증거와 논의의 본질과 꽤 다르다는 것에 초점을 둔 말이다. 실제로 교육 연구에서 물어볼 수 있는 질문들(그리고 기대할 수 있는 답변들)은 수학자들이 기대할 법한 질문의 종류가 아니다. 그 외에도 수학자들과 교육연구자들은 수학교육 연구의 목적과 방법을 다른 관점으로 바라보는 경향이 있다.

이 논문은 관련된 관점 몇 가지를 제시하고 수학교육 안에서의 탐구의 본질에 대한 배경지식을 제공하기 위한 이야기로 시작한다. 살펴볼 질문들은 다음과 같다. 도대체 그 활동(the enterprise)은 무엇인가? 즉 수학교육 연구의 목적은 무엇인가? 수학과 물리학의 이론 및 모델과 대조되는 교육의 이론과 모델은 어떤 모습을 갖고 있는가? 어떤 종류의 질문들이 교육 연구에서 답할 수 있는 것들인가? 그러한 질문들이 주어졌을 때 무엇이 합리적인 답을 주는가? 어떤 종류의 증거들이 교육적 주장을 뒷받침하는데 적합한가? 어떤 종류의 방법들이 그러한 증거들을 만들어낼 수 있는가? 주장, 모델 및 이론을 평가하기 위한 어떤 기준이 있을 수 있는가? 곧 알 수 있듯이 이 모든 질문들에 대한 수학과 교육 사이에 중요한 차이점들이 있다.

목적(Purposes)

수학교육 연구는 두 가지 주요 목적이 있다. 하나는 이론적(pure)인 것이고 하나는 응용된(applied) 것이다.

  • 이론(기초 과학): 수학적 사고, 교수, 학습의 본질을 이해하는 것
  • 응용(공학): 이러한 이해를 바탕으로 교수법을 개선하는 것

이들을 상당히 밀접하며 첫 번째 것은 적어도 두 번째 것 만큼 중요핟. 그 이유는 간단하다. 사고방식, 교수, 학습에 대한 깊은 이해 없이는 ``응용된 측면(applide front)''의 지속적인 발전이 불가능하기 때문이다. 유용한 비유로 의학연구와 실제 사이의 관계가 있다. 의학연구에는 넓은 범위가 있다. 몇몇은 가까운 미래의 잠재적인 응용으로 긴급하게 수행된다. 몇몇은 생리적인 매커니므의 기초를 이해를 목적으로 수행된다. 장기적으로 볼 때 이 두 종류의 일이 시너지 효과를 발휘한다. 이는 기초 지식은 본질적인 호기심이거니와 응용 연구의 기반이 되는 기초를 확립하고 강화하기 때문이다.

이 이중의 목적을 이해해야 한다. 이들은 많은 수학자들의 관점에서 볼 수 있는 하나의 목적과는 상당히 대비된다:

  • ``교실에서 무엇이 효과가 있는지 말해봐.''

이렇게 말하는 것이 수학자들은 수학교육의 기초연구의 어떤 추상적인 수준에 관심이 없다는 것을 의미하지는 않지만, 수학자들의 기본적인 기대가 직접적이고 실제적인 부분의 유용성에 있다는 것을 의미한다. 물론 교육 공동체는 반드시 유용한 결과들을 제공해야 한다. 실제로 유용성은 교육적 연구에 대단히 주요한 동기가 된다. 그러나 직접적인 활용(교육과정 개발, 교육적 처방의 효과에 대한 ``증명'' 등)이 수학교육 연구의 기본적인 본분이라 생각하는 것은 오해이다.

질문들(On Questions)

수학교육이 줄 수 있는 것이 무엇인지 생각할 때 중점적으로 다루어야 할 주요한 이슈는 수학교육 연구가 답할 수 있는 질문은 어떤 것인가라는 것이다.

간단히 말해, 수학자들이 가장 전형적으로 제기하는 교육적 질문인 ``무엇이 효과적인가?''나 ``어떤 접근이 더 좋은가?''라는 질문은 원칙적으로 답변할 수 없는 경향이 있다. 이는 사람이 효과를 생각하는 것은 가치관에 의존하기 때문이다. 어떤 교육적 접근이 성곡적인지 여부를 결정하기 전에는 다음과 같은 질문들이 선행되어야 한다. 도대체 무엇을 얻길 원하는가? 어떤 조건하에서 무슨 제약들이 있는지, 어떤 학생들을 위해서 무엇을 이해하는 것인지? 다음 예를 고려해보자.

교직원이나 행정가들이 종종 묻는 질문 중 하나는 ``대형 수업이 작은 수업만큼 좋은가?''이다. 이 질문이 관념적인 사고안에서 답할 수 없는 질문임은 분명하다. 누군가 대형 수업을 흡족해하는 것은 그가 중요하다고 생각하는 결과가 무엇인지에 달려있다. 학생들의 참여의식이 얼마나 가치있는가? 그 과정과 그 학과에 대한 학생들의 느낌이 중요한가? 후속 수학 과정에 대한 학생들의 등록 비율에 대한 우려가 있는가? 대형 수업의 유용성에 대해 이끌어낼 수 있는 결론은 이러한 결과가 얼마나 무게있게 주어졌는지에 따라 크게 차이가 날 수 있다.

수학을 가르치는 것에만 초점을 맞추더라도 마찬가지의 문제가 발생한다. 누군가 학생들이 대형 수업에서 작은 수업에서만큼 많이 배우는가?라는 질문에 답하기를 원한다고 해보자. 즉시 할 수 있는 질문은 ``무엇이 수학이라 할 수 있는가? 문제 해결, 모델링, 수학적 의사소통 등에 어떻게 비중을 두는가?''이다. 한 형태의 강의가 다른 형태의 강의에 비해 효과적인지에 대한 판단은 이 질문들에 대한 답변에 달려있다. 분명히 말하자면, 연구자는 무언가가 존재하는지 여부를 결정할 수 있기 전에 무엇을 찾고 있는지 그리고 무엇을 그 증거로 택할지를 알아야만 한다.

누군가의 판단에는 그 사람의 가치관이 반영된다는 사실은 [어떤 접근이 더 효과적인가(혹은 최선인가)?]와 같은 유형의 질문에도 적용된다. 이것은 분명해 보이기도 하지만 때로는 그렇지 않기도 하다. 미적분학 개혁을 생각해보자. Douglas[5]에서 문집이 소개된 Tulane “Lean and Lively” 컨퍼런스 직후 National Sciene Foundation(국립과학재단;NFC)은 주요 미적분 계혁 계획에 자금을 지원했다. 1990년대 중반까지 NSF 프로그램의 임원들은 미적분 개혁이 ``좋은 것''이라는 확신, 그리고 이 것이 다른 컨텐츠 분야의 개혁의 모델이 되어야 한다는 확신을 갖고 있었다. NSF는 수학교육 연구자들과 함게 개혁에 참여했던 수학자들을 모았으며 다음과 같은 질문을 제시하였다. ``미적분 개혁이 효과가 있다는 것의 증거를 얻을 수 있는가?(즉 미적분을 개혁한 것이 전통적인 미적분보다 더 좋다는 증거를 얻을 수 있는가?)'' 기본적으로 그들이 염두해 두고 있던 것은 어떤 형태의 시험이었다. 그들은 시험을 구성 및 관리하는 것과 개혁된 미적분을 배운 학생들이 더 우수하다는 것을 보이는 것이 쉬워야 한다고 생각했다.

이러한 접근을 지지하는 사람들은 그들이 제안한 것이 본질적으로 사과와 오랜지를 비교하는 것과 같음을 이해하지 못했다. 기호 조작의 수행능력에 크게 의존한 전통적인 시험이 주어진다면, ``개혁'' 미적분을 배운 학생들은 계산 기법을 연습하지 않았기 때문에 불리한 입장에 놓인다. 또한 테크놀로지에 의존하거나 모델링 요소가 많은 시험이 주어진다면, 전통적인 교육을 받은 학생들은 그들의 교육과정에 테크놀로지나 모델링이 큰 비중을 차지하지 않기 때문에 역시 불리한 입장에 놓인다. 어느쪽이든 시험을 치르고 점수를 비교하는 것은 공평하지 않을 것이다. 진행하기 위한 적절한 방법은 교육과정을 살펴보고, 중요한 주제들을 식별하고 이들을 개념적으로 이해하는 것이 무엇인지를 명확히 하는 것이었다. 이러한 종류의 정보를 통해, 개별 기관 및 학과(그리고 필요하다면 직업 전체)는 그들이 평가하기를 원하는 가장 중요한 이해의 측면과 그들이 원하는 평가 및 방식을 결정할 수 있게된다. 연장된 논의 끝에, NSF의 노력은 미적분 개혁의 효과를 입증하는 것에 초점을 둔 것에서 미적분학의 교수법의 효과를 찾기 위한 틀을 개발하는 것에 초점을 두는 것으로 발전하였다. 이러한 노력의 결실이 1997년에 출간된 책 Student Assessment in Calculus[10]이다.

요컨대 자연스러워 보이는 많은 질문들--무엇이 효과 있는가? 혹은 어떤 방법이 가장 좋은 방법인가?와 같은 유형--은 대답할 수 없는 타당한 이유가 있다.

이를 감안할 때, 수학교육의 영역에서 연구 할 수 있는 질문들은 어떤 것인가? 수학교육 연구에서 기본적으로 할 수 있는 것들은 다음과 같다는 걸 말하고자 한다.

  • 사고, 학습과 가르침을 이해하기 위한 이론적 관점;
  • 인지 측면의 설명(예를 들어, 수학적으로 생각하는 것, 학생들이 함수나 극한 개념을 이해하거나 오해하는 것 등);
  • 존재성 증명(문제해결 학습, 귀납법, 군론 등을 배울 수 있다는 증거; 교수법의 다양한 종류의 실행 가능성에 대한 증거);
  • 다양한 형태의 교수법의 결과에 대한 (긍정적이거나 부정적인) 설명

Michèle Artigue의 Notices의 최근 논문[1]은 이러한 연구의 많은 결과들을 설명하고 있다. 이제 다른 몇 가지를 설명하고 아래의 ``Methods'' 절에서 그들을 얻어내기 위한 방법들에 대해 논할 것이다.

이론과 모델, 좋은 것의 기준(On Theories and Models and Criteria for Good Ones)

수학자들이 ``이론''과 ``모델''을 이야기할 때, 그들은 대체로 [``이론''과 ``모델''의 실체에 대한 것] 그리고 [그들에 관한 주장을 하는데 사용된 증거 같은 것]과 같은 대단히 명확한 종류의 것들을 염두해 두고 있다. ``이론''과 ``모델''이라는 용어는 생명과학이나 사회과학에서 다른 방식으로 사용되곤 하는데 그것이 좀더 교육에서 사용하는 것과 유사한 면이 있다. 이 절에서는 표1에 나와있는 예들을 간단히 살펴보고자 한다.

과목 수학, 물리학 생물학 교육, 심리학
..의 이론 방정식; 중력 진화 마음
..의 모델 플레이트에서의 열흐름 포식자-피식자 관계 문제 해결

표1. 수학/물리학, 생물학, 교육/심리학의 이론과 모델; Reprinted with Permission from [11], page 9.

수학에서의 이론은 방정식 이론이나 복소변수의 이론처럼 명시적으로 나열된다. 결과들은 분석적으로 얻어진다. 즉 질문안의 대상들이, 그 대상들이 가진다고 주장하는 성질들을, 갖는다는 것을 보인다. 고전 물리학에서는 특이성의 비교가능한 범위가 있다. 예를 들어 물리학자들은 중력인력에 대한 역-제곱 법칙을 명확히 말한다. 모델은 근사적인 것으로 이해되지만, 그들은 결정론적 형태의 매우 구체적인 근삿값을 기대한다. 그러므로 예를 들어 laminar plate에서의 열흐름 모델을 만들기 위해 초기 경계조건과 열흐름조건을 명시하고 관련된 방정식을 푼다. 즉 그 과정에는 모호한 것이 없다. 설명은 명시적이며 정확함의 표준은 수학적인 증명이다. 이로부터 도출한 이론과 모델은 [이론의 정확성에 대한 경험적인 입증으로 간주되는 예측]을 만들어 내는데 사용될 수 있다.

생명과학에서는 이러한 것들이 더욱 복잡하다. 예를 들어 진화 이론을 생각해보자. 생물학자들은 일반적으로 이의 본질적인 정확함에는 동의하지만, 진화를 지지하는 정리된 증거들은 수학이나 물리학에서 사용하는 종류의 증거와는 완전히 다르다. 진화가 옳다는 것을 수학적인 양식으로 증명할 방법은 없다. 이를 뒷받침하는 논증들은 대립가설의 신중한 고찰과 함께 (Pólya의 책 중 한권의 제목을 빌리자면) ``말이되는 추론의 패턴들''으로 구성된다. 실제로 생물학자들은 다음과 같이 말해왔다. ``우리는 이론과 일치하는 산더미 같은 증거들을 갖고 있다. 제안된 이론을 부정하는 명백한 증거가 없으며, 같은 기준을 충족하는 경쟁가설은 없다.'' 진화적 사건의 시간 규모를 생각하면 진화에 대한 미래 예측은 가능하지 않은 반면, 이론은 다른 형태의 예측을 뒤받침한다. 앞서 분석되지 않은 화석 기록은 반드시 이론에 맞아야 하기 때문에 따라서 이론은 화석의 성질, 특히 지질 지층이 가져야 하거나 혹은 갖지말아야 할 성질을 기술하는데 사용될 수 있다. 누적된 기록은 이론에 대한 입증으로 간주된다.

요컨대 이론과 뒷받침하는 증거는 생명과학과 수학 및 물리학에서 상당히 다를 수 있다. 이는 모델, 혹은 적어도 그들이 기대하는 정확한 정도에 대해서도 마찬가지이다. 누구도 laminar plate에서의 열흐름이 열흐름 모델에 따를 것으로 예상되는 것과 동일한 방식으로 동물의 개체수가 그것의 포식자-피식자 모델을 따르는 개체수를 형성할 것이라 기대하지 않는다.

끝으로 과학에서의 이론과 모델은 늘 개정과 제련의 대상이다. 영광스럽고 놀랍운 것으로 여겨진 뉴턴의 중력 이론은 아인슈타인의 상대성 이론으로 대체되었다. 또한 핵이론을 생각해보자. 핵 주변에서 궤도를 그리면서 도는 전자 모델을 기초로한 원자가 이론은 아직 밝혀지지 않은 원소의 존재성과 같은 놀라운 예측을 가능케 했다. 그러나 물리학자들은 더이상 전자가 핵 주변에서 궤도를 선회한다고 말하지 않는다. 이론에서 전자와 같은 고체입자들은 이제 확률적인 전자구름으로 대체되었다. 이론들은 진화한다.

수학교육 연구는 앞서 언급한 물리학과 생명과학 연구의 많은 특성들을 갖고 있다. 예를 들어 ``마음의 이론''에서는 정신 조직의 본질에 대한 어떤 가정(예를 들어 특정한 방식으로 기능하는 어떤 종류의 정신구조가 있다는 가정)을 한다. 이러한 가정 중 하나로 작업기억 혹은 ``단기''기억과 같은 다양한 종류의 기억이 있다는 것이다. 그 이론에 따르면 사고(생각하는 것)는 작업 기억을 사용함으로써 하게 된다. 즉 사람들이 정신적으로 잘 조작하는 ``생각의 대상''은 일시적으로 작업 기억에 저장된다. 흥미로운(그리고 과학적인) 것은 이 이론이 작업 기억에 다소 강한 한계를 두는 것이다. 사람들은 작업기억에 한 번에 정보의 ``작은 덩어리(chunk)''들을 9개까지 유지할 수 있다고 (예를 들어 [8]에서) 주장한다.

이 주장이 실제로 사실일 수 있다는 것을 살피기 위해 눈을 감고 $379$에 \(658\)을 곱하는 것을 시도해보자. 대부분의 사람들은 이것이 불가능하진 않더라도 적어도 쉽지 않다는 것을 알 수 있을 것이다. (최근 회의에서 \(75\)명의 수학자들에게 이 과제를 부여해보았는데 일이분만에 성공한 사람은 아무도 없었다.) 이는 한 사람이 추척해야나가야 하는 원래의 수 및 곱셈과정에서 생기는 다양한 부분합(subtotal)들의 개수가 $9$개를 넘어서기 때문이다. 하지만 한 사람은 몇몇의 부분합을 연습한 후에 이 과제를 정신적으로 더 잘 수행할 수 있다. 예를 들어 한 사람은 \(8\times379=3032\)를 계산할 수 있고 ``\(3032\)''가 하나의 chunk가 되고 작업기억의 오직 하나의 공간(한 ``buffer'')만 차지할 때까지 머릿속으로 반복할 수 있다. 이는 다른 계산들을 할 수 있기에 충분한 작업 공간을 남겨준다. 이런 종류의 chunking을 이용하여 사람은 작업기억의 한계를 넘어설 수 있다.1

이제 사람의 작업 기억이 $9$개의 슬롯을 넘지 못한다는 주장의 진실성을 고려해보자. 이 주장의 절대적인 증명이란 존재하지 않을 것이다. 첫 째, 연구자들이 뇌 속의 작업기억 buffer들의 물리적 위치를 (그것이 존재하더라도) 찾을 것 같지 않다. Buffer는 모델의 구성요소들이며 이것이 꼭 물리적인 대상일 필요는 없다. 둘 째, 이 주장을 지지하는 증거들은 설득력이 있지만 이들이 최종적일 수는 없다. 사람들이 작업기억에서 $9$개의 슬롯보다 많은 슬롯들을 사용해야하는 과제들을 주고 사람들이 그것에 실패한 (혹은 약간의 노력 후에 몇몇의 chunking을 형성함으로써 그것을 수행한) 많은 종류의 실험들이 행해졌다.

진화처럼, 이 주장에 잘 부합하는 엄청나게 많은 증거들이 있으며 이에 모순되는 확실한 증거는 없고 동일한 기준을 충족시키는 경쟁 가설도 없다. 그러면 이것이 증명된 것인가? 수학적인 양식으로는 그렇지 않다. 본질적으로, 관련된 기준은 중립적인 심사원이 합리적인 의심을 할 수 없을 정도의 증거로 간주하는 것이다. 동일한 이야기를 모델들, 말하자면, 문제해결의 모델 또는 (내가 지금 관심있는) 교수 모델([12], [13] 참조)들에 대해서도 할 수 있다. 나는 최근 교사들이 어떻게 그리고 왜 교실에서 쉴 새 없이 그들이 행하는 행동들에 대해 이론적으로 설명하는 시도를 하고 있다. 이 연구는 기억 이론과 같은 세부 수준으로 정교화되어 있으며 ``맥락 속 교수 이론(theory of teaching-in-context)''으로 불린다. 주장하는 바는 이 이론과 특정 교사를 모델링하기에 충분한 시간이 있다면, 그 혹은 그녀의 교실 행동을 특징하는 그 사람의 교수에 대한 상당한 정확한 설명을 만들 수 있다는 것이다. 이 연구를 보면 leminar plate에서의 열흐름 모델링에서 얻는 것과 같은 정확도를 기대할 수는 없다. 그러나 이러한 행동이 포식자-피식자 모델과 같이 ``실 세계'' 행동과 동일한 정도의 정확함으로 모델링 할 수 있을 것이라 기대하는 것이 말이 안되는 것은 아니다.

다음 절에서는 이론, 모델, 그리고 결과들을 판단하는 기준에 대한 질문들을 살펴본다.

방법(Methods)

이 글에서는 학부수학교육의 연구 방법들에 대한 beginning catalogue조차 제공할 수 없다. 이 과제의 규모를 짐작하기 위해 Handbook of Qualitative Research in Education[6]이 약 900쪽이나 된다는 사실을 생각해보라. 그 책의 장들은 민족학(예를 들어 ``교실의 문화''를 어떻게 이해하는지?), 담론 해석(의사소통의 섬세한 연구에서 어떤 패턴을 발견되는지?), 인지형성에 있어서 문화의 역할, 주관성과 정당성에 대한 주제 등 광범위한 논의들을 포함하고 있다. 그리고 그것들은 질적인 연구뿐이다. 물론 사회과학에서 오랜 양적 연구 전통도 있다. 내 목표는 오히려 행해지는 연구의 종류에 방향을 제공하고, 그들이 만들 수 있는 발견들(그리고 그것의 한계)의 종류들을 제안하고자 하는 것이다.

교육연구에 익숙하지 않은 사람들은 [실험 및 대조군 그리고 결과들이 유의미한지 여부를 결정하기 위한 통계의 사용]을 포함하고 있는 실험연구의 관점으로 생각하는 경향이 있다. 밝혀진 바와 같이 교육에서 통계를 사용하는 것은 생각보다 훨씬 더 복잡한 문제이다.

세기 중반부터 몇 년간의 사회과학의 연구는 (적어도 미국에서는) 농업의 사례에 의해 지배되었다. 그 기본적인 개념은 만일 특정 농작물의 두 땅이 하나의 변수를 제외하곤 모두 동일하게 다뤄졌다면 작물 수확량의 차이는 그 변수의 차이에 기인한다는 것이다. 의심의 여지 없이 사람들은 교육에 대해서 동일하게 할 수 있다고 믿었다. 만일 X를 가르치는 새로운 방식이 더 뛰어난 방식이라는 것을 증명하고 싶다면 X를 공부한 두 학생그룹-한 그룹은 표준적인 방법으로 배웠고 다른 한 그룹은 새로운 방식으로 배운 두 그룹-에 대한 실험을 할 수 있을 것이다. 만일 새로운 방식으로 배운 학생이 더 잘 했다면 이는 그 교수 방법의 우월성의 증거를 얻은 것이다.

앞선 절에서 언급된 교수의 목적에 대한 문제, 그리고 예전 및 새로운 교수법의 동일한 것들에 초점을 맞추고 있지 않을 수 있다는 사실의 문제는 잠시 접어두자. 예전 및 새로운 교수법 모두에게 공정한 시험을 만들 수 있다고 상상해보자. 그리고 실험군 및 대조군에 임의적으로 배정하여 표준적인 실험절차를 따랐다고 가정해보자. 그럼에도 불구하고 이 실험에는 심각한 잠재적 문제들이 여전히 존재한다. 만일 다른 교사들이 두 학생 그룹을 가르쳤다면, 결과에 대한 어떠한 차이점도 그 가르치는 방식의 차이에 기인한 것일 수 있다. 그러나 동일한 교사가 두 학생 그룹을 가르쳤다하더라도 무수한 차이점들이 존재할 수 있다. 그것은 에너지 혹은 위탁과 관련있을 수 있다. ``동일한 예전 것''을 가르치는 것은 새로운 아이디어를 시도하는 것과 같지 않다. 혹은 한 그룹의 학생들은 그들이 무언가 새롭고 실험적인 것을 얻고 있다는 것을 알게 될 수도 있다. 이것만으로도 상당한 차이가 만들어 질 수 있다. (사람들은 변화가 그들 자신의 이익을 위해 만들어진다고 느끼면, 그 변화가 실제로 무엇이든 간에 더 열심히 그리고 더 잘 할 것이라는 것을 보여주는 많은 문헌들이 있다. 이 변화의 효과는 시간이 지남에 따라 사라진다.) 혹은 학생들은 실험받는 것에 불쾌감을 느낄 수 있다.

이제 중요한 사례를 하나 살펴보자. 몇 년 전 미적분학에 대한 독립형 교수 자료 묶음을 개발한 적이 있다. 다른 대학의 동료들은 그들의 학생들이 그 자료를 사용하는데 동의했다. 두 개의 절을 제외한 모든 절에서 그 자료를 받은 학생들이 그것을 받지 않은 학생들보다 더 잘하였다. 그러나 두 절에서 성취도의 본질적인 차이는 존재하지 않았다. 교직원 대부분은 그 자료들을 호의적으로 소개하고 학생들에게 도움이 될 것임을 시사한 것으로 드러났다. 차이가 없는 것으로 보인 절의 강사는 ``그들이 나에게 이걸 전하라는 요청을 했다. 나는 그들이 좋은지 모르겠다.''라고 말하며 나누어주었다.

간단히 말해서 교육 연구에서 고전적인 실험방법들은 문제의 소지가 있다. 단 두 개의 난점을 언급하기 위해 의학적인 의미에서의 이중 눈가림(누가 진짜 치료를 받고 있는지, 누가 가짜 치료를 받고 있는지를 의사와 환자 모두 모르는)실험은 드물게 눈가림되며 많은 변수들은 그 어떤 엄밀한 의미에서도 좀처럼 제어할 수 없다. (이는 앞선 문단의 사례의 요점이었다.) 결과적으로 긍정적인 결과 및 부정적인 결과 모두 설명하기 어려울 수 있다. 이것이 이러한 연구가 유용하지 않다고 말하는 것이거나, 큰 규모의 통계적 연구가 가치가 없다는 것을 말하는 것은 아니다.(분명히 이는 가치있다.) 그러나 큰 규모의 통계적 연구는 반드시 상당한 주의를 기울여 수행해야하며 결과와 주장을 모두 동일하게 주의 기울여 설명해야만 한다. 일관된 가치의 통계적 연구는 다음과 같은 경향이 있다.

  1. 인구에 대한 일반적인 결과들을 만들어낸다. 예를 들어 Artigue[1]은 ``프랑스 대학교에 입학하는 40% 이상의 학생들이 모든 양수 \(N\)에 대하여 두 수 \(A\)와 \(B\)가 \(1/N\)보다 가깝다면 그 두 수는 한없이 가까울 뿐 서로 같은 필요는 없다고 생각한다''는 것을 언급하고 있다.
  2. 두 개 이상의 무리의 명확한 비교를 제공한다. 예를 들어 the Third International Mathematics and Science Study의 결과들은 수학내용 범위의 다양한 국적의 학생들의 기초 성취를 문서화했다.
  3. 시간이 지남에 따라 더 작은 규모의 관찰 연구에서 처음 밝혀진 것들의 실증을 제공한다.

대부분의 경우애서 알 수 있는 한 가지는 학부 수학교육의 연구방법이-교육의 모든 분야에서-결과 암시적이며 많은 연구의 종합된 증거들이 시간이 지남에 따라 발견한 것들에 대한 실증을 제공한다는 것이다.

이제 이 지점을 나의 연구에서 가져온 하나의 확장된 사례와 함께 자세히 살펴보고자 한다. 핵심은 ``메타인지적(metacognitive) 행동'' 혹은 메타인지(metacognition)이다. 구체적으로, 누군가가 문제를 해결하는 동안 (시간을 포함한) 그의 역량(문제해결능력)의 효과적인 사용에 대한 것이다.

이 사례의 동기는 다음과 같다. 수년 전, 표준적인 1학년 미적분학의 주제가 적분기법에 있었을 때, 한 대형강의에서 주어진 시험의 첫 번째 문제는 다음과 같았다. \[ \int\frac{x}{x^2-9}\ dx.\] 학생들이 \(u=(x^2-9)\)로 쉽게 치환하고 문제를 빠르게 해결할 것이라는 기대가 있었다. 수업 인원 중 절반이 이같이 하였다. 그러나 수업 인원 중 약 $4$분의 $1$은 분모를 인수분해 할 수 있다는 것을 보고 부분분수의 기법을 사용하여 문제를 해결하려 했다. 더욱이 약 10%의 학생들은 분모가 \((x^2-a^2)\)꼴임을 보고 \(x=3\sin\theta\)로 치환하여 문제를 해결하려 하였다. 물론 이 모든 방법들이 정답을 구할 수 있는 방법이긴 하지만 두 번째와 세 번째 방법은 학생들에게 시간이 많이 필요한 방법이다. 이 방법들을 사용한 학생들은 초라한 점수를 받았는데 대체로 그들이 시간이 부족했기 때문이다.

이같은 사례들로부터 적분문제를 해결하는 과정에서 하게 되는 전략적 선택들에 초점을 맞춘 몇 가지 교수자료를 개발하게 되었다. 그 자료들은 학생들의 성취도에 차이를 만들었다. 이는 문제를 해결하는 동안의 전략적 선택이 중요하다는 몇가지 증거를 주었다.

전략적 주제의 핵심은 나의 문제해결 연구의 일부로서 학생들이 문제를 해결하여 시도하는 비디오를 조사할 때 다시 나타났다. 꽤 자주 학생들은 문제를 읽고 풀이법을 빠르게 선택하였으며 그 방법이 결과를 얻지 못하는 것처럼 보일때 조차도 그 접근방법을 집요하게 고집하는 모습을 보였다. 이러한 관찰을 엄밀히하기 위해 문제 해결 비디오 분석을 위한 ``coding scheme''을 개발하였다. 이 분선적 구조는 의사결정이 접근의 성공이나 실패의 모양을 만들 수 있는 문제 수업이 이루어지는 동안의 시간을 식별하는 메커니즘을 주었다. 이 구조는 다른 연구자들이 나의 테이프를 분석하려는 목적뿐만 아니라 그들 자신의 테이프를 분석하는 목적으로도 사용할 수 있는 방식으로 정의되었다. 이를 사용하여 연구자들은 학생들의 의사결정이 그들의 문제해결의 접근에 어떻게 도움이되거나 방해가되는지를 볼 수 있었다.

이러한 구조는 다양한 목적들에 도움이 된다. 첫 째, 그러한 scheme을 갖는다는 것은 비디오의 특징들이 상대적으로 객관적이 될 수 있게 한다. 만일 훈련된 두 명의 분석가가 동일한 테이프를 분석할 때, 이들이 독립적으로 이 테이프의 동일한 코딩을 만들어낸다면, 그 해석의 정합성을 믿을만한 이유가 있게된다. 둘 째, 이러한 유형의 분석적 도구를 갖는다는 것은 문제해결 교수법의 효과를 추적할 수 있게 한다. 문제해결 수업 비디오의 ``이전, 이후'' 비교는 학생들이 더 유능하거나 효과적인 문제해결자가 되었는지를 드러낼 수 있다. 셋 째, 이런 종류의 도구는 연구들에 걸쳐 데이터를 축척하게 해준다. 이 경우의 결과들의 한 줄 요약은 메타인지 역량은 문제해결의 매우 생산적인 요소라는 것이다.2 더 광범위한 세부 사항은 [9]를 참조하라.

위에서 말한바와 같이 교육에서의 연구결과는 수학에서 사용하는 증명된다는 의미로는 ``증명되지''않는다. 더욱이 교육적 조건이 ``반복 가능''하다는 의미와 관계된 복잡성때문에 물리학에서 사용되는 유형의 실험적인 방법 또는 통계적인 방법을 직접적으로 이용하는 것은 대게 어렵다. 교육에서는 광범위한 연구방법을 볼 수 있다. 학부수학교육의 첫 책 중 하나인 [14]에서 그 범위를 말하고 있다. 무엇보다 Research in Collegiate Mathematics Education의 제3권에서 입증된 바와 같이 연구방법의 수와 유형은 증가했다. 예를 들어 학생들과의 상세한 인터뷰 보고서, 개혁된 미적분과 전통적인 미적분의 비교, 미적분 ``워크숍''의 검토, 물리적 장치 및 그와 관련된 그래프에 대한 한 학생의 발전된 이해에 대한 확장된 연구 등이 있다. 인류학 적인 관찰 기법 및 다른 질적인 방법들을 이용하는 연구는 더욱더 보편화되고 있다.

이러한 연구들이 얼마나 타당한가 그리고 그 결과들에 얼마나 의존하는가? 이 문제는 바로 아래에서 살펴보자.

[이론, 모델 및 결과]를 평가하는 것의 표준(Standards for Judging Theories, Models, and Results

수학교육에는 광범위한 결과와 방법들이 있다. 중요한 질문은 다음과 같다. 어느 특정 결과에 대해 어느 정도의 신뢰를 가져야 하는가? 무엇이 확고한 근거들을 구성하며, 무엇이 ``합리적인 의심 없는 증명''을 구성하는가?

다음 목록은 수학교육에서의 모델과 이론(그리고 더 일반적으로 어느 경험적이거나 이론적인 작업)을 평가하는데 사용할 수 있는 일련의 규준을 제시한다.

  • 기술(서술)적 힘(Descriptive Power)
  • 설명을 위한 힘(Explanatory Power)
  • 범위(Scope)
  • 예측력(Predictive Power)
  • 엄밀함과 특수함(Rigor and Specificity)
  • 반증가능성(Falsifiability)
  • 반복가능성(Replicability)
  • 여러 증거 자료, ``삼각 측량''(Multiple Sources of Evidence, ``Triangulation'')
이제 이들 각각을 간략히 살펴보자.
기술(서술)적 힘(Descriptive Power)

기술적 힘이란 묘사되고 있는 현상에 충실해보이는 방식에서 ``중요한 것''을 담기 위한 이론의 능력을 뜻한다. Gaea Leinhart[7]가 짚은 것처럼, ``구 모양의 소를 생각해보자''라는 문구는 물리학자들이 소의 중력 질량을 고려할 때 적절할 수 있다. 그러나 이는 소가 갖고 있는 어떤 생리적인 특성들을 탐구할 때는 적절하지 않다. 지성, 문제해결 또는 가르치는 것에 대한 이론들은 각각 사고, 문제해결 그리고 가르치는 것에 관련있고 중요한 측면들을 포함해야 한다. 매우 폭넓은 수준에서 수준에서 적절한 질문은 다음과 같다. 어느것이라도 놓친것이 있는가? 그 이론의 요소들이 합리적으로 보이는 것들에 잘 부합하는가? 예를 들어 문제해결 수업, 인터뷰 혹은 교실 수업을 녹화했다고 해보자. 그 해석을 읽고 비디오를 본 사람이, 해석에서 누락된 것들 때문에 꽤 놀라게 될 것인가?

설명을 위한 힘(Explanatory Power)

설명을 위한 힘이란 어떤 것들이 어떻게(how) 그리고 왜(why) 작동하는지에 대한 설명을 주는 것을 뜻한다. 이는 사람들이 어떤 종류의 과업을 할 수 있다고 말하는 것 혹은 할 수 없다고 말하는 것, 심지어 그들이 무엇을 하는지 매우 상세하게 묘사하는 것이다. 왜(why)에 대한 설명을 하는 것은 꽤 다른 것이다. 예를 들어 이는 사람들이 머릿속으로 3-자리 곱셈을 하는 것에 어려움을 겪는다고 말하는 것이다. 하지만 이것은 어떻게 어려움이 발생되는지 그리고 왜 어려움이 발생되는지에 대한 정보를 주지는 않는다. 앞서 언급했었던 작업기억에 대한 이론적인 기술(서술) 전체에는 기억 완충기(memory buffer)에 대한 기술(서술), chunking의 메커니즘에 대한 상세한 설명, 그리고 기억의 요소들이 서로 어떻게 상호작용하는지에 대한 세심한 묘사들이 되어있다. 설명은 메커니즘의 수준에서 작동한다. 이는 그 이론의 대상이 무엇인지, 그들이 어떻게 관계되어 있는지, 그리고 어떤 것이 왜 가능한지 혹은 어떤 것은 왜 가능하지 않은지를 꽤 정확한 용어로 말한다.

범위(Scope)

범위란 그 이론에 의해 다뤄지는 현상의 범위를 뜻한다. 방정식의 이론이 일차방정식만을 다룬다면 그리 인상적이지는 않을 것이다. 마찬가지로 교수 이론이 오직 직접적인 강의만을 다룬다면 그리 인상적이지는 않을 것이다.

예측력(Predictive Power)

예측의 역할은 명백하다. 이론에 대한 하나의 시험은 그 이론이 어떤 결과들이 일어나기에 앞서 그것을 명시할 수 있느냐는 것이다. 다시 한 번 진화론을 하나의 모델로 생각해보는 것이 좋다. 교육학과 심리학에서의 예측은 대체로 물리학에서 만들어지는 형태의 것이 아니다.

때로는 구체적인 예측을 만드는 것이 가능하기도 하다. 예를 들어 Brown과 Burton[4]은 학생들이 10진법 뺄셈을 위한 미국의 표준 알고리즘을 학습할 때 나타낸 오개념의 종류를 연구했었다. 그들은 학생들이 만드는 매우 특정한 정신적 구조를 가정하였다. 아이다어는 학생들이 단순이 표준알고리즘을 완전히 습득하지 못한 것이 아니라, 오히려 학생들이 종종 그 알고리즘의 많은 종류의 잘못된 변형 중 하나를 만들어 내어 이를 지속적으로 활용한다는 것이었다. Brown과 Burton은 간단한 진단 테스트를 개발하였는데, 이는 학생들의 오답 패턴이 그 학생들이 사용하고 있을 수 있는 잘못된 알고리즘을 암시한다는 특성을 이용한 것이었다. 그들은 약 절반의 시간동안 학생들이 새로운 문제에서 얻게 될 오답을 학생들이 그 문제를 풀기 전에 예측할 수 있었다!

물론 진단 테스트처럼 단순한 것을 기반으로한 세밀하고 일관된 예측은 굉장히 드문 것이다. 예를 들어, 다양한 상황(환경)에서 교사가 무슨 행동을 할 것인지 구체적으로 예측할 수 있는 교수이론은 없다. 인간의 행동은 그렇게 예측가능한 것이 아니다. 하지만 교수 이론은 진화론과 유사한 방식으로 작동할 수 있다. 이는 제약조건을 제안할 수 있고 심지어 있을법한 사건들도 제안할 수 있다.

[예측을 만드는 것은 이론의 섬세함에 있어서 매우 강력한 도구이다. 무언가가 불가능하다고 주장되면서 그것이 일어났을 때, 혹은 한 이론이 무언가 매우 있을 법하다는 주장을 반복하면서 그것이 나타나지 않을 때, 그 이론은 문제를 갖고 있다! 따라서 구체적인 예측이 불가능하다는 것을 이해하면서도, 그러한 예측을 한다는 것은 하나의 중요한 방법론적 도구이다.]

엄밀함과 특수함(Rigor and Specificity)

이론이나 모델을 구성하는 것은 [대상들의 집합 및 그들 사이의 관계들]의 명확화를 포함한다. 이 추상적 대상들의 집합 및 관계들은 아마도 ``실세계''에서의 대상들의 집합 및 관계들에 대응할 것이다. 이와 관계된 질문들은 다음과 같다.

용어들이 얼마나 잘 정의되어 있는가? 당신이 하나를 본다면 당신은 하나를 알 수 있는가? 실생활에서? 모델에서? 그들사이의 관계들은 얼마나 잘 정의되어 있는가? 그리고 모델에서의 대상 및 관계들이 그들이 나태내기로 되어있는 것들에 얼마나 잘 대응되는가? 앞서 언급했던 바와 같이 간단한 물리학 모델의 경우처럼 모델의 일부와 실세계의 대상들 사이에 같은 종류의 대응들을 반드시 생각할 수 있는 것은 아니다. 기억 완충기나 ``교훈적인 계약''(이는 교사들과 학생들이 그들간의 상호작용을 위한 규범에 관한 암묵적인 이해를 갖고 교실로 들어가며, 그 이해가 그들이 행동하는 방식을 형성한다는 것)과 같은 정신적 구조 및 사회적 구조는 laminar plate에서의 열흐름을 살필때의 방식으로 검사하거나 측정할 수 없다. 그러나 대상들이 무엇이며 그들이 어떻게 어울리는지를 자세하게 물어볼 수 있다. 관계들 및 그들간의 변화들이 조심스럽게 정의되어 있는가? 혹은 도중 어딘가에서 ``마법적인 일''이 일어나는가? 하나의 대략적인 비유는 다음과 같다. 18세기 대부분 동안 연소에 관한 플로지스톤 이론-모든 가연성 물질안에는 연소중에 ``플로지스톤''이라 부르는 무색, 무취, 무중량, 무미인 연소중에 방출되는 물질이 있는 것으로 가정한 이론-은 널리 받아들여졌다. (Lavoisier의 연소에 관한 연구는 이 이론을 궁극적으로 반박하였다.) 작은 속임수와 함께 플로지스톤 이론은 현상의 합리적인 범위를 설명하였다. 이론가들이 원형 궤도 이론에서 주전원의 주전원을 계속 만들었을 수 있는 것처럼, 누군가는 이를 계속 사용했을 수 있다.3 이 이론은 ``모든 실제(현실)적인 목적들을 위해'' 충분히 좋은 유용한 결과들을 계속 만들어 냈을 수도 있다. 그것은 실제에 좋을 수도 있지만 이론에 대해서는 문제가 있다. 물리학에서와 마찬가지로, 교육 연구자들에게는 더 좋은 명쾌함 및 특수성을 추구하고 이론이 어디에서 무너지는 지를 보기위한 제한된 사례들이나 반례들을 찾아야할 지적인 의무가 있다.

간단한 두 사례를 살펴보자. 첫째, 나의 연구그룹의 교수과정 모델에서는 교사의 지식, 목표들, 신념들 및 의사결정의 측면들을 서술하였다. (우리를 포함해서) 의심이 많은 사람(skeptics)들은 그 서술이 얼마나 명확한가? 일단 그 모델에서 용어들이 정의되면(즉 일단 교사들의 지식, 목표들, 그리고 신념들을 명확히 하면) 거기에 교사들이 특정한 상황에서 무엇을 할 수 있는지를 말할 때 속임수를 쓰는 것이 있는가? 혹은 그 모델은 다른 사람들이 이를 실행하고 동일한 예측을 만들 수 있기에 충분하도록 잘 정의되었는가? 등을 물을 것이다. 둘째, [2]에 상세히 설명되어 있는 ``APOS 이론''은 행동(Action), 과정(Process), 대상(Object), 스키마(Schema)와 같은 용어들을 사용한다. 만일 하나를 만난다면 하나를 알 수 있는가? 그들이 모델에서 잘 정의되어 있는가? 그들이 상호작용하거나 적절히 변형되는 방식이 잘 명시되어 있는가? 두 경우 모두 핵심적인 이슈는, 이것 역시 플로지스톤 같은 이론이 될 가능성은 무엇인가? 그 이론을 사용하는 사람들은 발견하기 위해 이것을 지속적으로 시험하고 있는가? 교육연구에서 사용되는 모든 용어들, 예를 들어 ``교훈적인(교수학적) 계약(didactical contract'', ``메터인지(metacognition)'', ``개념 이미지(concept image)'', ``인식론적 장애(epistemological obstacles)''와 같은 용어들에 대해서도 마찬가지의 질문들을 재기해야 한다.

반증가능성(Falsifiability)

이 시점에서 (항진(동어반복)이아닌 주장을 만들거나 경험적으로 정확도를 시험받을 수 있는 예측을 만들기 위한) 반증가능성의 필요성은 명확해야 한다. 이는 앞선 두 소절에서의 논의에 필연적으로 따라오는 것이다. 한 분야는 그 아이디어를 선상에 두어(경계선에 두어;위태롭게 두어) 진보를 이룬다.(그리고 항진(동어반복 명제)를 막는다.)

반복가능성(Replicability)

반복가능성의 문제는 엄밀함과 특수함의 문제에도 밀접하게 관련되어 있다. 이와 관련된 두 개의 이슈는 다음과 같다. (1) 그 상황(환경)이 반복된다면 동일한 일이 일어나는가? (2) 다른 사람들이 적합한 훈련을 받는다면 그 자료들에서 동일한 것들을 볼 것인가? 두 경우 모두 이 질문들에 대한 대답은 잘 정의된 과정 및 구조를 갖고있느냐에 달려있다.

사례들의 넓은 범위들을 다루어야하기 때문에 (1)의 문구는 의도적인 모호함을 갖고 있다. 단기 기억의 경우, 주장은 사람들이 9개보다 많은 단기 기억 완충기를 사용해야만 하는 기억 과제들에 어려움을 겪는다는 것이다. 교실의 사회학적 분석의 경우, 주장은 일단 교훈적인 계약이 이해되면 학생들과 교사의 행동은 그 (보통은 암묵적인) 이해에 순응하는 모습을 보인다는 것이다. 신념의 경우, 주장은 어떤 신념을 갖고 있는 학생들은 수학을 하는 동안에도 어떤 방식으로 행동할 것이라는 것이다. 인식론적 장애 혹은 APOS 이론의 경우, 그 주장들은 유사한데, 특정한 정신적 구조를 가진(혹은 갖지 않은) 학생들은 특정한 일을 할 수 있을 것이라는 것이다.

이러한 무든 경우에 그 발견들의 유용성, 그 주장들의 정확도, 왜곡 혹은 반복하는 힘은 용어들이 정의되어진 용어들의 특이성에 따라 달라진다. 고전적인 교육 문헌에서 이 사례를 짚어보자. [3]에서 소개된 Ausubel의 ``선행 조직자(advance organizers)''이론은 학생들이 자료에 대한 소개를 받아 그들이 따라가야할 것에 그들을 적응시킨다면 학생들의 독해력이 현저하게 향상된다는 것을 전재한다. 1~20년이 지나고 수 많은 연구들이 진행된 후, 그 주제에 관한 문헌은 결론에 이르지 못했다. 연구의 약 절반에 대해서는 선행조직자가 차이를 만들었고 약 절반을 그렇지 못하였다. 더 자세히 살펴보면 그 이유를 알 수 있다. 바로 용어가 잘못 정의되었던 것이다. 다양한 실험자가 작자가 그럴듯 하다고 생각한 바를 바탕으로 선행조직자를 만들었었고 이는 대단히 큰 변수였다. 그 발견들이 결론에 이르지 못한 것은 당연한 것이었다. (잘 정의됨의 문제를 다루는 표준적인 방법 그리고 위의 (2)의 이슈를 말하는 방법 중 하나는 독립적인 연구자들이 동일한 데이터들을 통해 그들의 결과들을 비교하게 하는 것이다. 현장에는 ``평가자 간 신뢰도(inter-rater reliability)''에 대한 표준규범들이 있다. 이 규범들은 독립적인 분석가들이 데이터에서 동일한 것들을 보는 정도를 정량화한다.)

여러 증거 자료, ``삼각 측량''(Multiple Sources of Evidence, ``Triangulation'')

여기서는 수학과와 사회과학 사이의 중요한 차이점들 중 하나를 알 수 있다. 수학에서는 하나의 강력한 논증 한 줄(증명)으로 충분하다. 즉 타탕성을 얻는다. 교육 및 사회과학에서는 일반적으로 강력한 증거들을 찾는 사업을 하고 있다고 할 수 있다. 사실, 증거는 오독될 수 있다. 일반적이라고 생각하는 것은 사실 일반적인 현상이라기보다는 오히려 인위적인 것 혹은 상황(환경)의 작용일 수도 있다.

하나의 사례를 살펴보자. 몇년 전 평균-크기의 성인의 몸에는 얼마나 많은 세포들이 있을까?라는 문제를 연구하고 있는 대학생들의 비디오 시리즈를 만들었었다. 그들의 행동은 인상적이었다. 많은 수의 학생들이 세포의 크기 단위의 순서에 대해- ``한 세포를 한쪽의 한 옹스트롬 유닛이라 하자.''부터 ``한 세포를 폭이 $1/100$인치인 큐브라고 하자.''까지- 제멋대로 추측하였다. 몇 초만에 세포의 크기를 처리하곤 그들은 몸의 크기에 매우 많은 시간을 보냈으며 종종 몸을 원기둥, 원뿔, 구로 분해하여 가각의 부피를 비교적 세심하게 계산하였다. 이것은 매우 이상했다.

시간이 좀 지난 후 학생들이 그들 스스로보다는 짝들을 지어 문제를 연구하는 모습을 녹화하기 시작했다. 위에서 묘사한 행동들은 다시는 불 수 없었다. 학생들은 그들이 혼자 연구할 때, 엄청나게 큰 압박감을 느낀다는 것이 밝혀졌다. 그들은 수학교수가 자신의 연구를 살펴볼 것이라는 것을 알고 있었다. 그 상황에서 그들은 수학적인 무언가를 해야한다고 느꼈으며, 부피 계산은 적어도 그들이 수학을 하는 것처럼 보이게 만들었다! 학생들이 짝을 지어 연구할 때는, 그들은 ``이것은 분명히 이상한 문제이다.''라는 식으로 말하며 시작했다. 이는 어떤 압박감을 해소하기에 충분했고 그 결과 그들은 그런 부담을 덜기 위한 부피계산을 할 필요가 없어지게 되었다. 요컨대, 어떤 매우 지속적인 행동은 사실 그 문제의 속성 혹은 그 학생들의 속성이라기 보다는 오리혀 상황(환경)의 작용 일 때가 있다.

인위적인 행동을 확인해보는 한 방법은 상황(환경)을 바꾸는 것이다. 즉 다른 장소의 다른 시간에 같은 것을 보는가를 묻는 것이다. 또 하나의 방법은 질문의 현상에 대한 가능한 많은 정보의 출처를 찾고 그것들이 일관된 이야기를 하고 있는지를 보는 것이다. 예를 들어 교수법 모델링에 관한 나의 연구팀에서 활동중인 교사의 행동에 대한 추론을 그 교사의 비디오로부터 끌어내었다. 그러나 그 교사와의 인터뷰를 만들고 그 혹은 그녀의 수업계획 및 수업노트를 검토하며, 연구그룹의 일시적인 발견들에 대해 그 교사와 논의를 하기도 했다. 이러한 방식으로 그 데이터의 경향을 찾는다. 더욱 독립적인 뒷받침의 근원이 있을 수록 더욱 확고한 발견이 될 것이다.

결론(Conclusion)

본 논문의 핵심은 (학부) 수학교육 연구는 수학에서의 연구와는 매우 다른 활동이며, 현장에서의 연구의 진면모를 알기 위해서는(더 나아가 기여하기 위해서는) 수학교육의 연구와 수학의 연구의 차이에 대해 이해하는 것이 필수적이라는 것이다. 발견이 확정적인 것은 아주 드문일이다. 그것은 보통 암시적이다. 증거(evidence)가 곧 증명(proof)은 아니지만, 증거는 누적적이며 합리적인 의심의 여지가 없는 것으로 간주될 수 있는 결론을 향해 나아간다. 자연과학적인 접근이 가능하지만, 반드시 자연과학적이지 않도록 주의해야 한다. 중요한 것은 실험적 방법 같은 과학의 상징들이 아니라 세심한 추론 및 당면한 과제에 적합한 다양한 방법들로 이용되는 증거의 표준들을 사용하는 것이다.

수학교육이 하나의 분야로서 얼마나 어린가를 기억할 필요가 있다. 수학자들은 수학상의 혈통을 수천년까지는 아니더라도 수세기는 되는 것으로 보곤 한다. 대조적으로 수학교육 연구(특히 학부수학교육 연구)의 혈통은 수십년일 뿐이다. 저널 Educational Studies in Mathematics는 1960년대에 시작되었다. Journal for Research in Mathematics Education 의 제1권의 첫 발행은 1970년 1월이었다. 대학 수준의 수학교육을 위해서만 만들어진 최초의 책인 Research in Collegiate Mathematics Education 시리즈는 1994년에 처음 시작되었다. Artigue[1]가 1999년 그녀의 연구결과 리뷰에서 인용한 대부분의 주요 논문들이 1990년대에 쓰여진 것은 우연이 아니다. 그때 이전에는 학부 수준에 대한 연구는 거의 없었다! 최근 몇년간 엄청난 양의 진보가 있어왔지만 그러나 이 분야는 여전히 아직 어리며 가야할 길이 매우 멀다.

이 분야의 본질 때문에 연구와 그 유용성에 대한 자세를 조정하는 것이 적절하다. 이 연구에 접근하는 수학자들은 그들에게 익숙한 방법이나 관점들이 교육연구에 직접적으로 적용되니는 않는다는 것을 이해하면서 폭넓은 다양한 아이디어에 대하여 열려있어야 한다. 그들은 확정적인 답을 찾는 것이 아니라 사용할 수 있는 아이디어들을 찾아야 한다. 동시에 (학부) 수학교육 연구의 모든 소비자와 실무자들은 건강한 회의론자가 되어야 한다. 특히 명확한 정답이라는 것이 존재하지 않기 때문에, 그것을 제공하려는 사람은 누구든 확실히 경계해야 한다. 더욱 일반적으로, 다가올 수십년간의 주요 목표는 수학교육의 연구가 더욱더 강력한 기초 및 응용분야가 될 수 있도록 지속적으로 이론과 방법의 본체를 만들어가는 것이다.

참고문헌

  1. M. ARTIGUE, The teaching and learning of mathe-matics at the university level: Crucial questions for contemporary research in education, Notices Amer. Math. Soc. 46 (1999), 1377–1385.
  2. M. ASIALA, A. BROWN, D. DE VRIES, E. DUBINSKY, D. MATHEWS, and K. THOMAㄴS , A framework for research and curriculum development in undergraduate mathe-matics education, Research in Collegiate Mathematics Education (J. Kaput, A. Schoenfeld, and E. Dubinsky, eds.), vol. II, Conference Board of the Mathematical Sciences, Washington, DC, pp. 1–32.
  3. D. P. AUSUBEL, Educational Psychology: A Cognitive View, Holt-Reinhardt-Winston, New York, 1968.
  4. J. S. BROWN and R. R. BURTON, Diagnostic models for procedural bugs in basic mathematical skills, Cognitive Science 2 (1978), 155–192.
  5. R. G. DOUGLAS (ed.), Toward a Lean and Lively Calculus, MAA Notes Number 6, Mathematical Association of America, Washington, DC, 1986.
  6. M. LECOMPTE, W. MILLROY, and J. PREISSLE, Handbook of Qualitative Research in Education, Academic Press, New York, 1992.
  7. G. LEINHARDT, On the messiness of overlapping goals in real settings, Issues in Education 4 (1998), 125–132.
  8. G. MILLER, The magic number seven, plus or minus two: Some limits on our capacity for processing information, Psychological Review 63 (1956), 81–97.
  9. A. H. SCHOENFELD, Mathematical Problem Solving, Academic Press, Orlando, FL, 1985.
  10. --- (ed.), Student Assessment in Calculus, MAA Notes Number 43, Mathematical Association of America, Washington, DC, 1997.
  11. --- , On theory and models: The case of teaching-in-context, Proceedings of the XX Annual Meeting of the International Group for Psychology and Mathe-matics Education (Sarah B. Berenson, ed.), Psychol-ogy and Mathematics Education, Raleigh, NC, 1998.
  12. --- , Toward a theory of teaching-in-context, Issues in Education 4 (1998), 1–94.
  13. --- , Models of the teaching process, Journal of Mathematical Behavior (in press).
  14. D. TALL (ed.), Advanced Mathematical Thinking, Kluwer, Dordrecht, 1991.

[주의] 오역이 있을 수 있다. 원문은 http://www.ams.org/notices/200006/fea-schoenfeld.pdf 에서 볼 수 있다.

  1. 사람은 늘 ``chunking''을 하나의 매커니즘으로 사용한다. 간단한 예로 $10$-자리 전화번호를 $3$-자리의 지역 코드를 단위로 기억함으로써 어느 정도 상기해내는 것을 들 수 있다. 실질적으로 이 이론은 chunking이 이 논문을 읽을 수 있게하는 주요 메커니즘이라고 역설한다. 한 사람이 읽는 각각의 단어들은 한번은 소리내어 읽어야만 했던 글자들의 모임인 하나의 chunk이다. 사람이 이제 하나의 단위로 ``머릿속으로 가져다주는'' 모든 종류의 수학적 개념들의 경우도 마찬가지이다. 마지막으로 소위 ``lightnig calculators''라 불리는 엄청나게 빠른 암산을 하는 사람들이 이러한 주장의 반례라 할 수 있는가? 이는 그렇지 않아 보인다. 연구 대상자들은 중간 결과들인 거대한 수를 암기하는 것으로 밝혀졌다. 예를 들어 많은 사람들은 \(9\times8\)를 포함하는 계산을 할 때, 하나의 chunk로 ``$72$''를 자동적으로 머릿속으로 가져온다. ``lightning calculatiors''는 $2$-자리 혹은 $3$-자리 수들의 곱셈에 대해 동일한 일을 할 수 있을 것이다. 이는 작업기억의 호출(load)을 줄여준다.
  2. 이 경우(메타인지 행동), 많은 수의 연구는 문제해결을 하는 동안의 효과적인 의사결정은 ``자연스럽게 오는 것''이 아니라고 말하고 있다. 이러한 기술(skill)은 집중적인 교수가 필요하긴 하지만 배울수 있다. 학생들이 이러한 기술을 배울 때, 그들의 문제해결 능력이 좋아진다.
  3. 이 예는 또하나의 중요한 규준인 단순성을 짚고 있다. 주전원의 주전원과 같이 한 이론이 여러 ``해결책들''을 필요로 할 때, 이는 무언가 잘 못 되었다는 징조이다.

Leave a Comment