미국 연구진이 생쥐 실험을 통해 보상 크기가 학습 효율을 좌우한다는 사실을 밝혀냈다.
최근 미국 하워드 휴스 의학연구소(HHMI) 제넬리아 연구캠퍼스 연구팀은 생쥐 실험을 통해 보상의 크기가 학습 효율성을 좌우한다는 사실을 밝혀냈다.
기사의 이해를 돕기 위한 자료사진 / gettyimagesBank
연구팀은 특정 과제를 처음 접하는 생쥐들을 두 그룹으로 나눠 실험을 진행했다. 한 그룹에는 적은 양의 물을 여러 번 제공했고, 다른 그룹에는 많은 양의 물을 적은 횟수로 제공했다.
이는 사람에게 과자 한 개를 주는 것과 봉지 전체를 주는 것의 차이와 비슷한 개념이다.
실험 결과는 놀라웠다. 큰 보상을 받은 생쥐들은 과제를 현저히 빠르게 습득했다. 일반적으로 수천 번의 작은 보상을 받으며 며칠에 걸쳐 익히던 과제를 이들은 10번 미만의 성공만으로 하루 만에 완료했다.
학습 속도의 개체차도 크게 줄어들었다. 작은 보상을 받은 그룹이 일주일에서 한 달까지 걸린 반면, 큰 보상 그룹은 대부분 며칠 내에 과제를 마스터했다.
연구팀은 이 현상의 핵심에 도파민이 있다고 분석했다. 학습과 동기 부여를 조절하는 신경전달물질인 도파민의 활동을 관찰한 결과, 보상이 클수록 도파민 분비량이 증가할 뿐만 아니라 지속 시간도 길어지는 것으로 나타났다.
기사의 이해를 돕기 위한 자료사진 / gettyimagesBank
연구팀은 "더 큰 보상이 더 오래 지속하는 도파민 신호를 만들어내며, 이 지속적인 신호가 학습 속도 향상의 원동력으로 보인다"고 설명했다.
이번 발견은 신경과학계의 오랜 가정에 도전장을 내민다. 그동안 과학자들은 '동물은 수백 번의 반복 훈련과 작은 보상을 통해 서서히 학습한다'고 여겨왔다.
하지만 이번 연구는 '많이 반복할수록 잘 배운다'는 경험 위주 학습보다 '성취 시 얼마나 큰 보상을 받느냐'가 학습 효율의 핵심 전략이 될 수 있음을 시사한다.
공동 책임자인 루크 코딩턴 수석연구원은 연구 결과를 교실 상황에 빗대어 설명했다.
그는 "보상의 크기를 훨씬 크게 만든다면, 교실 속 모든 학생의 도파민 수치도 높아져 모든 학생이 열정적으로 수업에 참여하게 되는 셈"이라고 말했다.
기사의 이해를 돕기 위해 AI로 생성된 이미지
다만 연구팀은 한계점도 인정했다. 이번 연구가 생쥐를 대상으로 한 실험인 만큼, 사람의 학습 과정에서도 동일한 효과가 나타나는지는 추가 연구가 필요하다고 밝혔다.
이번 연구 결과는 '보상의 크기가 강화 학습의 효율성을 결정한다(Reward magnitude determines reinforcement learning efficiency)'는 제목으로 지난 5월 22일 국제학술지 '사이언스(Science)'에 게재됐다.