학습과학의 관점에서 현재의 AI는 학습하는 기계로 인정될까?
학습과학의 관점에서 현재의 AI는 “학습”하는 기계로 인정될까?
1. 연구의 목적
본 연구는 현재 인공지능(AI) 분야에 만연한 ‘인공 일반 지능(AGI)’에 대한 구체적인 정의가 부재한 문제를 해결하고자 합니다. 연구진은 AGI라는 용어가 ‘계속 움직이는 골대(moving goalpost)’처럼 모호하게 사용되어 현재 AI 기술과 인간 수준의 인지 능력 사이의 격차를 파악하기 어렵게 만든다고 지적합니다. 따라서 본 연구의 목적은 AGI를 잘 교육받은 성인의 인지적 다재다능함과 숙련도에 필적하는 수준으로 구체화하고, 이를 측정할 수 있는 정량화된 프레임워크를 제안하는 것입니다.
2. 연구의 방법
연구진은 AGI를 측정하기 위한 방법론의 근거를 유일한 일반 지능의 사례인 인간에서 찾습니다.
- 이론적 기반: 인간 인지 능력에 대해 가장 실증적으로 검증된 모델인 Cattell-Horn-Carroll (CHC) 이론에 기반합니다. CHC 이론은 일반 지능을 계층적, 분류학적 맵으로 분석하는 심리학 이론입니다.
- 측정 프레임워크: CHC 이론을 바탕으로, 연구진은 일반 지능을 10가지 핵심 인지 영역으로 분해하고 각 영역에 10%의 동일한 가중치를 부여했습니다. 10개 영역은 다음과 같습니다.
- 일반 지식 (
K
) - 읽기 및 쓰기 능력 (
RW
) - 수학적 능력 (
M
) - 즉각적 추론 (
R
) - 작업 기억 (
WM
) - 장기 기억 저장 (
MS
) - 장기 기억 인출 (
MR
) - 시각 처리 (
V
) - 청각 처리 (
A
) - 속도 (
S
)
- 일반 지식 (
- 평가 방식: 인간의 지능을 측정하기 위해 고안된 기존의 다양한 심리측정 배터리(psychometric batteries)를 AI 시스템 평가에 맞게 조정하여 적용했습니다. 이를 통해 100%를 AGI 달성으로 보는 표준화된 AGI 점수를 도출합니다.
3. 주요 발견
이 프레임워크를 최신 AI 모델(GPT-4, GPT-5)에 적용한 결과, 흥미로운 발견이 도출되었습니다.
- 들쭉날쭉한 인지 프로파일 (Jagged Profile): 현 세대 AI 모델들은 매우 들쭉날쭉한(jagged) 인지 프로파일을 보였습니다. 이는 특정 영역에서는 인간을 능가하지만 다른 영역에서는 심각한 결핍을 보인다는 의미입니다.
- 강점과 약점: 모델들은 방대한 훈련 데이터를 활용하는 ‘일반 지식(
K
)’, ‘읽기 및 쓰기(RW
)’, ‘수학(M
)’ 영역(특히 GPT-5)에서는 높은 숙련도를 보였습니다. - 결정적 병목 현상 (The Bottleneck): 가장 중요하고 충격적인 발견은 ‘장기 기억 저장(
MS
)’ 영역입니다. GPT-4와 GPT-5 모두 이 영역에서 0점을 받았습니다. 이는 현재 AI가 상호작용을 통해 지속적으로 학습하고 경험을 축적하는 근본적인 인지 기계(cognitive machinery)가 완전히 부재함을 시사합니다. - 정량적 점수: AGI 점수 총점은 GPT-4 (2023)가 27%, GPT-5 (2025)가 58%로 측정되었습니다. 이는 AI가 매우 빠른 속도로 발전하고 있음을 보여주는 동시에, 인간 수준의 AGI에 도달하기까지는 여전히 상당한 격차가 남아있음을 구체적으로 보여줍니다.
4. 결론 및 시사점
본 연구는 AGI에 대한 모호한 논쟁을 종식하고, 구체적인 진단 도구를 제공한다는 점에서 큰 의미가 있습니다.
- 역량 연극(Capability Contortions)의 폭로: 본 연구는 AI가 특정 능력이 없는 것을 다른 능력으로 교묘하게 위장하는 역량 연극의 실체를 드러냅니다.
- 작업 기억(
WM
) vs 장기 기억 저장(MS
): AI는 장기 기억(MS
)이 없기 때문에, 이를 보완하기 위해 엄청나게 큰 컨텍스트 창(작업 기억,WM
)에 의존합니다. 이는 비효율적이며 진정한 학습(경험 축적)이 아닙니다. “학습은 장기기억의 변화이다”라는 학습과학적 입장과는 정면으로 배치되기 떄문입니다. - RAG vs 기억 인출(
MR
/MS
): AI는 부정확한 내부 기억(환각)을 보완하고 경험적 기억이 없는 것을 감추기 위해 외부 검색(RAG)에 의존합니다. 이는 근본적인 기억 능력의 결핍을 가리는 임시방편입니다. - AGI의 조건: 결론적으로, AI가 진정한 AGI에 도달하기 위해서는 환각(
MR
) 문제를 해결하고 , 특히 지속적인 학습 능력(MS
, 즉 장기 기억 저장)이라는 결정적인 병목 현상을 반드시 해결해야 함을 시사합니다.
5. 리뷰어의 생각 더하기 (ADD+ One)
(1) 이 연구의 탁월한 점 (강점)
- 교육 심리학적 접근: 이 연구의 가장 탁월한 점은 AI 평가를 컴퓨터 공학의 벤치마크가 아닌, 인간 지능 연구의 핵심인 심리측정학(Psychometrics)과 CHC 이론에 기반했다는 것입니다. 이는 AI의 지능을 인간의 지능과 동일한 잣대로 비교·분석할 수 있는 과학적 토대를 마련했습니다.
- 총점이 아닌 프로파일 강조: 교육자가 학생을 총점으로 평가하지 않고 강점과 약점 프로파일로 이해하듯, 이 연구는 AGI 총점(58% 등)이 오해를 유발할 수 있으며 들쭉날쭉한 인지 프로파일 자체를 보는 것이 중요하다고 강조합니다. 이는 AI의 능력을 훨씬 더 정확하고 진단적으로 파악하게 해줍니다.
- 학습의 본질적 구분: 본 연구는 AI의 인-컨텍스트 러닝(작업 기억)과 인간의 경험적 학습(장기 기억 저장)이 근본적으로 다름을 0% 라는 점수로 명확히 보여줍니다. 이는 교육 현장에서 AI의 ‘학습’이라는 용어를 사용할 때 매우 비판적으로 접근해야 함을 시사합니다.
(2) 교육 현장을 위한 추가 제언
- AI의 학습자가 아닌 도구로서의 명확화: 교사와 학생은 현재 AI가 인간처럼 학습(learning)하지 못한다는 사실(
MS=0%
) 을 명확히 인지해야 합니다. AI는 경험을 통해 성장하는 학습 파트너가 아니라, 방대한 지식을 가졌지만 상호작용이 끝나면 모든 것을 잊어버리는(기억상실증) 비서 또는 도구에 가깝습니다. - AI의 약점(병목) 영역 교육 강화: AI는 ‘지식(
K
)’과 ‘읽기/쓰기(RW
)’에서 강점을 보이지만 , ‘즉각적 추론(R
)’, ‘적응(Adaptation)’, ‘장기 기억 저장(MS
)’ 에서는 치명적 약점을 보입니다. 이는 역설적으로 미래 교육이 AI가 못하는 인간 고유의 역량(유연한 문제 해결, 비판적 사고, 경험을 통한 누적적 성장, 사회적 상호작용(Theory of Mind) )에 집중해야 함을 강력히 시사합니다. - 역량 연극(Contortion) 간파 교육: AI가 진짜 기억하는 것처럼 보이거나(사실은 긴 컨텍스트 창) , 진짜 아는 것처럼(사실은 RAG 검색) 행동하는 역량 연극을 간파하는 능력이 미래의 핵심 디지털 리터러시가 되어야 합니다. 학생들에게 AI의 작동 원리를 가르쳐 맹목적인 신뢰나 의인화를 피하도록 지도해야 합니다.
6. 추가 탐구 질문
- ‘장기 기억 저장(
MS
)’이 0% 라는 것은 AI 연구의 치명적 한계입니다. 논문에서 언급된 LoRA 어댑터 방식을 넘어, 진정으로 경험적이고 동적인 기억을 AI에 구현하기 위한 아키텍처는 무엇이 있을까요? - 본 연구는 10개 영역에 동일 가중치(10%)를 부여한 것이 ‘폭넓음(breadth)’을 우선시한 방법론적 선택이라고 밝혔습니다. 만약 인간 인지 구조에서 더 중요하다고 여겨지는 ‘즉각적 추론(
R
)’이나 ‘장기 기억(MS
)’에 더 높은 가중치를 부여한다면, AGI 점수와 프로파일은 어떻게 달라질까요? - 연구진은 의도적으로 신체적, 운동 감각적 능력은 평가에서 제외했습니다. 하지만 체화된 인지(embodied cognition) 이론처럼, 많은 인지 과학자들은 지능이 신체 및 환경과의 상호작용을 통해 발달한다고 주장합니다. 만약 이 프레임워크에 감각-운동(Sensorimotor) 영역이 11번째로 추가된다면, AI의 들쭉날쭉한 프로파일은 어떤 양상을 보일까요?
- RAG와 같은 역량 연극(contortions)은 현재는 약점을 가리는 수단이지만, 이러한 외부 도구와의 결합이 고도화되는 것 자체가 AGI로 가는 또 다른 경로가 될 수는 없을까요? 아니면 본질적인 한계로 남을까요?
출처: Hendrycks, D., Song, D., Szegedy, C., Lee, H., Gal, Y., Brynjolfsson, E., Li, S., Zou, A., Levine, L., Han, B., Fu, J., Liu, Z., Shin, J., Lee, K., Mazeika, M., Phan, L., Ingebretsen, G., Khoja, A., Xie, C., … Bengio, Y. (2025). A definition of AGI. arXiv. https://arxiv.org/abs/2510.18212v1