프랑소와 숄레의 ARC 벤치마크: AI는 정말 지능적인가?
프랑소와 숄레의 ARC 벤치마크 분석: LLM의 한계와 지능의 본질 현대 딥러닝의 거두이자 케라스(Keras)의 창시자인 프랑소와 숄레(François Chollet) 는 현재의 LLM 열풍 속에서 냉철한 비판을 던집니다. 그는 AI가 단순히 방대한 데이터를 암기하는 것을 넘어, 처음 보는 문제를 해결하는 능력을 갖춰야 한다고 주장하며 ARC(Abstraction and Reasoning Corpus) 벤치마크를 제시했습니다. 1. ARC(Abstraction and Reasoning Corpus)란 무엇인가? ARC는 2019년 숄레가 발표한 지능 측정용 데이터셋으로, 지식의 양이 아닌 '일반화 능력(Generalization)' 을 측정하는 데 초점을 맞춥니다. 형태: 색상 점으로 구성된 격자(Grid) 이미지 퍼즐. 핵심 과제: 몇 가지 예시를 보고 규칙을 찾아내어 새로운 입력값에 대한 출력값을 직접 생성함. 차별점: 인간에게는 매우 직관적이지만, 대규모 데이터 학습에 의존하는 AI에게는 극도로 어려운 논리적 도약을 요구합니다. 2. 왜 ARC는 LLM의 천적인가? (핵심 원리) 숄레는 LLM이 '지능' 이 아닌 '기억' 에 기반하고 있다고 지적합니다. ARC가 LLM의 약점을 찌르는 이유는 다음과 같습니다. ① 암기 불가능한 제로샷 추론 (Zero-shot Reasoning) ARC 퍼즐은 학습 데이터에 포함되지 않은 완전히 새로운 논리를 사용합니다. 수조 개의 토큰을 외운 LLM이라도 처음 보는 기하학적 규칙 앞에서는 '검색' 기반의 답변이 ...