8 분 소요

hits

지난 10년간 인공지능 분야는 인간 수준의 범용 인공지능(AGI) 개발이라는 목표에 빠르게 다가섰다. 하지만 AGI 달성 이후 인공지능의 발전은 어떤 양상을 띠며 인공 초지능(ASI)에 도달할까? 이 글은 AGI를 넘어선 AI 발전의 잠재적 경로와 그 과정에서 마주할 수 있는 도전 과제를 다룬다.

AGI에서 ASI로 — 인공지능 초지능 도달 경로

AI 발전 속도와 미래 예측

인공지능의 발전 속도는 지난 10년간 매우 빨랐다. 특히 컴퓨팅 자원의 증가, 하드웨어 개선, 알고리즘 효율성 향상이 복합적으로 작용했다.

AI 발전의 세 가지 주요 동력은 다음과 같다.

동력 설명 지난 10년간 연간 성장률
하드웨어 제조 개선 무어의 법칙 등 칩 제조 기술 발전으로 단위 비용당 컴퓨팅 성능 증가 1.5배
컴퓨팅 하드웨어 투자 AI 개발에 투입되는 하드웨어 자금 투자 규모 증가 2.5배
알고리즘 효율성 개선 특정 성능 달성에 필요한 컴퓨팅 자원 감소 3~6배 (보수적으로 3배)

이 세 가지 동력을 종합하면 유효 컴퓨팅(effective compute)의 성장률은 연간 약 10배, 즉 매년 한 자릿수 규모가 증가한다. 이러한 지수 함수적 성장은 앞으로 몇 년간 지속될 가능성이 크다.

유효 컴퓨팅의 지속적 성장은 곧 AI 연구 속도 가속화로 이어진다. AI 시스템이 스스로 AI 연구 개발을 돕는 재귀적 자기 개선이 일어난다면, 성장률은 지수 함수를 넘어선 초지수 함수(super-exponential) 형태로 가속될 수 있다. 이는 이론적으로 무한한 성장에 도달하는 기술적 특이점(Singularity)을 야기할 가능성을 내포한다. 물론 이러한 성장이 얼마나 지속될지는 불확실하며, 자원 한계나 기술적 마찰로 인해 성장이 둔화될 수도 있다.

AGI와 ASI의 정의

인공지능의 지능 수준을 분류하고 이해하는 일은 매우 중요하다. 이 글에서는 AGI, ASI, UAI를 다음과 같이 정의한다.

지능 유형 정의 특징
AGI (인간 수준 범용 인공지능) 단일 인간과 유사한 지능을 지닌 시스템 대부분의 ‘인지’ 작업에서 중간 수준의 인간과 비슷한 능력
ASI (인공 초지능) 인간 수준 AGI를 훨씬 뛰어넘는 능력 거의 모든 인간 활동 영역에서 초인적인 능력 발휘. 대규모 인간 전문가 집단 능가
UAI (범용 인공지능) 초지능의 이론적 한계 AIXI 에이전트를 통해 정식화된 개념. 모든 계산 가능한 작업에서 최적의 성능을 목표. 계산 불가능하며 ASI로만 점진적으로 근사 가능하다.

이러한 지능은 레그-허터 점수(Legg-Hutter score)라는 범용 지능 측정 지표를 통해 연속체로 이해할 수 있다. 이 점수는 모든 계산 가능한 작업에서 에이전트의 평균 성능을 측정하며, 지능의 스펙트럼이 존재함을 시사한다. 중요한 점은 AGI와 ASI 사이에 상당한 지능 차이가 있다는 것이다.

디지털 지능의 강점과 한계

디지털 지능은 생물학적 지능과 근본적으로 다른 여러 장점을 지닌다. 이러한 장점은 컴퓨팅 성능이 향상될수록 더욱 증폭된다.

디지털 지능이 지닌 주요 장점은 다음과 같다.

장점 설명
알고리즘적 설명 가용성 AI의 전체 알고리즘적 설명을 알 수 있어 투명한 이해와 조작이 가능하다.
기질 독립성 AI가 특정 하드웨어에 얽매이지 않고 충분한 성능의 모든 디지털 컴퓨터에서 실행될 수 있다.
속도 조절 가능성 AI는 속도를 높이거나 늦추거나, 임의의 시간 동안 정지시킬 수 있어 인간보다 넓은 시간 스케일에서 작동한다.
완벽한 복사 가능성 AI 프로그램과 메모리 상태를 완벽하게 복사하여 수많은 동일한 사본을 만들고 실행할 수 있다.
경험 공유 용이성 수많은 AI 인스턴스들이 경험과 학습 결과를 높은 대역폭으로 광범위하게 공유할 수 있다.
유연한 확장성 AI의 물리적 기질을 쉽게 교체하고, 가상 또는 로봇 신체로 구성된 거대한 분산 집단으로 확장할 수 있다.

이러한 장점은 AI와 인간 지능 간의 격차를 더욱 벌린다. AI는 물리적 기질의 수명에 묶이지 않고, 훨씬 넓은 시간 및 공간 스케일에서 작동하며, 수많은 경험을 빠르게 시뮬레이션하고 공유하여 문화적 진화를 가속화할 수 있다.

물론 디지털 지능에도 한계는 있다. 아날로그 연산 대비 에너지 효율성, 물리 시스템과의 인터페이스를 위한 아날로그-디지털 변환 의존성 등이 대표적이다. 또 인간의 낮은 입출력 대역폭이 오히려 깊은 내적 모델과 추상화를 형성하게 했다는 주장도 있다. 즉 높은 대역폭의 디지털 지능은 그러한 추상화 능력을 덜 발달시킬 수 있다는 의미다.

결론적으로 ASI는 전지전능하거나 무한한 존재는 아니다. 물리적, 계산 복잡성 이론적 한계에 여전히 구속된다. AIXI 프레임워크는 이러한 한계의 일부를 정확하고 형식적으로 특성화하는 데 활용된다.

범용 인공지능(AIXI)의 이론적 토대

AIXI 프레임워크는 기계 지능의 이론적 상한선을 이해하는 데 가장 잘 알려진 모델이다. 이는 보편 AI라고도 불리며, 매우 광범위한 환경과 작업 클래스에 대해 최적의 성능을 보이는 범용 에이전트를 제시한다. AIXI는 계산 가능한 모든 환경에서 에이전트가 행동하고 환경 반응을 받으며 보상을 얻는 상호작용 상황을 가정한다.

AIXI는 세 가지 근본적인 문제에 대한 해결책을 제시한다.

  1. 불확실성 속의 행동: AIXI는 알려지지 않은 환경의 역학과 보상 함수를 모두 계산 가능한 가설로 간주한다. 새로운 관측이 있을 때마다 베이즈 방식을 통해 이 가설들의 확률을 업데이트한다. 사전적으로는 솔로모노프의 보편 사전 확률(Solomonoff’s Universal Prior)에 따라 콜모고로프 복잡도가 낮은 환경에 더 높은 확률을 할당한다.
  2. 상호작용적 의사결정: 단기적인 보상과 장기적인 결과를 모두 고려하여 최적의 누적 보상을 얻는 문제를 해결한다. 이는 일반 강화 학습(General Reinforcement Learning) 개념으로 접근한다.
  3. 탐색-활용 균형: 최적의 의사결정을 위해 환경에 대한 지식이 필요하지만, 순수 탐색적 행동만으로는 보상을 최대화할 수 없다. AIXI는 환경에 대한 불확실성을 줄일 가능성이 있는 행동을 장기적으로 높은 보상으로 간주하여 탐색과 활용의 균형을 자동적으로 맞춘다.

AIXI는 이러한 방식으로 모든 계산 가능한 환경에 대해 기댓값 누적 보상을 최대화하도록 설계되었다. 비록 AIXI 자체가 계산 불가능하다는 한계가 있지만, 이는 컴퓨팅 자원이 많아질수록 점진적으로 개선되는 범용 지능의 연속적인 특성을 이론적으로 보여준다.

AGI에서 ASI로 가는 네 가지 경로

AGI를 넘어 ASI로 나아가는 과정에는 여러 기술적 경로가 존재한다. 이 경로들은 서로 독립적이지만 병렬적으로 진행될 가능성이 크다.

AGI에서 ASI로 가는 주요 기술 경로와 그 불확실성은 다음과 같다.

기술 경로 주요 내용 주요 불확실성
규모 확장 컴퓨팅, 모델 크기, 데이터의 지속적인 확장 - 고품질 데이터 고갈 문제 해결 가능성
- 단순 양적 확장이 질적 도약으로 이어지는지 여부
- 자원(에너지, 경제) 한계
알고리즘 패러다임 전환 현재 AI 패러다임의 진화 또는 근본적 변화 - 새로운 아키텍처나 최적화 절차의 예측 불가능성
- 지속 학습, 무제한 컨텍스트, 세계 모델 등 핵심 연구 방향의 성공 여부
재귀적 자기 개선 AI가 AI 연구 개발 속도를 가속화하는 선순환 - 자기 개선 과정의 지속성 및 안정성
- ‘폭발적’ 성장이 현실화될 조건과 한계
다중 에이전트 협업 다수의 AGI가 상호작용하여 집단 초지능 형성 - 복잡한 집단 에이전트의 효과적인 조정 및 통합 메커니즘
- 개별 AGI의 한계를 넘어선 집단 지능의 특성

1. 규모 확장

최근 AI의 발전은 주로 모델, 데이터, 컴퓨팅 자원의 규모 확장에 기반한다. 이러한 추세가 AGI 단계를 넘어 ASI로 이어질지 여부가 핵심 질문이다. 스케일링 법칙은 컴퓨팅 자원이 증가함에 따라 AI 성능이 예측 가능하게 향상됨을 보여준다.

하지만 이 경로에는 몇 가지 마찰이 있다.

  • 데이터 고갈: 고품질 텍스트 데이터는 향후 몇 년 내에 고갈될 것으로 예상한다. AI가 스스로 고품질 데이터를 생성하는 능력이 이 문제를 해결할 수 있을지가 중요하다.
  • 양적 확장의 질적 도약: 단순히 더 많은 자원을 투입하는 양적 확장이 새로운 질적 능력을 이끌어낼 수 있을지 불분명하다. 예를 들어, NP-난해 문제의 경우 단순 컴퓨팅 확장은 효과적이지 않다.
  • 자원 한계: 컴퓨팅, 에너지, 경제적 투자 등의 자원이 기하급수적으로 늘어나는 규모 확장을 지속적으로 뒷받침할 수 있을지는 미지수다.

수십억 개의 인스턴스로 작동하는 인간 수준 AGI 시스템이 서로 협력한다면, 각각의 AGI는 인간 수준이더라도 집단적으로는 ASI에 도달할 수 있다. 따라서 규모 확장의 핵심 질문은 ‘과연 충분한 규모 확장이 지속 가능한가’에 있다.

2. 알고리즘 패러다임 전환 및 진화

현재 AI 패러다임은 대규모 트랜스포머 모델의 사전 학습과 미세 조정을 중심으로 한다. AGI를 넘어 ASI로 가기 위해서는 이 패러다임의 지속적인 진화 또는 근본적인 패러다임 전환이 필요하다.

현재 패러다임의 진화 방향은 다음과 같다.

  • 동적, 적응형 추론: 모델이 복잡한 문제를 분해하고, 코드 해석기나 시뮬레이션 환경 같은 외부 도구를 활용하여 하위 작업을 처리하는 방식.
  • 지속 학습: 시스템이 새로운 상호작용을 통해 지속적으로 능력을 축적하고, 치명적 망각 없이 학습하는 능력.
  • 무제한 컨텍스트 처리: 현재 모델의 고정된 컨텍스트 창 한계를 극복하기 위해 대규모 검색 시스템을 통합하여 무한한 작업 메모리를 활용하거나, Mamba와 S4 같은 선형 시간 아키텍처를 도입하는 방식.
  • 내부 세계 모델 구축: 환경 역학에 대한 압축되고 조작 가능한 표현을 학습하여 미래를 시뮬레이션하고, 장기적인 계획을 세우며, 새로운 상황에 일반화하는 능력.

이러한 진화는 AGI 도달에 필수적이지만, 근본적인 패러다임 전환은 새로운 아키텍처나 최적화 절차처럼 예측하기 어렵다. 이는 현재 패러다임의 한계에 부딪혔을 때 나타날 가능성이 크다. 진정한 패러다임 전환은 데이터나 에너지 효율성을 획기적으로 개선하거나, 현재 아키텍처의 계산 복잡성 이론적 한계를 극복하는 돌파구를 가져올 수 있다.

3. 재귀적 자기 개선

재귀적 자기 개선은 AI 시스템이 스스로 AI 연구 개발을 촉진하여, 더욱 개선된 AI 시스템을 만들고, 이 시스템이 다시 연구 발전을 가속화하는 선순환 과정을 의미한다. 이러한 과정은 AGI에서 ASI로의 전환을 ‘폭발적’으로 이끌 수 있다.

재귀적 자기 개선은 네 가지 형태로 나타날 수 있다.

  1. 유전적 자기 개선: AI가 스스로 아키텍처, 최적화 기법 등 ‘DNA’에 해당하는 코드를 수정하여 다음 세대 AI의 성능을 향상하는 방식.
  2. 문화적 자기 개선: AI가 더 높은 품질의 대규모 데이터셋을 선별, 생성, 시뮬레이션하여 다음 세대 모델 학습에 활용하는 방식. AlphaZero처럼 검색 결과를 데이터로 추출하거나, 자가 대결을 통해 환경을 생성하는 것이 예이다.
  3. 하드웨어 개선: AI가 더 빠르고 에너지 효율적인 칩을 설계하고, 제조 과정을 개선하는 등 하드웨어 발전에 기여하는 방식.
  4. 협력적 개선: AI 에이전트 집단이나 시장이 지속적인 전문화를 통해 효율성을 높여, 더 적은 자원으로 같은 목표를 달성하고 남은 자원으로 추가 전문화를 촉진하는 방식.

이러한 자기 개선 메커니즘은 인간 진화 과정(유전적, 문화적, 사회적 진화)에 비유할 수 있다. AI의 자기 개선은 이미 신경망 아키텍처 검색, 하이퍼파라미터 튜닝, AI 지원 하드웨어 설계 등 다양한 형태로 진행 중이다.

이 경로의 불확실성은 자기 개선 동역학에 대한 이해 부족에 있다. 자기 개선이 빠르게 소멸할지, 아니면 지속적인 투입 자원이 급증하여 한계에 부딪힐지는 미지수다. 하지만 AI가 AI 연구 개발에 기여하는 것은 필연적이며, 이는 AGI가 다른 마찰에 도달하기 전까지는 발전을 가속화할 것이다.

4. 다중 에이전트 협업 및 집단 지능

AGI에서 ASI로 가는 또 다른 경로는 여러 AGI 에이전트의 조정을 통해 점진적으로 복잡한 집단 지능 구조를 형성하는 방식이다. 이는 인간의 일반 지능이 사회 및 조직적 개체를 통해 초지능적 역량을 발휘하는 것과 유사하다.

  • 그룹 에이전트 형성: AGI 에이전트들이 통합되어 ‘완전 자동화된 기업’과 같은 그룹 에이전트를 형성할 수 있다. 이들은 개별 AGI와 구별되는 대표 및 동기 상태를 가지며, 단일 AGI의 인지 능력을 초월하는 전략적 행동과 문제 해결 능력을 갖춘다.
  • 인지적 분업: 전문화된 AGI 에이전트 네트워크를 통해 초지능이 집단적 특성으로 나타날 수 있다. 복잡한 문제를 하위 구성 요소로 분해하고 상호 보완적인 강점을 가진 에이전트에게 효율적으로 위임함으로써, 개별 아키텍처의 병목 현상을 우회할 수 있다.
  • 가상 에이전트 경제: AGI 에이전트들이 ‘가상 에이전트 경제’와 같은 복잡한 적응형 시스템 내에서 상호작용하며, 지역적 인센티브에 의해 구동되는 개별 결정들이 고차원적인 지능으로 집합될 수 있다.

이 경로의 핵심은 다수의 AGI가 어떻게 효과적으로 조정되고 통합되어 개별 AGI의 한계를 넘어서는 집단적 능력을 발휘할지에 있다. 이는 ‘인지적 분업’의 필요성과 협력을 통한 그룹 에이전시의 출현으로 이어진다.

언어학·인지언어학의 시선으로 보면

AIXI 프레임워크가 낮은 콜모고로프 복잡성(Kolmogorov complexity)을 가진 환경에 더 높은 사전 확률을 부여하는 방식은 인간의 언어 습득 과정과 유사점을 지닌다. 유아는 복잡하고 예외가 많은 문법 규칙보다는 단순하고 일반적인 규칙을 먼저 학습하는 경향이 있다. 이는 복잡한 정보를 처리할 때 인지 부하를 줄이고 효율성을 높이려는 자연스러운 경향이며, 언어학에서 말하는 간결성의 원칙(Principle of Parsimony)과 맞닿아 있다. 즉, 가장 간단하고 경제적인 설명이 인지적으로 선호된다는 의미다. 이러한 원칙은 AI가 최적의 세계 모델을 구축하는 데 필수적인 요소가 된다.

출처