3 분 소요

hits

AI에게 앱 개발을 맡기고 잠든 사이, 절반만 만들다 멈춰버린 경험이 흔하다. 바이브랩스는 이런 현상의 근본 원인을 ‘루프의 부재’에서 찾는다. 검증하고, 안 되면 되돌리고, 완료 조건을 명확히 하는 루프 파이프라인으로 일정 관리 웹 앱을 처음부터 끝까지 완성하는 방법을 공개한다.

AI 코드 자동 완성 — 클로드 루프 파이프라인 실전

AI 코딩의 네 겹 구조와 루프의 정의

AI 코딩은 네 가지 겹으로 구성된다. 전통적인 프롬프트가 가장 안쪽에 위치하며, 어떤 데이터를 입력할지 선택하는 컨텍스트가 그 바깥을 감싼다. 모델을 실제 구동시키는 하네스가 다음 겹이며, 이 모든 과정을 스스로 반복하게 만드는 가장 바깥 겹이 바로 루프이다.

루프는 AI 에이전트에게 매번 프롬프트를 수동으로 입력하는 대신, 이를 대신 처리하는 시스템을 설계하는 것을 의미한다. 루프 시스템의 핵심은 종료 조건검증에 있다.

기존 파이프라인의 공백, 세 가지 핵심 부재

AI를 활용한 코딩에서 기획, 화면 명세, 작업 목록 생성까지는 일반적으로 수행한다. 그러나 완성도 높은 결과물을 얻기 위해 반드시 채워야 할 세 가지 공백이 존재한다.

공백 항목 문제점
검증 루프 부재 만들어진 결과물이 정확한지 검증하는 과정이 없다.
완료 정의 부재 무엇을 충족해야 작업이 끝났다고 판단할지에 대한 명확한 기준이 없다.
문서 간 정합성 부재 제품 요구사항 정의(PRD), 화면 설계, 작업 목록 문서가 서로 일치하지 않아도 빌드 완료 시점까지 이를 인지하지 못한다.

이 세 가지 공백을 메우는 것이 바로 루프의 역할이다. 특히 플래닝 루프 슈퍼바이저 스킬은 문서를 직접 생성하지 않고, 이미 만들어진 문서들을 다시 읽고 검증하는 감독관 역할을 수행한다. 이 감독관은 기존 파이프라인 위에 한 겹 더 얹혀, 검증에서 맞지 않는 부분이 발견되면 해당 스킬로 되돌려 수정을 지시한다. 이는 승인을 거쳐 필요한 부분만 수정되며, 프로젝트만의 완료 기준을 설정하여 빌드가 이를 통과해야만 끝나도록 만든다.

페이블 5 기반의 AI 토론 기획

클로드 코드를 실행하기 위해 시웍스 터미널을 사용한다. 이때, 클로드 오퍼스 4.8 대신 새로 출시된 클로드 페이블 5를 오케스트레이터로 설정한다. 기획 과정은 소크라테스 스킬을 통해 진행하며, 다음 세 가지 모드를 제공한다.

기획 모드 특징
인터뷰 모드 AI와 사용자가 직접 대화하며 기획한다.
토론 모드 시웍스에서 여러 페인을 만들어 AI 두 명이 10턴 이상 스스로 토론하며 기획서를 작성한다. 인간 개입 없이 AI가 직접 기획한다.
산출물 작성 모드 최소한의 질문으로 바로 기획 산출물을 작성한다.

이번 시연에서는 AI들끼리 서로 토론하여 기획서를 작성하는 토론 모드를 선택한다. 페이블 5코덱스 두 AI가 열 번 이상 대화하며 시장을 조사하고 기능 합의를 이룬다. 초기 디베이트 리포트에서 즉시 추가, 월간 한눈 보기, JSON 내보내기 등의 핵심 기능이 도출된다. 사용자는 이 결과에 만족하지 않을 경우, “기능이 너무 적고 차별점이 약하다”, “로컬 스토리지가 아닌 SQLite DB를 사용했으면 좋겠다” 등의 의견을 직접 입력하여 AI들이 다시 토론하게 만든다. 두 번째 토론 결과, 핵심 기능은 세 개에서 여섯 개로 확장되고, 저장 방식도 SQLite로 변경된다.

설계 문서 10종 작성 및 감독관 검증

기획이 완료되면 도큐먼트 스페셜리스트가 PRD, TRD, 다이어그램, 태스크 MD 등 총 10가지의 설계 문서를 자동으로 작성한다. 이어서 플래닝 루프 슈퍼바이저 스킬이 빌드 전 이 설계 문서들의 일관성과 품질을 검증한다. 이 과정은 프로젝트별 완료 게이트를 설정하고, 문서 누락이나 충돌을 빌드 이전에 차단하는 역할을 한다. 검토 결과, 패치할 부분이 발견되면 즉시 수정이 진행된다.

멀티 페인 분산 빌드와 자동 수정 루프

분산 빌드 단계에서는 시웍스에서 여러 개의 페인(화면)을 실행하여 작업을 나눈다. 메인 오케스트레이터는 페이블 5이며, 각 페인에 역할을 위임한다.

페인 역할 담당 AI
오케스트레이터 페이블 5
백엔드 키미
프론트엔드 클로드 오퍼스 4.8
E2E 검증 코덱스
예비 오퍼스
브라우저 (실행)

페이블 5키미에게 백엔드 작업을, 오퍼스 4.8에게 프론트엔드 작업을 위임한다. 각 AI는 할당된 작업을 동시에 수행하며, 예를 들어 키미는 브라우저를 직접 실행하여 화면 반응을 확인하고, 오퍼스 4.8은 캘린더를 띄워 일정을 입력하며 테스트한다.

개발이 완료되면 코덱스가 전체 시스템의 E2E(End-to-End) 검증 작업을 수행한다. 검증 결과 ‘테스트 실패’가 나오면, 결함 내용을 페이블 5에게 보고한다. 페이블 5는 이 정보를 바탕으로 해당 문제를 수정할 책임이 있는 에이전트(프론트엔드 또는 백엔드)에게 수정 사항을 전달한다. 중요한 점은 메인 오케스트레이터페이블 5가 문제점을 직접 수정하지 않고, 오직 전체 멀티 페인을 제어하고 조정하는 역할만 수행한다는 사실이다. 문제가 해결될 때까지 이 루프 파이프라인은 반복적으로 작동한다.

완성된 일정 관리 앱 직접 테스트

모든 검증과 수정 루프를 거쳐 일정 관리 앱 개발이 완료된다. 사용자가 직접 테스트를 수행하면, 다음 기능들이 원활하게 작동한다.

  • 오늘 날짜에 일정 등록 및 수정
  • 일정 내용 입력 및 색상 변경
  • 다른 날짜에 일정 등록 및 관리
  • 월간/주간 보기 전환
  • 일정 삭제 및 되돌리기 (복구) 기능

이 모든 과정에서 인간 개발자는 코드를 단 한 줄도 직접 입력하지 않는다. 기획 문서를 만들고, 검증하고, 합격 기준을 세웠지만, 이 게이트를 만든 주체는 인간이 아닌 감독관이며, 이는 루프로 구현되었다. 특히, 개발을 담당한 에이전트가 아닌 다른 페인인 코덱스가 체크리스트를 들고 직접 실행하며 검증했다는 점이 핵심이다. 이 루프는 증거가 없는 ‘완료했습니다’는 절대 인정하지 않으며, 검증에 실패하면 사람이 아닌 루프가 자동으로 다시 작업을 지시한다.

검증 구조가 진짜 실력이다

AI가 코드를 짜는 시대에는 ‘잘 시키는 것’을 넘어 ‘잘 검증하는 구조를 만드는 것’이 진정한 실력이다. 프롬프트를 직접 입력하지 않아도 AI가 루프라는 견고한 구조 안에서 시스템적으로 돌아가도록 만드는 것이 핵심이다. 이러한 구조가 있다면, 개발자가 자리를 비운 몇 시간 동안 불안함을 느끼는 대신, 제품이 완성되는 시간을 기다릴 수 있다.

출처