생성형 AI 협업: 모호한 프롬프트에서 구조적 맥락으로 나아가는 길

6 분 소요

“프롬프트 한 줄”로 생성형 AI와의 협업을 시작하고, “불투명한 결과물”로 끝내는 현장에 절망감을 느낀다. 우리는 AI가 주는 모호한 결과물 때문에 시간 낭비를 반복하며, 이 과정에서 누가, 무엇을, 왜 했는지조차 불분명한 상황에 익숙해졌다. 이런 문제를 해결하려는 시도가 드디어 등장했다.

프랑스의 한 연구팀이 ‘프롬프트에서 맥락으로: 인간-생성형 AI 협업을 위한 온톨로지 기반 프레임워크’라는 논문에서 이 본질적인 문제를 건드린다. 생성형 AI가 작업에 기여한 과정을 투명하게 만들고, 책임 소재를 명확히 하며, 신뢰를 높이는 방법을 제안한다. 이 연구가 던지는 메시지는 단순한 기술적 진보를 넘어, AI 시대에 인간과 AI가 어떻게 ‘진정으로’ 협력해야 하는지에 대한 근본적인 질문에 답한다.

불투명한 AI 협업의 문제점

생성형 AI의 등장은 콘텐츠 제작, 문제 해결, 의사 결정 지원에 새로운 가능성을 열었다. 그러나 실제 현장에서 AI와의 협업은 늘 기대만큼 매끄럽지 않다. 우리는 챗GPT나 제미나이 같은 거대 언어 모델(LLM)에 간단한 프롬프트를 입력하고는, AI가 내놓는 불투명한 결과물을 받아든다. 이 과정에서 어떤 정보가 사용되었는지, AI가 어떤 역할을 했는지, 심지어 어떤 제약 조건이 적용되었어야 했는지 명확히 알기 어렵다.

연구 주장은 이러한 ‘맥락적 명시성의 부재’가 신뢰, 추적 가능성, 책임성 측면에서 심각한 장애물로 작용한다고 지적한다. 특히 검색, 질의, 프로필 관리와 같이 정보 집약적인 작업 흐름에 생성형 AI가 통합될 때 그 문제가 더 심화된다는 것이다. 기존의 인간-AI 협업 연구는 이러한 맥락적 요소를 표준화된 방식으로 포착하는 데 한계가 있었다.

데이터와 근거는 소프트웨어 개발 사례를 통해 이 문제를 명확히 보여준다. 팀원들이 생성형 AI의 도움을 받을 때, ‘맥락 표류(context drift)’ 현상을 자주 겪었다. AI가 만들어낸 사용자 프로필 페이지 구성요소가 실제 데이터베이스 스키마를 무시하고 일반적인 형태를 가정하는 바람에, 개발자와 기술 리더가 반나절을 재작업하는 일도 발생했다. AI가 단순히 유창하고 그럴듯한 내용을 생성할 뿐, 실제 작업에 필요한 미묘한 맥락이나 도메인별 요구 사항을 제대로 이해하지 못한다는 것이다.

필자의 판단은 이 현상이 우리 교육 현장에서도 반복적으로 일어나는 문제와 정확히 일치한다고 본다. 교사들이 학습 계획이나 평가 문항 생성을 위해 AI를 사용할 때, 단순히 “OO 학년 OO 단원 학습 계획 만들어 줘”라고 입력한다. AI는 그럴듯한 결과물을 내놓지만, 우리 학급의 특정 학습자 특성, 교실 환경, 해당 단원의 학습 목표 핵심 등 미시적인 맥락은 전혀 반영하지 못한다. 결과적으로 교사는 AI가 생성한 초안을 ‘거의 처음부터’ 수정해야 하는 비효율을 겪는다. 구조적으로 보면, 현재의 프롬프트 기반 상호작용은 AI의 강력한 생성 능력을 제대로 활용하지 못하고, 오히려 인간의 추가적인 맥락 부여 작업을 강요하는 셈이다.

온톨로지로 AI 협업의 맥락을 설계하다

연구팀은 이러한 문제에 대한 해답으로 ‘프롬프트에서 맥락으로(From Prompts to Context)’라는 온톨로지 기반 프레임워크를 제시한다. 이 프레임워크의 핵심은 맥락적 협업 AI 온톨로지(Contextual Collaboration AI Ontology, CCAI)이다.

연구 주장은 CCAI가 누가(Who), 무엇을(What), 어떻게(How), 왜(Why)라는 협업의 핵심 요소를 기계가 이해할 수 있는 어휘로 모델링한다고 설명한다. 구체적으로는 작업(Tasks), 에이전트 역할(Agent roles), 자원(Resources), 제약 조건(Constraints) 등을 정의한다. 그리고 이 온톨로지 인스턴스에 실제 데이터를 채워 넣고, SPARQL이라는 시맨틱 쿼리 언어를 사용해 맥락 정보를 검색한다. 이를 통해 일회성이고 사라져 버리는 프롬프트-응답 상호작용을 구조화되고 질의 가능한 협업 추적 기록으로 바꾼다.

데이터와 근거는 소프트웨어 개발 사례 연구를 통해 이 프레임워크가 요구 분석, 설계, 구현, 테스트 전반에 걸쳐 협업 에피소드를 어떻게 표현하고 문서화하는지 보여준다.

아래 표는 프롬프트만 사용했을 때와 CCAI 프레임워크를 사용했을 때 맥락 명시성의 차이를 명확히 보여준다.

지표	프롬프트만(Prompt-Only, PO)	CCAI 기반(CCAI-Backed, CB)
맥락 범주 명시성	0/4 (0%)	4/4 (100%)
자원 명시성	0/3 (0%)	3/3 (100%)
역할-에이전트 할당 명시성	0/3 (0%)	3/3 (100%)
누락된 작업 연결 맥락 항목	8	0
구조화된 출처 경로	없음	있음

이 데이터는 ‘역량 프로필 조회 및 업데이트’라는 대표적인 작업에 대한 프롬프트 수준 비교 결과이다. CCAI 기반 조건에서는 모든 맥락 범주, 자원, 역할-에이전트 할당이 명시적으로 드러났다. 반면 프롬프트만 사용하는 경우에는 이러한 정보가 암묵적으로 남아있거나 누락된다. 본질적으로, 이 프레임워크는 AI에게 ‘무엇을 할지’만 지시하는 것을 넘어 ‘이 작업이 어떤 맥락에서, 어떤 자원을 사용하고, 누가 어떤 역할을 수행하며, 어떤 제약을 가지는지’를 명확하게 전달한다.

SPARQL 쿼리 결과와 생성된 프롬프트 예시 화면. 맥락 정보, 팀 구성, 사용 가능한 자원, 요구 사항 등의 정보가 SPARQL 쿼리로 추출되어 프롬프트에 구조적으로 포함된다. — 그림: SPARQL 쿼리 결과와 생성된 프롬프트 예시 화면

필자의 판단은 이 연구가 생성형 AI와의 협업을 단순한 ‘대화’를 넘어 ‘체계적인 지식 기반 상호작용’으로 격상시키는 결정적인 전환점이라고 본다. 프롬프트는 이제 막연한 지시가 아니라, 온톨로지에서 추출된 풍부한 맥락 정보로 ‘구조화된 요청’이 된다. 이는 AI가 ‘맥락을 이해하지 못해’ 엉뚱한 결과물을 내놓는 문제를 근본적으로 해결하는 핵심 방법이다. 교육 현장에서 교사들이 자신의 수업 맥락(학급 특성, 학생 개개인의 강점과 약점, 교과 목표)을 온톨로지로 명확히 정의하고, 이를 AI에 전달한다면, AI는 훨씬 더 맞춤화되고 유용한 학습 자료, 평가 문항, 피드백을 생성할 수 있을 것이다. 다만, 이 맥락 정보가 누가, 어떻게 구축하고 유지 관리하는지는 또 다른 과제다.

협업의 투명성과 책임성을 높이는 장치

이 프레임워크는 협업 과정의 투명성과 책임성을 크게 향상시킨다. 이는 단순히 AI의 ‘말’만 믿는 것이 아니라, AI가 ‘어떻게’ 그 말을 하게 되었는지 그 과정을 추적할 수 있도록 돕는다는 의미이다.

연구 주장은 프레임워크가 AI 생성 기여의 추적 가능성을 향상시키고, 인간-생성형 AI 관행을 더 투명하고 책임감 있게 지원한다고 강조한다. 특히, 생성된 산출물과 원래의 작업, 사용된 자원, 참여한 에이전트 간의 명시적인 링크를 제공함으로써 추적 가능성을 확보한다.

데이터와 근거는 사례 연구에서 얻은 세 가지 핵심 질문(RQ)에 대한 답변으로 이를 입증한다.

RQ1 (워크플로우 형성): 온톨로지 기반 워크플로우는 작업 맥락, 자원, 역할 할당을 질의 가능한 구조로 외부화하여 맥락적 모호성을 줄인다. ‘View & Update Competency Profiles’ 작업의 경우, SPARQL 쿼리는 3개의 필수 자원(역량 데이터베이스, 사용자 API, 스타일 가이드)과 3개의 협업 역할(개발자, 코드 어시스턴트, QA 엔지니어)이 책임 에이전트(인간 개발자, AI 코드 어시스턴트, 인간 QA)에 매핑된 스냅샷을 반환한다. 이는 프롬프트 템플릿에 9개의 바인딩(3개 자원 x 3개 역할-에이전트 할당)을 직접 주입한다.
RQ2 (투명성 및 책임성 지원): 시맨틱 주석은 출처와 책임 링크를 명시적으로 제공하여 추적 가능성을 가능하게 한다. AI 초안 산출물이나 프로젝트 결과물은 prov:wasAttributedTo와 같은 출처 관계를 통해 책임 에이전트에 연결된다. 이를 통해 검토자는 수동 검색 없이도 그래프 링크(산출물 → 에이전트, 작업 → 에이전트, 관련 맥락/자원)를 따라 의사 결정 과정을 재구성할 수 있다. 책임 할당이 내러티브 회상이 아닌 질의 결과로 표현되는 것이다.
RQ3 (실질적 이점 및 과제): 주요 이점은 모호성 감소와 추적 가능성 향상이다. 하지만 지식 기반을 프로젝트 자원 및 요구 사항 변화에 맞춰 지속적으로 동기화해야 하는 오버헤드가 주요 한계점으로 꼽힌다.

필자의 판단은 이 ‘구조화된 출처 경로’는 단순한 감사 기록을 넘어선다. AI 협업의 문제점을 진단하고 개선하는 운영 모니터링 메커니즘으로 작동할 수 있기 때문이다. 예를 들어, 어떤 AI 생성 코드 초안이 가장 자주 수동 수정이 필요했는지, 어떤 작업이 추가 검토 주기를 체계적으로 거쳤는지, 특정 자원 구성이 결과물의 품질 저하와 관련이 있는지 등을 관리자가 식별할 수 있다. 이 변화가 정착되려면 교사들이 함께 실험하고 성찰하는 전문적 학습 공동체(PLC)가 먼저다. 이들이 온톨로지에 맥락 정보를 채우고, AI의 기여를 추적하며 ‘어떤 조건에서 AI가 효과적이었는지’를 집단적으로 학습하는 문화가 형성되어야 한다. 그렇지 않으면 이 모든 과정은 단순한 행정적 부담으로 전락한다.

교육 현장에 적용하기 위한 비판적 낙관주의

이 연구는 분명 생성형 AI 시대의 교육 혁신에 중요한 시사점을 던진다. AI를 단순히 ‘도구’로 쓰는 것을 넘어 ‘맥락을 공유하는 협력자’로 만들 수 있는 청사진을 제시하기 때문이다. 그러나 현장 적용에는 몇 가지 중요한 조건이 충족되어야 한다.

첫째, 온톨로지 구축 및 유지 보수의 오버헤드를 줄이는 방법이 필수다. 교사 한 명이 자신의 수업 맥락, 학생 데이터, 학습 목표, 평가 기준 등을 온톨로지로 정의하고 계속 업데이트하는 것은 사실상 불가능하다. 이를 위한 반자동화된 도구나 커뮤니티 기반의 협업 모델이 필요하다. 예를 들어, 특정 교과 및 학년군에 대한 온톨로지 초안을 AI가 생성하고, 교사들이 이를 검토하고 수정하는 방식으로 전환해야 한다. 교사들이 새로운 지식 베이스를 구축하는 부담을 덜어주는 장치가 없다면, 이 의욕적인 구상도 단순한 이론으로 남는다.

둘째, 교육 도메인에 특화된 CCAI 확장이 필요하다. 소프트웨어 개발은 역할, 자원, 제약 조건이 비교적 명확한 도메인이다. 하지만 교육은 학습자의 인지적, 정서적 특성, 사회문화적 맥락, 교사의 교수 철학 등 훨씬 더 복잡하고 미묘한 요소들을 포함한다. 학생의 학습 스타일, 오개념 유형, 특정 활동에 대한 참여도, 심지어 교실 내 역동과 같은 데이터는 온톨로지 모델링에 더 많은 고민을 요구한다. ‘무엇이 윤리적 제약인가’와 같은 질문도 교육 맥락에서는 훨씬 더 섬세한 답을 요구한다.

셋째, 교사들의 온톨로지 리터러시와 AI 협업 역량을 강화해야 한다. 온톨로지 기반 프레임워크는 단순히 기술적인 도구를 넘어, 맥락을 체계적으로 사고하고 구조화하는 새로운 방식의 협업 패러다임을 요구한다. 이는 교사들이 AI와 소통하는 방식을 근본적으로 바꿔야 한다는 의미다. 거창한 연수 프로그램보다, 동학년 교사가 점심시간에 ‘이 맥락 항목을 넣었더니 결과가 이렇게 달라졌다’고 한 줄 건네는 작은 습관이 더 멀리 간다. 옆 반 교사의 프롬프트 한 줄, 학년 메신저에 남긴 짧은 관찰 기록이 쌓일 때, 맥락을 설계하는 감각은 비로소 학교의 일상에 스며든다.

이 연구가 제안하는 프레임워크는 생성형 AI를 단순한 정보 검색 도구가 아닌, 우리 교육 현장의 ‘신뢰할 수 있고 투명한 협력자’로 만드는 데 핵심적인 역할을 한다. 하지만 그 가능성을 현실로 만들기 위해서는 기술적 지원뿐만 아니라, 교사들의 역량 강화와 학교 문화의 구조적 변화가 반드시 수반되어야 한다.

출처

Le, N. L., Abel, M.-H., & Laforge, B. From Prompts to Context: An Ontology-Driven Framework for Human-Generative AI Collaboration.

김진관(닷커넥터)

Categories

Tag Cloud

최근 방문

생성형 AI 협업: 모호한 프롬프트에서 구조적 맥락으로 나아가는 길

불투명한 AI 협업의 문제점

온톨로지로 AI 협업의 맥락을 설계하다

협업의 투명성과 책임성을 높이는 장치

교육 현장에 적용하기 위한 비판적 낙관주의

출처

관련 글

교원 AI 디지털 교육 역량체계 교육 혁신 방향

인공지능 시대: 교실 속 AI 사용, 금지 대신 ‘계약’을 맺다

AI 리터러시, 오해를 걷어내는 비판적 설계가 먼저다

대규모 언어 모델은 누구의 목소리를 대변하는가? AI의 숨겨진 의견 편향