5 분 소요

GenAI를 활용하여 복잡한 정치 공약을 쉽게 접근 가능하게 하고, 정치 교육을 촉진할 수 있을까?

“GenAI를 활용하여 복잡한 정치 공약을 더 쉽게 접근 가능하게 만들고, 이를 통해 정치 교육을 촉진할 수 있을까?”

이 연구는 독일 도르트문트 청년 AI 리더 그룹이 제기한 이 질문에서 시작합니다. GenAI를 사용해 선거 공약을 분석하고 시각화하는 Dortmund-Wahl-KI 프로젝트를 통해, AI를 활용한 정치 교육의 잠재력과 명백한 한계를 동시에 탐구합니다.


1. 연구의 목적

생성형 AI(GenAI)는 교육의 모든 영역에서 기회와 도전을 동시에 제시하고 있습니다. 이 연구는 독일 노르트라인베스트팔렌주의 지방 선거를 앞두고 도르트문트 청년 AI 리더(Young AI Leaders) 그룹이 제기한 구체적인 질문에서 시작합니다.

“GenAI를 활용하여 복잡한 정치 공약을 더 쉽게 접근 가능하게 만들고, 이를 통해 정치 교육을 촉진할 수 있을까?”

따라서 이 연구의 목적은 GenAI(대형 언어 모델과 확산 모델)를 사용하여 도르트문트 지방 선거 공약을 분석하고 시각화하는 Dortmund-Wahl-KI 프로젝트를 수행하는 것과, 그 과정에서 GenAI의 잠재력과 한계를 투명하게 논의하는 것입니다. 궁극적으로는 AI를 활용한 정치 교육의 장단점을 명확히 제시함으로써 UN의 지속가능발전목표 4(SDG 4: 양질의 교육)에 기여하는 것을 목표로 합니다.


2. 연구의 방법

본 연구는 도르트문트 2025년 지방 선거를 맥락으로 한 실험적 연구(experimental study)입니다. 주목할 점은, 연구팀이 ChatGPT와 같은 블랙박스 AI 서비스를 의도적으로 배제하고, 투명성과 재현성을 높이기 위해 오픈 웨이트(open-weights) 모델을 사용한 자체 AI 파이프라인을 구축했다는 것입니다. 모든 모델은 도르트문트 기반의 로컬 컴퓨팅 클러스터에 배포되었습니다.

이미지

  • 데이터 수집: 각 정당의 선거 공약 및 Kommunalomat(지역 선거 나침반) 응답 데이터를 수집했습니다.
  • 번역 (독일어→영어): 수집된 텍스트를 TowerInstruct-13B 모델을 사용해 영어로 번역했습니다.
  • 요약: 번역된 공약을 BART-Large-CNN 모델로 압축 및 요약했습니다.
  • 추론 (핵심 추출): Qwen3-30B-A3B 추론 모델을 사용하여, 요약된 공약이 도시 외관에 미칠 5가지 중요한 시각적 변화를 텍스트로 추출했습니다.
  • 이미지 생성: FLUX.1 [schnell] 모델을 사용하여 4단계에서 추출된 텍스트 묘사를 기반으로 이미지를 생성했습니다.

모든 실험 코드, 결과물, 웹사이트 코드는 오픈 사이언스(open science) 실천의 일환으로 공개 GitHub 저장소에 게시되었습니다. 또한, AI 파이프라인의 환경적 영향(에너지 소비 및 탄소 배출량)을 측정하고 투명하게 보고했습니다.


3. 주요 발견

연구팀은 총 8개 정당의 공약과 선거 나침반 응답을 시각화하여 80개의 이미지를 생성했습니다.

  • 한계 1. 정당 간 차별성 포착 실패: AI 파이프라인이 생성한 텍스트 설명과 이미지는 정당 간에 매우 유사하게 나타났습니다. AI가 각 정당의 미묘한 뉘앙스와 뚜렷한 우선순위를 포착하는 데 한계를 보였습니다.
  • 한계 2. 일반적 주제로의 수렴: 분석 결과는 대부분의 정당에서 녹색 변혁(green transformation), 자전거 도로 확장, 현대적이고 활기찬 도시 등 일반적이고 중복되는 주제로 수렴되었습니다.
  • 한계 3. 부정확한 시각화: 텍스트 분석(추론) 단계에서 태양광 패널, 저렴한 주택, 안전한 거리 등이 언급되었음에도 불구하고, 생성된 이미지에는 이러한 핵심 요소가 제대로 반영되지 않았습니다.
  • 한계 4. 데이터 소스 민감성: 원본 데이터의 형태가 결과에 큰 영향을 미쳤습니다. 동일한 질문지로 구성된 선거 나침반 데이터를 사용했을 때, 정당 간의 결과물은 공약집을 사용했을 때보다 훨씬 더 유사해졌습니다.

이미지


4. 결론 및 시사점

(1) 결론

본 연구는 GenAI가 복잡한 정치 공약을 요약하고 시각화함으로써 정치 교육에 대한 접근성을 높일 잠재력이 있음을 확인했습니다. 그러나 현재 기술 수준으로는 정당 간의 핵심적인 차이나 추상적인 공약을 정확히 포착하는 데 명백한 한계가 존재함을 밝혔습니다. 저자들은 AI를 정치 교육에 활용할 수는 있으나, 이는 반드시 투명하고, 신뢰할 수 있으며, 책임감 있는 방식으로 이루어져야 한다고 결론 내립니다.

(2) 교육적 시사점

교육전문가의 관점에서 이 연구는 GenAI의 교육적 활용에 대한 매우 중요하고 시의적절한 경고성 사례(cautionary tale) 를 제공합니다. GenAI가 정치적 담론을 활성화하는 긍정적 측면(실제로 프로젝트가 토론을 촉발함)이 있지만, 동시에 복잡한 정치적 스펙트럼을 과도하게 단순화하고 모든 정당을 비슷하게 보이게 만들 위험이 공존합니다. 따라서 교사와 학생들은 GenAI를 중립적인 정보 도구로 신뢰해서는 안 됩니다. 오히려 GenAI가 어떻게 정보를 요약하고, 어떤 편향(예: 시각화하기 쉬운 주제만 부각하는 편향)을 갖는지 비판적으로 분석하는 미디어 리터러시 교육의 대상으로 삼아야 합니다.


5. 리뷰어의 ADD(+) One: 생각 더하기

(1) 이 연구의 탁월한 점 (강점)

  • 연구 투명성의 극대화 (Open Science): 이 연구의 가장 탁월한 점은 블랙박스 모델(예: ChatGPT)을 거부하고 전체 파이프라인을 오픈소스 모델로 구축, 코드와 데이터를 전부 공개한 것입니다. 이는 AI 연구, 특히 정치와 교육처럼 민감한 영역에서 신뢰성과 재현성을 확보하는 핵심적인 과학적 태도입니다.
  • 용기 있는 자기 비판 (Self-Critical Reflection): 저자들은 자신들의 AI 파이프라인이 정당 간의 차이를 잡아내지 못하고 매우 유사한 결과물만 생성했다는 실패 혹은 한계를 숨기지 않고 핵심 결과로 제시했습니다. AI의 능력을 과장하지 않고 현실적 한계를 명확히 보고했다는 점에서 매우 가치 있는 기여입니다.
  • 총체적 비용의 제시 (Holistic Reporting): AI 모델의 성능뿐만 아니라, 이 AI를 구동하는 데 필요한 환경 비용(에너지 소비)까지 측정하고 보고한 점은 교육 현장에서 무료로만 인식되는 AI 기술의 숨겨진 비용을 인지하게 하는 중요한 교육 자료가 됩니다.

(2) 교육 현장을 위한 추가 제언

  • 비교 리터러시 교재로의 활용: 이 연구의 한계(유사한 결과물) 를 교육적으로 역이용할 것을 제안합니다. 교사가 이 연구의 결과물(유사한 이미지)과 저자들이 비교 대상으로 언급한 bundestagswahl.ai(ChatGPT 사용, 차별화된 이미지) 의 결과물을 학생들에게 함께 제시해야 합니다. 그리고 “왜 두 AI는 같은 정당을 다르게 시각화했을까?”, “모델(오픈소스 vs ChatGPT)의 차이인가, 프롬프트의 차이인가?”를 토론하게 함으로써, AI 모델에 따른 편향을 학습하는 비교 미디어 리터러시 교육을 수행해야 합니다.
  • 차이점을 추출하는 AI로의 개선: 저자들이 미래 연구로 제안했듯이, 정치 교육의 본질은 유권자가 정당 간의 ‘차별점’을 인지하는 것입니다. 현행 파이프라인은 각 정당을 개별 분석하여 공통점이 부각되었습니다. 교육용 AI는 “A 정당의 공약 중 B, C 정당과 가장 구별되는 핵심 공약 3가지는 무엇인가?”와 같이, 차이점과 대조를 핵심 추론 과제로 삼도록 프롬프트를 재설계해야 합니다.
  • 시각화 불가능성의 명시적 교육: 이 연구는 AI가 저렴한 주택이나 안전한 거리 같은 추상적이고 중요한 공약들을 시각화하는 데 실패했음을 명백히 보여줍니다. 교육용 도구는 이 실패를 숨겨서는 안 됩니다. 오히려 AI가 생성한 이미지 옆에 “AI가 시각화에 실패한 공약: 저렴한 주택, 안전한 거리”처럼, 시각화의 한계를 명시적으로 표시해야 합니다. 이는 학생들에게 어떤 공약이 구체적이고(예: 자전거 도로) 어떤 공약이 추상적인지(예: 안전) 구별하는 비판적 안목을 길러줄 것입니다.


6. 추가 탐구 질문

  1. (이미지 생성 프롬프트): 이미지 생성 시 ‘Dortmund city, with additional [visual descriptions]’라는 비교적 중립적인 프롬프트를 사용했습니다. 이로 인해 모든 이미지가 도르트문트의 일반적인 풍경에 약간의 변형만 가한 것처럼 유사하게 보였을 수 있습니다. 만약 프롬프트에 각 정당의 핵심 이념(예: 생태주의적, 보수적, 사회 민주적)을 반영하는 스타일 키워드를 추가했다면, 정당 간의 시각적 차별성이 더 잘 드러났을까?
  2. (사용자 인식 평가): 본 연구는 AI 파이프라인의 기술적 결과(유사성, 부정확성)에 초점을 맞추었습니다. 하지만 프로젝트가 유권자들의 토론을 촉발했다는 긍정적 측면도 언급했습니다. 이 시각화 자료를 접한 학생 및 청년 유권자들이 (A) 정치에 더 흥미를 느끼게 되었는지, (B) 오히려 모든 정당이 다 비슷하다는 정치적 냉소주의를 갖게 되었는지, 그 교육적/인식적 영향을 측정하기 위한 후속 사용자 연구를 계획하고 있을까?
  3. (편향의 근원): AI가 녹색 변혁, 자전거 도로 등 특정 주제에 집중한 것이, (A) 실제로 도르트문트의 모든 정당이 해당 주제를 최우선 순위로 다루었기 때문인지, (B) 연구에 사용된 오픈소스 모델(Qwen3, FLUX.1) 자체가 문헌 고찰에서 지적된 다른 모델들처럼 특정 이념(예: 환경주의)에 편향되어 해당 주제를 과도하게 추출(over-representing)한 것인지, 이 편향의 근원을 어떻게 식별할 수 있을까?

출처: Fischer, R., Abdelrahim, Y., & Poitz, K. (2025). Benefits and limitations of using GenAI for political education and municipal elections. arXiv. https://arxiv.org/abs/2510.11749v1