3 분 소요

hits

AI가 우리의 삶을 바꾼다고 말한다. 하지만 그 AI가 정말 한국인의 삶을, 우리의 교육 현장을, 그리고 우리 학생들의 마음을 이해하는지 생각해 본 적이 있는가. 단지 기술이 아니라 ‘사람’을 닮아가는 AI의 새로운 시도에 주목한다.

AI, 사람을 만나다

최근 엔비디아가 Nemotron-Personas-Korea라는 흥미로운 데이터셋을 공개했다. 이는 한국인의 다양한 삶의 모습을 반영하는 합성 페르소나 데이터셋이다. 즉, 가상의 인물들이지만 실제 한국 사회의 통계적 분포를 따른다. AI가 한국 사람들의 생각과 감정을 더 잘 이해하고 반응하도록 돕는 중요한 시도다.

이 데이터셋은 단지 이름과 직업 목록이 아니다. 각 페르소나는 직업, 취미, 가족 관계, 성격, 사는 지역, 심지어 특정 상황에서의 반응 방식까지 상세하게 묘사한다. 마치 소설 속 인물처럼 생생하다. AI가 ‘철수’나 ‘영희’라는 추상적인 개념이 아니라, ‘광주 서구 하역 현장의 베테랑 전기태 씨’나 ‘서초동 부동산 회계 사무원 최은지 씨’처럼 구체적인 인물을 학습하는 셈이다. 이처럼 AI에게 인간 군상의 깊이와 다양성을 보여주려는 노력은 궁극적으로 AI의 이해도를 높이는 길이다.

통계 속 살아있는 이야기

Nemotron-Personas-Korea는 가상의 인물이지만, 그 기반은 놀랍도록 현실적이다. 대한민국 통계청, 대법원, 국민건강보험공단, 농촌경제연구원, 네이버 클라우드의 실제 통계 데이터를 바탕으로 인구통계학적 특성, 지리적 분포, 심지어 성격 특성까지 반영한다. 말 그대로 ‘통계 속에서 살아있는 이야기’를 끄집어낸다.

예를 들어, “전기태 씨”라는 페르소나를 보면, 그는 70대 광주 서구의 하역 일을 하는 가장이다. 투박한 전라도 사투리를 쓰며, 주말에는 무등산 자락을 걷고 단골 목욕탕에서 친구들과 정치 이야기를 나눈다. 무뚝뚝하지만 아내가 좋아하는 간식을 슬그머니 식탁에 올려두는 애정을 표현한다. 이러한 묘사는 단순히 연령, 직업, 지역만 제공하는 것이 아니다. 한 인물의 삶의 궤적, 가치관, 행동 양식까지 보여준다. AI는 이처럼 구체적인 사례를 통해 ‘70대 광주 할아버지’라는 추상적인 개념을 훨씬 더 풍부하게 이해한다.

이러한 접근 방식은 AI가 특정 세대나 지역, 직업에 편향되지 않도록 돕는다. 기존의 AI 학습 데이터는 주로 특정 지역, 젊은 세대의 온라인 정보에 집중되는 경우가 많다. 하지만 이 데이터셋은 고령층, 농촌 지역, 다양한 교육 수준과 직업을 가진 사람들의 이야기까지 폭넓게 담는다. AI의 눈으로 세상을 볼 때, 그 시야가 훨씬 더 넓어지고 깊어진다.

교육 현장에 던지는 질문

그렇다면 이 페르소나 데이터셋이 우리 교육 현장에 어떤 의미를 가질까. AI 교육 전문가는 AI 기술을 학교에 접목할 때 늘 ‘어떻게 하면 AI가 학생 개개인의 특성을 더 잘 이해할까?’라는 질문에 부딪힌다.

첫째, 맞춤형 학습의 가능성을 확장한다. 만약 AI 튜터가 학생의 성격, 관심사, 배경을 페르소나처럼 이해한다면, 단순히 정답을 알려주는 것을 넘어 학생의 눈높이에 맞는 비유와 설명을 건넬 수 있다. 예를 들어, 수학 문제를 어려워하는 ‘문화예술을 좋아하는 학생’에게는 역사적 건축물의 비율을 예시로 들어 설명하고, ‘e스포츠에 몰입하는 학생’에게는 게임 속 전략으로 문제 해결의 실마리를 제시할 수 있다. 이는 학생들에게 훨씬 더 몰입감 있는 학습 경험을 선사한다.

둘째, 교육 콘텐츠 개발에 새로운 지평을 연다. 교과서 속 인물들이나 AI 캐릭터들이 단순히 정형화된 모습이 아니라, 실제 한국인처럼 입체적인 성격과 배경을 가진다면 어떨까. AI가 다양한 페르소나를 기반으로 교육용 드라마 대본을 쓰거나, 역사 속 인물들의 가상 인터뷰를 만들어낼 수도 있다. 이는 학생들이 배움의 내용을 단순히 암기하는 것이 아니라, 살아있는 이야기로 느끼게 한다.

셋째, AI 윤리 교육의 좋은 사례가 된다. AI가 왜 다양한 데이터를 학습해야 하는지, 그리고 AI의 편향이 어떻게 발생하는지를 설명할 때, 이 페르소나 데이터셋은 구체적인 예시를 제공한다. AI가 특정 집단의 목소리만 듣는다면 어떤 문제가 생기는지, 그리고 다양한 사람들의 삶을 반영하는 것이 왜 중요한지를 시각적으로 보여준다. 이는 AI의 공정성과 다양성이라는 추상적인 가치를 학생들이 쉽게 이해하도록 돕는다.

NVIDIA의 숨은 조력

이러한 복합적인 페르소나는 엔비디아의 NeMo Data Designer라는 합성 데이터 생성 시스템으로 만들어진다. 독자적인 확률적 그래프 모델(PGM)과 google/gemma-4-31B-it 모델 등 복합 AI 시스템이 사람의 손으로 만들기 어려운 방대한 양의 데이터를 생성한다. 오픈소스인 덕분에 이 데이터셋은 상업적, 비상업적 용도로 모두 자유롭게 활용 가능하다. 기술이 단순히 상업적인 이익을 넘어, AI의 본질적인 발전에 기여하려는 노력을 엿볼 수 있는 지점이다.

AI는 결국 인간을 닮아가는 과정을 겪는다. 그리고 그 과정에서 가장 중요한 것은 다양한 ‘인간’을 이해하는 일이다. Nemotron-Personas-Korea는 AI가 단순히 똑똑한 기계를 넘어, 우리 사회의 다양한 구성원들과 함께 호흡하는 ‘지혜로운 동반자’로 성장할 수 있다는 희망을 보여준다.

도시계획·공간행동학의 시선으로 보면

도시계획가들은 건물을 짓기보다 사람의 삶을 디자인한다. 그들은 특정 공간이 다양한 사람들의 행동과 상호작용에 어떻게 영향을 미치는지, 또 사람들이 공간을 어떻게 자신만의 방식으로 경험하고 변형하는지 끊임없이 연구한다. Nemotron-Personas-Korea가 제공하는 상세한 개인별 데이터는 도시를 계획하는 데 필요한 ‘가상 시민’을 만드는 것과 같다고 말한다. 연령, 직업, 가족 구성, 취미까지 고려된 이 페르소나들은 공원, 도로, 주택 같은 물리적 공간이 어떻게 다른 사람들에게 다르게 인식되고 사용될지 시뮬레이션하는 데 귀중한 통찰을 제공한다. 공간은 단순히 물리적 실체가 아니라, 그 안에서 살아가는 사람들의 무수한 이야기가 겹쳐진 팔레트와 같다고 본다.

<출처> - https://huggingface.co/datasets/nvidia/Nemotron-Personas-Korea