[AxC] 크리에이터 인터뷰: 인하AI인, AI가 시인이 되다

만드는 사람, 창작하는 사람. 새롭거나 다른 결의 시도를 통해 우리에게 또 다른 감각적이고 이성적인 자극을 주며 확장된 시야를 열어주는 사람들이 중요한 시대입니다. 그리고 그 시도는 기술(technology)과 닿아있습니다. 우리의 생물학적 종의 한계를 넘어 설 수 있게 하는 주요 방법이자 삶을, 나아가 우리 자체를 변화시켜 온 주요한 방법이자 존재인 기술은 근래 문화예술과 만나 우리에게 또 다른 전이의 경험을 전달하고 있습니다. 융복합이라고 알려진, 과학과 기술이 문화예술과 만나 형성하고있는 분야가 그것입니다. 이에 그러한 새로운 크리에이터를 육성하고 지원하는 사업이 활발히 진행되고 있으며, 창작을 시도하고 진입하는 사람들 역시 더욱 증가하고 있습니다. 본 콘텐츠는 이러한 다양한 영역을 연결하며 우리에게 새로운 감각과 앎, 자극을 공유하는 크리에이터를 소개하는 자리입니다.

 

앨리스온: 안녕하세요, 이렇게 뵙게 되어 반갑습니다. 기대도 많이 되고요. 처음에는 인하AI인이라는 팀명을 들었을 때 이걸 어떻게 읽어야하나 고민을 했었어요. 반복해서 읽다가 아, 인하’시’인!! 이라는 생각을 떠올리고 역시 시를 다루는 분들이구나 하고 감탄을 했습니다. 우선, 인하AI인의 소개와 시작 지점 여쭙겠습니다.

저희는 인하대에서 인공지능을 공부하고 있고, 인하대 문과 그리고 공대 대학원생 분들과 함께 인하AI인팀을 이루어 프로젝트를 진행하였습니다.

시작은 인하대 박승보 교수님 소개로 콘텐츠진흥원의 콘텐츠임팩트 지원사업 중 AI스토리텔러 과정을 알게 된 것이었어요. 이후 2019, 2020년 2년간 참여하였습니다. 참여 기간 동안 저희는 인간의 영역인 스토리 창작을 인공지능이 할 수 있도록 노력하였습니다. 짧은 프로젝트 기간을 고려하다 보니 동화, 소설, 시 장르 중에서 문장이 길이가 짧고, 문장이 완벽하지 않아도 독자가 해석이 가능한 시를 도전 목표로 진행하였습니다.

앨리스온: 프로젝트에 대한 소개 부탁드리겠습니다.

프로젝트는 시를 학습하는 단계와 시를 서비스 하는 단계로 구분됩니다. 시를 학습하는 단계는 수집한 시를 자연어 전처리를 통해 학습이 가능하게 정리하는 과정입니다. AI가 학습하기에 적합하지 않은 것을 배제하는 과정이 포함되었습니다. 예를들어 한자를 배제하는 것이죠.

이후 시를 위한 인공지능을 만들기 위해 딥러닝 모델을 사용했습니다. 그런데 시를 창작하는 데 있어서 문제점은 정답지가 없다는 점입니다. 일반적으로 인공지능으로 학습할 때 동물을 인식하는 모델의 경우에는 정답이 있죠. 하지만 동시를 학습한 결과물이 정말 좋은가 라는 판단은 사람이 봐도 주관적이에요. 인공지능이 문장을 이루어도 그것이 좋은 시인지 판단이 어려웠습니다. 물론 단순히 생각해 보면 처음 입력한 시와 유사하게 나오면 좋은 것 아닌가 라고 생각할 수 있지만, 그것은 창작이 아니죠. 이 부분이 어렵고 시간이 많이 걸렸습니다. 학습 모델은 Seq2Seq, BERT, GPT-2로 하이퍼파라메터를 조정하면서 팀원분들의 주관적인 판단으로 다른 모델보다 좋은 성능을 보인 GPT-2로 결정하였습니다.  전처리와 학습을 거쳐 마지막 후처리는 서비스에 적합하지 않은 시을 걸러내는 작업이었습니다. 시, 그 중에서 동시는 따뜻하고 아름다워야 하는데 여기에 욕이 들어갈 수 있었어요. 이 부분도 미묘한 것이 맥락이었습니다. ‘강아지’는 어떤 상황 중 잘못 튀어나오면 욕으로 보일 수가 있어요. 이렇게 사람의 판단으로 정리한 여러 규칙을 기반으로 시가 적합하다, 그렇지 않다를 판단해서 적합하지 않으면 시를 파기하고 다시 생성하도록 하였습니다.

인하AI인, 마음의 실험: ai 스토리텔러 프로젝트

시를 서비스 하는 단계에서는 개발한 웹사이트를 통해 시제를 복수로 선택하고 시 창작할 수 있도록 인터페이스를 구성하였습니다.

기술적 영역 중 소개드릴 부분은 전처리 과정 중 시를 데이터화할 때 카카오에서 개발한 형태소 분석기를 사용하여 품사를 분류하고, 분류된 단어를 단어 간의 긴밀도를 Fast text 라이브러리를 사용하여 계산하였습니다. 이러한 단어 간의 관계 정보, 통계 정보를 규칙으로 활용하기 위해 온톨로지 기법으로 표현하였습니다. 여기에는 시로 표현하기 적합하지 않은 단어를 불용어와 금칙어로 목록화 하여 후처리시에 사용되었습니다.

앨리스온: ‘시’라는 문학의 형식에서 스토리라는 부분은 생소할 수 있는 부분일 것 같습니다. 프로젝트 주제인 ‘시’에서 스토리의 의미는 무엇일까요?

AI가 시에서 담아내는 스토리가 저희 관심 주제였습니다. 여기에서 스토리는 일반적인 소설의 기승전결 구조라기 보단, 시의 내용을 함축할 수 있는 한 단어 혹은 두-세 단어로 이루어진 것입니다. 예를 들면 어머니, 어머니의 추억이 될 수 있습니다. 이러한 함축어로를 시제로 하여 인공지능이 시를 써서 의미를 전달할 수 있게 하면 나중에 동화로도 확장해 나갈수 있으리라 생각했습니다.

앨리스온: 후처리 결과물의 처리 과정에서 팀원분들이 주관적 판단이 들어간다고 했는데 주관성의 명료한 조건이 있을까요?

공대생은 이런 부분이 어려워서 그 부분은 문과 팀원 2명이 참여했습니다. 좋은 시가 될 수 있는 최소조건을 정리했어요. 그 정리를 규칙으로 모두 만들 수는 없었지만 금칙어, 불용어 배제, 생성된 시어 중 맞춤법이 너무 차이가 나도 배제, 명사와 동사의 분포도를 분석하여 공통 합의한 규칙에 따라 배제하는 식으로 정리했습니다. 이 과정을 거쳤음에도 여전히 규칙이 러프하달까, 타이트하지 않아서 왜 이렇게 나오지? 하는 부분이 있습니다.

인하 AI 팀원 (강수환, 윤의녕, 오수연, 홍명덕)

앨리스온: 각자 다른 영역의 전문가들이 모여 융복합 프로젝트를 진행하는 것은 여러모로 매우 어려운 작업입니다. 이를 진행하며 느낀 점, 어려웠던 지점과 이를 극복하기 위한 노하우가 있다면?

공대와 문과대 사람이 모였습니다. 처음에는 각자 생각의 범위가 다른 것이 컸어요. 공대생은 칼같은 개발범위를 요청하는데 문학은 명확해 보이지 않았습니다. 이 다른 관점과 사고의 차이를 아는 것이 중요했습니다. 그래서 중요한 것은 먼저 듣고 되물었습니다. 그리고 내가 이해한 것이 맞는지 재차 확인하는 과정을 되풀이했습니다. 상대가 말씀하신 부분을 제가 이해하고 정리해서 다시 상대방에게 얘기했을 때 이해하면 맞는 것이고, 다시 얘기했는데 이해를 못했다면 이것을 명확하게 밝히기 위해 다시 대화했습니다.

용어 차이도 컸어요. 같은 용어인데 다르게 쓰이는 경우가 있어 용어 정의를 반복하고 되물었습니다. 흔한 예로 정의라는 단어는 문과분들은 Justice라고 생각하시지만 공대생은 Definition으로 생각하거든요. 여기에서도 잘 듣는 것이 중요했습니다. 보통 내가 이해했다고 생각하는 것은 내가 가진 지식의 틀을 통해서인데 이 이해의 틀을 공용화하는 과정이었습니다. 평상시의 의사소통에도 그랬고 상대방을 이해하기 위한 세미나도 진행하는 등 개발이라는 과정을 인문학적으로 모두 이해시킬 수는 없지만 구조를 설명하며 공통의 인식 틀을 만들기 위한 긴 시간의 노력이 있었습니다.

앨리스온: 가장 강렬했던 결과물은?

일반적인 동시의 특성은 긍정적이고 밝은 분위기에요. 그렇게 머릿속으로 그리고 있는데 인공지능이 가끔 우울한 거나 반사회적인 시를 뽑아냈어요. 그 중 ‘엄마’라는 시가 기억에 남습니다. 4행시인데 대략 설명을 드리자면 ‘엄마는 하얀휴지를 둘둘 말아 마련해 놓고 그 방에서 앉아 울더라’ 라는 시작하는 내용이었어요. ‘육아를 하는 엄마가 울 준비를 하는 하얀휴지를 둘둘말아서, 그게 봄날이 오니 좋아질거야’라고, 마디마디 주무르며 ‘좋아질거야’ 라는 주문을 넣는 것 같은 심상이 표현되며 슬프고 의미있게 다가오는 시였어요.

앨리스온: 인공지능이 우리의 역할을 대체할 수 있을까요?

일부는 답을 찾은 것 같습니다. 인간만이 사유하고 즐기는 부분, 즉 문화인 동시, 시는 인간을 위한 행동이죠. 셈셈이는 사람들을 위해 시를 제공해주며 또한 시를 쓰고 싶은데 어려워하는 사람을 위해 협업을 할 수있게 합니다. 인공지능과 협업을 한다는 구도, 인간 창작자를 서포트할 수 있는 존재. 그 가능성을 확인한 것 같습니다. 향후 이러한 서포트 서비스, 그리고 관계를 위해 어떤 UI가 필요할까에 대해서도 목표를 잡고 있습니다.

앨리스온: 시의 저자는 어떻게 표시? (웃음)

2020년에는 셈셈이라고 이름을 부여 했어요. 컴퓨터의 순우리말은셈틀입니다. ‘딥러닝’이 계산량이 많은 학습모델이다보니셈하고 셈하는 사람으로서 그렇게 결정했습니다. 또다른 이유로는 저의 딸 태명이기도 합니다.

앨리스온: 올해의 계획에서스토리단어가 많이 보입니다. 올해 사업에서 스토리의미는?

올해의 인하AI인의 활동은 지난 번 진행된 프로젝트의 후속연구지원프로젝트입니다. 새로운 연구는 아니고 셈셈이를 고도화 하는 작업이에요. 작년의 제한된 짧은 시에서 확장해 긴 시의 창작 시도, 연과 행의 변화 등 모델 고도화하고 그 결과물을 정리하여 공모전과 논문에 투고하려고 준비중입니다. 그렇게 나온 시를 정리하여 PDF 시집으로 만들었는데 공모전 투고 결과가 좋다면 정식 시집으로 제작하려고 계획을 잡고 있습니다.

앨리스온: 향후 계획을 어떻게 잡고 계신가요?

동화나 소설도 초기 목표 중 하나였는데 기간상 접근이 어려웠어요. 이 프로젝트 이후로 같이 팀원들과 동시보다 긴 동화창작 영역을 고민하고 있습니다. 올해의 진척을 토대로 작은 플롯 구조를 엮어서 동화를 쓸 수 있을 않을까 기대하는 바가 있습니다.

저희가 공통으로 가진 질문은 ‘인공지능이 인간을 대신하여 역할을 대체할 수 있을까?’ 입니다. 프로젝트를 진행하며 일부는 답을 찾은 것 같아요. 인간만이 사유하고 즐기는 시는 인간을 위한 건데 저희 셈셈이는 사람들을 위해 시를 제공해줄 수 있다는 단초를 확인했어요. 시를 쓰고 싶은데 어렵다면, 셈셈이를 통해서 같이 협업을 한다는 구도, 작가와 인공지능이 창작 영역에서 협업을 하는 모습을 그리며 이를 어떻게 서포트할 수 있을까에 대한 고민과 실행도 지속해 나갈 예정입니다.

저희는 누군가가 예산을 편성해 만들어진 팀이 아니라 구성원 각자의 니즈에 따라 만난팀이라 긴밀하고 견고합니다. 다른 인공지능 경진대회도 참여해서 실적도 냈고, 공학만이 아닌 인문과 공학이 함께 하는 프로젝트를 지속적으로 시도해 나가려고 해요. 돈이 되지는 않지만 재미있어서 하는 만큼 계속 그 재미를 찾아나갈 것 같습니다.

앨리스온: 인터뷰 응해주셔서 감사합니다. AI와 함께하는 앞으로의 모습, 기대하겠습니다.

본 콘텐츠는 콘텐츠임팩트 사업의 지원을 받아 제작되었습니다. 이 곳에서는 콘텐츠임팩트의 2019-20년도 우수지원 크리에이터와 2021년의 뉴 크리에이터의 프로젝트 소개와 그들의 이야기를 담아 공유할 예정입니다.

진행. 허대찬(aliceon managing editor)