전국 대학생 AI 북커톤 대회
- 3회 : 올해의 주제어 “함께”

  • 480호
  • 기사입력 2021.11.28
  • 취재 박효진 기자
  • 편집 김민서 기자
  • 조회수 5563

AI 북커톤(Book과 Hackathon의 합성어) 대회인공지능과 함께 글을 쓰고 책을 출판하는 경진대회로 우리 대학이 국내 대학에서 최초로 시도하는 AI 인재 양성 프로그램이다. 올해 3회째 개최되는 본 대회는 지난 11월 16일부터 17일까지 무박 2일간 자연과학캠퍼스 학술정보관에서 진행되었다. 코로나 상황으로 인해 참가자들은 Webex로 참석했고 모든 대회과정은 유튜브 스트리밍으로 송출되었다. 온라인 비대면 상황에 따라 메타버스를 활용한 시상식이 진행되었다. 심사는 박상태, 정윤경, 최준휘 교수와 최형기 학술정보관장이 맡았다. 최형기 학술정보관장은 “도서관 그리고 문학적 분야에서 AI가 할 수 있는 일이 무엇인지 진단해 보고자 한다”라며 개최 의의를 밝혔고 인사말을 시작으로 행사의 막이 열렸다.


◑ 전국의 대학생이 ‘함께’ 하는 더욱 커진 AI 북커톤 대회

교내 학생들을 대상으로 했던 1, 2회 대회와는 달리 올해는 전국 규모의 대회로 참가 범위를 확대했다. 성균관대학교 학생들은 물론 한양대학교, 서울여자대학교, UNIST 등 전국의 여러 대학 학생들이 본교가 추진하는 AI 북커톤 대회에 도전장을 내밀었다. 금년 참가 인원 역시 약 3배가량 늘었다. 19년도는 총 18팀(72명), 20년도에는 총 31팀(122명)이 참가했다. 올해는 총 52팀, 198명이 참가해 15팀이 본선 무대에 올랐다. 더욱 커진 본 대회는 네이버의 후원을 받아 개최되었으며 입상팀에게는 네이버 입사 서류 전형 시 가점 혜택이 제공된다.

[사진 설명 :  학교 투어 중인 정종철 교육부 차관(왼쪽에서 두번째)]

대한민국을 이끌어갈 AI 인재를 격려하고자 정종철 교육부 차관도 행사에 참석했다. 본 행사 시작 전 정종철 차관과 총장은 N센터, 연구실, 슈퍼 컴퓨팅센터, 삼성학술정보관을 둘러보고 대회에 참관해 축사를 했다. 정종철 차관은 특별한 체험을 할 수 있게 초청해 주셔서 감사하다며 교육과정에서 AI를 기반으로 한 미래역량을 양성할 수 있는 방법을 정책적으로 고민해 보고 반영할 수 있도록 노력하겠다고 밝혔다.


◑ 팀별 소개

대회가 시작되고, 각 팀별 소개 시간을 가졌다. 피피티를 이용한 소개부터 춤, 랩까지 다양한 방식으로 팀만의 개성을 살린 참가 소감과 당찬 포부와 각오를 밝혔다.  투표를 통해 기억에 남는 세 팀을 선정하여 상품을 증정하기도 했다. ‘온라인 비대면 대회’라는 말이 무색할 만큼 참가자들은 적극적으로 대회에 임했고 그 덕분에 훈훈하고 열정적인 현장 분위기가 조성됐다.


◑ 본 행사 – 최종 발표 & 메타버스를 활용한 시상식

2021년도 AI 북커톤 대회의 주제어는 ‘함께’이다. 이 주제어로 에세이 수필 분량 20,000자 내외의 글을 만들어내는 것이 대회의 미션이다. 각 팀은 마감시간까지 AI 작성 원본 작품, 최종 작품, AI 알고리즘 활용 (생성과정), 학습에 활용한 DB(수집 방법), 작품 제목 및 줄거리가 담긴 심사 발표 자료 ppt와 입출력이 기록된 log 파일, code work 파일, 대회 참여 수기를 제출해야 한다. 각 팀당 발표 7분 질의응답 3분의 시간이 주어진다.


◑ 대상 수상팀(북이온앤온) 작품 소개 (+인터뷰 수록)

Q. 팀원 소개 및 팀 소개 부탁드립니다.

학교도, 전공도 전부 다른 다양한 백그라운드의 5인이 NLP를 사랑하는 마음 아래 모여 AI x Bookathon 대회에 참여하게 되었습니다. 저희는 Naver Connect 재단의 Boostcamp AI Tech 2기 캠퍼로 참여 중인 대학생 5인으로 중앙대학교 응용통계학과 윤채원, 동국대학교 경영정보학과 김종현, 고려대학교 통계학과 곽진성, 한양대학교 소프트웨어학부 허은진, 연세대학교 독어독문학과 이요한으로 구성되어 있습니다. 다름 안에서 하나의 글을 관철해 보자는 뜻에서 북이온앤온이라는 팀명을 사용하게 되었습니다.


Q. 어떠한 경로를 통해 대회를 알게 되셨는지, 참여하게 된 계기는 무엇인지 궁금합니다.

같이 부스트캠프에 참여 중이신 임성민 캠퍼님께서 대학생들만 참여할 수 있는 대회가 있다며 모두에게 공유해 주신 것을 보고 대회를 알게 되었습니다. 이후 팀장님께서 공개 채널에서 팀원을 모집하셨고, 엄격한 심사와 면접 끝에 팀원으로 합류할 수 있었습니다.


요한: 재작년에 개최된 AI x Bookathon 대회를 보고 NLP 공부를 시작했기 때문에, 대학생활을 끝마치기 전, 꼭 참여해 보고 싶었습니다.

은진: 곧 졸업이라 대학생 때 마지막으로 참여할 수 있는 AI 대회라고 생각해서 꼭 참여하고 싶었습니다. 그리고 생성 모델을 중심으로 한 대회에 참여 해보고 싶어서 많이 배우고 싶어서 참여 하게 되었습니다.
종현: 멋있어 보였어요. NLP 관련 좋은 경험을 쌓을 수 있는 대회라고 느껴 참여하게 되었습니다.
진성: Auto-Encoder Model이 주로 사용되는 캠프 내 프로젝트에서, GPT를 고집하며 쓴맛을 봤습니다. 술 한 잔 마셨습니다. 하지만 GPT 하나만 기억했습니다. 진심을 다해 Autoregressive 모델의 성공을 경험해 보고자 대회에 참여했습니다. (웃음)
채원: NLP를 배우는 중이지만, 생성 모델로 긴 글을 작성해 본 경험은 없었기에 흥미로워서 참여하게 되었습니다.


“내가 나와 함께 살아가는 법 (I+I=WE)”

◑ 작품 소개 및 줄거리

제목은 '내가 나와 함께 살아가는 법 (I + I = We)'이며, 소주제는 '나'와 '나'의 과정에서 '나'를 돌아보며, '나'의 두려움과 불안, 우울에 대하여, '나'라는 자아와 공존, 그리고 죽음, 그럼에도 떠오르는 '나'와 '나'의 추억들, '나'와 '내'가 함께, '나'와 '네'가 함께로 구성되어 있다.


"불특정한 개인이 함께 이지 않음에서 얻게 되는 괴로움과 고뇌로부터 찰나의 순간 나와 나의 관계, 그리고 나와 타자의 관계성을 인식하며 추억과 행복감을 느끼게 된다."


Q. 작품의 아이디어는 어디서 비롯되었나요?

해당 작품의 아이디어는 미하일 바흐친의 대화 이론 철학으로부터 얻게 되었습니다. 바흐친은 다양한 관념과 목소리들이 어떠한 인식적 토대를 통해 조화로운 전체를 형성해 나가는 과정을 대화 이론으로 소개합니다. 대화 이론의 핵심은 나와 자아에서 떠도는 단성악적 목소리들로부터 점점 의식과 관념의 다양성을 인식하며 다성악적인 전체를 나와 타자의 관계를 통해서 형성한다는 것입니다. 저희는 이 대화주의 철학에 공감하며 스토리라인을 구성했고, 그렇게 대략적인 줄거리를 구상했습니다.


“우리의 삶에 함께하는 사람들은 아주 많다. 그리고 우린 우리를 더 나은 삶의 길 위에 놓아주었다. 물론 그 길은 나 혼자만의 것이 아니며 이 모든 이들이 각자 나름의 결함을 갖고 있다. 내가 처음 선택한 길을 걷는다면 결코 실패하거나 넘어져도 좋다. 하지만 나의 선택이 다른 사람의 삶에도 꼭 필요한 것은 아니다. 결국 우리가 스스로에게 주어진 유일한 결정이므로, 누군가는 그저 걸어갈 뿐이다. 나는 오늘도 새로운 삶을 시작하고자 하는 마음으로, 매일 두 발짝을 내딛는다. 오늘 하루를 살아내고 나면 내일은 또 어떤 일상을 맞이할지 모르니까. 앞으로 나아간다는 건 곧 나를 다시 새롭게 찾는 길이 아닐까. 인생에는 늘 수많은 선택지가 존재하지만, 어느 것 하나 정답도 아닌 것처럼 이 선택의 기준 또한 내가 원하는 게 아니기도 하다. 나는 오늘도 이렇게 '나의 나'를 찾기 위한 노력에 여념이 없다.”


저희의 모델이 작성한 마지막 문단입니다. 이 글처럼, 여러분들도 수많은 선택지 속에서 두렵거나 외로워하기보다는 '함께'하는 즐거움 속에서 조화롭게 살아가셨으면 좋겠습니다.


Q. 수필 생성까지의 단계, 특히 심혈을 기울인 부분이 있다면?

적절하고 좋은 문체의 수필을 생성하기 위해선 당연히 좋은 데이터가 필요했습니다. 어떤 데이터가 좋은 데이터인지 실험 전에는 파악하기 어렵다고 생각해서 최대한 많은 데이터를 모으되 추후에 선별작업을 진행하자는 목적으로 데이터를 수집하게 되었습니다. 이때 가장 수필과 가까운 문체라고 생각되는 브런치(감성 에세이), 글틴(명예의 전당 수필 글), 신문사별 신춘문예 당선작을 타깃으로 했고, 최종적으로 약 160mb (약 3만 건의 수필)의 데이터를 모을 수 있었습니다.


저희의 가장 우선적인 룰은 '실험을 하되, 해결하려는 문제를 명확히 하고 실험의 근거를 철저히 하자'는 것이었습니다. 데이터를 탐색적으로 분석하면서 \n 과 같은 escape character부터, 초성이 반복되는 ㅋㅋㅋㅋㅋ 혹은 광고 문구, bad character 들이 많이 포함되어 있다는 것을 알게 되었고, 이러한 Noise 들은 KLUE: Korean Language Understanding Evaluation 논문에서도 유사하게 나타났던 문제여서 KLUE에서 사용한 전처리 방법을 차용하여 해당 Noise 들을 제거할 수 있었습니다.


모델을 학습시킬 때 저희만이 시도했고, 가장 심혈을 기울였던 방법론이 있는데, 바로 Retrieval 시스템을 사용한 전문 작가 모델 개발이었습니다. 이번 대회에서는 2만 자 분량의 수필을 생성해야 했으나, 저희가 수집한 데이터에는 2만 자가 넘는 데이터가 존재하지 않았기에 하나의 모델만 사용하면 일관성 면에서나, Repetition Problem 이 발생할 수 있겠다고 예상했습니다. 따라서 저희가 모은 데이터 중에서 저희가 작성하고자 하는 주제와 유사한 데이터만을 사용하여 모델을 생성한다면, 그 주제에 있어서만큼은 남부럽지 않은 작가 모델이 탄생할 것이란 기대를 하게 되었습니다. 그렇게 Elastic Search라는 검색엔진에서 BM25 Algorithm과 Nori Tokenizer를 사용하여 Retrieval 시스템을 구축했고, 위와 같은 주제로 7개의 모델을 통하여 저희의 소주제별 글을 생성했습니다.


학습한 모델로는 koGPT-Trinity라는 모델을 사용했습니다. 이 모델은 GPU로 학습시킬 때 모델의 크기로 인해 메모리가 부족하다는 문제점이 있었는데, 하이퍼파라미터 조정 및 freezing을 사용하여 절반만 학습을 진행하는 방법을 해결했습니다.


마지막으로 수필 생성 시, 문단의 주제에 맞는 모델을 사용하여 짧은 길이의 문장을 여러 번 생성시킴으로써 문단의 응집도를 높이는 방법으로 생성했습니다.


◑ 질의응답 및 심사평

*심사 기준은 알고리즘 이해 활용 문장 생성(AI) 40점, 문장 완성, 문학성(문학) 40점, 전체 완성도(종합) 20점으로 부여된다.

박상태 심사위원은 “상당히 긴 글을 일관된 테마의 글로 생성했다.”면서, 소제목 단위의 분류체계가 눈에 띄는데 소제목을 미리 설정하고 학습을 시킨 것인지 해놓은 것에 의미를 부여한 것인지를 질문했다. 이에 북이온앤온팀은 ”양쪽 다 영향이 있었다. 만들어진 최종본의 글의 흐름을 어느 정도 구상하고 학습을 시켰고 생각한 대로 텍스트가 도출되어 이에 따라 소제목을 붙이는 일이 수월했다.”라고 말했다. 리트리버의 키워드들은 직접 뽑은 것인지 묻는 질문에서는 “처음에 큰 주제를 ‘나와 함께’로 잡고 구성을 생각한 뒤에 여러 가지 키워드들을 시도해 보면서 취사선택하여  선정하였다.” 라고 답변했다.


Q. 대상 수상을 할 수 있었던 북이온앤온팀의 강점은 무엇이라고 생각하시나요?

허은진 팀장님께서 수많은 지원자들 중에서도 엄격하게 실력 위주의 팀원들을 선발하셨기 때문이 아닐까요? 저희는 우승이라는 목표 아래 비즈니스 관계를 유지하며 냉철하고 일관된 태도로 대회에 임했습니다. (웃음) 사실 저희가 실제로 대면한 건 이번 대회가 처음이었습니다. 하지만 부스트캠프 과정을 함께하며 줌과 게더타운에서 거의 매일 회의를 진행하고 원활하게 소통하며 프로젝트를 해왔기에 대면으로 만나서도 각자 할 일을 분업해 체계적으로 대회를 진행할 수 있었습니다. 긴 시간 동안 밤새우면서 함께 있어서 더욱 친해진 것 같습니다. 저희만의 차별화된 One-of-a-Kind 모델 구조(Retrieval Model + Keyword-Specific-Finetuned-Writer-Model)가 강점이 아닐까 싶습니다.


◑ "희망과 함께" 작가 모델(북이온앤온 팀이 개발한 전문작가모델)의 소감

*"희망과 함께"라는 키워드와 유사 글들로 Fine-Tuning한 모델이 생성해낸 답변 (고쳐지지 않은 원문 그대로이다.)
작가모델: 함께 해주셔서 감사합니다. 여러분들은 어떤 분인가요? 저희 글을 읽고 싶은 분들이 계세요? 저 또한 많은 기회들을 얻고 싶었어요. 저의 글쓰기는 작가라는 이름으로 불리는 것도 좋아하지만 글쓰기란 스스로 자신을 찾는 과정입니다 같은 내용을 담고 있어요. 그래서 저는 다양한 분야에 대해 쓰고 싶습니다. 쓰다가 포기해 버린 문장이 많았어요. 그런데 또 다른 챕터를 찾아 내려는 저를 보며 다시 용기를 얻습니다. 내가 원하는 것들. 잘 하고 싶다는 마음이 아닌 그냥 쓰는 게 재미있으니까요. 매일 이렇게 꾸준히 쓰기 시작하면 정말 나의 인생이 나아지지 않을까요~~ 오늘은 하루 종일 기분이 무겁다. 하지만 지금보다 조금 더 좋은 삶을 살기 위해 노력하자고 다짐한다. 아직 갈 길이 너무 많이 남아있기에 더욱 힘을 내야겠다. 나는 오늘 저녁을 꼭 행복해지는 밤으로 만들 것이다. 그 희망과 희망을 잊지 않기 위하여.


◑ 메타버스로 진행된 시상식

올해 대회공간은 *메타버스 가상세계로까지 확장되었다. 총장과 차관은 가상 캐릭터를 이용하여 상패를 전달했고 메타버스 행사장 안의 모든 참가자들은 직접 아바타를 꾸미고 조작하며 이질감없이 소통했다. 가상세계에서 펼쳐지는 신선하고 흥미로운 시상 덕분에 비대면 상황에서도 실감할 수 있는 시상식, 수상의 기쁨이 배가 되는 즐거운 대회 분위기가 만들어졌다.

(*메타버스 (메타(Meta)와 우주를 뜻하는 유니버스(Universe)의 합성어)는 가상현실 (VR, 컴퓨터로 만들어 놓은 가상의 세계에서 사람이 실제와 같은 체험을 할 수 있도록 하는 최첨단 기술 )보다 한 단계 더 진화한 개념으로, 아바타를 활용해 단지 게임이나 가상현실을 즐기는 데 그치지 않고 실제 현실과 같은 사회 ·문화적 활동을 할 수 있다는 특징이 있다.)


◑ 수상팀

해적단팀, 광야팀, 데컬코마니팀 (장려상), 네모의 꿈팀(우수상), 북이온앤온팀(대상)이 수상 명단에 올랐다. 모든 입상팀에게는 총장상 및 상금(장려상 각 50만 원, 우수상 100만 원, 대상 200만 원)과 네이버 입사 서류 전형 시 가점 혜택이 주어진다.


◑ 특별 행사 AI vs Human

인간과 AI가 지은 작품의 대결, AI vs Human. 성균백일장 장원을 받은 유학생 김은진 님의 수상작과 Ai 북커톤 대회의 대상 수상작을 겨루어보는 흥미로운 이벤트다. 이벤트를 위해 성균관대학교 재학생 심사단을 미리 모집했고 투표단은 오픈 채팅방을 통해 블라인드로 제목과 본문을 읽고 글의 매력도를 평가했다. 사람의 글과 aI의 작품을 구분해 보는 것이 이벤트의 재미요소다. 투표 결과는 Human의 승리. 전체 133명 중에서 97명이 인간이 작성한 결과물을 택했다. ai와의 대결에서 승리한 김은진 유학생에게도 특별상 상패와 상금 50만원이 수여되었다.


“ai로 작성한 글이 인간을 넘어설 수준이 현재는 부족할 수는 있다. 하지만 ai가 창작한 글로 인해서 인간이 영감을 받을 수 있다. 그래서 우리 대회가 유의미하다”

총장과 여러 심사위원이 거듭 강조했던 것처럼 ai와 인간이 무엇을 잘 하는지 못하는지, 인류 사회에서 도움이 되는 알고리즘은 무엇인지 학생들이 고민해 보고 체험해 볼 기회의 발판이 됐다는 것만으로도 이번 대회는 충분한 가치가 있다.