빅 데이터 페스티벌 수상,
팀 'Gingko'

  • 405호
  • 기사입력 2018.10.17
  • 취재 정지현 기자
  • 편집 주희원 기자
  • 조회수 11523

‘도전하라’는 이야기를 자주 듣게 되는 대학시절, 하지만 누군가는 고민하고, 누군가는 이것 저것 재느라 도전할 기회를 잃곤 한다. 이번 ‘성대생은 지금’에서 무모하다고 생각할 수도 있는 도전 끝에 공모전 1위라는 결실을 맺은 이를 만났다.  미래에셋대우에서 주관하는 빅 데이터 페스티벌에서 수상한 팀 ‘Gingko’(권순규 학우(통계,14)한상현 학우,(통계,14) 백우현 학우(통계,14)로 구성)의 대표, 권순규 학우이다. 그의 이야기를 들어보자.


공모전에 참여하게 된 계기는 무엇인가요

처음에는 정말 충동적이고 무모한 생각으로 도전했던 것 같습니다. 카페에 모여서 이번 방학 때 서로 뭘 할지 얘기하던 와중에 학회 단체 톡방에 이 공모전 관련 글이 올라왔고 ‘이거나 해볼까?’해서 그 자리에서 바로 지원하게 되었습니다. (마감 2시간을 남기고 지원했던 것 같군요)  지원서는 제출했는데 통계학과인 저희는 막상 경제관련 지식도 하나 없고, 주가가 어떻게 움직이는지에 대한 아무런 이해가 없어서 큰 기대는 없었습니다. 주변 지인들도 이 공모전은 너희가 수상하기에는 무리가 있을 것이라고 말했습니다. 


참가하신 이번 공모전과 소속 팀에서 제출한 공모전 결과물의  소개 부탁드립니다.

이번에 저희가 참가한 공모전은 미래에셋대우에서 주관하는 빅 데이터 페스티벌이었습니다. 주제는 크게 두 분야로 1) 금융 데이터 분석과 2) 금융 서비스 개발이 있었고 저희는 이중 데이터 분석 분야에 참여했습니다. 데이터 분석 분야는 주가예측모형을 만드는 것이 주 과제였는데, 저희는 그중에서도 화장품 생산기업 주가예측에 집중했습니다. 화장품 산업의 전반적인 동향을 파악하기 위해 화장품 종합주가지수라는 산업 섹터 지수를 새로 산출했고 온라인 뉴스기사를 크롤링해서 경제/외교 상황을 고려해주는 변수도 추가했습니다. 하지만 심사위원분들께서 가장 좋게 보신 점은 저희 분석의 메인 아이디어인 “인플루언서 지수”가 아니었을까 생각합니다. “인플루언서 지수”는 저희가 고안해낸 변수로써 화장품을 리뷰하는 뷰티 유튜버들의 동영상을 분석하여 그들이 화장품 업계에 미칠 수 있는 영향을 수치화한 지수입니다. 이를 추가함으로써 예측모형의 성능이 눈에 띄게 향상되었고, 이전에 시도되지 않았던 분석인만큼 창의성 부분에서 큰 점수를 받아  대상을 받을 수 있었던 것 같습니다.



공모전을 진행하면서 어려웠던 점은 무엇이었나요

금융데이터 관련 공모전이다 보니 경제관련 도메인지식이 많이 요구되었습니다. 저희 세 명 모두 통계학과라 주식이나 전반적인 경제지식이 많이 부족했고, 이때문에 분석 초반 분석의 세부방향을 결정하는 것에 어려움이 많았던 것 같습니다. 주가를 예측하는 알고리즘을 만들어야 하는데 주가에 영향을 미치는 요소는 구체적으로 어떤 것들이 있는지, 주식시장이 가지는 특징은 무엇인지 등 공부해야 할 것들이 많았습니다. 심지어 주최측에서 제공한 데이터에는 종목별 주가만 포함되어있었고, 경제지표와 같은 다른 정보들은 일체 들어있지 않았죠. 

  

따라서 저희들은 분석 초반에 거의 매일 주가예측관련 논문과 칼럼들만 읽었습니다. 많은 주가예측 논문을 읽으면서 어떤 변수들이 사용되고, 어떤 모델들을 사용하는지 등 저희가 부족했던 정보 위주로 읽었습니다. 또한 Fn-Guide의 경제칼럼들을 통해 주가와 밀접한 영향이 있는 요소들은 무엇이 있고 왜 해당 요소들이 중요한지에 대해 공부했습니다. 점차 지식이 쌓이다 보니 조금씩 방향이 잡혀 나갔고 처음에는 생각조차 할 수 없었던 내용들도 마구 떠오르기 시작했습니다. 공부 하면서 현재 주가분석에 사용되지 않지만 중요한 요소는 무엇이 있을지 팀원들끼리 계속 논의했고 결과적으로 저희의 핵심 주제라고 할 수 있는 ‘뷰티 유튜버 분석을 통한 주가 예측 알고리즘 개발’ 이라는 주제까지 갈 수 있었습니다.


이번 수상에서 더 나아가, 앞으로의 계획이 있으신지.

저희 셋 모두 이번이 첫 빅데이터 공모전이었는데, 너무 큰 상을 받아서 아직도 실감이 잘 나지 않습니다.  미래에셋 공모전 제출이 완료되자 마자 다른 공모전들도 열심히 준비해 이미 제출하고 결과를 기다리고 있는데요, 이처럼 저희들은 도전을 계속하고 싶습니다. 통계와 데이터 분석 분야가 매우 빠르게 변화하고 배울 것이 너무 많다 보니 공모전과 같은 치열한 Competiton을 통해 학교에서는 배우기 어려운 내용들을 많이 습득할 수 있는 것 같습니다. 그래서 학회활동과 더 많은 공모전을 통해 진짜 데이터 사이언티스트가 되기 위한 경험들을 쌓아 나갈 예정입니다. 


이러한 과정은 항상 어렵고, 새로우며, 좌절하는 일이 다반사일 것입니다. 하지만 새로운 정보와 지식은 너무 많고 무엇 하나 중요하지 않은 것이 없다고 생각합니다. 아는 것이 좀 생겼다고 생각되는 순간 항상 내 앞에서 뛰고 있는, 더 잘하고 더 실력 있는 사람들이 보입니다. 그러나 미래에셋 공모전 멘토께서 말씀해 주셨던 것처럼 지금 부딪히는 벽들이 미래에 우리를 높여줄 발판이 되리라 생각하며 매일 정진할 것입니다. (그렇다고 학교생활을 소홀히 해서는 안되겠지요 ㅎㅎ) 겨울 시즌에 있는 공모전과 다음학기 예정된 미래에셋 인턴직을 포함하여 끊임없이 도전하고, 배우겠습니다. 


대회 수상소감과 대회를 통해 느낀 점

 이번 미래에셋 빅데이터 패스티벌은 저희 인생의 터닝 포인트라고 말해도 과언이 아닐 것 같습니다. 가장 먼저 깨닫게 된 점은 포기하지 않는 법을 배웠다는 것입니다. 지금도 맨 처음 대회 초반에 증권에 관해 아무것도 모르는 세 명이 소위 말하는 ‘노답’ 상태로 회의를 지속하던 기억이 눈에 선합니다. 석박사들도 많이 참여하는 대회라 저희의 레이스 질주 속도는 말그대로 거북이가 토끼를 따라잡는 꼴이었습니다. 하지만 이보다 더 완벽할 수 없는 저희의 단합력과 끈기로 이 모든 것을 극복해 냈다고 생각합니다. 어떤 어려운 과업이 있어도, 팀원들 스스로 자처하여 본인이 담당하려 했고, 이런 이타적인 팀플 과정에서 계속해서 좋은 방향으로 분석이 진행되고 발전할 수 있었습니다. 방학 내내 눈을 뜨는 대로 국제관 지하 3층 빈 강의실에 모여 최소 자정 혹은 새벽 4시 넘은 늦은 시각까지 공부하고 또 공부했고, 끼니를 거르는 경우도 다반사였습니다. 


전체 5등부터 수상 명단을 호명했고, 마지막 2등까지 발표했는데도 저희 팀 이름 ‘Gingko’가 호명되지 않았을 때 그 감동과 떨림을 아직도 잊을 수 없습니다. 약 3달간의 피나는 노력과 고생을 한 번에 보상받은 느낌이었고 실감 나지 않았습니다. 앞으로 어떤 어려운 일이 있어도 헤쳐나갈 수 있는 지혜와 용기를 얻었습니다.  팀 프로젝트를 진행할 때, 개개인의 실력보다 중요한 것이 협동심과 이타적인 마인드라는 것 역시 뼈저리게 느낄 수 있었습니다.


빅데이터 관련 공모전 혹은 대회에 도전할 학우들에게 한마디 

‘이 대회는 석박사들이 많이 참여한다더라, 우리는 수상가능성이 없을거다’ 등의 불안감과 두려움으로 인해 대회 참가를 포기하거나 주저하지 않았으면 합니다. 단, 참가하기로 마음먹었다면 결과물 제출까지 최선을 다해 임해야겠지요? 최근 빅데이터 분야가 굉장히 큰 이슈가 되고 관심 있는 학우분들이 많은 것으로 아는데, 데이터 분석에 관한 실력을 늘리기에 가장 좋은 방법은 공모전에 참여해 실무 데이터를 직접 다루고 만져보는 것이라고 생각합니다. 끊임없이 ‘에러’ 메시지를 마주하고 좌절하다 보면 저희도 모르는 사이에 한 발짝씩 나가는 것을 알 수 있었고, 그러한 요소들이 모이고 모여서 지금과 같은 결과가 나온 것이 아닌가 생각합니다. 결론은 주저하지 말고 도전하시되, 끝까지 포기하지 마세요.


주변 분석 경험이 있는 동기나 선배들의 조언을 구하는 것도 중요하지만 이 분야에 있어서 가장 중요한 것은 바로 ‘자유로운 구글링’ 이라고 생각합니다. 모르는 것을 구글에 찾아서 구현하는 능력만 제대로 겸비할 줄 알아도 에러를 해결할 수 있는 지혜가 생기고 분석 실력도 향상시킬 수 있는 것 같습니다.