AI를 위한 데이터 분석 기초-
한옥영 저 & 저자 인터뷰

  • 504호
  • 기사입력 2022.11.30
  • 취재 임찬수 기자
  • 편집 김윤하 기자

우리는 이른바 데이터 홍수의 시대에 살고 있다. 인간의 뇌로는 감당할 수 없는 방대한 양의 데이터를 처리하기 위해선 필연적으로 컴퓨터의 도움을 받게 된다. 성균관대학교에는 학생들이 컴퓨터를 활용한 데이터 분석 시대에 경쟁력을 갖출 수 있도록 도와주는 필수 교양 과목들이 존재한다. 더 나아가서, 수업만으로는 어려움을 겪는 학생들을 위한 도서가 출판되었다. 기사를 따라 읽어가며 도서의 정보와 저자의 생각에 대해 알아보도록 하자.


☞ 자기소개 및 책 소개 부탁드립니다. 

안녕하세요, 저는 한옥영 교수이고요. 학부대학에 소속되어 교양 필수에 해당하는 컴퓨팅 과목들을 가르치고 있어요. 책의 제목은 AI를 위한 데이터 분석 기초입니다. 제가 데이터 분석 기초라는 과목을 교양 필수로 개설해서 계속 가르치고 있는데요. 학생들이 너무 어려워해요. 그래서 어떻게든지 도와주고 싶은데 일일이 붙잡고 설명해 줄 수도 없다보니, 책이 있으면 학생들이 말로는 전달받지 못하는 것들을 활자로 보면서 공부할 수 있지 않을까싶어 정리 해본 책입니다.


☞ 이 책을 읽으면 데이터 분석 기초 과목에 도움을 받을 수 있나요? 

요즘의 AI 시대에 맞게끔 실질적으로 파이선 프로그래밍을 활용하기 위해서는 데이터 분석부터 시작 해야 돼요. 이 책을 읽으면 학생들에게 가이드라인이자 나침반이 될 수 있어요. 주의해야 할건 이 책은 수업을 듣는 친구들에게 나침반 같은 도움이 될 수 있는 하나의 도구인 거지 이미 방향을 잘 알고 있는 친구에게는 필요 없을 수도 있어요. 그래서 모든 친구에게 도움이 될 거라는 확신은 없지만 어떤 친구에게는 절실한 책이 될 수 있지 않을까. 그 절실한 친구들을 위해서 집필한 책이에요.

☞ 데이터 분석이라는 소재가 낯설고 어려울 수 있는데, 이를 해결하기 위해 특별히 신경쓴 부분이 있나요?

이 책은 절대로 프로그래밍을 설명하려는 책이 아니고 데이터 분석을 어떤 방식으로 접근할 수 있는지 보여주려 했어요. 코딩의 기본 틀이 다 갖춰진 채 예제식으로 제공되기 때문에 자신이 적용하는 데이터로만 바꾼다면 특성과 데이터들 간의 상관관계를 분석함으로써 내용을 알 수 있는 거죠. 코딩이 어렵다고 데이터 분석의 기초도 못하는 게 아니에요. 영어를 배운다고 모두 다 미국 사람처럼 CNN 뉴스 보면서 100% 이해할 수 없잖아요. 그거랑 똑같다는 거죠. 결국 미국 맥도날드에서 먹고 싶은 햄버거를 주문할 수 있느냐 정도의 데이터 분석이지, 미국 정치인들과 공화당과 민주당의 현실에 대해서 얘기하는 수준은 아니에요.

본인이 데이터 분석 기초 프로그래밍에 관심이 많고 수준이 높다면 이 책은 부적합한 책일지도 몰라요. 말했듯이 이 책은 나침반 같은 책이에요. 나침반은 방향만 알려주지 네비게이션처럼 자세하게 얘기해 주진 않잖아요. 이 책도 예제를 주고 그 예제를 이해할 정도만 가르쳐줘서 코딩을 어려워한다고 해서 절대로 어려운 책은 아니에요.


☞ 책을 통해서 전하고 싶었던 말이 있나요?   

저는 데이터를 읽는 사람이 세상을 지배한다 생각해요. 세상에 끌려가지 않고 주인공이 되려면 결국 데이터를 읽을 수 있는 통찰력이 필요해요. 그 통찰력을 키우기 위해 데이터를 분석해야 되는데 가장 쉬운 방법이 파이선이지만 인문사회과학은 어려울 수 있으니까 도와주고 싶다는 마음이죠. 이 책은 코딩이나 파이썬이 핵심이 아니에요. 절대 그거에 대한 오해는 안 했으면 좋겠어요. 그거는 하나의 도구에 불과한 거예요. 인문사회과학 학생이라고 해서 사회가 “너 이거 몰라도 돼”, “너 코딩하지 마.” 라고 말하는 사회가 아니잖아요. 저는 이 책을 통해서 학생들이 데이터 분석을 이해하고 활용할 수 있기를 바래요.


☞ 요즘 시대에 데이터 분석이 중요한 이유는 무엇일까요? 

말씀드렸듯이 지금은 AI시대인데, AI는 인공적으로 만든 지능이잖아요. 컴퓨터가 공부하는 방법은 딱 하나, 데이터로 공부해요. 이런 데이터가 있으면 이런 결과가 나오는구나 그 공부를 시킨다는 거죠. 빅데이터 시대가 되면서 인터넷이 활발해지고 IOT에서 사물마다 데이터를 쏟아내는데, 이 데이터를 처리할 수 있다면 나타나는 방향이 뭔지 읽을 수 있다는 거고 결국엔 다음 단계를 예측해 데이터를 컨트롤할 수 있게 돼요. 

중요한 게 교육부 개정안이 나와서 이제는 정보 교육으로 초등학교부터 AI를 배워요. 그러면 그 친구들은 AI를 알고 올라오는데 현재 대학생들은 모르는 뜬 세대가 돼버린 거예요. 그래도 성대생처럼 미리 대비한다면 나중에 도움이 될거예요. 1학년 때 코딩을 어려워하고  2학년때는 AI와 데이터 분석때문에 방황해도, 훗날에는 전에 배웠었다는 자신감을 가지고 세계에 뛰어들 수 있다는 거죠. 대학이 인생의 끝이 아니기 때문에 대학교에서 데이터 분석에 대한 예방주사를 맞고 세상에 나가서 싸울 경쟁력을 가질 수 있으면 좋겠어요.


☞ 데이터 세상을 살아가는 교수님의 목표는 무엇인가요?

저의 최종목표는 제주도에 대안학교를 세우는 거예요. 기존의 교육은 틀을 만들고 그 안에 학생들을 쑤셔넣어요. 중요한 점은, 틀에 맞지 않는다해도 틀린 것은 아니라는 거죠. 보통 관측되는 데이터의 범위에서 많이 벗어난 값을 이상치라고 하는데, 이것이 잘못된 데이터는 아니에요. 저는 이상치가 자신의 빛을 낼 수 있도록, 아이가 정말 세상적으로 인정받을 수 있도록 대안학교를 만들고 싶어요.

☞  교육자로서 학생들이 수업을 듣고 어떤 학생이 되기를 바라나요? 

계속 말했던 것의 결론인데, 문제 해결을 할 수 있는 학생이 되길 바래요. 문제를 창의력으로 해결할 수도 있지만 데이터를 기반으로 문제를 해결 할 수도 있는 거예요. 똑같이 코딩만 해서는 절대로 앞서지 못해요. 코딩을 더 잘하는 사람들이 수원에 깔려 있고, 온 세상에 깔려 있어요. 그렇지만 본인의 전공 분야에서 자신이 가지고 있는 데이터의 의미가 있겠죠. 그 의미가 뜻하는 게 무엇인지는 본인밖에 알지 못하잖아요. 본인이 모은 데이터를 가지고 그다음에 나타날 수 있는 문제들을 미리 대비하고 해결할 수 있는 사람이 되면 좋겠어요.

 

☞  마지막으로 성균관대 학생들에게 한마디 해주세요.

저는 그냥 성균관대 학생들이 모두가 인정하는 인재가 됐으면 좋겠어요. 제가 수업시간에 사고력 스무 개를 가르쳤어요. 그 스무 개를 보면 자기가 남들보다 못하는 것도 있죠. 그거를 중간으로 끌어올리는 노력도 중요하지만 더 중요한 건, 바로 자기가 잘하는 걸 더 잘하게 만들어야 돼요. 그렇게 자신이 누구나 그 사고력을 생각했을 때 떠오르는 사람이 된다면,  우리 사회에 필요하면서도 중요한 사람이 된다는 거죠. 성대생이여 세상을 가져라, 세상을 가지기 위해서는 데이터를 알고 분석할 줄 알아야 한다. 거기에 이 책이 조금이나마 도움이 되면 좋겠습니다.

겉으로는 컴퓨터를 활용하더라도, 결국 본질은 우리가 삶을 살아가는 것에 대한 이야기다. 성균관대 학생들 모두가 세상을 읽고 미리 예측해 대비할 수 있는 인재로 성장하길 바라며, 인터뷰에는 미처 싣지 못한 교수님의 말로 기사를 마친다.

”문제 해결 방법에는 여러 가지 정답이 있어요. 문제 해결과 알고리즘 과목에서 최적화에 대해 배우잖아요. 코딩과 마찬가지로 삶도 그 당시엔 최선이라 생각했지만 돌아보면 후회가 남는 일이 있어요. 하지만 문제를 깔끔하고 간단하게가 아니라 어렵게 고생고생 다 해보면서 해결하더라도, 틀린 길은 아니에요. 조금 느리고 고생한다는게 인생에서 오답을 의미하지는 않아요. 끝까지 포기하지 않고 앞으로 나아가고 부딪혀 보면 결국은 목표에 도달하게 되고, 다음 목표에 대한 자신감을 가질 수 있을 거예요.”