도시숲이 놓일 만한 곳을 찾아서
– 통계데이터 분석∙활용대회 보고서 분야 대상 수상

  • 479호
  • 기사입력 2021.11.11
  • 취재 최승욱 기자
  • 편집 윤서빈 기자
  • 조회수 4974

도시숲이 많은 사람들에게 사랑받고 있다. 도시 안에 있지만 들어가면 도시와 멀어진 것만 같은 기분이 드는 곳이라서 그런 걸까. 숲이 주는 푸르름과 안정감이 있다. 이 느낌을 아는 순간부터 숲을 좋아하게 되는 것 같다. 숲을 가꾸는 건 지구온난화에 대처하는 최선의 방법이기도 하다. 점점 살결로 느껴지는 기후 변화를 더 이상 무시할 수 없는 요즘이기에 도시숲은 더더욱 절실하다. 


이번 <성대생은 지금>에서는 ‘도시숲이 어디에 놓여야 할까’에 대한 답을 제공해 통계데이터 분석∙활용대회 보고서 분야에서 대상을 수상한 데이터사이언스융합전공 19학번 친구들을 만났다. 이은서(사진 왼쪽), 이수정(사진 가운데), 김예린(사진 오른쪽) 학우와 이야기를 나눴다.



▶ 자기소개 부탁드립니다.

이은서 - 안녕하세요. 데이터사이언스융합전공을 원전공으로 하고 통계학과를 복수전공하는 19학번 이은서입니다.

이수정 – 원전공으로 데이터사이언스융합전공, 복수전공으로 통계학을 하고 있는 19학번 이수정입니다. 데이터 분석과 통계적 지식을 기반으로 사회 발전에 도움이 되고자 노력하는 성균인입니다.

김예린 - 안녕하세요. 소프트웨어융합대학 소속의 글로벌융합학부 데이터사이언스융합전공 2기로 전공 진입하여 2년째 데이터를 공부하고 있는 19학번 김예린입니다.



▶ ‘2021 통계데이터 분석∙활용대회’에 참가하게 된 계기는 무엇인가요?

김예린 - 3학기째 전공수업을 듣다 보니 학교에서 이것저것 새롭게 접하는 이론은 늘어나는데 실제로 현실 세계에서 어떻게 잘 써먹을 수 있을지에 대한 막연한 두려움이 있었어요. 동기들과 함께 이야기를 하다 보니 저 말고도 많은 친구들이 답답함을 느끼는 부분이더라고요. 이를 함께 헤쳐 나가보자는 뜻이 모이자 자연스럽게 공모전으로 눈길을 돌리게 되었죠. 특히나 ‘2021 통계데이터 분석∙활용대회’의 경우 국가 중앙행정기관 중 하나인 통계청에서 주관하는 대회이다 보니 실제로 저희의 데이터 분석 결과가 현실 세계에서도 활용되길 바라는 마음을 조금 더 잘 전달할 수 있지 않을까 하는 기대감이 있었어요.


▶ 어떤 문제의식에서 ‘도시숲 입지 선정’이라는 연구 주제를 선정하셨나요?

이은서 - 이전에 인턴으로 일했던 회사에서 ESG 분야의 데이터를 다뤘었는데 그걸 계기로 환경 분야에 관심이 생겨 이번 공모전에는 환경과 관련된 주제를 하고 싶었습니다. 그러다 서울에서 도시림이 조성된다는 뉴스를 보게 되었고 도시숲이라는 키워드에 꽂혔습니다. 팀원들과 회의를 하면서 좋은 소재인 것 같아 조금 더 자료 조사를 진행했는데 도시숲의 효과에 대한 내용은 많았지만 정작 어디에 도시숲이 위치하면 효과적일지에 대한 내용이 나오지 않아 저희가 최적의 입지를 제시하면 좋겠다고 생각했습니다.


이수정 – 탄소 배출을 줄이려는 전 세계적 시류 속에서 능동적으로 대응하기 위해 정부는 관계 부처 합동으로 ‘2050 탄소중립 추진전략’을 발표했습니다. 도시숲은 지구온난화의 주범이 되는 탄소를 저감하는 데에 탁월한 효과를 보일 뿐 아니라 시민의 생활환경을 증진하고 정신적·신체적 건강에도 효과를 내는 중요한 생태적 요충지 역할을 합니다. 지역사회 역시 적극적으로 도시숲 조성에 힘쓰고 있으며 서울시에서도 2024년까지 매년 1곳씩 총 3개의 도시숲을 조성하겠다는 계획을 밝힌 바 있습니다. 그러나 도시숲 입지 선정에 관한 논의는 부족한 상황이라 본 프로젝트를 통해 서울시 내 도시숲 입지를 선정하고자 했습니다.


선행연구를 살펴보면 단순한 공간분석만을 진행하거나 미세먼지 저감을 위한 평가 지표만을 제공하면서 어떤 입지를 선정할지 언급하지 않거나 혹은 탄소 배출 외의 지표만을 활용하여 입지를 선정하는 등의 연구만이 진행되었습니다. 이에 저희는 탄소 배출 관련 지표와 비관련 지표를 동시에 고려한 도시숲 최적의 입지를 찾는 연구를 진행했습니다.


▶ 이번 대회의 데이터 분석에서 가장 힘들었던 점은 무엇인가요?

이은서 - 앞의 질문과 약간 이어지는데 데이터 분석 과정 하나하나 논리적으로 말이 되도록 하는 것이 힘들었습니다. 예를 들어 교통량을 변수로 쓴다고 하면 어느 정도 범위까지 고려해야 할지에 대해서 서울 기준 도시림 이용 통계에서 보통 도시림 이용객 대부분이 15분 동안 도보로 이동한다면 도시림에서 도보로 이동 가능한 1km 이내의 교통량 측정소 데이터를 활용하는 식이었습니다.


김예린 - 아마 모든 팀원들이 같은 대답을 할 것 같은데 데이터 확보 과정이었어요. 4차 산업혁명, 데이터 역량, 데이터사이언스 등의 키워드가 처음 떠오른 지도 꽤 시간이 지난 것 같은데 저희가 원하는 데이터가 없거나 있다고 하더라도 찾기 어려울 때마다 아직은 모두가 쉽게 접할 수 있는 공공데이터 인프라 구축을 향해 나아가야 할 길이 많이 남았구나 하는 생각이 들더라고요.


▶ 데이터 분석에서 가장 중요한 건 뭐라고 생각하시나요?

이은서 – 데이터를 분석하는 데에 정답은 없겠지만 데이터 분석을 통해 타인을 잘 설득할 수 있는지가 중요한 것 같습니다. 그러기 위해 분석자의 주관이 불가피하게 필요할 때를 제외하고는 어떤 데이터를 선정하고 어떤 가정으로 데이터를 전처리하고 어떤 방법론을 사용할지에 대해 나름의 근거를 제시할 수 있어야 한다고 생각합니다.


이수정 - 전처리만큼 중요한 것이 검증입니다. 제가 통계학과를 복수전공으로 택한 이유도 검증을 철저하게 하기 위해서입니다. 어떤 분석도, 어떤 모델링도 한 번의 과정으로 결과를 도출하여 마무리 짓지 않습니다. 분석 후, 그리고 모델링 후 검증을 통해 어떤지를 확인하고 더 좋은 방법은 없는지 더 향상시킬 수는 없는지 확인하는 게 필수적입니다. 저희가 학창 시절에 오답노트를 필수라고 여겼던 것처럼요.


김예린 - 저희가 세운 가설에 따라 데이터 분석을 한 결과가 항상 맞아떨어지는 것은 아니에요. 기껏 열심히 분석한 후에 잘못된 결과를 마주할 때면 가설 자체를 포기하고 싶은 마음이 들기도 하고 절대 그래서는 안 되지만 이 단계만 건너 뛰어버릴까 하는 못된 유혹이 슬그머니 고개를 드는 건 어쩔 수 없어요. 해결하고자 하는 문제의 방향성과 목표를 잃지 않되 데이터가 말하는 바에 언제나 귀를 기울이며 마주한 문제상황에 따라 그에 맞는 솔루션을 또다시 찾아 나서는 유연한 사고가 중요하다고 생각해요. 저 역시 아직 배워가는 입장이지만요.


▶ 데이터 분석의 한계는 무엇일까요?

이은서 - 데이터 분석은 결국 데이터가 있어야만 할 수 있다는 것이 한계인 것 같습니다. 아무리 열심히 주제를 선정하고 기획을 해도 최신의 여러 인사이트를 얻을 수 있는 내부 데이터를 대부분은 구할 수 없기에 한계에 부딪히는 일이 많았습니다.


이수정 - 데이터 분석이 다양한 분야를 포괄하는 만큼 데이터 분석을 절대적인 것으로 바라보는 시선이 많아지고 있는데 이를 조심해야 할 필요가 있습니다. 모든 상황을 데이터로 설명할 수 없습니다. 이것이 데이터 분석의 한계입니다. 언제나 예외는 존재합니다. 전처리 과정상에서 우리는 일반적인 경우를 알기 위해서, 동시에 유의미한 데이터 분석을 위해 outlier를 삭제하는 경우가 종종 있습니다. 하지만 이러한 삭제는 데이터의 존재를 부정한다기보다는 일반적인 상황에서의 분석을 위해 없다고 가정하는 것일 뿐 outlier는 실제로 존재한다는 것을 유념해야 합니다. 하지만 앞서 말씀드린 것과 같이 데이터 분석을 절대적으로 여기는 것은 outlier 존재에 대한 고려가 희미해지게 되어 이것이 데이터 분석의 한계로 이어진다고 생각합니다.


▶ 제시하신 15개 입지 후보지 중에서 “여기에 왜 도시숲이 없지?” 했던 부지를 하나 꼽는다면 어디일까요?

이은서 - 금천구청 옆의 한 부지는 정말 도로와 건물, 공업 건물들로 가득한 곳이었는데 사람들이 잘 접근할 수 있고 매연도 심각할 거 같아 도시숲이 조성되면 좋을 거 같다고 생각했습니다.


이수정 - 저는 마포구의 한 나지 지역을 도시숲 후보지로 뽑았습니다. 이곳은 상암동으로 탄소 배출 우려 건물이 많아 큰 탄소 배출 저감효과를 기대할 수 있습니다. 건물의 밀집도가 높아 생활복지 수혜자가 많습니다. 특히 회사 건물 주변에 위치하여 직장인들이 산책하며 여름의 경우 도시의 무더위를 피할 수 있는 생활 환경 숲으로의 역할이 기대됩니다.


▶ 대회 보고서를 통해 그 대상이 누구든 가장 하고 싶으셨던 말은 무엇인가요?

김예린 - 저희의 분석 전체를 아우르는 중요한 포인트는 아니지만 개인적으로는 분석을 진행하면서 서울 시내에서도 각 지역별 소득수준과 그 지역 주민이 누릴 수 있는 생활권 도시숲 면적이 어느 정도의 상관관계를 갖는다는 사실을 발견하고 다소 놀랐던 기억이 납니다. 시민의 복지라고도 할 수 있는 도시숲이 소득격차와 무관하게 누구나 누릴 수 있는 장소로 자리 잡고 사회가 그렇게 변화해 가길 기대합니다. 저희의 이번 도시숲 입지 분석이 그 변화의 작은 불씨가 되었다면 정말 기쁠 것 같아요.



▶ 대회와 관련해서 가장 뿌듯했던 순간은 언제인가요?

이은서 - 계속 이 지표를 사용한 이유는 무엇인지, 그리고 어떻게 전처리를 해야 할지 사소한 것까지 리즈닝을 하느라 전처리 단계에서 많은 어려움이 있었습니다. 최종적으로 그 문제들을 해결하고 최종 데이터를 완성했을 때 이제 데이터 분석이 다 끝난 것처럼 뿌듯했습니다.


김예린 - 준비 과정에서는 팀원들과 매일 밤 치열하게 결과물 도출에만 몰입해서 오히려 뿌듯함은 수상 이후에야 비로소 즐길 수 있었던 것 같아요. 성대뉴스, 네이버 뉴스에 저희가 등장하는 게 신기했어요. 이렇게 성균웹진에서 인터뷰할 기회도 얻어서 영광입니다. 저에게는 그중에서도 대전에 있는 통계청에서 열린 시상식에 참여했던 게 가장 기억에 남고 특별했던 순간이에요. 통계청에 출입한 것도 신기했고 옥상 구내식당에서 먹은 점심도 재미있었어요. 말하고 보니 시상식보다는 통계청 견학이 즐거웠던 것 같네요.


▶ 이번 프로젝트를 통해 성장한 모습은 무엇일까요?

이은서 - 하나부터 열까지 다 저희가 계획을 세우고 어려움이 있을 때 해결해야 해서 그 과정에서 문제해결 능력이 늘어난 것 같습니다. 오프라인으로 만나기에는 스케줄 조정이 너무 힘들어서 주로 줌으로 회의를 진행했습니다. 덕분에 비대면으로도 정보를 공유하고 팀플을 진행하는 것에 익숙해졌습니다.


김예린 - ‘문제 정의에서 시작해 해결책 제시 라는 목적지에 다다르기까지 큰 흐름과 방향을 놓치지 않아야 한다’는 것을 몸소 체감한 프로젝트였다고 생각해요. 분석의 한 단계 한 단계에 몰입하다 보면 샛길로 빠져버리기 십상이거든요. 앞으로 어떤 프로젝트를 진행하든 이 배움은 저에게 큰 자산이 될 것 같아요.


▶ 데이터사이언스융합전공에 진입하게 된 계기는 무엇인가요?

이수정 - 1학년 교양 수업인 ’문제해결과 알고리즘’을 수강하며 팀장을 맡아 프로젝트를 진행하고 여름방학에는 K-ICT빅데이터센터를 방문하여 데이터 분석 및 시각화에 대한 설명을 들으며 데이터사이언스융합전공의 수업(R, 시각화 실습 등)에 관심을 가졌습니다. 2019 글로벌 융합캠프, 데이터사이언스융합전공의 일원으로 참여하여 컴퓨터 도구를 이용해 빅데이터를 분석해서 의미 있는 정보를 만드는 데이터사이언스융합전공의 지향점들을 알게 되며 진입을 결정한 것 같습니다.


김예린 - 인문과학계열로 입학해서  1년간의 전공탐색 시간이 주어졌어요. 고등학생 때는 미처 생각하지 못했던 ‘무언가의 전공자가 된다’라는 말의 무게감이 저에게는 굉장히 크게 다가왔고 덕분에 이 기간 동안 ‘내가 정말로 하고 싶은 일이 무엇인가’에 대한 답을 찾기 위해 다양한 분야의 수업과 책을 접하며 끊임없이 고민하는 시간을 보냈죠. 20살의 저에게는 ‘내가 가진 기술로 세상을 지금보다 조금 더 나은 세상으로 바꾸어 나가는 것’이 그 답이었고 바로 데이터사이언스융합전공이 그런 저의 자유로운 배움터가 되어준 셈이에요.


▶ 나를 움직이는 내적인 동력이 있을까요?

이수정 - 가장 강한 동력은 저 스스로 느끼는 결핍이라고 생각합니다. 데이터사이언스융합전공 수업을 수강하며 통계적 지식이 부족함을 느껴 교수님과의 멘토링을 통해 통계학 복수전공을 결심했고 다양한 사람들과 프로젝트를 진행하고 싶어 학회에 들어갔으며 다른 외부 활동을 해보고자 공모전에 참가했습니다. 이제는 정형 데이터뿐만 아니라 자연어, 이미지, 오디오인 비정형 데이터도 활용하여 의미 있는 정보를 만들고자 한국데이터산업진흥원이 주관하는 데이터 청년캠퍼스 고려대학교 과정에 참여하고 있습니다.


김예린 - 성장에 대한 강렬한 열망이요. 많은 사람들이 긍정적인 변화를 통한 성장을 원하지만 인간은 새로운 변화에 저항적이죠. 이렇게 이야기하는 저 역시 마찬가지예요. 항상 주어진 상황에 안주하지 않고 더 나은 나로 성장하기 위해 익숙한 안정감을 경계하는 편입니다. 내가 되고 싶은 너무 멀지 않은 미래의 나의 모습을 구체적으로 그려보는 것도 한 가지 방법인 것 같아요. 그러다 보면 내일의 내가, 1년 후의 내가, 그리고 5년 후의 내가 기대되고 조금 과장하자면 설레기까지 합니다.


▶ 앞으로의 목표(학문적, 직업적 등)는 무엇인가요?

이은서 - 저는 ESG, 녹색금융 관련 분야에 흥미를 가지고 있습니다. ESG에 대한 정부 차원, 기업 차원의 관심도 커지고 있지만 명확한 기준이나 데이터도 잘 정립이 되어 있지 않아 앞으로 ESG 관련 데이터를 분석하는 인력이 필요할 것이라 생각합니다. ESG 데이터를 분석하고 유의미한 인사이트를 도출하는 데이터 분석가가 되고 싶습니다.


이수정 - 저의 적성에 맞는 것을 중점적으로 공부하고 이를 바탕으로 대학원에 진학하고자 합니다. 저는 최종적으로 통계적 지식을 가지고 정형 데이터뿐만 아니라 비정형 데이터에도 특기를 보이며 머신러닝, 딥러닝 알고리즘을 사용하는 데이터 사이언티스트를 목표로 하고 있습니다.


김예린 - 5학기가 지난 지금도 저의 꿈은 끊임없이 변하는 진행형이라서 하나로 딱 정의하기는 어렵지만 현재를 콕 집어서 답변해 보도록 할게요. 지금은 휴학 하고 스타트업에서 함께 일 하는 중이라 지금의 목표는 이걸 어떻게 잘 해낼까 치열하게 고민하는 것입니다. 그렇지만 제 삶에 데이터 분석 공부도 깊이 있게 해볼 생각은 여전해요. 스타트업과 데이터 분석, 둘 다 내가 가진 기술로 이 세상을 조금 더 나은 곳으로 바꾸고자 한다는 점에서 공통점이 있네요. 그래서인지 둘 다 제가 사랑하는 일입니다.


▶ 어떤 사람이 되고 싶은지 궁금합니다.

이수정 - 저는 덜 후회하는 사람이 되고 싶으며 현재도 덜 후회하기 위해 노력하고 있습니다. 사람이 후회하지 않는다는 것은 거의 불가능하다고 생각합니다. 하지만 미래의 내가 현재, 이때를 생각했을 때 아쉬워하지는 않을지 생각하면 저는 무언가를 하지 않는다는 것을 선택하기보다는 ‘도전’을 선택한 것 같습니다. 도전이 실패하더라도 그 과정 속에서 얻는 깨달음이 분명 있으니까요. 현실에 안주하면 얻을 것이 없기에 앞으로도 도전하는 삶을 살아가고 싶습니다. 부모님과 더불어 주변 사람들을 본받아 다른 사람들에게 도움을 줄 수 있는 사람이 되고 싶습니다. 좁게는 같은 팀의 팀원으로서, 넓게는 세계시민으로, 내가 아는 지식, 할 수 있는 행동으로 따뜻한 세상을 만들어가고 싶습니다.


김예린 - 죽는 순간까지 살아있음을 느끼며 사는 사람이고 싶어요. 누군가에게 제 생각이 아직 어려서 철없이 하는 22살의 치기쯤으로 보일 수 있다고 생각해요. 시간이 흐르면 그 답을 알 수 있겠죠? 그전까지 저는 매일 아침 눈을 떴을 때 오늘 하루가 기대되는 그런 삶을 계속해서 만들어가보려고요.