통계 / 학점 4.22 / 토스 레벨7 / 인턴 O , 공모전 O, 봉사활동 O, 대외활동 O
보고있는 합격자소서 참고해서 내 자소서 작성하기
새창
목록
마음에 드는 문장을 스크랩 할 수 있어요!
지금 바로 PC에서 이용해보세요.
최고 품질의 상품들을 지금보다 더 많은 소비자들이 여러 유통 채널에서 더욱 폭 넓고 쉽게...
1. 본인의 Digital 역량 및 관심도에 대해 분량에 관계없이 자유롭게 기술하시오.
* 공통 기술사항 : 컴퓨터, 소프트웨어, 통계, 머신러닝, UI/UX 등 Digital관련 이수한 수업 (학내외 모두 가능)
* 세부분야별 기술사항 : 본인이 지원한 세부분야별 요구되는 내용을 최대한 포함하여 기술 DS : ① Kaggle 참가여부 및 해당 Kernel 링크 ②오픈소스 개발 경험 및 github 주소 ③데이터 사이언스 관련 컨퍼런스 참가 경험
[서론: “무지에 대한 자각”으로 인해 지속된 디지털 분야에 대한 흥미 ]
저는 무지에 대한 자각 덕분에 학문을 지속할 수 있었습니다. 총 두 가지 상황에서, 다른 선택지보다 학문으로의 길을 선택하였는데, 첫 번째가 학부 2학년 시기였고, 두 번째가 인턴시기였습니다.
학부시절, 대학에 들어와 많은 다양한 경험을 해보고 싶었기에 뮤지컬을 배우기도 했고, ‘기획과 제작을 통해 하고 싶은 것을 직접 계획해서 해보자’라는 모티브를 가진 동아리를 2년간 활동하며 대학생의 신분이 주는 큰 장점을 잘 이용했습니다. 이후 2학년이 되어서는, 학문에 대한 관심보다는 취업에 대한 생각이 중심에 있었기에 여러 경제자격증을 취득하기에 고군분투 하였습니다. 그러나 한 수업시간에 느낀 무지함에 대한 자각을 통해 배움에 대한 열망이 생기게 되었습니다. 2학년 전공수업시간, 교수님께서 통계학에서 기본이라 할 수 있는 “p-value”가 무엇이냐는 질문을 저에게 던지셨습니다. 그러나 저는 당시 어떤 답변도 하지 못했고 전공에 대한 지식도 없는 제 자신이 매우 부끄러웠습니다. 이후 저는 무지함이 주는 부끄러움에서 벋어나기 위해 3학년이 되기 전 겨울 방학부터 기초통계학, 수리통계학 등 학부 초반에 배웠던 통계전공과목을 복습하였습니다. 매일의 계획을 세워 공부했고 개강 직전에는 전공과목을 선택 하는 것에도 신중을 가하였습니다. 당장 학점을 더 잘 받기 위한 것이 아닌, 과거 본인에게 필요한 과목들을 선택하여 수강하였습니다. 그러한 노력의 결과로 3학년 1학기에는 학과 수석을 달성하여 여러 교수님들을 놀라게 했습니다. 또 이런 배움에 대한 열망은 같은 전공 학생들보다 24학점 더 많은 전공과목에 대한 이수로 이어 졌습니다.
둘째 인턴시기, 짧은 기간의 사회생활이 저에게 알려준 것 또한 무지함에 대한 자각이었습니다. 당시 인턴으로 근무했던 회사는 블로그, 트위터 데이터에 대한 버즈 추이로 시장의 니즈를 밝혀내고 새로운 척도로 고객을 관리하는 일을 하였습니다. 그러나 제게 주어진 업무는 학부시절 전공지식만으로는 적용하기 힘든 실제 마케팅 분야였습니다. 때문에 가진 실력만으로 사회에 나가 통계분석자로 성장하기 어려울 것이라는 결론을 내리게 되었습니다. 이러한 무지에 대한 자각으로 인해 취업보다 대학원 진학의 길을 선택하게 되었고, 상대적으로 오랜 시간동안 통계에 관련된 지식을 습득하였습니다.
[본론]
통계라는 학문과 긴밀하게 연관되어있는 프로그램 능력을 인지하고 독학으로 새로운 통계프로그램 언어를 학습하였습니다. 또 최근 빅데이터 분석분야에서 자주 사용되는 머신러닝, 딥러닝에 대해 흥미를 가지고 석사논문 주제와 연계하여 관심분야를 구체화하였습니다.
[본론1: 학부시절 관심 있던 과목 – 데이터 마이닝]
학부시기 수강했던 과목 중 가장 흥미를 느꼈던 과목은 데이터 마이닝이었습니다. 해당 수업시간에 처음으로 실제자료를 다루어 보면서 3년 동안 배워온 학문이 어떻게 적용되고 사용되는지 확인할 수 있었기 때문입니다. 분석에 사용한 자료는 고객 구매 자료로, 자료의 전처리도 이루어지지 않은 원자료(raw data)였습니다. 그동안 어디서도 배우지 못한 결측값 처리나, 다른 전처리도 이루어졌습니다. 이렇게 실제사례에 통계를 적용하는 것에 대한 흥미로, 수업에서만 끝내지 않고 공모전에 출전하여 수업에서 배운 지식을 활용해보았습니다. 같은 수업에 참여한 학부 동기들과 함께 ‘빅콘테스“라는 빅데이터 공모전에 참가하게 되었고, 열심히 노력한 덕택에 본선진출 또한 할 수 있었습니다. 공모전이 끝난 이후 데이터 전처리를 위해 높은 수준의 프로그래밍 능력이 필요함을 깨닫고 이후 추가적으로 프로그램 수업과 IT수업을 연계하여 수강하였습니다.
[본론2: 프로그래밍 독학 – 새로운 통계분석프로그램 R 도전]
학부 마지막 학기의 마무리와 더불어 대학원 진학이 결정되었습니다. 새로운 환경에서 달성하고자 하는 목적을 용이하게 이루기 위해서는, 새로운 곳에 대한 사전조사가 먼저 이루어져야 한다고 생각되었습니다. 때문에 해당 대학원에 먼저 진학한 선배를 통해 사용하는 프로그램, 추가적으로 익혀야할 과목 등에 관한 조언을 구했습니다. 그 중 가장 먼저 준비되어야 하는 부분이 새로운 통계프로그램을 습득하는 것 이었습니다. 학부 4년 동안 익숙하게 사용했던 SAS프로그램 보다 진학할 새로운 학교에서는 R프로그램을 가장 많이 사용한다는 것을 알게 되었습니다. 부족한 프로그래밍 능력을 상승시키기 위해, 책과 검색사이트에 구현된 단계별 프로그램 학습 과정을 통해 조금씩 새로운 언어를 습득하게 되었습니다. 혼자 힘으로 새로운 코딩실력을 가질 수 있게 된 이유는 계획과 보상에 있습니다. 먼저 장기간의 대략적 계획을 세워 마감일을 지정하였습니다. 그리고 하루 전날 다음날 공부를 위한 세밀한 계획을 수립하였습니다. 또 자칫 지켜지지 않아 무산될 수 있는 계획을 유지할 수 있는 장치로, 학습한 날만 마스크 팩을 할 수 있도록 하는 ‘보상’을 주었습니다. 세밀한 계획 및 보상으로 짧은 방학기간 동안 새로운 프로그램을 전반적으로 다룰 수 있게 되었고, 후반에는 “Communities and Crime Unnormalized Data Set”을 전처리(data cleansing) 뿐만 아니라, 선형분석 및 모형단순화를 위한 여러 가지 변수선택법을 구현할 수 있었습니다.
[본론3: 스피드하게 새로운 언어 구현]
대학원 진학 후 한 학기가 지난 후, 세부관심 분야를 설정하여 연구실을 정하게 되었습니다. 저는 실제자료 분석 시, 전문가가 가지고 있는 사전지식을 배경지식으로 활용할 수 있는 “베이지안”이라는 학문에 매력을 느끼게 되어 해당 연구실로 세부 전공을 결정하였습니다. 단지 통계라는 큰 틀에서 사용하는 분석들을 익히다가 세부적인 분야에 심도 깊은 지식을 학습해야했기 때문에 당시 가진 지식이 매우 부족하였습니다. 때문에 연구실 선배들에게 베이즈 분야에 관한 학문적 조언을 구했고, 결과적으로 방학기간동안 베이즈 통계에서 유명한 “Sampling based approaches to calculating marginal densities”라는 논문을 구현해 보는 전략을 세웠습니다. 이 때, C++기반에서 R을 사용하는 RCPP라는 프로그램을 사용하기로 하였습니다. 하나의 논문을 붙잡고 두 달간 알고리즘을 이해하고 새로운 프로그램에 도전하였습니다. 처음에는 저자가 말하고자 하는 의도를 파악하지 못했지만, 이해하는 과정을 반복하고 주변 연구실 선배들의 도움을 통해 끈기 있게 몰입하여 단기간에 새로운 언어와 연구의 기초지식이 되는 이론을 습득할 수 있었습니다.
[본론4: 머신러닝, 딥러닝에 대한 흥미- 논문주제와의 연결고리]
석사 3학기 차에 고급데이터마이닝이라는 수업을 들었습니다. 수업에서는 SVM, 의사결정나무, 부스팅 등 여러 가지 머신러닝 뿐만 아니라 CNN, 심층뉴럴네트워크 등 딥러닝에 관련된 학습알고리즘과 사용 예에 대해 배울 수 있었습니다. 그 중에서 특별히 추천시스템에 사용되는 제한볼츠만머신에 관심이 생기게 되었습니다. 아마존, 넷플릭스에서 사용하는 고객맞춤기반의 추천은 이미 마케팅 분야의 뉴스나 이슈에서 많이 접했던 주제였고, 이를 머신러닝을 이용해 실제로 어떻게 구현할 수 있을지에 대한 호기심에서부터 연구는 시작되었습니다. 계속된 흥미와 관련분야에 대한 전공지식의 확보로, 석사 논문 주제로 연결되어 “제한볼츠만 머신을 활용한 추천시스템 소개 및 자료분석”에 관해 심도있는 연구를 하게 되었습니다.
[결론]
저는 무지를 자각하고 이를 부끄러워하는 감정이 사람을 성장할 수 있도록 만드는 원동력이라고 생각합니다. 어떠한 사람도 모든 분야에 전문가가 될 수 없기 때문에 많은 방면에서 무지함을 깨달을 수 있습니다. 그러나 단지 무지에서 멈추지 않고 부끄러운 감정을 느끼는 것은 사람으로 하여금 그 상황을 다른 상황보다 명확히 기억하게 하고, 단기간에 고효율의 결과를 성취해 낼 수 있습니다.
또한 저는 통계와 밀접하게 관련되어 있는 프로그램 능력을 스스로 노력하여 습득하기도 하였습니다. 여럿과 함께여도 얻기 힘든 프로그램 역량을 갖출 수 있었던 이유는 전략적인 계획 수립에 있었습니다. 최근 통계 이슈에 지속적인 흥미를 가지고 있습니다. 이슈와 맞추어 새로운 통계기법을 학습하여 자칫 매너리즘에 빠질 수 있는 분석기법에 변화를 도모하였습니다. 현대카드에 입사해서는 무수한 결재데이터를 심층적인 통계분석 기법을 이용하여 그 속에 숨겨진 인사이트를 발굴해 내겠습니다.
2. 아래 주제와 관련하여 본인이 경험한 프로젝트에 대해 분량에 관계없이 자유롭게 기술하시오.(프로젝트 주제/인원/기간/본인의 역할 포함) DS : Algorithm model 연구 참여 또는 DB Analytics, 머신러닝 관련 프로젝트 ex) App/Web 로그 분석 경험 등
[ “지하철 혼자 타셨나요? 이제 스마트하게 타세요!” / 13명 / 2012.9–11 ]
통계학술대회에 참가한 경험이 있습니다. 여러 학년으로 구성된 저희 팀은 지하철의 인식조사를 하기로 결정하였습니다. 대부분의 학술제는 설문조사를 통한 통계분석으로 간단하게 끝난다는 것을 선배들을 통해 알게 되었습니다. 그러나 저는 실제 지하철을 탈 때에 궁금했던 부분들을 저희의 조사를 통해 풀어보면 좋을 것이라는 생각이 들었습니다.
그래서 전체회의에서 설문조사뿐만 아니라 실제 지하철을 돌아다니며 현장조사를 해보는 것도 좋겠다는 주장을 내었습니다. 구체적으로 만원 지하철에서 어떤 자리 앞에 기다려야 앉을 수 있는 확률이 높은지, 설문지도 현장에서 직접 조사해 보자는 안건을 내었습니다.
자료조사방법을 다양화하다 보니 지하철 와이파이 이용실태 조사, 지하철 편의시설 이용만족도 등의 아이디어들도 추가로 나오게 되었습니다. 한편으론 현장조사로 인해 학술제에 할애해야할 시간이 늘어나게 될까봐 불평하는 팀원들도 있었습니다. 그러나 다양한 분석을 통해 얻을 수 있는 정보와 실제자료 분석을 통해 많은 배움을 얻을 수 있겠다는 저의 설득에 현장조사를 실시할 수 있게 되었습니다.
실제현장에서 이루어지는 관찰조사는 생각보다 쉽지 않았습니다. 자료를 얻기 위한 새로운 방법 때문에 다른 팀보다 두 배의 시간이 걸렸고, 보행자 설문법을 실시했기 때문에 설문조사 자체도 매우 어려웠습니다. 그러나 데이터를 얻기까지의 어려움은 보고서의 질로 이어졌습니다. 결과적으로 성공적인 보고서는 SAS 코리아 주관 학술제에서 1등이라는 결과를 가져다주었습니다.
기존의 방식을 고수하지 않은 하나의 아이디어는 우물 안에서는 절대 보지 못할 새로운 관점을 제시할 수 있습니다. 익숙함, 편안함에서 벗어난 황무지로의 도전은 많은 어려움을 가져올 수 있으나 양질의 결과물의 거름이 될 수 있습니다. 현대카드의 일원이 되어서도 이러한 도전정신을 가지고 열정을 다해 근무하겠습니다.
[ “성북동 비둘기 실태 및 인식조사” / 5명 / 2015.03-12 ]
저는 통계가 실생활을 대표하고 설명하기 어려운 현상을 쉽게 요약해 주는 것에 큰 매력을 느낍니다. 그래서 학부시절 자발적으로 사회현상에 대한 주제를 정하고, 통계로 이를 설명해 보기 위해 팀을 꾸려본 경험이 있습니다. 저희 팀은 김광섭 시인의 시 ‘성북동 비둘기’ 에 착안하여 성북구 비둘기의 분포와 비둘기에 대한 사람들의 인식을 살펴보는 조사를 실시하였습니다.
그러나 비둘기에 대한 수준 높은 이해가 없었기 때문에 구체적인 설문문항작성에서 어려움이 있었습니다. 적절한 분석을 위해서는 주제에 관한 심도 깊은 이해가 필요하다는 것을 깨닫고 직접 조류학 관련 전문가를 찾게 되었습니다. 전문가를 통해 얻은 비둘기에 관한 이해를 바탕으로 자료 분석은 순조롭게 진행될 수 있었습니다. 해당 분석은 보고서로 작성되었고 사회현상에 대한 적절한 통계분석을 한 것으로 인정받아 학과 통계사례집에 실리게 되었습니다.
이처럼 자발적인 통계분석 경험을 통해, 통계는 적용되는 분야가 무수히 많은 반면, 한 분야에 적용될 때 그 분야에 대한 전문가 수준의 이해가 필요하다는 것을 깨닫게 되었습니다. 현대카드에 입사해서는 제가 가진 통계에 관한 열정을 기반으로 금융, 고객 소비 패턴, 주요 소비 공간들에 관한 깊은 이해를 선행하고 귀사의 고객관리를 도울 수 있는 통계모형을 만들기 위해 노력하겠습니다.
[ “빅콘테스트-영화 관객수 예측” , 5명, 2014.09]
데이터 분석 및 모델링 분야에 강점을 가지고 있다고 생각합니다. 학부시절 한국빅데이터연합회가 주최하고 미래창조과학부가 후원하는 “빅콘테스트”라는 빅데이터 공모전에 참가한 경험이 있습니다. 공모전은 같은 학년의 동기 4명과 함께 팀을 만들어 도전하였습니다.
공모전 주최 측에서 배포한 원자료를 가공하는 것에서부터 많은 시간을 들였습니다. 모형화 단계에서는 팀원들의 공통된 의견이었던 회귀분석을 이용하여 모형을 만드는 것을 생각했습니다. 그러나 회귀분석의 다양한 가정들에 위배되는 결과로 인해 순조로웠던 분석과정이 잠시 정체기를 맞게 되었습니다. 이 과정에서 저는 빈도자료 예측모형을 사용한 다양한 논문들을 찾아보았고, 포아송 분포를 가정한 일반화선형모형을 해당 자료에 적용하는 것이 맞겠다는 의견을 내었습니다. 제 의견에 맞추어 새로운 모형가정 하에 분석을 실시한 결과 이전 모형보다 더 나은 예측을 하는 것을 확인할 수 있었습니다. 모든 팀원들의 노력 하에 완성된 결과물은 500:7의 경쟁률을 뚫고 본선진출이라는 결과를 이끌어 내었습니다.
저는 이처럼 가공되지 않은 원자료를 정제하고 분석목적에 맞는 적절한 모형을 세우는 부분에 탁월한 능력을 가지고 있습니다. 해당능력은 현대카드가 가진 무수한 원자료로부터 숨겨진 가치를 발굴해 내는 것에 쓰일 수 있을 것이라 자부합니다.
[“미생 트렌드 분석”/ 1명/ 2015.02]
다음소프트에서 3개월의 인턴기간 동안 데이터 인사이트 발굴을 위한 목표를 수립하고 노력한 경험이 있습니다. 저는 마이닝 서치라는 부서에 팀원이 되어 성공적인 마케팅 보고서를 쓰는 공동의 목표를 성취해야 했습니다. 팀의 일원으로 제가 담당했던 업무는 데이터 분석 부분이었고, 팀의 목표를 위해 데이터의 숨겨진 의미를 찾는 개별적 목표를 수립하였습니다.
보고서에는 드라마 “미생”의 SNS데이터를 통해 새로운 인사이트를 제시하는 내용을 담아야했습니다. 업무초반에는 인턴기간 동안 1편의 보고서를 완성하는 것은 당연히 가능한 일이라고 생각했습니다. 그러나 분석을 진행하기 위해 데이터를 살펴보니 초마다 갱신되는 SNS의 특징으로 인해 한정된 시간에 보고서를 완성하기가 어려울 것 같다는 판단이 들었습니다.
하지만 그동안 많은 데이터 분석 경험을 통해, 분석에 앞서서, 데이터의 생김새와 세부적인 정보이해가 선행되어야 한다는 사실이 떠올랐습니다. 그러한 판단 하에 오랜 시간 동안 SNS에 떠오르는 “미생”관련 글들을 차근차근 읽어보았습니다. 데이터의 수치적 요약값이 아닌 실제 데이터의 모양을 바라보니 다른 드라마와 비교했을 때 미생이 가지는 강점, 미생의 연관 검색어, PPL과 미생의 관계와 같은 새로운 특징들이 보였습니다. 회의시간 공들여 발굴한 인사이트를 팀원들에게 제시했고 인정을 받았습니다. 또 업무의 끝에는 회사로부터 정직원 제의를 받을 수 있었습니다.
이러한 경험을 통해 전략적 목표설정은 자칫 안일 할 수 있는 현재의 상황에 새로운 길을 제시한다는 것을 깨달았습니다. 또 목표를 위한 끊임없는 노력은 스스로의 동기부여를 위한 최고의 수단이라는 사실도 알게 되었습니다. 현대카드에 입사를 해서도 끊임없는 목표설정과 그를 위한 노력을 수반하여 항상 스스로를 돌아보겠습니다.
[ “EDIYA 매출데이터를 이용한 비용예측모델” , 4명, 2016.11 ]
석사과정 재학 중 관심 있는 데이터를 분석하고 이를 보고서로 작성하는 수업에 참여한 경험이 있습니다. 보고서는 자율적인 주제로 여러가지 통계분석방법을 제시하는 내용을 담아야 했습니다. 데이터 분석은 통계연구실마다 집중하고 있는 부분이 서로 다르기 때문에 팀을 이루어 분석하는 것이 더 좋겠다고 생각되었습니다. 제가 주축이 되어 서로 다른 연구실에 팀원을 모았고 자연스럽게 제가 팀의 리더를 맡게 되었습니다.
주제로는 팀원 한명의 부모님이 운영하시는 EDIYA 매장의 매출데이터를 이용한 비용예측모델로 설정하였습니다. 팀원 모두 프로젝트와 논문 등의 서로 다른 이유로 바빴기 때문에 제출해야하는 기간보다 일찍 분석을 실시하였습니다.
그러나 시간을 맞추기 위한 노력에도 불구하고, 보고서를 제출해야 하는 당일 팀원 한 명이 자신이 맡은 모형의 분석 결과를 완성할 수 없겠다는 통보가 왔습니다. 저는 혼자라면 불가능한 일이지만 미리 완료한 팀원이 부족한 팀원을 도와주면 완성할 수 있겠다고 판단하였습니다. 그래서 늦은 시간이었지만, 자신의 부분을 완성한 팀원을 인터넷 상에 모으고 그룹통화를 이용해 대책회의 시간을 가졌습니다. 코딩, 모형파악, 모형분석 부분으로 나누고 평소 해당 부분에 강점을 지녔다고 생각된 팀원에게 제안을 하였습니다. 흔쾌히 일을 맡아 준 다른 팀원들 덕분에 해당 팀원도 끝까지 포기하지 않았습니다. 결국 가까스로 시간에 맞추어 보고서를 완성할 수 있었습니다.
해당경험을 통해 기한 내에 결과를 도출해야하는 프로젝트의 경우, 제출기한이 다가올수록 팀원의 능력이 감소할 수 있다는 것을 알게 했습니다. 그러나 부족한 팀원의 능력은 다른 팀원들의 협업과 응원으로 충분히 되살아날 수 있다는 것 또한 깨닫게 해주었습니다. DS부서에 입사해서도 팀원들과의 협업을 통해 혼자가 만들어내는 결과보다 더 강한 결과를 만들어 보이겠습니다.
[“제한볼츠만 머신을 이용한 추천시스템 소개 및 실제사례 분석”, 1명, 진행중]
석사 논문으로 머신러닝 방법 중 클러스터링을 하는 경우에 사용하는 모형인, 제한볼츠만 머신을 이용하여 추천시스템을 구현하는 것을 선정하였습니다. 기업의 지속적인 발전과 성장을 위해서는 기업을 이용하는 고객을 효과적으로 관리하고, 그들이 지속적으로 기업의 제품을 이용하도록 만들어야 한다고 생각합니다. 매초마다 수억 개의 데이터가 쌓여가는 고객 구매 데이터에서 의미 있는 패턴을 파악해내어, 개별 고객마다 맞춤형 상품을 추천해 줄 수 있다면, 기업 매출 상승에도 기여할 수 있을 것입니다.
논문에는 CGV의 고객이 영화에 평점을 준 자료를 이용하여 상품 기반, 고객 기반, 두 가지를 합친 하이브리드 모형을 이용하여 실제 추천시스템을 구현해 보았습니다. 하나의 논문을 완성하기 위해 오랜 시간 동안 수편의 논문들을 읽고, 머신러닝의 모수 학습 알고리즘을 공부하여 빅데이터를 다루는 감각을 가질 수 있게 되었습니다.
귀사에 입사한다면, 현대카드의 중점인 BTB 마케팅을 위해 개성이 다른 고객들을 분류하고 그들의 구매패턴을 조사하여 귀사의 서비스를 이용하는 다른 기업에게 맞춤형, 효율적 마케팅 방안을 제시하겠습니다.