가천대학교 / 소프트웨어학과 / 학점 3.57/4.5 / 오픽: AL / 사회생활 경험: 인턴(한 달) / 2021 인공지능 언어 능력 평가(은상)
보고있는 합격자소서 참고해서 내 자소서 작성하기
새창
목록
마음에 드는 문장을 스크랩 할 수 있어요!
지금 바로 PC에서 이용해보세요.
최고 품질의 상품들을 지금보다 더 많은 소비자들이 여러 유통 채널에서 더욱 폭 넓고 쉽게...
1. 지원자가 생각하는 올리브영만의 매력은 무엇인지 서술해주세요. 이를 강화하기 위해 수행하고 싶은 업무를 지원 직무 관점에서 작성해주세요. (800자)
[이제는 올리브영의 섬세함을 보여줄 때입니다]
화장품부터 건강기능식품, 이제는 생활용품까지. 올리브영은 젊음과 건강을 유지하고자 하는 우리의 삶 전반에서 라이프스타일의 혁신을 가져오고 있습니다. 얼마 전, 잠실 롯데타워에서 일본인을 만났습니다. 한국 화장품을 추천해달라는 부탁에 저는 단번에 올리브영 앱을 켜고 보여주며, 근처에 있는 올리브영 매장을 알려주었습니다. 또한 올리브영 앱에서 제공하는 랭킹 기능을 통해 화장품을 추천해주었습니다. 올리브영만의 매력은 편리한 기능과 쉬운 매장 접근성, 그리고 국내 H&B 시장을 선도하는 유일한 브랜드라는 인식입니다. 트렌디한 상품과 제품의 다양성도 빼놓을 수 없는 올리브영만의 매력입니다.
또한 올리브영은 ‘로켓뷰’를 인수하면서 빅데이터 기반의 인공지능 기술을 도입하여, 고객별 맞춤형으로 초개인화된 상품을 추천하도록 노력하고 있습니다. 고객의 쇼핑 패턴과 구매한 상품 데이터를 다각도로 수집 및 분석하며, 맞춤형 추천 시스템을 정교화하고 있습니다.
그러나 저는 올리브영의 오랜 팬이자 소비자로서, 아쉬웠던 부분이 있습니다. 성분을 기반으로 한 추천 시스템이 없다는 것입니다. 실제로 올리브영 매장에서 많은 고객들은 화장품 구매를 위해, 특정 앱으로 성분을 확인합니다. 올리브영만의 편리함 그리고 쉬운 접근성과 더불어, 이제는 올리브영의 섬세함이 필요할 때입니다. 초개인화된 상품 추천 시스템을 개발하기 위해, 입사 후 성분 정보들을 수집 및 분석할 것입니다. 별도의 앱을 이용하지 않아도 성분을 확인하고, 맞춤형 제품을 구매할 수 있도록 시스템을 개발할 것입니다.
2. 지원 직무에서 본인이 발휘할 수 있는 강점은 무엇인가요? 그 이유는 무엇이며, 해당 역량이 본인의 강점이 되기까지 어떤 노력과 도전을 했는지 구체적인 사례를 들어 작성해주세요. (1000자)
석사과정에서 자연어처리 전공을 하며, 머신러닝과 세부분야인 딥러닝에 대한 학습 경험이 있습니다. 올리브영의 테크 조직 중 데이터/AI 조직은, 데이터플랫폼 개발 및 AI/추천엔진 개발 부서가 하나의 조직으로 이루어져있습니다. 저는 데이터/AI 조직에서 근무하며 머신러닝 기반의 데이터 분석도 가능하지만, 딥러닝 기반의 모델 학습도 가능합니다. 올리브영에서 수집한 방대한 데이터를 다각도로 분석하여 다양한 인사이트를 발견할 수 있습니다.
저는 데이터 분석 및 자연어처리 개발자로 성장하기 위해, 다양한 머신러닝 기술을 사용한 프로젝트 경험이 있습니다.
1. Kaggle에서 제공하는 데이터를 사용하여, python기반의 심장병 예측 시스템을 개발한 경험이 있습니다. 16개의 feature를 제공하는 4,238개의 데이터를 분석하여, 심장질환 예측에서 필요하지 않다고 판단되는 ‘교육’ 데이터를 제거하는 등의 데이터 전처리를 수행했습니다. 또한 다양한 인사이트를 얻기 위해 heatmap과 feature의 상관관계를 시각화했습니다. KNN과 Logistic Regression 알고리즘을 사용하여 심장병 예측 시스템을 개발했으며, GridSearchCV를 통해 모델이 가장 높은 정확도를 도출하는 hyper-parameter tuning도 수행했습니다. 프로젝트를 수행하며 주어진 데이터의 특성을 꼼꼼히 파악하여 분석하는 것이 중요하다는 것을 배웠습니다.
2. 졸업작품으로 Wi-Fi sensing을 이용한 인간 행동 인식 시스템 개발 경험이 있습니다. 수집한 Wi-Fi 무선 신호를 이용하여, 특정 공간에 사람이 있는지/어디에 위치하는지/몇 명의 사람이 있는지 인식하는 시스템을 개발했습니다. Random Forest, KFold, Logistic Regression 알고리즘을 사용하여 문제를 해결했습니다.
3. 음성, 대화, 시각, 무선 신호 등 다양한 데이터를 다루어 본 경험이 있습니다. 석사과정에서 다양한 모달리티를 다뤄본 경험이 올리브영에서 큰 거름이 될 것입니다.
3. 1) 데이터 설계 과정에서 가장 중요하다고 생각하는 요소는 무엇인지 이유와 함께 서술해 주세요. 2) 위 요소의 반영 여부에 따른 결과물의 차이에 대하여 경험을 바탕으로 설명해주세요. (1500자)
데이터 설계 과정에서 가장 중요하다고 생각하는 요소는 ‘효율적인 데이터 적재’입니다. 데이터 엔지니어는 ‘데이터를 유용한 상태로 필요한 사람에게 제공하는 사람’입니다. 데이터 엔니지어링을 업무 영역으로 구분한다면, 좁게는 '데이터 파이프라인 개발'로 넓게는 '효과적인 데이터 제공을 위한 데이터 프로세스 수립' 및 '데이터 플랫폼 구축'이라고 할 수 있습니다.
올리브영은 수많은 고객들로부터 방대한 데이터를 수집합니다. 수집한 빅데이터를 warehouse에 적재하고, 쿼리를 통해 수집한 데이터를 추출하여 분석을 수행합니다. 이 과정에서 효과적으로 데이터를 적재하여, 개발자가 쉽고 빠르게 방대한 데이터를 추출하는 것이 중요합니다. 2021년까지 올리브영은 이러한 전통적인 ETL 시스템 구조로 원본 데이터를 Data Warehouse에 적재했습니다. 또한 DW 쿼리를 통해 적재한 데이터를 추출하여 분석 업무를 수행했습니다. 하지만, ETL 시스템 구조는 빠르게 추가되는 원천 데이터를 수용하기 어렵다는 문제점과 다양한 경로를 통한 데이터 제공 등의 한계점이 있습니다. 따라서 2022년부터는 클라우드 기반의 새로운 데이터 플랫폼을 설계했습니다. 클라우드 기반 데이터 엔지니어링을 통해 기존 시스템의 문제점을 해결하였고, 데이터 기술 중 가장 강력한 분석 도구 중 하나인 빅쿼리를 이용하여 데이터를 분석하고 있습니다.
다양한 프로젝트를 수행하며 데이터 적재에 대한 어려움을 마주한 경험이 있습니다. 특히, 석사과정에서 머신러닝 프로젝트를 수행하며, 한국어 데이터를 어떻게 데이터베이스에 적재할 것인지 모색한 경험이 있습니다. 머신러닝 모델은 한국어 데이터를 숫자나 벡터의 형태로 이해합니다. 따라서 프로젝트를 수행하면서 데이터를 적재할 때, '한국어 텍스트로 적재해야 하는지' 혹은 '모델이 이해하기 쉽도록 벡터 형태로 적재해야 하는지'를 고민했습니다. 모델 관점에서 데이터를 적재한다면 숫자나 벡터 형태로 적재해야 합니다. 그러나 엔지니어가 쿼리를 통해 적재한 데이터를 추출해 보았을 때, 사람이 이해하기 어려운 형태의 데이터이기 때문에 추출한 데이터가 어떤 데이터인지 알기 어렵습니다. 따라서 다각도의 인사이트를 얻기 어렵다는 문제점과 dimension이 큰 여러 벡터를 하나의 column에 저장하기 어렵다는 문제점이 있습니다. 그러나 데이터베이스에 한국어 형태로 적재한다면, 모델이 이해하도록 숫자나 벡터 형태로 변환하는 추가적인 단계가 필요하지만 적재하기 쉽고, 다양한 feature와 결합하여 폭 넓은 인사이트를 얻을 수 있습니다.
데이터 엔니지어는 적재된 데이터를 SQL 쿼리로 정확하게 추출해야 함과 동시에, 사용자로부터 수집한 방대한 데이터를 효과적으로 적재할 수 있어야 함을 배웠습니다. 올리브영에 데이터 분석 및 개발자로 입사하여, 데이터를 어떻게 더 효과적으로 적재할 수 있는지와 데이터의 품질을 높이기 위한 방법들을 배우고 싶습니다. 이를 통해 다양한 인사이트를 발견하여 고객들에게 새로운 가치를 제공하는 데이터 분석가로 성장하고 싶습니다.