업스테이지
- 기업형태
- 중소기업
- 접수기간
- 시작일2026.04.06마감일상시모집
- 채용형태
- 체험형 인턴
- 모집직무
- IT/인터넷
- 근무지역
- 경기 용인시 수지구
공유하기
Internet Explorer 서비스 종료 안내
Internet Explorer(IE) 11 및 이전 버전에 대한 지원이 종료되었습니다.
원활한 이용을 위해 Chrome, Microsoft Edge, Safari, Whale 등의 브라우저로 접속해주세요.
공유하기
[업스테이지] VLM팀 AI Research Engineer - Vision Language Model Internship (체험형)
[담당업무]
1.데이터 수집 파이프라인 설계 및 구축
-멀티모달 데이터(문서 이미지, 현장 사진, 차트 등)의 수집 및 필터링을 포함한 데이터 수집 파이프라인 설계 및 구축
-데이터 품질 향상을 위한 전처리 및 개선 기법의 연구·적용
-데이터팀과의 협업을 위한 Human-in-the-loop 기반 어노테이션 워크플로우 설계 및 운영
2.모델 학습
-대규모 Multi-modal representation learning 및 Cross-modal pretraining 기법의 연구 및 적용
-다양한 질의응답 태스크에 대응하기 위한 Instruction tuning 전략 개발
-학습과 추론 효율을 고려한 모델 구조 개선 및 최적화 기법 연구
3.평가
-문서 중심 VLM 모델의 성능을 평가하기 위한 다양한 평가 기법 조사 및 적용
-실제 사용 환경에 부합하는 새로운 평가 방법의 개발 및 도입
-지속적인 개선과 확장이 가능한 내부 벤치마크 도구의 설계 및 구현
4.그 외
-연구 결과를 탑티어 국제 학회 논문 또는 오픈소스 코드 형태로 공유
-최신 논문 재현 및 기법 도입을 위한 선행 연구 주도 및 팀 내 기술 공유
-제품팀, MLOps팀 등과의 긴밀한 협업을 통한 모델의 실서비스 적용 및 시스템 통합
[자격요건]
-관련 분야 석사 혹은 박사 학위
-AI 문제를 정의하고 해결하는 능력
-기초 머신러닝 알고리즘에 대한 깊은 이해
-Python, C++ 등의 언어를 활용한 강력한 프로그래밍 능력 및 Linux/Shell 활용 능력
-컴퓨터 비전(CV), 자연어처리(NLP), 멀티모달 학습 최신 알고리즘 이해
-주요 기계 학습 프레임워크에 대한 깊은 이해(예: TensorFlow, PyTorch)
-다양한 협업 환경에서 일할 수 있는 능력
-훌륭한 의사 소통 능력
[우대사항]
-Vision–Language Model 관련 연구 및 논문(e.g. CVPR, ICCV, ACL, EMNLP) 게재 경험
-국제 혹은 국내 AI 대회(Kaggle 등) 상위권 입상
-새로운 연구 혹은 개발 방향성을 제시할 수 있는 능력
-멀티모달 VLM 최적화 및 도메인 적응(fine-tuning) 경험
[채용공고]
허위·과장·오류 내용이 있다면 신고해주세요.
이 공고를 스크랩한 사용자들이 궁금하다면?
내 정보를 입력하면 스크랩한 사용자들의지원부터 면접까지 함께 준비할 스터디를 찾아보세요
직접 모집글을 작성해 스터디원을 모집해보세요!
스터디 모집글 쓰기스터디 모집글 보기인기 활동 리스트 보러가기
기아
기아
PTKOREA