카카오
기업정보 더보기- 기업형태
- 대기업
- 접수기간
- 시작일2026.06.18마감일채용 시 마감
- 채용형태
- 신입, 경력직
- 모집직무
- IT/개발
- 근무지역
- 경기 성남시 분당구
공유하기
Internet Explorer 서비스 종료 안내
Internet Explorer(IE) 11 및 이전 버전에 대한 지원이 종료되었습니다.
원활한 이용을 위해 Chrome, Microsoft Edge, Safari, Whale 등의 브라우저로 접속해주세요.
공유하기
[카카오] LLM Research Engineer (Pre-training) (신입/경력)
[모집기간]
채용 시 마감
[담당업무]
-추론 및 학습에 효율적인 LLM 구조 탐색 및 최적화 (e.g. Mixture of Experts, Gated Delta Net, Kimi Linear)
-비용 효율화를 위한 학습 최적화 및 데이터 최적화 (e.g., Fp-8 training, Dataset mixture search)
-비용 효율적인 언어 모델 학습을 위한 알고리즘 연구 및 응용 (e.g., Pruning & Distillation, Hyperparameter transfer, Scaling law, Optimizer)
-LLM 학습을 위한 대규모 데이터 수집, 생성 및 메타 정보 부착기술 개발 및 연구 (e.g. Synthetic dataset generation)
[자격요건]
-CS/AI/ML 등 관련 전공 석사 이상 혹은 이에 준하는 관련 프로젝트 경험을 보유하신 분
-Data/Model/Pipeline/Context/Expert Parallel 등 Model parallel 기반의 모델 학습 경험
-연구/개발에 대한 지속적인 관심과 새로운 기술/업무에 대한 도전 정신을 가지신 분
[우대사항]
-Low-precision training 관련 연구/개발 경험 (e.g., FP8/MXFP4 학습 시 수치 안정성 확보, loss scaling, tensor-wise/block-wise scaling 전략 설계)
-Quantization-Aware Training(QAT) 및 저비트 양자화(W4A8, W4A16 등) 환경에서의 LLM 학습 경험 (e.g., STE 기반 학습, rotation/smoothing 기법 적용, PTQ 대비 품질 회복)
-Knowledge Distillation을 활용한 모델 압축 연구 경험 (e.g., logit/feature-level distillation, on-policy distillation, teacher-student 학습 파이프라인 설계)
-LLM 관련 kernel 개발 경험 (e.g., Triton, CUDA 기반 custom kernel)
-Data/Model/Pipeline/Context/Expert Parallel 등 분산 학습 전략 설계 및 프레임워크(e.g., Megatron-LM, DeepSpeed, FSDP) 기여 경험
-LLM 학습 데이터의 품질 향상과 평가를 위한 연구 개발 경험 및 페타바이트 수준의 텍스트 데이터 수집 및 분산 처리 경험
-대규모 클러스터 환경(e.g., GPU / TPU)에서 초거대 모델 학습을 위한 최적화 경험 (e.g., communication overlap, activation recomputation, memory-efficient optimizer)
[채용공고]
허위·과장·오류 내용이 있다면 신고해주세요.
이 공고를 스크랩한 사용자들이 궁금하다면?
내 정보를 입력하면 스크랩한 사용자들의지원부터 면접까지 함께 준비할 스터디를 찾아보세요
직접 모집글을 작성해 스터디원을 모집해보세요!
스터디 모집글 쓰기스터디 모집글 보기인기 활동 리스트 보러가기
SK하이닉스
현대자동차
현대모비스
주택도시보증공사