Skip to content

Data Research Engineer Internship

RemoteYongin, Gyeonggi-do, 대한민국Data

Description

업스테이지는 AI 기술로 해결할 수 있는 비즈니스 문제들을 풀어갑니다. Making AI Beneficial 이라는 미션 아래, 누구나 AI 기술의 혜택을 누릴 수 있도록 '적용이 쉬운 AI 솔루션'을 만들고 있습니다. 세계 최고 수준의 AI 모델을 다양한 분야에서 손쉽게 활용할 수 있는 API 시리즈를 출시하여 기업 고객들의 비즈니스 성공에 기여하고 있습니다. 또한 LLM 기술을 비즈니스 환경에 맞게 최적화해 기업들의 업무 효율과 생산성을 높일 수 있는 Private LLM 서비스를 제공하는 등 AI가 세상에 이롭게 쓰이게 하기 위해 노력하고 있습니다.


업스테이지 LLM 팀은 자체 파운데이션 모델 SOLAR를 개발하고, 이를 기반으로 각 산업 분야에 특화된 커스텀 모델(Private LLM) 및 컴포넌트(RAG, Function Call, multi-turn dialogue 등 LLM과 시너지를 낼 수 있는 모듈)를 개발합니다. 동시에 오픈리더보드 주최 및 운영, 한국어 데이터셋 확보 프로젝트 등을 통해 LLM 생태계 확장에 기여하고, 데이터 파이프라인 구축을 통해 지속가능한 개발 환경을 만들어 나갑니다.

  • 업스테이지, 기업용 생성AI 독자 개발…“의료·금융 특화 해외시장 공략” [기사]
  • 한국판 LLM 리더보드 나온다…업스테이지-NIA, 27일 'Open Ko-LLM 리더보드' 개설 [기사]
  • Open Ko-LLM 리더보드 [링크]


주요 업무

  • Open Ko-LLM 리더보드 운영 및 개선
    • 리더보드 평가 작업에 필요한 GPU 및 기타 컴퓨팅 자원 관리 및 장애 대응

    • 리더보드 사용자 커뮤니티로부터의 요청사항 대응 및 문제 해결

    • 지속적인 리더보드 모니터링을 통한 제출 모델의 규정 준수 여부 검토 및 가이드 (리더보드 사용자와의 커뮤니케이션 필수)

    • 리더보드 관련 각종 피드백 수집 및 분석을 통한 시스템 개선

    • 신규 벤치마크 데이터에 대한 분석 및 평가 코드 개발

  • 효과적인 평가 프로세스를 확립하고 효과적으로 운영
    • 평가 프로세스 자동화 (ex. 질문 자동 생성, 평가 자동화)

    • 효과적인 평가 툴 제작 및 운영

  • Modeling에 대한 이해를 바탕으로 효과적인 Data Curation
    • 코드 베이스 데이터 분석 및 분석 프로세스 자동화

    • 모델 성능을 향상시킬 수 있는 데이터 개선방안 도출


근무 형태

  • 체험형 인턴십 (3개월)


모집 절차 - 전체 온라인으로 진행

  • 서류 전형
  • 알고리즘 코딩테스트
  • 기술 인터뷰 (1차/2차)
  • 컬처 인터뷰
  • 인턴 실습 (3개월)

*모든 절차는 상황에 따라 조정될 수 있습니다.


근무 환경

  • Anywhere On Earth But Together! ‘어디서든’ 함께 일할 수 있습니다.

  • 근무를 위한 카페 이용 시 음료 비용, 스터디룸 혹은 공유오피스 이용 비용 등을 지원해드립니다.

  • 업무 관련 소프트웨어, 도서, 자료, 교육수강비 등 성장에 필요한 비용을 지원해드립니다.

Requirements

필수 사항

  • Python, C++ 등의 언어를 활용한 프로그래밍 능력 및 Ubuntu Linux/Shell 활용 능력 (Python 필수)

  • HuggingFace 허브의 사용 및 데이터셋, 딥러닝 모델의 업로드 경험

  • 모델 평가 파이프라인 스크립트 개발 및 운영 경험

  • 소프트웨어 버전 관리 시스템, Git에 대한 경험

  • AI 문제를 정의하고 해결하는 능력

  • 기초 머신러닝 알고리즘에 대한 깊은 이해

  • NLP, LLM 등 관심 AI 도메인의 최신 동향에 대한 이해

  • 다양한 협업 환경에서 일할 수 있는 능력

  • 훌륭한 의사 소통 능력


우대 사항

  • 대규모 상용 ML(LLM, NLP 등) 제품 개발 경험

  • 새로운 연구 혹은 개발 방향성을 제시할 수 있는 능력 혹은 NLP 관련 AI Conference Main Track (e.g. ACL, EMNLP, NAACL, COLING, LREC, IJCNLP, AACL etc)에서 1저자 혹은 교신저자로 출판 기록

  • 국제 혹은 국내 AI 대회 (Kaggle 등) 상위권 입상

  • 대규모 데이터로부터 AI 모델 학습 및 추론을 위한 data/model pipeline을 개발한 경험

  • AI 관련 연구 또는 프로덕트 개발을 리딩한 경험

  • 리더보드 또는 유사한 벤치마킹 프로젝트의 운영 경험

  • Docker와 같은 컨테이너 기술을 이용한 개발 환경 구축 경험


*관련 문의사항은 joinstage@upstage.ai로 문의 부탁드립니다.

*CV를 포함한 모든 제출 자료는 PDF 형식으로 업로드 해주시기 바랍니다.
*지원자의 민감 정보(연봉 정보, 주민번호 등) 및 고유식별번호는 이력서에 기재하지 않도록 유의해주시기를 바랍니다.

or