Skip to content

Data Research Engineer Internship

Remote
  • Yongin-si, Gyeonggi-do, 대한민국
Data

Description

업스테이지는 AI 기술을 활용하여 비즈니스 문제를 해결하는 데 주력하고 있습니다. “Making AI Beneficial” 이라는 비전과 “Artificial General Intelligence (AGI) for Work” 라는 미션을 바탕으로, 단순한 업무 자동화를 넘어서 복잡한 의사결정 지원 및 비용 절감을 통해 기업의 생산성을 증진시킬 수 있는 AI 솔루션 개발에 착수하고 있습니다. 이를 통해 우리는 업무 처리 방식을 혁신하고 기업들이 더욱 효율적으로 성장할 수 있도록 지원합니다.


업스테이지는 누구나 AI 기술의 혜택을 누릴 수 있도록 “적용이 쉬운 AI 솔루션“을 만들고 있습니다. 세계 최고 수준의 AI 모델을 다양한 분야에서 손쉽게 활용할 수 있는 API 시리즈를 출시하여 기업 고객들의 비즈니스 성공에 기여하고 있습니다. 또한 LLM 기술을 비즈니스 환경에 맞게 최적화해 기업들의 업무 효율과 생산성을 높일 수 있는 Private LLM 서비스를 제공하는 등 AI가 세상에 이롭게 쓰이게 하기 위해 노력하고 있습니다. 그 중에서 업스테이지 Document AI는 세계 최고 수준의 OCR 및 정보추출 기술력을 바탕으로 한 제품으로, AI를 통해 번거로운 문서 처리를 자동화하고 효율화하겠다는 목표를 가지고 있습니다.


또한 ChatGPT를 적용한 카카오톡 채널 기반 챗봇 '애스크업'(AskUp)을 통해 모바일 사용 경험의 혁신을 이루는 동시에 AI분야에 대한 대중들의 접근성과 신뢰성을 높여가고 있으며, Chat AI 기술을 비즈니스 환경에 맞게 최적화해 기업들의 업무 효율과 생산성을 높일 수 있는 ‘애스크업 비즈’(AskUp Biz)를 운영하는 등 AI가 세상에 이롭게 쓰이게 하기 위해 노력하고 있습니다.


업스테이지 LLM 팀은 자체 파운데이션 모델 SOLAR를 개발하고, 이를 기반으로 각 산업 분야에 특화된 커스텀 모델(Private LLM) 및 컴포넌트(RAG, Function Call, multi-turn dialogue 등 LLM과 시너지를 낼 수 있는 모듈)를 개발합니다. 동시에 오픈리더보드 주최 및 운영, 한국어 데이터셋 확보 프로젝트 등을 통해 LLM 생태계 확장에 기여하고, 데이터 파이프라인 구축을 통해 지속가능한 개발 환경을 만들어 나갑니다.

  • 업스테이지, 기업용 생성AI 독자 개발…“의료·금융 특화 해외시장 공략” [기사]
  • 한국판 LLM 리더보드 나온다…업스테이지-NIA, 27일 'Open Ko-LLM 리더보드' 개설 [기사]
  • Open Ko-LLM 리더보드 [링크]


주요 업무

  • Open Ko-LLM 리더보드 운영 및 개선
    • 리더보드 평가 작업에 필요한 GPU 및 기타 컴퓨팅 자원 관리 및 장애 대응

    • 리더보드 사용자 커뮤니티로부터의 요청사항 대응 및 문제 해결

    • 지속적인 리더보드 모니터링을 통한 제출 모델의 규정 준수 여부 검토 및 가이드 (리더보드 사용자와의 커뮤니케이션 필수)

    • 리더보드 관련 각종 피드백 수집 및 분석을 통한 시스템 개선

    • 신규 벤치마크 데이터에 대한 분석 및 평가 코드 개발

  • 효과적인 평가 프로세스를 확립하고 효과적으로 운영
    • 평가 프로세스 자동화 (ex. 질문 자동 생성, 평가 자동화)

    • 효과적인 평가 툴 제작 및 운영

  • Modeling에 대한 이해를 바탕으로 효과적인 Data Curation
    • 코드 베이스 데이터 분석 및 분석 프로세스 자동화

    • 모델 성능을 향상시킬 수 있는 데이터 개선방안 도출


근무 형태

  • 체험형 인턴십 (3개월)


모집 절차 - 전체 온라인으로 진행

  • 서류 전형
  • 알고리즘 코딩테스트
  • 기술 인터뷰 (1차/2차)
  • 컬처 인터뷰
  • 인턴 실습 (3개월)

*모든 절차는 상황에 따라 조정될 수 있습니다.


근무 환경

  • Anywhere On Earth But Together! ‘어디서든’ 함께 일할 수 있습니다.

  • 근무를 위한 카페 이용 시 음료 비용, 스터디룸 혹은 공유오피스 이용 비용 등을 지원해드립니다.

  • 업무 관련 소프트웨어, 도서, 자료, 교육수강비 등 성장에 필요한 비용을 지원해드립니다.

Requirements

필수 사항

  • Python, C++ 등의 언어를 활용한 프로그래밍 능력 및 Ubuntu Linux/Shell 활용 능력 (Python 필수)

  • HuggingFace 허브의 사용 및 데이터셋, 딥러닝 모델의 업로드 경험

  • 모델 평가 파이프라인 스크립트 개발 및 운영 경험

  • 소프트웨어 버전 관리 시스템, Git에 대한 경험

  • AI 문제를 정의하고 해결하는 능력

  • 기초 머신러닝 알고리즘에 대한 깊은 이해

  • NLP, LLM 등 관심 AI 도메인의 최신 동향에 대한 이해

  • 다양한 협업 환경에서 일할 수 있는 능력

  • 훌륭한 의사 소통 능력


우대 사항

  • 대규모 상용 ML(LLM, NLP 등) 제품 개발 경험

  • 새로운 연구 혹은 개발 방향성을 제시할 수 있는 능력 혹은 NLP 관련 AI Conference Main Track (e.g. ACL, EMNLP, NAACL, COLING, LREC, IJCNLP, AACL etc)에서 1저자 혹은 교신저자로 출판 기록

  • 국제 혹은 국내 AI 대회 (Kaggle 등) 상위권 입상

  • 대규모 데이터로부터 AI 모델 학습 및 추론을 위한 data/model pipeline을 개발한 경험

  • AI 관련 연구 또는 프로덕트 개발을 리딩한 경험

  • 리더보드 또는 유사한 벤치마킹 프로젝트의 운영 경험

  • Docker와 같은 컨테이너 기술을 이용한 개발 환경 구축 경험


*관련 문의사항은 joinstage@upstage.ai로 문의 부탁드립니다.

*CV를 포함한 모든 제출 자료는 PDF 형식으로 업로드 해주시기 바랍니다.
*지원자의 민감 정보(연봉 정보, 주민번호 등) 및 고유식별번호는 이력서에 기재하지 않도록 유의해주시기를 바랍니다.

or