Skip to content

Data Engineer

Remote
  • Yongin, Gyeonggi-do, 대한민국
Data

Description

업스테이지는 AI 기술을 활용하여 비즈니스 문제를 해결하는 데 주력하고 있습니다. “Making AI Beneficial” 이라는 비전과 “Artificial General Intelligence (AGI) for Work” 라는 미션을 바탕으로, 단순한 업무 자동화를 넘어서 복잡한 의사결정 지원 및 비용 절감을 통해 기업의 생산성을 증진시킬 수 있는 AI 솔루션 개발에 착수하고 있습니다. 이를 통해 우리는 업무 처리 방식을 혁신하고 기업들이 더욱 효율적으로 성장할 수 있도록 지원합니다.


업스테이지는 누구나 AI 기술의 혜택을 누릴 수 있도록 “적용이 쉬운 AI 솔루션“을 만들고 있습니다. 세계 최고 수준의 AI 모델을 다양한 분야에서 손쉽게 활용할 수 있는 API 시리즈를 출시하여 기업 고객들의 비즈니스 성공에 기여하고 있습니다. 또한 LLM 기술을 비즈니스 환경에 맞게 최적화해 기업들의 업무 효율과 생산성을 높일 수 있는 Private LLM 서비스를 제공하는 등 AI가 세상에 이롭게 쓰이게 하기 위해 노력하고 있습니다. 그 중에서 업스테이지 Document AI는 세계 최고 수준의 OCR 및 정보추출 기술력을 바탕으로 한 제품으로, AI를 통해 번거로운 문서 처리를 자동화하고 효율화하겠다는 목표를 가지고 있습니다.


또한 ChatGPT를 적용한 카카오톡 채널 기반 챗봇 '애스크업'(AskUp)을 통해 모바일 사용 경험의 혁신을 이루는 동시에 AI분야에 대한 대중들의 접근성과 신뢰성을 높여가고 있으며, Chat AI 기술을 비즈니스 환경에 맞게 최적화해 기업들의 업무 효율과 생산성을 높일 수 있는 ‘애스크업 비즈’(AskUp Biz)를 운영하는 등 AI가 세상에 이롭게 쓰이게 하기 위해 노력하고 있습니다.


최근 업스테이지는 글로벌 LLM 리더보드에서 우수한 성능을 입증한 바 있는 자체 개발 Large Language Model (LLM) SOLAR를 오픈소스로 공개한 바 있으며, 곧 상품성을 대폭 높인 SOLAR API 정식 출시를 앞두고 있습니다. 더불어, 국내 뿐만 아니라 글로벌 고객들을 만족시킬 수 있는 LLM 및 이를 지원하는 생태계를 만들기 위해 박차를 가하고 있습니다. 이 장대한 여정에 함께할 열정적인 동료를 찾고 있습니다.


주요 업무

  • LLM향 대용량 데이터를 수집, 저장, 처리하기 위한 시스템 설계 및 구축

  • 데이터 파이프라인 및 ETL(Extract, Transform, Load) 프로세스 개발 및 최적화

  • 데이터 품질 및 처리 성능 모니터링

  • 데이터 웨어하우스 및 데이터 레이크 아키텍처 설계 및 구현

  • 데이터 처리를 위한 분산 시스템 운영

  • 고객사 데이터 분석 및 파이프라인 운영 (지표 설계 및 대시보드 운영)

  • 평가 프로세스 확립 및 운영


근무 형태

  • 정규직


모집 절차 - 전체 온라인으로 진행

  • 서류 전형

  • 알고리즘 코딩 테스트 

  • 기술 인터뷰 (1차/2차)

  • 컬처 인터뷰

  • 최종 인터뷰 

  • 최종 결과 발표

*절차는 상황에 따라 조정될 수 있습니다.
*최종 인터뷰 후, 레퍼런스 체크 절차가 진행될 수 있습니다.


근무환경

  • Anywhere On Earth But Together! ‘어디서든’ 함께 일할 수 있습니다.

  • 원격 근무에 필요한 장비를 500만원 예산 내에 자유롭게 선택하실 수 있습니다.

  • 근무를 위한 카페 이용 시 음료 비용, 스터디룸 혹은 공유오피스 이용 비용 등을 지원해드립니다.

  • 업무 관련 소프트웨어, 도서, 자료, 교육수강비 등 성장에 필요한 비용을 지원해드립니다.

  • 직장 단체보험 및 연 1회 종합건강검진을 지원해드립니다.

Requirements

필수 사항

  • 기본적인 CS 기초 과목 (ex. 자료구조, 알고리즘, 데이터베이스, 운영체제, 네트워크)에 대한 이해도

  • AI 문제를 정의하고 해결하는 능력

  • 기초 머신러닝 알고리즘에 대한 기초적인 이해

  • Python, C++ 등의 언어를 활용한 프로그래밍 능력 및 Linux/Shell 활용 능력

  • 다양한 협업 환경에서 일할 수 있는 능력

  • 훌륭한 의사 소통 능력


우대 사항

  • 대규모 상용 ML(LLM, NLP 등) 제품 개발 경험

  • 새로운 연구 혹은 개발 방향성을 제시할 수 있는 능력 혹은 NLP 관련 AI Conference Main Track (e.g. ACL, EMNLP, NAACL, EACL, COLING, AACL etc)에서 1저자 혹은 교신저자로 출판 기록

  • 국제 혹은 국내 AI 대회 (Kaggle 등) 상위권 입상

  • 대규모 데이터로부터 AI 모델 학습 및 추론을 위한 Data / Model Pipeline을 개발한 경험

  • AI 관련 연구 또는 프로덕트 개발을 리딩한 경험


*관련 문의사항은 joinstage@upstage.ai로 문의 부탁드립니다.

*CV를 포함한 모든 제출 자료는 PDF 형식으로 업로드 해주시기 바랍니다.
*지원자의 민감 정보(연봉 정보, 주민번호 등) 및 고유식별번호는 이력서에 기재하지 않도록 유의해주시기를 바랍니다.

or