업스테이지는 AI 기술로 해결할 수 있는 비즈니스 문제들을 풀어갑니다. "Making AI Beneficial"이라는 미션 아래, 누구나 AI 기술의 혜택을 누릴 수 있도록 '적용이 쉬운 AI 솔루션'을 개발하고 있습니다. 세계 최고 수준의 AI 모델을 다양한 분야에서 손쉽게 활용할 수 있는 API 시리즈를 출시하여 기업 고객들의 비즈니스 성공에 기여하고 있습니다. 또한, LLM 기술을 비즈니스 환경에 맞게 최적화하여 기업들의 업무 효율과 생산성을 높일 수 있는 Private LLM 서비스를 제공하는 등 AI가 세상에 이롭게 사용될 수 있도록 노력하고 있습니다.
LLM 기술과 더불어 Document Parse와 Information Extraction 등의 제품을 통해 문서 처리 분야에서 혁신을 이루고 있으며, 자체 LLM 및 Chat AI 기술을 비즈니스 환경에 맞게 최적화하여 기업들의 업무 효율과 생산성을 높일 수 있는 AI Space를 개발하는 등 업무 환경의 미래를 위한 인텔리전스를 만들어 갑니다.
LLM Serving 팀은 대규모 GPU 클러스터 위에서 Upstage Solar LLM을 가장 빠르고, 안정적이며, 비용 효율적으로 제공하기 위한 서빙 플랫폼과 추론 최적화 기술을 연구·개발합니다. 팀의 핵심 목표는 ① latency·throughput·cost 간의 trade-off를 최적화하는 서빙 아키텍처 구축, ② Prefill/Decode Disaggregation, KV Cache Offloading, Speculative Decoding, Expert Parallelism 등 최신 추론 기법의 프로덕션 적용, ③ Solar 모델의 구조적 특성을 고려한 양자화·경량화 및 커널 수준 최적화를 통한 토큰당 추론 비용의 지속적 절감입니다. 또한 vLLM, SGLang과 같은 오픈소스 추론 런타임에 자체 확장 기능을 기여하며, 대규모 트래픽을 효율적으로 처리하기 위한 라우팅·스케줄링 로직과 높은 가용성을 보장하는 관측 가능성(Observability) 체계를 설계합니다. 팀에 합류한다면, 최신 서빙 기술을 실제 프로덕션 환경에서 빠르게 검증하고, 글로벌 프론티어 수준의 LLM 서빙 인프라를 함께 만들어가는 경험을 할 수 있습니다.
주요 업무
근무형태
모집절차
*절차는 상황에 따라 조정될 수 있습니다.
*최종 인터뷰 후, 레퍼런스 체크 절차가 진행될 수 있습니다.
근무환경
필수사항
우대사항
—
*관련 문의사항은 [email protected]로 문의 부탁드립니다.
*CV를 포함한 모든 제출 자료는 PDF 형식으로 업로드 해주시기 바랍니다.
*지원자의 민감 정보(연봉 정보, 주민번호 등) 및 고유식별번호는 이력서에 기재하지 않도록 유의해주시기를 바랍니다.
*입사지원 서류에 허위사실이 발견될 경우, 영입 확정 이후라도 영입이 취소될 수 있습니다.
업스테이지는 AI 기술로 해결할 수 있는 비즈니스 문제들을 풀어갑니다. "Making AI Beneficial"이라는 미션 아래, 누구나 AI 기술의 혜택을 누릴 수 있도록 '적용이 쉬운 AI 솔루션'을 개발하고 있습니다. 세계 최고 수준의 AI 모델을 다양한 분야에서 손쉽게 활용할 수 있는 API 시리즈를 출시하여 기업 고객들의 비즈니스 성공에 기여하고 있습니다. 또한, LLM 기술을 비즈니스 환경에 맞게 최적화하여 기업들의 업무 효율과 생산성을 높일 수 있는 Private LLM 서비스를 제공하는 등 AI가 세상에 이롭게 사용될 수 있도록 노력하고 있습니다.
LLM 기술과 더불어 Document Parse와 Information Extraction 등의 제품을 통해 문서 처리 분야에서 혁신을 이루고 있으며, 자체 LLM 및 Chat AI 기술을 비즈니스 환경에 맞게 최적화하여 기업들의 업무 효율과 생산성을 높일 수 있는 AI Space를 개발하는 등 업무 환경의 미래를 위한 인텔리전스를 만들어 갑니다.
LLM Serving 팀은 대규모 GPU 클러스터 위에서 Upstage Solar LLM을 가장 빠르고, 안정적이며, 비용 효율적으로 제공하기 위한 서빙 플랫폼과 추론 최적화 기술을 연구·개발합니다. 팀의 핵심 목표는 ① latency·throughput·cost 간의 trade-off를 최적화하는 서빙 아키텍처 구축, ② Prefill/Decode Disaggregation, KV Cache Offloading, Speculative Decoding, Expert Parallelism 등 최신 추론 기법의 프로덕션 적용, ③ Solar 모델의 구조적 특성을 고려한 양자화·경량화 및 커널 수준 최적화를 통한 토큰당 추론 비용의 지속적 절감입니다. 또한 vLLM, SGLang과 같은 오픈소스 추론 런타임에 자체 확장 기능을 기여하며, 대규모 트래픽을 효율적으로 처리하기 위한 라우팅·스케줄링 로직과 높은 가용성을 보장하는 관측 가능성(Observability) 체계를 설계합니다. 팀에 합류한다면, 최신 서빙 기술을 실제 프로덕션 환경에서 빠르게 검증하고, 글로벌 프론티어 수준의 LLM 서빙 인프라를 함께 만들어가는 경험을 할 수 있습니다.
주요 업무
근무형태
모집절차
*절차는 상황에 따라 조정될 수 있습니다.
*최종 인터뷰 후, 레퍼런스 체크 절차가 진행될 수 있습니다.
근무환경
필수사항
우대사항
—
*관련 문의사항은 [email protected]로 문의 부탁드립니다.
*CV를 포함한 모든 제출 자료는 PDF 형식으로 업로드 해주시기 바랍니다.
*지원자의 민감 정보(연봉 정보, 주민번호 등) 및 고유식별번호는 이력서에 기재하지 않도록 유의해주시기를 바랍니다.
*입사지원 서류에 허위사실이 발견될 경우, 영입 확정 이후라도 영입이 취소될 수 있습니다.