Skip to content

Platform Software Engineer

  • Remote
    • Yongin-si, 경기도, 대한민국
  • Software Engineering

Description

업스테이지는 AI 기술로 해결할 수 있는 비즈니스 문제들을 풀어갑니다. "Making AI Beneficial"이라는 미션 아래, 누구나 AI 기술의 혜택을 누릴 수 있도록 '적용이 쉬운 AI 솔루션'을 개발하고 있습니다. 세계 최고 수준의 AI 모델을 다양한 분야에서 손쉽게 활용할 수 있는 API 시리즈를 출시하여 기업 고객들의 비즈니스 성공에 기여하고 있습니다. 또한, LLM 기술을 비즈니스 환경에 맞게 최적화하여 기업들의 업무 효율과 생산성을 높일 수 있는 Private LLM 서비스를 제공하는 등 AI가 세상에 이롭게 사용될 수 있도록 노력하고 있습니다.

LLM 기술과 더불어 Document Parse와 Information Extraction 등의 제품을 통해 문서 처리 분야에서 혁신을 이루고 있으며, 자체 LLM 및 Chat AI 기술을 비즈니스 환경에 맞게 최적화하여 기업들의 업무 효율과 생산성을 높일 수 있는 AI Space를 개발하는 등 업무 환경의 미래를 위한 인텔리전스를 만들어 갑니다.

"AI를 세상에 쏘아 올리는 발사대, Platform 팀"

업스테이지 Platform 팀은 세계 최고 수준의 AI 모델과 서비스가 가장 빠르고 안정적으로 고객에게 닿을 수 있도록 돕는 핵심 엔지니어링 조직입니다. 우리는 "Platform as a Product"라는 철학 아래, 내부 개발자가 인프라의 복잡함을 느끼지 않고 비즈니스 로직과 모델링에만 집중할 수 있는 Golden Path(표준화된 개발 경로)를 만듭니다.

단순한 운영을 넘어, LLM/ML 서비스에 특화된 GPU 스케줄링, 글로벌 멀티 리전 아키텍처, 그리고 고도화된 Self-Service Platform을 통해 엔지니어링의 생산성을 극대화합니다. 유연하고 수평적인 문화 속에서 최고의 동료들과 함께 글로벌 스케일의 AI 플랫폼을 함께 만들어갈 분을 찾습니다.

주요 업무

  • Internal Developer Platform (IDP) 구축 및 고도화: 개발자가 인프라를 쉽고 안전하게 프로비저닝할 수 있도록 셀프 서비스 플랫폼을 개발하고, 개발의 시작부터 배포까지의 경험(DevEx)을 지속적으로 개선합니다.

  • Kubernetes 기반 플랫폼 엔지니어링: EKS 및 On-Premise 환경을 아우르는 하이브리드 Kubernetes 클러스터를 운영하며, GPU 리소스 스케줄링 최적화 및 모델 서빙 안정성을 확보합니다.

  • Global Multi-Region 인프라 아키텍처 설계: 데이터 주권 및 글로벌 서비스 확장에 대응하기 위해 Multi-Region 네트워크 및 인프라 아키텍처를 설계하고 운영합니다.

  • Infrastructure as Code 기반 자동화 및 모듈화: Terraform, Ansible 등을 활용하여 모든 인프라를 코드로 관리하고, 재사용 가능한 인프라 모듈을 개발하여 운영 효율을 높입니다.

  • Observability 체계 구축 및 SLO 기반 운영: Logging, Metrics, Tracing 파이프라인을 구축하여 플랫폼의 가시성을 확보하고, SLO/SLI 기반의 데이터 중심 운영 문화를 정착시킵니다.

  • CI/CD 파이프라인 및 배포 전략 고도화: ArgoCD, Github Actions 등을 활용하여 GitOps 기반의 배포 파이프라인을 구축하고, Canary/Blue-Green 등 안정적인 배포 전략을 제공합니다.

근무형태

  • 정규직

모집절차

  • 서류 전형

  • 알고리즘 코딩 테스트

  • 기술 인터뷰

  • 컬처 인터뷰

  • 최종 인터뷰

  • 최종 결과 발표

*절차는 상황에 따라 조정될 수 있습니다.

*최종 인터뷰 후, 레퍼런스 체크 절차가 진행될 수 있습니다.

근무환경

  • Anywhere On Earth But Together! ‘어디서든’ 함께 일할 수 있습니다.

  • 원격 근무에 필요한 장비를 500만원 예산 내에 자유롭게 선택하실 수 있습니다.

  • 근무를 위한 카페 이용 시 음료 비용, 스터디룸 혹은 공유오피스 이용 비용 등을 지원해드립니다.

  • 업무 관련 소프트웨어, 도서, 자료, 교육 및 어학 수강비 등 성장에 필요한 비용을 지원해드립니다.

  • 건강을 위한 운동비, 직장 단체보험 및 종합건강검진을 지원해드립니다.

Requirements

필수사항

  • AWS, Azure등 Public Cloud 환경에서 대규모 서비스 운영 경험 (EKS, VPC, IAM, Transit Gateway 등)

  • Kubernetes 생태계에 대한 깊은 이해 및 운영 경험 (Architecture, CNI, CSI, CRD 등)

  • Terraform, Ansible 등을 활용한 IaC(Infrastructure as Code) 모듈 설계 및 운영 경험

  • 서비스 운영/장애 대응 경험 및 관측성(Observability)에 대한 깊은 이해

  • 플랫폼을 '제품'으로 바라보고, 고객(내부 개발자)의 문제를 정의하고 해결하려는 Product Mindset을 보유하신 분

  • 다양한 직군(개발자, 모델러, PM 등)과 원활하게 소통하며 문제를 주도적으로 해결할 수 있는 커뮤니케이션 역량

우대사항

  • LLM/ML 인프라 구축 또는 GPU 기반 모델 서빙 환경 경험

  • 대규모 트래픽 처리를 위한 고가용성(HA) 아키텍처 설계 및 Multi-Region / Global Service 운영 경험

  • DevEx 개선, Internal Platform/IDP 구축 경험

  • Cloud Native 기술(Service Mesh, Operator Pattern, ArgoCD, KEDA 등)에 대한 깊은 이해와 실무 적용 경험

  • SLO/SLI/Error Budget 기반의 SRE 문화 도입 및 실천 경험

  • FinOps 관점에서 클라우드 비용 효율화 및 리소스 최적화 경험

*관련 문의사항은 joinstage@upstage.ai로 문의 부탁드립니다.
*CV를 포함한 모든 제출 자료는 PDF 형식으로 업로드 해주시기 바랍니다.
*지원자의 민감 정보(연봉 정보, 주민번호 등) 및 고유식별번호는 이력서에 기재하지 않도록 유의해주시기를 바랍니다.

or