
[WBL] AI Research Engineer - LLM Post-training
- Remote
- Yongin-si, ๊ฒฝ๊ธฐ๋, ๋ํ๋ฏผ๊ตญ
- AI Research Engineering
Description
์ ์คํ ์ด์ง๋ AI ๊ธฐ์ ์ ํ์ฉํ์ฌ ๋น์ฆ๋์ค ๋ฌธ์ ํด๊ฒฐ์ ์ฃผ๋ ฅํ๋ ๊ธฐ์ ์ผ๋ก, โ"Making AI Beneficial"โ์ด๋ผ๋ ๋น์ ๊ณผ โ"Artificial General Intelligence (AGI) for Work"โ๋ผ๋ ๋ฏธ์ ์ ๊ธฐ๋ฐ์ผ๋ก ์ด์๋ฉ๋๋ค. ๋จ์ํ ์ ๋ฌด ์๋ํ๋ฅผ ๋์ด, ๋ณต์กํ ์์ฌ๊ฒฐ์ ์ง์ ๋ฐ ๋น์ฉ ์ ๊ฐ์ ํตํด ๊ธฐ์ ์ ์์ฐ์ฑ์ ํ์ ์ ์ผ๋ก ํฅ์์ํค๋ AI ์๋ฃจ์ ๊ฐ๋ฐ์ ์ง์คํ๊ณ ์์ต๋๋ค.
์ด๋ฌํ ๋น์ ์คํ์ ์ํด ์ ์คํ ์ด์ง๋ AGI์ ํต์ฌ ๊ธฐ๋ฐ ๊ธฐ์ ์ธ LLM(Large Language Model) ๋ชจ๋ธ์ ์ง์์ ์ผ๋ก ๋ฐ์ ์ํค๊ณ ์์ต๋๋ค. ๊ธฐ์ ๊ฒฝ์๋ ฅ ๊ฐํ๋ฅผ ์ํด โGlobal Frontierโ์์ ์ถ์ ํ๋ ๋ฒค์น๋งํฌ ์งํ๋ฅผ ํตํ์ฌ ๋ชจ๋ธ ์ฑ๋ฅ์ ์ง๋จ ๋ฐ ๊ฐ์ ํ๋ฉฐ, ๋์์ ๊ณ ๊ฐ์ฌ์ ์ค์ ๋์ฆ๋ฅผ ๋ฐ์ํ โWorkspace Benchmark Setโ์ ๊ตฌ์ถํด ๋ชจ๋ธ์ ์ค์ฉ์ฑ๊ณผ ์ฑ๋ฅ์ ๊ทน๋ํ์ ํ์ฉํ๊ณ ์์ต๋๋ค. ์ด๋ฅผ ํตํด ์ ์คํ ์ด์ง๋ ์ฐ์ ํ์ฅ์ ๋ณต์กํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๋์์ ๊ธ๋ก๋ฒ ์์ค์ ๊ธฐ์ ํ์ค์ ์ ๋ํ๊ธฐ ์ํด ๋ ธ๋ ฅํ๊ณ ์์ต๋๋ค.
LLM Post-training ํ์ (1) ์ง์/์ถ๋ก ๋ฅ๋ ฅ ๊ฐํ, (2) ์ธ๊ฐ ์ ํธ๋ ์ ๋ ฌ(human preference alignment), (3) ์์ด์ ํธํ ๋๊ตฌ ํ์ฉ(agentic tool use) ์ฑ๋ฅ ํฅ์์ ํต์ฌ ๋ชฉํ๋ก ์ผ๊ณ , ํ์ฅ ๊ฐ๋ฅํ ๋ฐ์ดํฐ ๊ตฌ์ถ ๋ฐฉ๋ฒ๋ก , ์ด๊ณ ํ์ง ๋ฐ์ดํฐ ํํฐ๋ง ์์คํ , DPOยทRLHFยทRLVR ๋ฑ ์ต์ ํ์ต ๊ธฐ๋ฒ์ ํ์ฉํด โ์ธ๊ณ ์ต๊ณ ์์ค์ ์ฌํ ํ์ต ๊ธฐ์ ๊ฐ๋ฐโ์ ์ฃผ๋ํฉ๋๋ค. ์ด ํ์ ํฉ๋ฅํ๋ค๋ฉด, ์งํํ๋ LLM ๊ธฐ์ ์ ์ ๋ํ๋ฉฐ ์ฐ์ ํ์ฅ์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ โ์ฐจ์ธ๋ ๊ธฐ์ ํ์ โ์ ํจ๊ป ์คํํ ์ ์์ ๊ฒ์ ๋๋ค.
Representative projects
Reinforcement learning for LLM (math, code, general reasoning, tool use)
Efficient & effective reasoning
A scalable agentic tool use data synthesis pipeline
Language-specific reward models
Precise instruction following
** ๊ธฐ์ ์ ํ๋ฆ๊ณผ ์ํฉ์ ๋ฐ๋ผ์ ๊ฐ๋ฐํ๋ ํ๋ก์ ํธ๋ ๋ณํํ๋ฉฐ, ํ๋ก์ ํธ๋ ๊ฐ ์์ ์ LLM ๋ชจ๋ธ ๋ฐ์ ์ ๊ฐ์ฅ ์ํฅ๋ ฅ์๋ ๊ธฐ์ ์์์ ์ง์คํฉ๋๋ค.
๊ทผ๋ฌด ํํ
์ ๊ท์ง/์ธํด์ญ(์ฒดํํ, 3๊ฐ์~6๊ฐ์)
๋ชจ์ง ์ ์ฐจ - ์ ์ฒด ์จ๋ผ์ธ์ผ๋ก ์งํ
์๋ฅ ์ ํ
์๊ณ ๋ฆฌ์ฆ ์ฝ๋ฉ ํ ์คํธ
๋ฅ๋ฌ๋ ์ฝ๋ฉํ ์คํธ
๊ธฐ์ ์ธํฐ๋ทฐ (1์ฐจ)
๊ธฐ์ ์ธํฐ๋ทฐ (2์ฐจ)
์ปฌ์ฒ ์ธํฐ๋ทฐ
์ต์ข ์ธํฐ๋ทฐ
์ต์ข ๊ฒฐ๊ณผ ๋ฐํ
*์ ์ฐจ๋ ์ํฉ์ ๋ฐ๋ผ ์กฐ์ ๋ ์ ์์ต๋๋ค.
*์ต์ข
์ธํฐ๋ทฐ ํ, ๋ ํผ๋ฐ์ค ์ฒดํฌ ์ ์ฐจ๊ฐ ์งํ๋ ์ ์์ต๋๋ค.
๊ทผ๋ฌดํ๊ฒฝ
Anywhere On Earth But Together! โ์ด๋์๋ โ ํจ๊ป ์ผํ ์ ์์ต๋๋ค.
์๊ฒฉ ๊ทผ๋ฌด์ ํ์ํ ์ฅ๋น๋ฅผ 500๋ง์ ์์ฐ ๋ด์ ์์ ๋กญ๊ฒ ์ ํํ์ค ์ ์์ต๋๋ค.
๊ทผ๋ฌด๋ฅผ ์ํ ์นดํ ์ด์ฉ ์ ์๋ฃ ๋น์ฉ, ์คํฐ๋๋ฃธ ํน์ ๊ณต์ ์คํผ์ค ์ด์ฉ ๋น์ฉ ๋ฑ์ ์ง์ํด๋๋ฆฝ๋๋ค.
์ ๋ฌด ๊ด๋ จ ์ํํธ์จ์ด, ๋์, ์๋ฃ, ๊ต์ก ๋ฐ ์ดํ ์๊ฐ๋น ๋ฑ ์ฑ์ฅ์ ํ์ํ ๋น์ฉ์ ์ง์ํด๋๋ฆฝ๋๋ค.
๊ฑด๊ฐ์ ์ํ ์ด๋๋น, ์ง์ฅ ๋จ์ฒด๋ณดํ ๋ฐ ์ข ํฉ๊ฑด๊ฐ๊ฒ์ง์ ์ง์ํด๋๋ฆฝ๋๋ค.
Requirements
Strongly wanted
LLM post-training/fine-tuning์ ์ํํ์ฌ ํน์ ๋ฌธ์ ์์ ์ต๊ณ ์ฑ๋ฅ์ ๋ฌ์ฑํด๋ณธ ๊ฒฝํ
ML๊ณผ NLP ํ ํฝ์ผ๋ก ๊ตญ์ ํํ์์ ์ถํ ๊ธฐ๋ก (1์ ์ ํน์ ๊ต์ ์ ์)
May helpful
AI ๊ด๋ จ ์ฐ๊ตฌ ๋๋ ํ๋ก๋ํธ ๊ฐ๋ฐ์ ๋ฆฌ๋ฉํ ๊ฒฝํ
LLM Post-training์ ์ํ ๋ฐ์ดํฐ ์์ง, ์์ฑ, ์ ์ ๋ฑ์ ์ํํด ๋ณธ ๊ฒฝํ
๊ตญ์ ํน์ ๊ตญ๋ด AI ๋ํ (Kaggle ๋ฑ) ์์๊ถ ์ ์
0.1%์ ์ฑ๋ฅ์ ๋ฏผ๊ฐํ์ฌ ์ ํ๋ ์์๊ณผ ์๊ฐ์ ์ต์ ํ๋ฅผ ์ํํ ์ ์๋ ์ง์ค๋ ฅ
๋ ผ๋ฆฌ์ ์ธ ์ฌ๊ณ ์คํ์ ์ํํ๊ณ ๊ฐ์ค/๊ฒ์ฆ์ ๋ฐฉ์์ผ๋ก ์คํ ์ค๊ณ ๋ฐ ๊ฒฐ๊ณผ๋ฅผ ๋์ถํ ์ ์๋ ์ฌ๊ณ ๋ ฅ
๋ ์จ๋ฐ์ ํจ๊ณผ์ ์ด๊ณ ํจ์จ์ ์ผ๋ก ์ ํํ๊ณ ๋ ผ์ํ ์ ์๋ ์์ฌ์ํต ๋ฅ๋ ฅ
*๊ด๋ จ ๋ฌธ์์ฌํญ์ joinstage@upstage.ai๋ก ๋ฌธ์ ๋ถํ๋๋ฆฝ๋๋ค.
*CV๋ฅผ ํฌํจํ ๋ชจ๋ ์ ์ถ ์๋ฃ๋ PDF ํ์์ผ๋ก ์
๋ก๋ ํด์ฃผ์๊ธฐ ๋ฐ๋๋๋ค.
*์ง์์์ ๋ฏผ๊ฐ ์ ๋ณด(์ฐ๋ด ์ ๋ณด, ์ฃผ๋ฏผ๋ฒํธ ๋ฑ) ๋ฐ ๊ณ ์ ์๋ณ๋ฒํธ๋ ์ด๋ ฅ์์ ๊ธฐ์ฌํ์ง ์๋๋ก ์ ์ํด์ฃผ์๊ธฐ๋ฅผ ๋ฐ๋๋๋ค.
or
All done!
Your application has been successfully submitted!