
[์ ๋ฌธ์ฐ๊ตฌ์์ ์ ๊ทํธ์ & ์ ์ง] AI Research Engineer - LLM
- On-site
- Yongin-si, ๊ฒฝ๊ธฐ๋, ๋ํ๋ฏผ๊ตญ
- AI Research Engineering
Description
*๋ณธ ๊ณต๊ณ ๋ ๋ณ์ญํน๋ก์ ํด๋นํ๋ โ์ ๋ฌธ์ฐ๊ตฌ์์โ์ ํฌ๋งํ๋ ๋ถ๋ค์ ํํด ์ง์ํ์ค ์ ์์ผ๋ฉฐ, ๋ณ์ญ์๋ฌด๊ฐ ์๋ ๋ถ๋ค์ ์ง์๋์์ ํด๋น๋์ง ์์ต๋๋ค.
์ ์คํ ์ด์ง๋ AI ๊ธฐ์ ์ ํ์ฉํ์ฌ ๋น์ฆ๋์ค ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๋ฐ ์ฃผ๋ ฅํ๊ณ ์์ต๋๋ค. โMaking AI Beneficialโ ์ด๋ผ๋ ๋น์ ๊ณผ โBuilding intelligence for the future of workโ ๋ผ๋ ๋ฏธ์ ์ ๋ฐํ์ผ๋ก, ๋จ์ํ ์ ๋ฌด ์๋ํ๋ฅผ ๋์ด์ ๋ณต์กํ ์์ฌ๊ฒฐ์ ์ง์ ๋ฐ ๋น์ฉ ์ ๊ฐ์ ํตํด ๊ธฐ์ ์ ์์ฐ์ฑ์ ์ฆ์ง์ํฌ ์ ์๋ AI ์ ํ๊ณผ ์๋ฃจ์ ์ ์ ๊ณตํฉ๋๋ค. ์ด๋ฅผ ํตํด ์ฐ๋ฆฌ๋ ๊ธฐ์ ๋ค์ด ์ ๋ฌด ์ฒ๋ฆฌ ๋ฐฉ์์ ํ์ ํ๊ณ ๋์ฑ ํจ์จ์ ์ผ๋ก ์ฑ์ฅํ ์ ์๋๋ก ์ง์ํฉ๋๋ค.
์ ์คํ ์ด์ง๋ ๋๊ตฌ๋ ์์ฝ๊ฒ AI ๊ธฐ์ ์ ํ์ฉํ ์ ์๋๋ก โ์ฌ์ฉ์ด ์ฌ์ด AI ์๋ฃจ์ โ์ ์ ๊ณตํ๋ ๊ฒ์ ๋ชฉํ๋ก ํ๊ณ ์์ต๋๋ค. ์ด๋ฏธ ์ต๊ณ ์์ค์ OCR ๊ธฐ์ ๊ณผ ๋ฌธ์ ๋ด ์๋ฏธ ์๋ ์ ๋ณด๋ฅผ ์๋์ผ๋ก ์ถ์ถํ๋ Key-Value ์ถ์ถ ๊ธฐ์ ์ ๋ณด์ ํ๊ณ ์์ผ๋ฉฐ, ์ต๊ทผ์๋ ๋ค์ํ ๋ฌธ์ ๋ ์ด์์์ ๋ถ์ํ๋ Document Parsing ๋ชจ๋ธ์ ๊ณต๊ฐํ์์ต๋๋ค. ์ด๋ฌํ ๊ธฐ์ ๋ค์ ๋ฐํ์ผ๋ก, ์ ์คํ ์ด์ง๋ ๊ธฐ์ ๋ค์ ์ ๋ฌด ํจ์จ๊ณผ ์์ฐ์ฑ์ ๊ทน๋ํํ๋ ๋ง์ถคํ AI ์๋ฃจ์ ์ ์ ๊ณตํ์ฌ AI๊ฐ ์ค์ ๋น์ฆ๋์ค์์ ํฐ ๊ฐ์น๋ฅผ ์ฐฝ์ถํ ์ ์๋๋ก ๋ ธ๋ ฅํ๊ณ ์์ต๋๋ค.
๋ํ LLM ๊ธฐ์ ์ ๋น์ฆ๋์ค ํ๊ฒฝ์ ๋ง๊ฒ ์ต์ ํํด ๊ธฐ์ ๋ค์ ์ ๋ฌด ํจ์จ๊ณผ ์์ฐ์ฑ์ ๋์ผ ์ ์๋ Private LLM ์๋น์ค๋ฅผ ์ ๊ณตํ๋ ๋ฑ AI๊ฐ ์ธ์์ ์ด๋กญ๊ฒ ์ฐ์ด๊ฒ ํ๊ธฐ ์ํด ์ธ๊ณ ์ต๊ณ ์์ค์ AI ๋ชจ๋ธ์ ๋ค์ํ ๋ถ์ผ์์ ์์ฝ๊ฒ ํ์ฉํ ์ ์๋ API ์๋ฆฌ์ฆ๋ฅผ ์ถ์ํ์ฌ ๊ธฐ์ ๊ณ ๊ฐ๋ค์ ๋น์ฆ๋์ค ์ฑ๊ณต์ ๊ธฐ์ฌํ๊ณ ์์ต๋๋ค. ๊ทธ ์ค์์ ์ ์คํ ์ด์ง Document AI๋ ์ธ๊ณ ์ต๊ณ ์์ค์ OCR ๋ฐ ์ ๋ณด์ถ์ถ ๊ธฐ์ ๋ ฅ์ ๋ฐํ์ผ๋ก ํ ์ ํ์ผ๋ก, AI๋ฅผ ํตํด ๋ฒ๊ฑฐ๋ก์ด ๋ฌธ์ ์ฒ๋ฆฌ๋ฅผ ์๋ํํ๊ณ ํจ์จํํ๊ฒ ๋ค๋ ๋ชฉํ๋ฅผ ๊ฐ์ง๊ณ ์์ต๋๋ค.
์ด๋ฌํ ๋น์ ๊ณผ ๋ฏธ์ ๋ฌ์ฑ์ ์ํด, ์ ์คํ ์ด์ง LLM Team์ Solar Mini, Solar Pro์ ๊ฐ์ LLM์ ์์ฒด ๊ฐ๋ฐํ๊ณ ์์ผ๋ฉฐ, ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก Chat, Translation ๋ฑ ํน์ ์์ ์ ์ํ API์, ๋ฒ๋ฅ , e-commerce ๋ฑ ํน์ ๋ถ์ผ๋ฅผ ์ํ Private LLM ์๋น์ค๋ ๊ฐ๋ฐํ๊ณ ์์ต๋๋ค.
์ฃผ์ ์ ๋ฌด
LLM Post-training์ ์ํ ๋ฐ์ดํฐ ์์ง ๋ฐ ์ ์
LLM Post-training ๋ฐฉ๋ฒ๋ก ์ฐ๊ตฌ ๋ฐ ๊ฐ๋ฐ
LLM ์ ํํ๋ฅผ ์ํ ๊ฐ๋ฐ
๊ทผ๋ฌด ํํ
์ ๊ท์ง (์ ๋ฌธ์ฐ๊ตฌ์์ ์ ๊ทํธ์ , ์ ์ง ๋์)
๊ทผ๋ฌด์ง
๊ด๊ต ์คํผ์ค (์ํ์ญ ๊ทผ์ฒ ๋๋ณด 10๋ถ)
๋ชจ์ง ์ ์ฐจ - ์ ์ฒด ์จ๋ผ์ธ์ผ๋ก ์งํ
์๋ฅ ์ ํ
์๊ณ ๋ฆฌ์ฆ ์ฝ๋ฉํ ์คํธ
๋ฅ๋ฌ๋ ์ฝ๋ฉํ ์คํธ
๊ธฐ์ ์ธํฐ๋ทฐ (1์ฐจ)
๊ธฐ์ ์ธํฐ๋ทฐ (2์ฐจ)
์ปฌ์ฒ ์ธํฐ๋ทฐ
์ต์ข ์ธํฐ๋ทฐ
์ต์ข ๊ฒฐ๊ณผ ๋ฐํ
*์ ์ฐจ๋ ์ํฉ์ ๋ฐ๋ผ ์กฐ์ ๋ ์ ์์ต๋๋ค.
*์ต์ข
์ธํฐ๋ทฐ ํ, ๋ ํผ๋ฐ์ค ์ฒดํฌ ์ ์ฐจ๊ฐ ์งํ๋ ์ ์์ต๋๋ค.
๊ทผ๋ฌดํ๊ฒฝ
๊ฐ๊ฐ์ธ์ ์ ๋ฌด ์์จ์ฑ์ ์ํ์ฌ ์ ์ฐ๊ทผ๋ฌด์ ๋๋ฅผ ์ด์ํ๊ณ ์์ต๋๋ค.
์ ๋ฌด ํจ์จ์ ๋์ผ ์ ์๋ ์พ์ ํ ๊ทผ๋ฌดํ๊ฒฝ์ ์ ๊ณตํฉ๋๋ค.(๊ฐ์ ์คํ ์ด์ , ์๋ง์์, ํ๋จผ๋ฐ๋ฌ ๋ฑ)
๊ทผ๋ฌด์ ํ์ํ ์ฅ๋น๋ฅผ 500๋ง์ ์์ฐ ๋ด์ ์์ ๋กญ๊ฒ ์ ํํ์ค ์ ์์ต๋๋ค.
์ ๋ฌด ๊ด๋ จ ์ํํธ์จ์ด, ๋์, ์๋ฃ, ๊ต์ก ๋ฐ ์ดํ ์๊ฐ๋น ๋ฑ ์ฑ์ฅ์ ํ์ํ ๋น์ฉ์ ์ง์ํด๋๋ฆฝ๋๋ค.
๊ฑด๊ฐ์ ์ํ ์ด๋๋น, ์ง์ฅ ๋จ์ฒด๋ณดํ ๋ฐ ์ข ํฉ๊ฑด๊ฐ๊ฒ์ง์ ์ง์ํด๋๋ฆฝ๋๋ค.
Requirements
ํ์ ์ฌํญ
๊ด๋ จ ๋ถ์ผ ์์ฌ ์ด์์ ํ์
LLM ์๊ณ ๋ฆฌ์ฆ/๋ฐ์ดํฐ ์ฐ๊ตฌ/๊ฐ๋ฐ ๊ฒฝํ
LLM Post-training ๊ฒฝํ
๋ค์ํ ํ์ ํ๊ฒฝ์์ ์ผํ ์ ์๋ ๋ฅ๋ ฅ
ํ๋ฅญํ ์์ฌ ์ํต ๋ฅ๋ ฅ
์ฐ๋ ์ฌํญ
๋๊ท๋ชจ ๋ชจ๋ธ ํ์ต์ ์ํ ํ๋ ์์ํฌ ์ฌ์ฉ ๊ฒฝํ (e.g. DeepSpeed)
LLM ๊ธฐ๋ฐ ์ ํ ๊ฐ๋ฐ ๊ฒฝํ
LLM Post-training์ ์ํ ๋ฐ์ดํฐ ์์ง, ์ ์ , ๋ฐ annotation ๊ฒฝํ
AI ๋ฐ NLP ๊ด๋ จ ๊ตญ์ ํํ์์ 1์ ์ ํน์ ๊ต์ ์ ์๋ก ์ถํ ๊ธฐ๋ก
E.g. NeurIPS, ICML, ICLR, ACL, NAACL, EMNLP, AAAI, CVPR, ICCV, ECCV ๋ฑ
๊ตญ์ ํน์ ๊ตญ๋ด AI ๋ํ (Kaggle ๋ฑ) ์์๊ถ ์ ์
๊ธ๋ก๋ฒ ๊ณ ๊ฐ ๋์์ ์ํ ์์ด ์ปค๋ฎค๋์ผ์ด์ ๋ฅ๋ ฅ
*๊ด๋ จ ๋ฌธ์์ฌํญ์ joinstage@upstage.ai๋ก ๋ฌธ์ ๋ถํ๋๋ฆฝ๋๋ค.
*CV๋ฅผ ํฌํจํ ๋ชจ๋ ์ ์ถ ์๋ฃ๋ PDF ํ์์ผ๋ก ์
๋ก๋ ํด์ฃผ์๊ธฐ ๋ฐ๋๋๋ค.
*์ง์์์ ๋ฏผ๊ฐ ์ ๋ณด(์ฐ๋ด ์ ๋ณด, ์ฃผ๋ฏผ๋ฒํธ ๋ฑ) ๋ฐ ๊ณ ์ ์๋ณ๋ฒํธ๋ ์ด๋ ฅ์์ ๊ธฐ์ฌํ์ง ์๋๋ก ์ ์ํด์ฃผ์๊ธฐ๋ฅผ ๋ฐ๋๋๋ค.
or
All done!
Your application has been successfully submitted!