
AI Research Engineer - LLM Eval
- Remote
- Yongin-si, ๊ฒฝ๊ธฐ๋, ๋ํ๋ฏผ๊ตญ
- Data
Description
์ ์คํ ์ด์ง๋ AI ๊ธฐ์ ์ ํ์ฉํ์ฌ ๋น์ฆ๋์ค ๋ฌธ์ ํด๊ฒฐ์ ์ฃผ๋ ฅํ๋ ๊ธฐ์ ์ผ๋ก, โ"Making AI Beneficial"โ์ด๋ผ๋ ๋น์ ๊ณผ โ"Artificial General Intelligence (AGI) for Work"โ๋ผ๋ ๋ฏธ์ ์ ๊ธฐ๋ฐ์ผ๋ก ์ด์๋ฉ๋๋ค. ๋จ์ํ ์ ๋ฌด ์๋ํ๋ฅผ ๋์ด, ๋ณต์กํ ์์ฌ๊ฒฐ์ ์ง์ ๋ฐ ๋น์ฉ ์ ๊ฐ์ ํตํด ๊ธฐ์ ์ ์์ฐ์ฑ์ ํ์ ์ ์ผ๋ก ํฅ์์ํค๋ AI ์๋ฃจ์ ๊ฐ๋ฐ์ ์ง์คํ๊ณ ์์ต๋๋ค.
์ด๋ฌํ ๋น์ ์คํ์ ์ํด ์ ์คํ ์ด์ง๋ AGI์ ํต์ฌ ๊ธฐ๋ฐ ๊ธฐ์ ์ธ LLM(Large Language Model) ๋ชจ๋ธ์ ์ง์์ ์ผ๋ก ๋ฐ์ ์ํค๊ณ ์์ต๋๋ค. ๊ธฐ์ ๊ฒฝ์๋ ฅ ๊ฐํ๋ฅผ ์ํด โGlobal Frontierโ์์ ์ถ์ ํ๋ ๋ฒค์น๋งํฌ ์งํ๋ฅผ ํตํ์ฌ ๋ชจ๋ธ ์ฑ๋ฅ์ ์ง๋จ ๋ฐ ๊ฐ์ ํ๋ฉฐ, ๋์์ ๊ณ ๊ฐ์ฌ์ ์ค์ ๋์ฆ๋ฅผ ๋ฐ์ํ โWorkspace Benchmark Setโ์ ๊ตฌ์ถํด ๋ชจ๋ธ์ ์ค์ฉ์ฑ๊ณผ ์ฑ๋ฅ์ ๊ทน๋ํ์ ํ์ฉํ๊ณ ์์ต๋๋ค. ์ด๋ฅผ ํตํด ์ ์คํ ์ด์ง๋ ์ฐ์ ํ์ฅ์ ๋ณต์กํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๋์์ ๊ธ๋ก๋ฒ ์์ค์ ๊ธฐ์ ํ์ค์ ์ ๋ํ๊ธฐ ์ํด ๋ ธ๋ ฅํ๊ณ ์์ต๋๋ค.
LLM Eval ํ์ (1) ์ง์/์ถ๋ก ๋ฅ๋ ฅ, (2) ์ธ๊ฐ ์ ํธ๋ ์ ๋ ฌ(human preference alignment), (3) ์์ด์ ํธํ ๋๊ตฌ ํ์ฉ(agentic tool use) ๋ถ์ผ์ ์ฑ๋ฅ ํ๊ฐ โ๋ฒค์น๋งํฌ ๋ฐ ํดํทโ์ ์ฐ๊ตฌยท๊ฐ๋ฐํ๋ฉฐ, ๊ธ๋ก๋ฒ ํ๋ก ํฐ์ด LLM๋ค์ด ์ฃผ๋ชฉํ๋ ๋ฒค์น๋งํฌ ๋ํฅ์ ์ค์๊ฐ ๋ชจ๋ํฐ๋งํด Solar์ ๊ธฐ์ ์ ๋ต์ ๋ถํฉํ๋ ํ๊ฐ ์ฒด๊ณ๋ฅผ ๊ตฌ์ถํฉ๋๋ค. ๋ฒค์น๋งํฌ ๊ฐ๋ฐ์ โ ๋ค๊ตญ์ด(ํ๊ตญ์ด ํฌํจ) ํ๊ฐ ๋ฐ์ดํฐ์ ์ธ์ด ํธํฅ์ฑ ํด์, โก ๋ฌธํยท์ธ์ด ์ดํด๋ ๋ฐ ์ ํธ๋ ์ธก์ ์ ์ํ ๋ฐ์ดํฐ ์ค๊ณ, โข ๊ธฐ์กด ํ๊ฐ ๋ฐ์ดํฐ์ ํ๊ณ ๊ทน๋ณต์ ์ํ ํ์ฅ/์ ๊ท ๊ตฌ์ถ์ ํต์ฌ ๋ชฉํ๋ก ํฉ๋๋ค. ์ด ํ์ ํฉ๋ฅํ๋ค๋ฉด, ํ๋ก ํฐ์ด ๋ชจ๋ธ๊ณผ Solar์ ๋ค๊ฐ์ ์ผ๋ก ํ๊ฐยท์ง๋จํ๋ฉฐ ๋ฐ์ดํฐ ๊ธฐ๋ฐ์ ๊ธฐ์ ๋ก๋๋งต์ ๊ณต๋์ผ๋ก ์ค๊ณํด ๋๊ฐ ์ ์์ต๋๋ค.
Representative projects
Automatic quality assessment system development
Solar safety benchmark development
Solar edge-case (failure or error) benchmark development
Complex structured text generation benchmark development
** ๊ธฐ์ ์ ํ๋ฆ๊ณผ ์ํฉ์ ๋ฐ๋ผ์ ๊ฐ๋ฐํ๋ ํ๋ก์ ํธ๋ ๋ณํํ๋ฉฐ, ํ๋ก์ ํธ๋ ๊ฐ ์์ ์ LLM ๋ชจ๋ธ ๋ฐ์ ์ ๊ฐ์ฅ ์ํฅ๋ ฅ์๋ ๊ธฐ์ ์์์ ์ง์คํฉ๋๋ค.
๊ทผ๋ฌด ํํ
์ ๊ท์ง
์ธํด์ญ(์ ๊ท์ง ์ ํํ, ์ฒดํํ)
๋ชจ์ง ์ ์ฐจ - ์ ์ฒด ์จ๋ผ์ธ์ผ๋ก ์งํ
์๋ฅ ์ ํ
์๊ณ ๋ฆฌ์ฆ ์ฝ๋ฉํ ์คํธ
๊ธฐ์ ์ธํฐ๋ทฐ (1์ฐจ/2์ฐจ)
์ปฌ์ฒ ์ธํฐ๋ทฐ
์ต์ข ์ธํฐ๋ทฐ (์ ๊ท์ง)
์ต์ข ๊ฒฐ๊ณผ ๋ฐํ
*์ ์ฐจ๋ ์ํฉ์ ๋ฐ๋ผ ์กฐ์ ๋ ์ ์์ต๋๋ค.
*ํ์์ ๋ ํผ๋ฐ์ค ์ฒดํฌ ์ ์ฐจ๊ฐ ์งํ๋ ์ ์์ต๋๋ค.
๊ทผ๋ฌดํ๊ฒฝ
Anywhere On Earth But Together! โ์ด๋์๋ โ ํจ๊ป ์ผํ ์ ์์ต๋๋ค.
๊ทผ๋ฌด๋ฅผ ์ํ ์นดํ ์ด์ฉ ์ ์๋ฃ ๋น์ฉ, ์คํฐ๋๋ฃธ ํน์ ๊ณต์ ์คํผ์ค ์ด์ฉ ๋น์ฉ ๋ฑ์ ์ง์ํด๋๋ฆฝ๋๋ค.
์ ๋ฌด ๊ด๋ จ ์ํํธ์จ์ด, ๋์, ๊ต์ก ์๋ฃ ๋ฑ ์ฑ์ฅ์ ํ์ํ ๋น์ฉ์ ์ง์ํด๋๋ฆฝ๋๋ค.
Requirements
ํ์ ์ฌํญ
Strongly wanted
AI ๋ชจ๋ธ ํ๊ฐ ๋ฐ ๋ถ์ ๊ด๋ จ ํ ํฝ์ผ๋ก ๊ตญ์ ํํ์์ ์ถํ ๊ธฐ๋ก (๊ณต์ ์ ํฌํจ)
๋๋ ML๊ณผ NLP ํ ํฝ์ผ๋ก ๊ตญ์ ํํ์์ ์ถํ ๊ธฐ๋ก (1์ ์ ํน์ ๊ต์ ์ ์)
May helpful
AI ๋ชจ๋ธ ํ๊ฐ๋ฅผ ์ํ ๋ฐ์ดํฐ ์์ง, ์์ฑ, ์ ์ ๋ฑ์ ์ํํด ๋ณธ ๊ฒฝํ
Agentic flow (w/ tool use)๋ฅผ ์ค๊ณ ๋ฐ ๊ฐ๋ฐํด๋ณธ ๊ฒฝํ
Failure analysis๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ํ๋ํ๋ ๋ค์ฌ๋ค ๋ณด๊ณ ์ธ์ฌ์ดํธ๋ฅผ ์ป์ ์ ์๋ ์ง์ค๋ ฅ
๋ ผ๋ฆฌ์ ์ธ ์ฌ๊ณ ์คํ์ ์ํํ๊ณ ๊ฐ์ค/๊ฒ์ฆ์ ๋ฐฉ์์ผ๋ก ์คํ ์ค๊ณ ๋ฐ ๊ฒฐ๊ณผ๋ฅผ ๋์ถํ ์ ์๋ ์ฌ๊ณ ๋ ฅ
๋ณต์กํ ๋ฐ์ดํฐ ํ์ ํ๋กํ ์ฝ (๊ท์น) ์ ์ ๋ํ ์ ์๋ ์์คํ ์ ์ฌ๊ณ ๋ฅ๋ ฅ
๋ ์จ๋ฐ์ ํจ๊ณผ์ ์ด๊ณ ํจ์จ์ ์ผ๋ก ์ ํํ๊ณ ๋ ผ์ํ ์ ์๋ ์์ฌ์ํต ๋ฅ๋ ฅ
์ฐ๋ ์ฌํญ
LLM์ ํ์ฉํ ์ ํ ๊ฐ๋ฐ ๋๋ ์ด์ ๊ฒฝํ์ด ์์ผ์ ๋ถ
AI ๋ชจ๋ธ๋ง ๊ฒฝํ์ด ์์ผ์ ๋ถ
์ปดํจํฐ๊ณตํ ์ง์ (Data Structure & Algorithm, Computer Network, Database, OS ๋ฑ)์ ๋ณด์ ํ์ ๋ถ
*๊ด๋ จ ๋ฌธ์์ฌํญ์ joinstage@upstage.ai๋ก ๋ฌธ์ ๋ถํ๋๋ฆฝ๋๋ค.
*CV๋ฅผ ํฌํจํ ๋ชจ๋ ์ ์ถ ์๋ฃ๋ ๋ฐ๋์ PDF ํ์์ผ๋ก ์
๋ก๋ ํด์ฃผ์๊ธฐ ๋ฐ๋๋๋ค.
*์ง์์์ ๋ฏผ๊ฐ ์ ๋ณด(์ฐ๋ด ์ ๋ณด, ์ฃผ๋ฏผ๋ฒํธ ๋ฑ) ๋ฐ ๊ณ ์ ์๋ณ๋ฒํธ๋ ์ด๋ ฅ์์ ๊ธฐ์ฌํ์ง ์๋๋ก ์ ์ํด์ฃผ์๊ธฐ๋ฅผ ๋ฐ๋๋๋ค.
or
All done!
Your application has been successfully submitted!