
AI Research Engineer - Document AI
- Remote
- Yongin-si, ๊ฒฝ๊ธฐ๋, ๋ํ๋ฏผ๊ตญ
- AI Research Engineering
Description
์ ์คํ ์ด์ง๋ AI ๊ธฐ์ ์ ํ์ฉํ์ฌ ๋น์ฆ๋์ค ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๋ฐ ์ฃผ๋ ฅํ๊ณ ์์ต๋๋ค. โMaking AI Beneficialโ ์ด๋ผ๋ ๋น์ ๊ณผ โBuilding intelligence for the future of workโ ๋ผ๋ ๋ฏธ์ ์ ๋ฐํ์ผ๋ก, ๋จ์ํ ์ ๋ฌด ์๋ํ๋ฅผ ๋์ด์ ๋ณต์กํ ์์ฌ๊ฒฐ์ ์ง์ ๋ฐ ๋น์ฉ ์ ๊ฐ์ ํตํด ๊ธฐ์ ์ ์์ฐ์ฑ์ ์ฆ์ง์ํฌ ์ ์๋ AI ์ ํ๊ณผ ์๋ฃจ์ ์ ์ ๊ณตํฉ๋๋ค. ์ด๋ฅผ ํตํด ์ฐ๋ฆฌ๋ ๊ธฐ์ ๋ค์ด ์ ๋ฌด ์ฒ๋ฆฌ ๋ฐฉ์์ ํ์ ํ๊ณ ๋์ฑ ํจ์จ์ ์ผ๋ก ์ฑ์ฅํ ์ ์๋๋ก ์ง์ํฉ๋๋ค.
์ ์คํ ์ด์ง๋ ๋๊ตฌ๋ ์์ฝ๊ฒ AI ๊ธฐ์ ์ ํ์ฉํ ์ ์๋๋ก โ์ฌ์ฉ์ด ์ฌ์ด AI ์๋ฃจ์ โ์ ์ ๊ณตํ๋ ๊ฒ์ ๋ชฉํ๋ก ํ๊ณ ์์ต๋๋ค. ์ด๋ฏธ ์ต๊ณ ์์ค์ OCR ๊ธฐ์ ๊ณผ ๋ฌธ์ ๋ด ์๋ฏธ ์๋ ์ ๋ณด๋ฅผ ์๋์ผ๋ก ์ถ์ถํ๋ Key-Value ์ถ์ถ ๊ธฐ์ ์ ๋ณด์ ํ๊ณ ์์ผ๋ฉฐ, ์ต๊ทผ์๋ ๋ค์ํ ๋ฌธ์ ๋ ์ด์์์ ๋ถ์ํ๋ Document Parsing ๋ชจ๋ธ์ ๊ณต๊ฐํ์์ต๋๋ค. ์ด๋ฌํ ๊ธฐ์ ๋ค์ ๋ฐํ์ผ๋ก, ์ ์คํ ์ด์ง๋ ๊ธฐ์ ๋ค์ ์ ๋ฌด ํจ์จ๊ณผ ์์ฐ์ฑ์ ๊ทน๋ํํ๋ ๋ง์ถคํ AI ์๋ฃจ์ ์ ์ ๊ณตํ์ฌ AI๊ฐ ์ค์ ๋น์ฆ๋์ค์์ ํฐ ๊ฐ์น๋ฅผ ์ฐฝ์ถํ ์ ์๋๋ก ๋ ธ๋ ฅํ๊ณ ์์ต๋๋ค.
๋ํ LLM ๊ธฐ์ ์ ๋น์ฆ๋์ค ํ๊ฒฝ์ ๋ง๊ฒ ์ต์ ํํด ๊ธฐ์ ๋ค์ ์ ๋ฌด ํจ์จ๊ณผ ์์ฐ์ฑ์ ๋์ผ ์ ์๋ Private LLM ์๋น์ค๋ฅผ ์ ๊ณตํ๋ ๋ฑ AI๊ฐ ์ธ์์ ์ด๋กญ๊ฒ ์ฐ์ด๊ฒ ํ๊ธฐ ์ํด ์ธ๊ณ ์ต๊ณ ์์ค์ AI ๋ชจ๋ธ์ ๋ค์ํ ๋ถ์ผ์์ ์์ฝ๊ฒ ํ์ฉํ ์ ์๋ API ์๋ฆฌ์ฆ๋ฅผ ์ถ์ํ์ฌ ๊ธฐ์ ๊ณ ๊ฐ๋ค์ ๋น์ฆ๋์ค ์ฑ๊ณต์ ๊ธฐ์ฌํ๊ณ ์์ต๋๋ค. ๊ทธ ์ค์์ ์ ์คํ ์ด์ง Document AI๋ ์ธ๊ณ ์ต๊ณ ์์ค์ OCR ๋ฐ ์ ๋ณด์ถ์ถ ๊ธฐ์ ๋ ฅ์ ๋ฐํ์ผ๋ก ํ ์ ํ์ผ๋ก, AI๋ฅผ ํตํด ๋ฒ๊ฑฐ๋ก์ด ๋ฌธ์ ์ฒ๋ฆฌ๋ฅผ ์๋ํํ๊ณ ํจ์จํํ๊ฒ ๋ค๋ ๋ชฉํ๋ฅผ ๊ฐ์ง๊ณ ์์ต๋๋ค.
์ ์คํ ์ด์ง์ AI Research Engineer๋ Vision ๋ชจ๋ธ์ ํ์ฉํด ์ธ๊ณ ์ต๊ณ ์์ค์ OCR(๊ดํ ๋ฌธ์ ์ธ์), ๋ฌธ์ ๊ตฌ์กฐ ๋ถ์(Document Parsing), ๊ทธ๋ฆฌ๊ณ Key-Value ์ถ์ถ(Key-Value Supervision) ๊ธฐ์ ์ ๊ฐ๋ฐํ๋ ์ญํ ์ ๋งก์ต๋๋ค. ์ด๋ฅผ ํตํด ๋์ฑ ์ ๊ตํ๊ณ ๊ณ ๋ํ๋ ๋ฌธ์ ์ดํด ๋ฐ ์ ๋ณด ์ถ์ถ ์๋ฃจ์ ์ ์ ๊ณตํ์ฌ ๋ค์ํ ์ฐ์ ์ ๋น์ฆ๋์ค ํ๊ฒฝ์ ๊ธฐ์ฌํ๋ ๊ฒ์ ๋ชฉํ๋ก ํฉ๋๋ค. ์ด๋ฌํ ๋ชฉํ๋ฅผ ์คํํ๊ธฐ ์ํด, Vision ๋ถ์ผ์ ๊น์ ์ ๋ฌธ์ฑ๊ณผ LLM ๊ธฐ์ ์ ๋ํ ์ดํด๋ฅผ ๊ฐ์ถ ์ธ์ฌ๋ฅผ ์ฐพ๊ณ ์์ต๋๋ค.
์ฃผ์ ์ ๋ฌด
DocumentAI Vision ๋ชจ๋ธ ์ฐ๊ตฌ ๋ฐ ๊ฐ๋ฐ
๊ณ ๊ฐ์ ๋ฌธ์ ๋ฅผ ์ดํดํ๊ณ , ๊ทธ๋ฅผ ๊ฐ์ฅ ํจ๊ณผ์ ์ผ๋ก ํด๊ฒฐํ๊ธฐ ์ํ ๊ฐ์ค ์ ์ ๋ฐ ๊ฒ์ฆ์ ์ํ
์ ํ์ ์๊ตฌ ์ฌํญ์ ์ดํดํ๊ณ ์ด๋ฅผ ๊ฐ๋ฐ ๋ชฉํ ๋ฐ ์ฐ๊ตฌ ๊ณผ์ ๋ก ๋ณํ
๋ชจ๋ธ ์ฑ๋ฅ์ ๋ํ ๊ฐ๊ด์ ์ธ ๋ฉํธ๋ฆญ ์ ์ ๋ฐ ์ธก์
๊ทผ๋ฌด ํํ
์ ๊ท์ง/์ธํด(3๊ฐ์~6๊ฐ์)
๋ชจ์ง ์ ์ฐจ - ์ ์ฒด ์จ๋ผ์ธ์ผ๋ก ์งํ
์๋ฅ ์ ํ
์๊ณ ๋ฆฌ์ฆ ์ฝ๋ฉ ํ ์คํธ
๋ฅ๋ฌ๋ ์ฝ๋ฉํ ์คํธ
๊ธฐ์ ์ธํฐ๋ทฐ (1์ฐจ)
๊ธฐ์ ์ธํฐ๋ทฐ (2์ฐจ)
์ปฌ์ฒ ์ธํฐ๋ทฐ
์ต์ข ์ธํฐ๋ทฐ
์ต์ข ๊ฒฐ๊ณผ ๋ฐํ
*์ ์ฐจ๋ ์ํฉ์ ๋ฐ๋ผ ์กฐ์ ๋ ์ ์์ต๋๋ค.
*์ต์ข
์ธํฐ๋ทฐ ํ, ๋ ํผ๋ฐ์ค ์ฒดํฌ ์ ์ฐจ๊ฐ ์งํ๋ ์ ์์ต๋๋ค.
๊ทผ๋ฌดํ๊ฒฝ
Anywhere On Earth But Together! โ์ด๋์๋ โ ํจ๊ป ์ผํ ์ ์์ต๋๋ค.
์๊ฒฉ ๊ทผ๋ฌด์ ํ์ํ ์ฅ๋น๋ฅผ 500๋ง์ ์์ฐ ๋ด์ ์์ ๋กญ๊ฒ ์ ํํ์ค ์ ์์ต๋๋ค.
๊ทผ๋ฌด๋ฅผ ์ํ ์นดํ ์ด์ฉ ์ ์๋ฃ ๋น์ฉ, ์คํฐ๋๋ฃธ ํน์ ๊ณต์ ์คํผ์ค ์ด์ฉ ๋น์ฉ ๋ฑ์ ์ง์ํด๋๋ฆฝ๋๋ค.
์ ๋ฌด ๊ด๋ จ ์ํํธ์จ์ด, ๋์, ์๋ฃ, ๊ต์ก ๋ฐ ์ดํ ์๊ฐ๋น ๋ฑ ์ฑ์ฅ์ ํ์ํ ๋น์ฉ์ ์ง์ํด๋๋ฆฝ๋๋ค.
๊ฑด๊ฐ์ ์ํ ์ด๋๋น, ์ง์ฅ ๋จ์ฒด๋ณดํ ๋ฐ ์ข ํฉ๊ฑด๊ฐ๊ฒ์ง์ ์ง์ํด๋๋ฆฝ๋๋ค.
Requirements
ํ์ ์ฌํญ
๊ด๋ จ ๋ถ์ผ ์์ฌ ํ์
AI ๋ฌธ์ ๋ฅผ ์ ์ํ๊ณ ํด๊ฒฐํ๋ ๋ฅ๋ ฅ
๊ธฐ์ด ๋จธ์ ๋ฌ๋ ์๊ณ ๋ฆฌ์ฆ์ ๋ํ ๊น์ ์ดํด
Python, C++ ๋ฑ์ ์ธ์ด๋ฅผ ํ์ฉํ ๊ฐ๋ ฅํ ํ๋ก๊ทธ๋๋ฐ ๋ฅ๋ ฅ ๋ฐ Linux/Shell ํ์ฉ ๋ฅ๋ ฅ
CV, NLP, LLM ๋ฑ ๊ด์ฌ AI ๋๋ฉ์ธ์ ์ต์ ์๊ณ ๋ฆฌ์ฆ์ ๋ํ ์ดํด
์ฃผ์ ๊ธฐ๊ณ ํ์ต ํ๋ ์์ํฌ์ ๋ํ ๊น์ ์ดํด(์: TensorFlow, PyTorch)
๋ค์ํ ํ์ ํ๊ฒฝ์์ ์ผํ ์ ์๋ ๋ฅ๋ ฅ
ํ๋ฅญํ ์์ฌ ์ํต ๋ฅ๋ ฅ
์ฐ๋ ์ฌํญ
๋๊ท๋ชจ ์์ฉ ML(CV, NLP ๋ฑ) ์ ํ ๊ฐ๋ฐ ๊ฒฝํ
์ต๊ณ ์ AI ์ปจํผ๋ฐ์ค(e.g. NeurIPS, ICML, ICLR, AAAI, CVPR, ICCV, ECCV, ACL, EMNLP, KDD, etc)์์ 1์ ์ ํน์ ๊ต์ ์ ์๋ก ์ถํ ๊ธฐ๋ก
๊ตญ์ ํน์ ๊ตญ๋ด AI ๋ํ (Kaggle ๋ฑ) ์์๊ถ ์ ์
๋๊ท๋ชจ ๋ฐ์ดํฐ๋ก๋ถํฐ AI ๋ชจ๋ธ ํ์ต ๋ฐ ์ถ๋ก ์ ์ํ data/model pipeline์ ๊ฐ๋ฐํ ๊ฒฝํ
AI ๊ด๋ จ ์ฐ๊ตฌ ๋๋ ํ๋ก๋ํธ ๊ฐ๋ฐ์ ๋ฆฌ๋ฉํ ๊ฒฝํ
์๋ก์ด ์ฐ๊ตฌ ํน์ ๊ฐ๋ฐ ๋ฐฉํฅ์ฑ์ ์ ์ํ ์ ์๋ ๋ฅ๋ ฅ
*๊ด๋ จ ๋ฌธ์์ฌํญ์ joinstage@upstage.ai๋ก ๋ฌธ์ ๋ถํ๋๋ฆฝ๋๋ค.
*CV๋ฅผ ํฌํจํ ๋ชจ๋ ์ ์ถ ์๋ฃ๋ PDF ํ์์ผ๋ก ์
๋ก๋ ํด์ฃผ์๊ธฐ ๋ฐ๋๋๋ค.
*์ง์์์ ๋ฏผ๊ฐ ์ ๋ณด(์ฐ๋ด ์ ๋ณด, ์ฃผ๋ฏผ๋ฒํธ ๋ฑ) ๋ฐ ๊ณ ์ ์๋ณ๋ฒํธ๋ ์ด๋ ฅ์์ ๊ธฐ์ฌํ์ง ์๋๋ก ์ ์ํด์ฃผ์๊ธฐ๋ฅผ ๋ฐ๋๋๋ค.
or
All done!
Your application has been successfully submitted!