Skip to content

AI Research Engineer - Document AI

  • Remote
    • Yongin-si, ๊ฒฝ๊ธฐ๋„, ๋Œ€ํ•œ๋ฏผ๊ตญ
  • AI Research Engineering

Description

์—…์Šคํ…Œ์ด์ง€๋Š” AI ๊ธฐ์ˆ ์„ ํ™œ์šฉํ•˜์—ฌ ๋น„์ฆˆ๋‹ˆ์Šค ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ๋ฐ ์ฃผ๋ ฅํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. โ€œMaking AI Beneficialโ€ ์ด๋ผ๋Š” ๋น„์ „๊ณผ โ€œBuilding intelligence for the future of workโ€ ๋ผ๋Š” ๋ฏธ์…˜์„ ๋ฐ”ํƒ•์œผ๋กœ, ๋‹จ์ˆœํ•œ ์—…๋ฌด ์ž๋™ํ™”๋ฅผ ๋„˜์–ด์„œ ๋ณต์žกํ•œ ์˜์‚ฌ๊ฒฐ์ • ์ง€์› ๋ฐ ๋น„์šฉ ์ ˆ๊ฐ์„ ํ†ตํ•ด ๊ธฐ์—…์˜ ์ƒ์‚ฐ์„ฑ์„ ์ฆ์ง„์‹œํ‚ฌ ์ˆ˜ ์žˆ๋Š” AI ์ œํ’ˆ๊ณผ ์†”๋ฃจ์…˜์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ์šฐ๋ฆฌ๋Š” ๊ธฐ์—…๋“ค์ด ์—…๋ฌด ์ฒ˜๋ฆฌ ๋ฐฉ์‹์„ ํ˜์‹ ํ•˜๊ณ  ๋”์šฑ ํšจ์œจ์ ์œผ๋กœ ์„ฑ์žฅํ•  ์ˆ˜ ์žˆ๋„๋ก ์ง€์›ํ•ฉ๋‹ˆ๋‹ค.

์—…์Šคํ…Œ์ด์ง€๋Š” ๋ˆ„๊ตฌ๋‚˜ ์†์‰ฝ๊ฒŒ AI ๊ธฐ์ˆ ์„ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๋„๋ก โ€˜์‚ฌ์šฉ์ด ์‰ฌ์šด AI ์†”๋ฃจ์…˜โ€™์„ ์ œ๊ณตํ•˜๋Š” ๊ฒƒ์„ ๋ชฉํ‘œ๋กœ ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฏธ ์ตœ๊ณ  ์ˆ˜์ค€์˜ OCR ๊ธฐ์ˆ ๊ณผ ๋ฌธ์„œ ๋‚ด ์˜๋ฏธ ์žˆ๋Š” ์ •๋ณด๋ฅผ ์ž๋™์œผ๋กœ ์ถ”์ถœํ•˜๋Š” Key-Value ์ถ”์ถœ ๊ธฐ์ˆ ์„ ๋ณด์œ ํ•˜๊ณ  ์žˆ์œผ๋ฉฐ, ์ตœ๊ทผ์—๋Š” ๋‹ค์–‘ํ•œ ๋ฌธ์„œ ๋ ˆ์ด์•„์›ƒ์„ ๋ถ„์„ํ•˜๋Š” Document Parsing ๋ชจ๋ธ์„ ๊ณต๊ฐœํ•˜์˜€์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๊ธฐ์ˆ ๋“ค์„ ๋ฐ”ํƒ•์œผ๋กœ, ์—…์Šคํ…Œ์ด์ง€๋Š” ๊ธฐ์—…๋“ค์˜ ์—…๋ฌด ํšจ์œจ๊ณผ ์ƒ์‚ฐ์„ฑ์„ ๊ทน๋Œ€ํ™”ํ•˜๋Š” ๋งž์ถคํ˜• AI ์†”๋ฃจ์…˜์„ ์ œ๊ณตํ•˜์—ฌ AI๊ฐ€ ์‹ค์ œ ๋น„์ฆˆ๋‹ˆ์Šค์—์„œ ํฐ ๊ฐ€์น˜๋ฅผ ์ฐฝ์ถœํ•  ์ˆ˜ ์žˆ๋„๋ก ๋…ธ๋ ฅํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

๋˜ํ•œ LLM ๊ธฐ์ˆ ์„ ๋น„์ฆˆ๋‹ˆ์Šค ํ™˜๊ฒฝ์— ๋งž๊ฒŒ ์ตœ์ ํ™”ํ•ด ๊ธฐ์—…๋“ค์˜ ์—…๋ฌด ํšจ์œจ๊ณผ ์ƒ์‚ฐ์„ฑ์„ ๋†’์ผ ์ˆ˜ ์žˆ๋Š” Private LLM ์„œ๋น„์Šค๋ฅผ ์ œ๊ณตํ•˜๋Š” ๋“ฑ AI๊ฐ€ ์„ธ์ƒ์— ์ด๋กญ๊ฒŒ ์“ฐ์ด๊ฒŒ ํ•˜๊ธฐ ์œ„ํ•ด ์„ธ๊ณ„ ์ตœ๊ณ  ์ˆ˜์ค€์˜ AI ๋ชจ๋ธ์„ ๋‹ค์–‘ํ•œ ๋ถ„์•ผ์—์„œ ์†์‰ฝ๊ฒŒ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๋Š” API ์‹œ๋ฆฌ์ฆˆ๋ฅผ ์ถœ์‹œํ•˜์—ฌ ๊ธฐ์—… ๊ณ ๊ฐ๋“ค์˜ ๋น„์ฆˆ๋‹ˆ์Šค ์„ฑ๊ณต์— ๊ธฐ์—ฌํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ ์ค‘์—์„œ ์—…์Šคํ…Œ์ด์ง€ Document AI๋Š” ์„ธ๊ณ„ ์ตœ๊ณ  ์ˆ˜์ค€์˜ OCR ๋ฐ ์ •๋ณด์ถ”์ถœ ๊ธฐ์ˆ ๋ ฅ์„ ๋ฐ”ํƒ•์œผ๋กœ ํ•œ ์ œํ’ˆ์œผ๋กœ, AI๋ฅผ ํ†ตํ•ด ๋ฒˆ๊ฑฐ๋กœ์šด ๋ฌธ์„œ ์ฒ˜๋ฆฌ๋ฅผ ์ž๋™ํ™”ํ•˜๊ณ  ํšจ์œจํ™”ํ•˜๊ฒ ๋‹ค๋Š” ๋ชฉํ‘œ๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

์—…์Šคํ…Œ์ด์ง€์˜ AI Research Engineer๋Š” Vision ๋ชจ๋ธ์„ ํ™œ์šฉํ•ด ์„ธ๊ณ„ ์ตœ๊ณ  ์ˆ˜์ค€์˜ OCR(๊ด‘ํ•™ ๋ฌธ์ž ์ธ์‹), ๋ฌธ์„œ ๊ตฌ์กฐ ๋ถ„์„(Document Parsing), ๊ทธ๋ฆฌ๊ณ  Key-Value ์ถ”์ถœ(Key-Value Supervision) ๊ธฐ์ˆ ์„ ๊ฐœ๋ฐœํ•˜๋Š” ์—ญํ• ์„ ๋งก์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๋”์šฑ ์ •๊ตํ•˜๊ณ  ๊ณ ๋„ํ™”๋œ ๋ฌธ์„œ ์ดํ•ด ๋ฐ ์ •๋ณด ์ถ”์ถœ ์†”๋ฃจ์…˜์„ ์ œ๊ณตํ•˜์—ฌ ๋‹ค์–‘ํ•œ ์‚ฐ์—…์˜ ๋น„์ฆˆ๋‹ˆ์Šค ํ™˜๊ฒฝ์— ๊ธฐ์—ฌํ•˜๋Š” ๊ฒƒ์„ ๋ชฉํ‘œ๋กœ ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ชฉํ‘œ๋ฅผ ์‹คํ˜„ํ•˜๊ธฐ ์œ„ํ•ด, Vision ๋ถ„์•ผ์˜ ๊นŠ์€ ์ „๋ฌธ์„ฑ๊ณผ LLM ๊ธฐ์ˆ ์— ๋Œ€ํ•œ ์ดํ•ด๋ฅผ ๊ฐ–์ถ˜ ์ธ์žฌ๋ฅผ ์ฐพ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

์ฃผ์š” ์—…๋ฌด

  • DocumentAI Vision ๋ชจ๋ธ ์—ฐ๊ตฌ ๋ฐ ๊ฐœ๋ฐœ

  • ๊ณ ๊ฐ์˜ ๋ฌธ์ œ๋ฅผ ์ดํ•ดํ•˜๊ณ , ๊ทธ๋ฅผ ๊ฐ€์žฅ ํšจ๊ณผ์ ์œผ๋กœ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•œ ๊ฐ€์„ค ์ œ์‹œ ๋ฐ ๊ฒ€์ฆ์„ ์ˆ˜ํ–‰

  • ์ œํ’ˆ์˜ ์š”๊ตฌ ์‚ฌํ•ญ์„ ์ดํ•ดํ•˜๊ณ  ์ด๋ฅผ ๊ฐœ๋ฐœ ๋ชฉํ‘œ ๋ฐ ์—ฐ๊ตฌ ๊ณผ์ œ๋กœ ๋ณ€ํ™˜

  • ๋ชจ๋ธ ์„ฑ๋Šฅ์— ๋Œ€ํ•œ ๊ฐ๊ด€์ ์ธ ๋ฉ”ํŠธ๋ฆญ ์ •์˜ ๋ฐ ์ธก์ •

๊ทผ๋ฌด ํ˜•ํƒœ

  • ์ •๊ทœ์ง/์ธํ„ด(3๊ฐœ์›”~6๊ฐœ์›”)

๋ชจ์ง‘ ์ ˆ์ฐจ - ์ „์ฒด ์˜จ๋ผ์ธ์œผ๋กœ ์ง„ํ–‰

  • ์„œ๋ฅ˜ ์ „ํ˜•

  • ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์ฝ”๋”ฉ ํ…Œ์ŠคํŠธ 

  • ๋”ฅ๋Ÿฌ๋‹ ์ฝ”๋”ฉํ…Œ์ŠคํŠธ

  • ๊ธฐ์ˆ  ์ธํ„ฐ๋ทฐ (1์ฐจ)

  • ๊ธฐ์ˆ  ์ธํ„ฐ๋ทฐ (2์ฐจ)

  • ์ปฌ์ฒ˜ ์ธํ„ฐ๋ทฐ

  • ์ตœ์ข… ์ธํ„ฐ๋ทฐ 

  • ์ตœ์ข… ๊ฒฐ๊ณผ ๋ฐœํ‘œ

*์ ˆ์ฐจ๋Š” ์ƒํ™ฉ์— ๋”ฐ๋ผ ์กฐ์ •๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
*์ตœ์ข… ์ธํ„ฐ๋ทฐ ํ›„, ๋ ˆํผ๋Ÿฐ์Šค ์ฒดํฌ ์ ˆ์ฐจ๊ฐ€ ์ง„ํ–‰๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๊ทผ๋ฌดํ™˜๊ฒฝ

  • Anywhere On Earth But Together! โ€˜์–ด๋””์„œ๋“ โ€™ ํ•จ๊ป˜ ์ผํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

  • ์›๊ฒฉ ๊ทผ๋ฌด์— ํ•„์š”ํ•œ ์žฅ๋น„๋ฅผ 500๋งŒ์› ์˜ˆ์‚ฐ ๋‚ด์— ์ž์œ ๋กญ๊ฒŒ ์„ ํƒํ•˜์‹ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

  • ๊ทผ๋ฌด๋ฅผ ์œ„ํ•œ ์นดํŽ˜ ์ด์šฉ ์‹œ ์Œ๋ฃŒ ๋น„์šฉ, ์Šคํ„ฐ๋””๋ฃธ ํ˜น์€ ๊ณต์œ ์˜คํ”ผ์Šค ์ด์šฉ ๋น„์šฉ ๋“ฑ์„ ์ง€์›ํ•ด๋“œ๋ฆฝ๋‹ˆ๋‹ค.

  • ์—…๋ฌด ๊ด€๋ จ ์†Œํ”„ํŠธ์›จ์–ด, ๋„์„œ, ์ž๋ฃŒ, ๊ต์œก ๋ฐ ์–ดํ•™ ์ˆ˜๊ฐ•๋น„ ๋“ฑ ์„ฑ์žฅ์— ํ•„์š”ํ•œ ๋น„์šฉ์„ ์ง€์›ํ•ด๋“œ๋ฆฝ๋‹ˆ๋‹ค.

  • ๊ฑด๊ฐ•์„ ์œ„ํ•œ ์šด๋™๋น„, ์ง์žฅ ๋‹จ์ฒด๋ณดํ—˜ ๋ฐ ์ข…ํ•ฉ๊ฑด๊ฐ•๊ฒ€์ง„์„ ์ง€์›ํ•ด๋“œ๋ฆฝ๋‹ˆ๋‹ค.

Requirements

ํ•„์ˆ˜ ์‚ฌํ•ญ

  • ๊ด€๋ จ ๋ถ„์•ผ ์„์‚ฌ ํ•™์œ„

  • AI ๋ฌธ์ œ๋ฅผ ์ •์˜ํ•˜๊ณ  ํ•ด๊ฒฐํ•˜๋Š” ๋Šฅ๋ ฅ

  • ๊ธฐ์ดˆ ๋จธ์‹ ๋Ÿฌ๋‹ ์•Œ๊ณ ๋ฆฌ์ฆ˜์— ๋Œ€ํ•œ ๊นŠ์€ ์ดํ•ด

  • Python, C++ ๋“ฑ์˜ ์–ธ์–ด๋ฅผ ํ™œ์šฉํ•œ ๊ฐ•๋ ฅํ•œ ํ”„๋กœ๊ทธ๋ž˜๋ฐ ๋Šฅ๋ ฅ ๋ฐ Linux/Shell ํ™œ์šฉ ๋Šฅ๋ ฅ

  • CV, NLP, LLM ๋“ฑ ๊ด€์‹ฌ AI ๋„๋ฉ”์ธ์˜ ์ตœ์‹  ์•Œ๊ณ ๋ฆฌ์ฆ˜์— ๋Œ€ํ•œ ์ดํ•ด

  • ์ฃผ์š” ๊ธฐ๊ณ„ ํ•™์Šต ํ”„๋ ˆ์ž„์›Œํฌ์— ๋Œ€ํ•œ ๊นŠ์€ ์ดํ•ด(์˜ˆ: TensorFlow, PyTorch)

  • ๋‹ค์–‘ํ•œ ํ˜‘์—… ํ™˜๊ฒฝ์—์„œ ์ผํ•  ์ˆ˜ ์žˆ๋Š” ๋Šฅ๋ ฅ

  • ํ›Œ๋ฅญํ•œ ์˜์‚ฌ ์†Œํ†ต ๋Šฅ๋ ฅ

์šฐ๋Œ€ ์‚ฌํ•ญ

  • ๋Œ€๊ทœ๋ชจ ์ƒ์šฉ ML(CV, NLP ๋“ฑ) ์ œํ’ˆ ๊ฐœ๋ฐœ ๊ฒฝํ—˜

  • ์ตœ๊ณ ์˜ AI ์ปจํผ๋Ÿฐ์Šค(e.g. NeurIPS, ICML, ICLR, AAAI, CVPR, ICCV, ECCV, ACL, EMNLP, KDD, etc)์—์„œ 1์ €์ž ํ˜น์€ ๊ต์‹ ์ €์ž๋กœ ์ถœํŒ ๊ธฐ๋ก

  • ๊ตญ์ œ ํ˜น์€ ๊ตญ๋‚ด AI ๋Œ€ํšŒ (Kaggle ๋“ฑ) ์ƒ์œ„๊ถŒ ์ž…์ƒ

  • ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ๋กœ๋ถ€ํ„ฐ AI ๋ชจ๋ธ ํ•™์Šต ๋ฐ ์ถ”๋ก ์„ ์œ„ํ•œ data/model pipeline์„ ๊ฐœ๋ฐœํ•œ ๊ฒฝํ—˜

  • AI ๊ด€๋ จ ์—ฐ๊ตฌ ๋˜๋Š” ํ”„๋กœ๋•ํŠธ ๊ฐœ๋ฐœ์„ ๋ฆฌ๋”ฉํ•œ ๊ฒฝํ—˜

  • ์ƒˆ๋กœ์šด ์—ฐ๊ตฌ ํ˜น์€ ๊ฐœ๋ฐœ ๋ฐฉํ–ฅ์„ฑ์„ ์ œ์‹œํ•  ์ˆ˜ ์žˆ๋Š” ๋Šฅ๋ ฅ

*๊ด€๋ จ ๋ฌธ์˜์‚ฌํ•ญ์€ joinstage@upstage.ai๋กœ ๋ฌธ์˜ ๋ถ€ํƒ๋“œ๋ฆฝ๋‹ˆ๋‹ค.

*CV๋ฅผ ํฌํ•จํ•œ ๋ชจ๋“  ์ œ์ถœ ์ž๋ฃŒ๋Š” PDF ํ˜•์‹์œผ๋กœ ์—…๋กœ๋“œ ํ•ด์ฃผ์‹œ๊ธฐ ๋ฐ”๋ž๋‹ˆ๋‹ค.
*์ง€์›์ž์˜ ๋ฏผ๊ฐ ์ •๋ณด(์—ฐ๋ด‰ ์ •๋ณด, ์ฃผ๋ฏผ๋ฒˆํ˜ธ ๋“ฑ) ๋ฐ ๊ณ ์œ ์‹๋ณ„๋ฒˆํ˜ธ๋Š” ์ด๋ ฅ์„œ์— ๊ธฐ์žฌํ•˜์ง€ ์•Š๋„๋ก ์œ ์˜ํ•ด์ฃผ์‹œ๊ธฐ๋ฅผ ๋ฐ”๋ž๋‹ˆ๋‹ค.

or