과기부 '독자 파운데이션 모델' 사업 일환
이미지 확대보기배키는 과학기술정보통신부가 선정한 독자 AI 파운데이션 모델 프로젝트의 일환으로 개발됐다. 10조 토큰 규모의 방대한 데이터를 학습했으며 토크나이저 어휘 중 20%를 한국어에 할당했다. 이를 통해 한글 자모 조합은 물론 고어(옛 언어)까지 처리할 수 있는 것이 특징이다.
NC AI에 따르면 배키는 기존의 하이엔드급 LLM(대규모 언어 모델) GPT-OSS-120B와 비교했을 때 한국어 주요 벤치마크 3종에서 평균 101%의 우세한 성능을 보였다.
한국어 외 글로벌 벤치마크에서도 지표 평균 기준 메타 '라마4 스카우트' 대비 약 1.9배, 특히 지시 이행 능력(IFEval) 측면에선 265%, 박사 수준 추론능력(HLE) 영역에서 137%의 성능 수치를 기록했다. 배키의 성능에 주목한 미국 비영리 연구기관 에포크AI는 배키를 '주목할 만한 AI 모델'로 선정했다.
이연수 NC AI 대표는 "배키는 단순히 글로벌 기술을 따라잡는 것을 넘어 대한민국의 주력 산업이 AI를 무기 삼아 글로벌 시장을 선도하게 만드는 전략적 자산이 될 것"이라며 "산업 현장에서 실제로 가치를 창출하는 소버린 AI 생태계를 구축해 나가가겠다"고 말했다.
이원용 글로벌이코노믹 기자 wony92kr@naver.com
































