매개변수 1000억개…중국어 처리, 고급 추론, 장문 생성에 특화

훈위안은 중국 선전에서 지난 7일 열린 텐센트의 연례 콘퍼런스 '글로벌 디지털 에코시스템 서밋'에서 공식적으로 공개됐다. '도슨 통' 통타오상 텐센트 클라우드 스마트 인더스트리 비즈니스 그룹 대표, 장제 텐센트 부사장 등이 연사로 나서 훈위안에 대해 소개했다.
훈위안은 1000억 개 이상 매개변수(파라미터), 2조개 이상의 토큰을 사전 학습했다. 매개변수만 놓고 보면 네이버 '하이퍼클로바X'의 2040개, 챗GPT의 근간 기술 GPT-3.5의 1750억개, 보다 최신 기술인 GPT-4의 약 1조개(추산치)에 비하면 적은 수치다.
텐센트 측은 훈위안의 장점으로 중국어 처리 능력, 고급 논리 추론, 장문의 텍스트 도출 등을 들었다. 또 사측의 소셜 미디어 QQ, 클라우드 컴퓨팅, 게임, 광고 등 다양한 사업분야에 걸쳐 실전적인 데이터를 확보했다고 설명했다.
훈위안이 적용된 대표적인 서비스로는 △사용자의 일상적 언어를 이해해 회의 자료 준비, 기록 작성 등을 수행하는 '텐센트 회의(Meeting)' △클릭 한 번에 표준 텍스트 파일을 생성 가능한 '텐센트 문서(Docs)' △쇼핑 가이드는 물론 광고 콘텐츠 지원 등 B2B(기업 간 비즈니스) 분야까지 아우르는 '텐센트 광고(Advertising)' 등을 들었다.
텐센트는 훈위안을 중국 내 기업들에게 선제 공개한 후 해외 사업으로도 연계해나갈 계획이다. 일본·동남아시아·중동·유럽 등 세계 각지에서 1만1000여 파트너사를 보유한 텐센트 클라우드가 중심이 될 전망이다.
통타오상 텐센트 클라우드 스마트 인더스트리 비즈니스 그룹 대표는 "훈위안은 초거대 AI 모델로서 보유한 놀라운 기능들을 갖고 있다"며 "운영 효율성, 비용 절감은 물론 개인정보, 기업의 기밀 데이터 보호에 이르기까지 현실적 니즈를 최대한 반영한 서비스를 선보이겠다"고 전했다.
이원용 글로벌이코노믹 기자 wony92kr@naver.com