닫기

글로벌이코노믹

“구글알파고나 IBM왓슨 훨씬 앞섰다...공개 대결해 보자”

공유
24

“구글알파고나 IBM왓슨 훨씬 앞섰다...공개 대결해 보자”

음성통역 엔진개발한 신한진 AI코퍼스 사장

[글로벌이코노믹 이재구 기자] “음성 인공지능(AI)구현을 위해서는 하늘의 별만큼이나 많은 말을 필요로 합니다. 저희는 이 문제를 해결해 주는 알고리즘 기술을 확보했습니다. 언제든 좋습니다. 그 유명한 구글 알파고나 한글을 공부하고 있다는 IBM의 왓슨, 그리고 네이버의 파파고나 에트리의 엑소브레인과 동시에 공개 비교 검증 대결을 제안합니다. 우리가 개발한 음성 통번역 엔진 테스트결과 이미 이들을 앞지르는 엄청난 성능을 보여주고 있기 때문이죠.”

25일 한국번역학회 주최로 국회 제1세미나실에서 열린 ‘한국형 인공지능 음성인식 및 번역시스템 개발’ 세미나에 참석한 신한진 AI코퍼스 대표의 말이다. 그는 이날 병렬 코퍼스(Parrel Corpus,병렬말뭉치)기술을 기반으로 한 세계에서 가장 정확하고 빠른 한-영 AI통역엔진 개발에 성공했다고 주장했다. 또 지난 20년간 150억원의 자금을 투입해 통번역의 핵심인 말뭉치, 즉 코퍼스(Corpus)를 자동형성해 주고 즉각 통역을 해주는 AI 엔진과 기술을 확보할 수 있었다고 밝혔다.
25일 한국번역학회 주최로 국회 제1세미나실에서 열린 ‘한국형 인공지능 음성인식 및 번역시스템 개발’세미나에 참석한 신한진 AI코퍼스 대표가 병렬 코퍼스(Parrel Corpus,병렬말뭉치)기술을 기반으로 한 세계에서 가장 정확하고 빠른  한-영 음성AI엔진 개발에 성공했다고 발표했다. 사진=글로벌이코노믹이미지 확대보기
25일 한국번역학회 주최로 국회 제1세미나실에서 열린 ‘한국형 인공지능 음성인식 및 번역시스템 개발’세미나에 참석한 신한진 AI코퍼스 대표가 병렬 코퍼스(Parrel Corpus,병렬말뭉치)기술을 기반으로 한 세계에서 가장 정확하고 빠른 한-영 음성AI엔진 개발에 성공했다고 발표했다. 사진=글로벌이코노믹
신 대표는 구글이나 IBM을 능가할 수 있게 된 것은 병렬코퍼스 엔진과 기술을 확보해 이들의 모노랭귀지 기반 시스템의 단점을 해소했기 때문이라고 설명했다. 음성통역용 AI엔진 개발에 필수 요소라고 강조하는 말뭉치는 그동안 언어학자들의 영역이었다. 하지만 기계가 인간의 말을 통역하고 번역해주는 시대를 맞자 언어영역은 IT영역에서도 주된 연구과제가 되기 시작했다.

그는 우리나라 미래과학창조부 주도로 진행중인 음성인식 프로젝트 역시 수학, 기계 추리, 통계학적 방식으로는 높은 수준의 음성인식 AI를 만들 수 없다고도 주장했다.

“말뭉치를 모르고 음성 AI를 개발한다고 말하면 안 됩니다. 음성 AI는 언어기술 기반으로 개발돼야 하며 따라서 코퍼스 연구 전문가들이 참여해야 합니다.”

말뭉치는 말그대로 한 덩어리로 볼 수 있는 말의 뭉치라는 의미를 갖는다. 컴퓨터가 이해할 수 있도록 텍스트나 말의 형태로 모아놓은 언어 자료를 뜻한다. 즉 컴퓨터에게 대화나 번역 문장같은 언어 상황을 총체적으로 드러내 보여줄 수 있는 자료의 집합체다. 시간이나 공간, 그리고 상대자가 누군지에 따라 다양하게 변화하는 말의 형태 하나하나를 일컫는다.

신한진 대표는 “구글을 비롯한 검색엔진회사들은 통번역시스템으로 알려져 있지만 모두 모노 랭귀지(Mono language)를 다루고 있습니다. 수학적, 기계적, 통계적, 이론적 알고리즘에 바탕한 통번역을 되풀이하고 있습니다. 이 때문에 이들의 엔진은 동음이의어나 의문문도 제대로 인식하지 못하는 겁니다. 의문문 하나 처리 못하는 엔진을 음성 AI라고 할 수 없습니다. 이들 번역이 제대로 되지 못하는 것은 병렬코퍼스 기술 기반이 아니기 때문입니다. 저희가 구글이나 IBM에 감히 대적하자고 나선 것은 병렬코퍼스 엔진과 기술을 확보해 이들 회사의 약점을 모두 해소했기 때문입니다. 일본도 국가차원에서 병렬코퍼스 구축에 연간 1000억원씩 투자하고 있습니다. 우리나라에서도 국립국어연구원이 10년간 수백억원을 들여 말뭉치 DB를 구축해 온 것으로 아는데 진척은 더디기만 합니다. 저희는 50일 만에 6억개의 형태소를 확보했습니다”라며 음성통역 AI개발에서 병렬코퍼스가 차지하는 중요성에 대해 설명했다.

신한진 대표는 “한국어는 세계에서 가장 과학적으로 표현되는 대단한 언어이기도 하지만 세상에서 가장 어려운 비선형적 구조를 가진 별난 언어이기도 하다”고 말했다. 이 때문에 한국어와 영어 통번역이 가능해지면 전세계 언어 통번역시스템 시장을 제패할 수 있다고 말했다.
그는 “구글이나 IBM이 한국기업에게 통번역 인공지능(AI)에 사용할 말뭉치를 팔라고 요청하게 만들어야 하지 않겠습니까?”라고 말했다. 그만큼 자신있다는 말이었다.

이날 세미나를 주재한 차원용 국가과학기술심의회 ICT위원은 “뭐가 됐든 95%이상의 통번역률을 보이는 음성인식 AI를 찾아보자”고 말했다.

이날 행사에는 미래부 산하 정보통신기술진흥센터 관계자들도 참석했지만 끝까지 자리를 지키지 못했고 신한진 대표의 통번역AI 성과 발표내용은 정부관계자들에게 전달되지 못했다.

한편 미래과학창조부와 삼성전자·현대자동차·SK텔레콤·KT·LG전자·네이버·한화생명 등 7개 민간기업은 각각 30억원씩 총 210억원을 출자해 '지능정보기술연구원(AIRI)'을 출범시키기로 했고 오는 10월 출범을 앞두고 있다. AIRI는 초기 5년간 총 750억원의 정부 지원을 받아 기업들이 활용할 수 있는 다양한 분야의 실용적인 AI 기술을 비롯해 인재육성과 스타트업 지원 등에도 나선다. AIRI는 오는 10월 경기도 판교테크노밸리 글로벌R&D 센터에 둥지를 틀고, 개소식과 함께 대규모 국제컨퍼런스를 개최할 예정이다.
이재구 기자 jklee@