닫기

글로벌이코노믹

AI 문장 독해력 인간 추월 전 세계 '초긴장'... 알리바바· MS의 AI, 'SQuAD' 언어해독 능력 탁월

공유
7

AI 문장 독해력 인간 추월 전 세계 '초긴장'... 알리바바· MS의 AI, 'SQuAD' 언어해독 능력 탁월

상품 스펙 정보 직접 읽은 후 귀납적 추리 통해 사용자 질문에 응답

미국 스탠포드대학이 주최한 'SQuAD' 문장 독해력 대회에서 인공지능 프로그램이 인간의 독해력을 넘어서는 수준의 점수가 나와 전 세계를 긴장시키고 있다. 자료=글로벌이코노믹이미지 확대보기
미국 스탠포드대학이 주최한 'SQuAD' 문장 독해력 대회에서 인공지능 프로그램이 인간의 독해력을 넘어서는 수준의 점수가 나와 전 세계를 긴장시키고 있다. 자료=글로벌이코노믹
[글로벌이코노믹 김길수 기자] 인공지능(AI)이 과연 "인간을 뛰어 넘을 수 있을까", 아니면 "비슷한 수준까지 도달할 수 있는가"에 대한 연구는 세계 곳곳에서 다양한 방법으로 시도되고 있다.

최근 미국 스탠퍼드대학은 '인간'과 'AI 프로그램'의 현재 수준 차이를 테스트하기 위해 'SQuAD(Stanford Question Answering Dataset)' 문장 독해력 대회를 개최했다. 이 대회에서 인공지능 프로그램이 인간의 독해력을 넘어서는 수준의 점수가 나와 전 세계를 긴장시키고 있다.
특히 이번 대회에서 알리바바와 마이크로소프트(MS)가 개발한 AI 프로그램은 이미 인간의 독해력을 넘어서는 수준으로 평가받았다. 자연어 처리 능력에서 알리바바의 딥 신경망 모델은 테스트에서 82.440을 기록해 인간 참가자가 득점한 82.304를 앞섰다. 또 마이크로소프트의 인공지능 소프트웨어는 82.650으로 최고 점수를 받았으나 테스트에서 정한 소요 시간을 넘겨 2위로 밀려났다. 텐센트와 iFLYTEK(科大讯飞)의 AI 프로그램도 상위권에 이름을 올렸다.

알리바바의 딥 신경망 모델은 테스트에서 82.440을 기록해 인간 참가자가 득점한 82.304를 앞섰다. 자료=SQuAD이미지 확대보기
알리바바의 딥 신경망 모델은 테스트에서 82.440을 기록해 인간 참가자가 득점한 82.304를 앞섰다. 자료=SQuAD
SQuAD 독해력 테스트는 10만개 이상의 질문과 답으로 구성된 500개가 넘는 위키피디아 데이터에서 문제를 발췌하고, AI는 이 중 100자에서 800자 이내의 단문을 이해함으로써 몇 가지 질문에 따른 답을 도출하는 방식으로 진행됐다.

이번에 알리바바는 AI에 계층별 융합 메커니즘에 기초한 딥 신경망 모델을 구축하여 문장을 이해하기 위한 사고, 표시, 통찰력을 학습하도록 프로그램된 ‘알리샤오미(阿里小蜜)를 출전시켰다. 고객이 상품에 대해 일반적인 문제를 물으면, 알리샤오미는 상품 스펙 정보를 직접 읽고 귀납적 추리를 통해 사용자의 질문에 응답함으로써 서비스 효율을 높였다.

알리샤오미는 이미 지난해 11월 11일 광꾼제(솔로데이)와 12월 12일 쌍12(双12) 같은 중국 대형 쇼핑 이벤트에서 큰 역할을 해내면서 주목받았다. 일반적인 질문은 인공 지능 서비스에 맡기고 복잡한 문제만 사람이 직접 해결함으로써 고객 서비스의 업무량을 줄였을 뿐만 아니라 고객도 쇼핑 시 필요한 답변을 받을 수 있게 되었다. 이러한 자연어 대응 기술은 전자상거래 외에도 박물관 안내, 온라인 의료 문제 답변 등에도 응용된다.

마이크로소프트가 자랑하는 어시스턴트 '코타나(Cortana)'와 '샤오빙(小冰)'을 대표적인 예로 들 수 있다. 중국 특색이 강한 샤오빙은 채팅 로봇의 상업적 해결 방안에 대해 응용 범위가 상당히 넓다. 'JD샤오빙(京东小冰)', '중국동방항공샤오빙(东航小冰)', '둔황샤오빙(敦煌小冰)' 등 마이크로소프트의 샤오빙을 탑재한 지능형 고객 시스템은 텍스트, 음성, 의미 식별에 기초하여 여러 번에 걸친 기술 혁신을 통해 자연어에 대한 이해력이 향상되고, 대답 형태도 인간과 점점 가까워지는 답변으로 이미 그 능력을 인정받고 있다.


김길수 기자 gskim@g-enews.com