TV쇼로 5000시간 연습...정확도 46.8%
이미지 확대보기인공지능(AI)이 당신의 입술 모양만을 보고도 무슨말을 하는지 이해하는 세상이 됐다.
지난 3월 이세돌과의 바둑대결을 승리로 이끈 구글의 인공지능(AI) 딥마인드가 이제는 사람의 입술까지 읽어낸다. 그것도 사람 전문가를 능가하는 수준으로.
뉴사이언트스트는 25일 구글의 딥마인드가 이같은 최신 기술을 추가로 습득했으며, 조만간 실생활에 활용될 것이라고 전했다. 구글의 딥마인드프로젝트와 옥스퍼드대가 딥마인드를 BBC의 방송데이터와 접목 시켜 훈련시킨 결과 과학소설(SF)같은 일을 현실로 만들었다.
이에 따르면 딥마인드는 그동안 5000시간 동안이나 TV쇼를 시청하면서 말하는 사람의 입술 모양만으로 그(또는 그녀)가 어떤 말을 하는지 익히는 훈련을 했다. 이 AI시스템은 뉴스나이트, BBC브렉퍼스트, 퀘스천 타임 등 6개의 서로다른 TV프로그램을 가지고 독순술(讀脣術)훈련을 했다.
전체 훈련 영상은 11만 8000개 문장으로 구성돼 있었다. 옥스퍼드대와 딥마인드연구진은 지난 2010년부터 2015년 사이에 방송된 동영상을 가지고 딥마인드를 훈련시켰다. 그리고 나서 올 3월부터 9월 사이에 방송된 동영상으로 독순술 실력을 평가했다.
그 결과 딥마인드는 말하는 사람의 입술 모습만 보고서 정확하게 전체 문장을 알아냈다.
200개의 임의 문장을 가지고 테스트 한 결과 전문 독순술사의 정확도는 12.8%였던 반면, 딥마인드는 46.8%라는 놀라운 성적을 기록했다. 그나마 그 실수도 문장맨 끝의 ‘s’를 빼놓은 것 같은 사소한 것에 불과했다.
남은 문제는 AI의 독순술을 어떻게 활용하느냐 하는 것이다.
이 기술은 가전품 등에 적용돼 사용자의 발음을 더 잘 알아듣는데 사용될 수 있을 것으로 기대되고 있다. 연구진은 이 기술이 또한 청각장애자에게도 도움을 주며 시끄러운 환경에서도 음성을 인식하게 해 줄 것으로 보고 있다.
































