하이퍼클로바는 블로그, 지식iN, 뉴스 등 수천만이 이용하는 네이버 서비스 내의 양질의 방대한 한국어 데이터를 기반으로 텍스트에 포함된 다양한 표현들을 스스로 인식하고 긴 문장을 요약하거나 새로운 문장을 생성하는 데 뛰어난 능력을 보이고 있다. 하이퍼클로바는 이미 네이버 검색, 쇼핑, 클로바노트 등 다양한 서비스에 적용돼 사용자에게 차별화된 경험을 제공하고 있다.
먼저 대용어가 포함된 연속발화의 범위가 확대돼 주어가 생략된 연속 대화에서도 자연스러운 음성검색이 가능해졌다. 기존 음성검색에서는 날씨, 번역 등 일부 시나리오에 한해 대용어 포함 연속발화가 가능했다면 하이퍼클로바 적용 후에는 주제와 관계없이 모든 질의의 전후 맥락을 파악해 끊김 없는 검색 흐름을 제공한다.
예를 들어 "코로나 확진자 수"라고 검색 후 연이어 "미국은 몇 명이야?"로 질문하면, 미국 인구 수가 아닌 미국 내 코로나 확진자 수를 검색 결과로 보여준다. 또 "분당구 보건소"를 검색하고 "거기 가는 길 알려줘"라고 연속 질문하면 현재 위치에서 목적지까지 가는 길을 교통수단 별로 안내하는 식이다.
이어 긴 구어체나 이해하기 어려운 질의도 키워드형 질의로 자동 요약·변환시켜 네이버 컨텐츠 검색, 지식스니펫 등 정답형 검색결과를 바로 찾아주는 방식으로 개선됐다. 예를 들어 "메이저리그 LA 다저스가 어떻게 되십니까"라고 다소 모호하게 질문해도 "LA 다저스 경기 일정"으로 질의를 변환하고 해당 정보를 안내한다.
또 사용자가 검색어를 명확히 알지 못해 서술형으로 풀어서 발화해도 적절한 질의를 자동으로 추천해 주기 때문에 "배를 타고 바다위를 다니는 것"이라고 질문하면 하이퍼클로바가 "크루즈 여행"이라는 질의를 추천해 다양한 검색결과를 찾아준다.
이 밖에 하이퍼클로바가 적용된 음성검색에서는 음성인식 오류나 무의미어가 포함된 질의에 대해서도 자연스러운 문장을 학습한 결과를 토대로 정확한 질의로 변환 후 검색결과를 안내한다. 또 네이버는 음성검색에 하이퍼클로바뿐 아니라 자체 개발한 서비스 필터도 함께 적용해 하이퍼클로바가 사용자의 발화를 잘못 인식하거나 부정확한 답변 생성 가능성까지 최소화했다.
여용준 글로벌이코노믹 기자 dd0930@g-enews.com