딥서치, 핀테크기업 최초 지수 산출 기관 선정…국내 첫 원자력 ETF 출시

자체 코어 엔진 보유…방대한 '자연어' 처리 강점

인공지능(AI) 기반 데이터플랫폼 전문기업 딥서치가 국내 핀테크 기업 최초 지수 산출 기관으로 선정됐다. 자체 개발한 엔진을 기반으로 방대한 '자연어(인간이 사용하는 언어)'를 빠르게 처리 가능하다는 점이 강점이다. 딥서치는 이 같은 기술을 기반으로 국내를 넘어 해외 기업까지 다루는 글로벌 지수 사업자로 성장할 계획이다.

27일 딥서치에 따르면 자체 인덱스 기반 ETF인 'KINDEX 원자력테마딥서치 ETF(상장지수펀드)'가 오는 28일 상장한다. 지수산출기관 선정 이후 처음 시장에 나오는 상품이다. 앞서 딥서치는 'KODEX 2차전지산업 ETF' 등을 운용사와 공동 개발한 사례가 있으나 단독 지수를 기반으로 한 상품 승인은 이번이 처음이다.

딥서치 지수 산출 방식은 기존 전통 산업 분류 방식과 다르다. 현재 금융 시장 트렌드를 가장 잘 반영하는 테마를 발굴코자 AI 기술을 이용했다. 구체적으로는 머신러닝(ML) 기반 클러스터링(clustering, 유사성 데이터 분류)을 활용한다.

이 같은 기술을 적용할 수 있었던 배경에는 자체 개발한 '딥서치 코어 엔진'이 있다. 일일 10만개, 1990년대 이후 누적된 10억개 이상의 수집 뉴스 대부분이 분석 가능한 이유다. 또 증권사 리포트, 공시, IR자료, 특허 등 여타 문서들도 엔진을 이용한 키워드 추출, 문서 군집 등의 과정을 거친다.

각 문서의 작성 주체가 다른 만큼 그 특징을 반영해 가중치를 부여하는 방식도 적용된다. 기업이 작성하는 특허와 사업보고서에 가중치를 둔다면 원자력 관련 특허를 많이 보유하고 해당 사업을 영위하는 기업을 선정하는 방식이다.

최종 트렌드 선정 작업은 특정 트렌드와 관련된 다수 키워드로 확장하는 방향으로 진행한다. 예를 들면 '원자력'과 관련된 '원전', '원자력발전', '원전해체', '신재생에너지', '탄소' 등 파생 혹은 유사 키워드를 도출한다. 1개의 핵심 키워드와 다수의 확장 키워드를 중심으로 최근 5개 년 이상의 각종 문서들을 검색하며, 이를 바탕으로 최종 기업을 선정한다.

선정 방식으로는 단순 키워드 도출 방식이 아닌 AI 기술 중 하나인 '개체명 인식(NER: Named-Entity Recognition)'을 사용한다. NER은 단어 간 관계와 문맥에 대한 분석을 수행하므로 특정 단어가 의미하는 기업을 정확히 파악할 수 있다.

이를 바탕으로 딥서치는 방대한 자연어 처리가 가능하다. 즉 이용자가 원하는 데이터 확인과 확보에 한계가 없다. 공급자 중심의 데이터 서비스가 아닌 이용자 중심의 데이터 서비스를 구성하고 있다는 장점도 지닌다.

김재윤 딥서치 대표는 "원자력 ETF를 시작으로 국내는 물론 글로벌 기업을 모두 다루는 AI 기술 기반 테마 ETF 전문 지수 사업자로 성장하겠다"며 "이같은기술을 기반으로 연내 '다이렉트 인덱싱(Direct Indexing)' 시장도 진출한다"고 말했다.

강수지 글로벌이코노믹 기자 ksj87@g-enews.com

[알림] 본 기사는 투자판단의 참고용이며, 이를 근거로 한 투자손실에 대한 책임은 없습니다.