27일 딥서치에 따르면 자체 인덱스 기반 ETF인 'KINDEX 원자력테마딥서치 ETF(상장지수펀드)'가 오는 28일 상장한다. 지수산출기관 선정 이후 처음 시장에 나오는 상품이다. 앞서 딥서치는 'KODEX 2차전지산업 ETF' 등을 운용사와 공동 개발한 사례가 있으나 단독 지수를 기반으로 한 상품 승인은 이번이 처음이다.
이 같은 기술을 적용할 수 있었던 배경에는 자체 개발한 '딥서치 코어 엔진'이 있다. 일일 10만개, 1990년대 이후 누적된 10억개 이상의 수집 뉴스 대부분이 분석 가능한 이유다. 또 증권사 리포트, 공시, IR자료, 특허 등 여타 문서들도 엔진을 이용한 키워드 추출, 문서 군집 등의 과정을 거친다.
각 문서의 작성 주체가 다른 만큼 그 특징을 반영해 가중치를 부여하는 방식도 적용된다. 기업이 작성하는 특허와 사업보고서에 가중치를 둔다면 원자력 관련 특허를 많이 보유하고 해당 사업을 영위하는 기업을 선정하는 방식이다.
최종 트렌드 선정 작업은 특정 트렌드와 관련된 다수 키워드로 확장하는 방향으로 진행한다. 예를 들면 '원자력'과 관련된 '원전', '원자력발전', '원전해체', '신재생에너지', '탄소' 등 파생 혹은 유사 키워드를 도출한다. 1개의 핵심 키워드와 다수의 확장 키워드를 중심으로 최근 5개 년 이상의 각종 문서들을 검색하며, 이를 바탕으로 최종 기업을 선정한다.
선정 방식으로는 단순 키워드 도출 방식이 아닌 AI 기술 중 하나인 '개체명 인식(NER: Named-Entity Recognition)'을 사용한다. NER은 단어 간 관계와 문맥에 대한 분석을 수행하므로 특정 단어가 의미하는 기업을 정확히 파악할 수 있다.
이를 바탕으로 딥서치는 방대한 자연어 처리가 가능하다. 즉 이용자가 원하는 데이터 확인과 확보에 한계가 없다. 공급자 중심의 데이터 서비스가 아닌 이용자 중심의 데이터 서비스를 구성하고 있다는 장점도 지닌다.
강수지 글로벌이코노믹 기자 ksj87@g-enews.com
[알림] 본 기사는 투자판단의 참고용이며, 이를 근거로 한 투자손실에 대한 책임은 없습니다.