닫기

글로벌이코노믹

파이헬스케어 박정우 책임연구원, IEEE 학회서 멀티모달 이미지 검색 AI 논문 발표

글로벌이코노믹

파이헬스케어 박정우 책임연구원, IEEE 학회서 멀티모달 이미지 검색 AI 논문 발표

㈜파이헬스케어 박정우 책임연구원이 멀티모달 AI 검색 분야의 최신 성과를 담은 논문을 IEEE 주관 국제 학술대회에서 발표했다. 사진=파이너헬스케어이미지 확대보기
㈜파이헬스케어 박정우 책임연구원이 멀티모달 AI 검색 분야의 최신 성과를 담은 논문을 IEEE 주관 국제 학술대회에서 발표했다. 사진=파이너헬스케어
㈜파이헬스케어(대표 이영규)의 박정우 책임연구원이 멀티모달 AI 검색 분야의 최신 성과를 담은 논문을 IEEE 주관 국제 학술대회에서 발표했다. 해당 논문은 이미지 검색 분야의 최신 과제 중 하나인 Zero-Shot Composed Image Retrieval(CIR) 성능 향상을 목표로 하며, 학습 없이 작동하는(training-free) 혁신적 모델 아키텍처를 제안해 실질적인 기술 성과를 입증했다.

박정우 연구원은 현재 파이헬스케어에서 AI 기반 진단 보조 솔루션 ‘닥터아이(DOCTOR EYE)’ 프로젝트의 책임연구원으로 활동하고 있으며, 안과 및 뇌 질환의 조기 진단을 위한 핵심 알고리즘 개발을 주도하고 있다. 앞서 미국인공지능학회(AAAI)에 논문이 채택된 바 있으며, 이번 연구 역시 닥터아이 프로젝트의 핵심 기술 역량을 확장하는 한 축으로서 진행한 학술 성과다.

논문〈Multi-Faceted Chain-of-Thought and Re-Ranking for Training-Free Zero-Shot Composed Image Retrieval〉은 멀티모달 대형언어모델(MLLM)의 추론 능력을 기반으로, 학습 없이도 복합 질의에 따른 이미지 검색 정확도를 향상시키는 프레임워크를 제안했다. 특히, 텍스트 지시 내 명시적 수정 요청과 맥락적 통합 설명을 분리하여 각각 1차 필터링과 2차 재정렬(Re-Ranking)에 활용하는 구조를 통해, 정보 손실을 줄이고 텍스트–이미지 간 정합성 및 추론 신뢰도를 크게 높였다.

이번 논문에서 제안된 MCoT-RE(Multi-Faceted Chain-of-Thought and Re-Ranking)는 FashionIQ, CIRR 등 주요 벤치마크에서 기존 Zero-Shot CIR 기법 대비 최대 8.58%의 성능 향상을 기록했으며, 모델이 생성한 Chain-of-Thought 기반 캡션은 AI 추론 과정을 사람이 이해할 수 있도록 명시화하여 높은 해석 가능성과 설명력을 확보했다.
박정우 연구원은 “이번 연구는 닥터아이 프로젝트로부터 축적된 멀티모달 해석 역량을 일반 비전 AI 영역으로 확장한 시도”라며, “향후 의료영상과 진료 정보 간 융합 해석, 설명 가능한 임상보조 시스템 등 다양한 응용 가능성을 확인한 의미 있는 성과”라고 전했다.


이용수 글로벌이코노믹 기자 piscrait@g-enews.com