오케스트레이션 벤치마크 자체 개발
LLM의 에이전틱 AI 고도화 트렌드 착안
AI 연구개발 생태계 활성화 위해 오픈소스 공개
LLM의 에이전틱 AI 고도화 트렌드 착안
AI 연구개발 생태계 활성화 위해 오픈소스 공개
이미지 확대보기3일 업계에 따르면 카카오는 최근 대형 언어모델(이하 LLM)이 단순 질의응답을 넘어 이용자가 요구하는 다양한 종류의 작업을 계획하고 조율하는 에이전틱 AI로 고도화되고 있는 기술 트렌드에 주목해 이번 벤치마크를 개발했다.
특히 실제 서비스 환경에서의 멀티 스텝과 멀티 도메인 처리 능력을 평가하는 데 초점을 맞췄다. 기존 LLM 벤치마크는 단편적인 성능 평가에 그쳐, 복잡한 사용자 요청을 해석해 적절한 도구를 호출하고 다양한 작업 간 의존 관계를 관리하는 오케스트레이션 능력 평가에 한계가 존재했다. 이에 카카오는 실제 서비스 시나리오를 기반으로 AI 모델의 작업 계획과 도구 실행을 분리해 정밀하게 평가하는 새로운 프레임워크를 제시했다.
이번 오케스트레이션 벤치마크는 여행·쇼핑·금융·일정 등 17개 서비스 도메인과 100여 개의 가상 도구를 포함해 구성했으며 사용자 요청 변경이나 추가 질문 등과 같은 실제 서비스 상의 대화 흐름을 토대로 시나리오를 구축해 실용성을 높였다.
카카오는 글로벌 AI 생태계의 활성화에 기여하고 연구 개발 성과의 자유로운 활용을 위해 해당 논문을 오픈소스 플랫폼 깃허브에 공개했다.
카카오 관계자는 "오케스트레이션 벤치마크는 에이전틱 AI가 실제 서비스 환경에서 안정적으로 작동하는지를 평가하는 핵심 도구로, 스스로 판단하고 이행하는 에이전틱 AI로 진화하는 현 시점에서 의미있는 연구 성과”라며 "향후 에이전트 간 협업과 오케스트레이션 능력 강화를 위한 연구를 지속하고 카카오의 에이전틱 AI 방향성에 부합하는 기술의 고도화를 추진해 갈 계획”이라고 말했다.
이재현 글로벌이코노믹 기자 kiscezyr@g-enews.com
































