AI 실제 활용 ‘기대와 현실’ 교차…벤치마크·성장률·사용자 반응 한눈에

◇ ‘기대 이하’ 평가와 기술 업그레이드
오픈AI는 GPT-5 공개 나흘 뒤, 챗GPT의 주간 활성이용자가 7억 명에 이르렀다고 발표했다. 이는 1년 전보다 4배나 늘어난 수치다. 실제 하루 평균 질문은 30억 건을 넘을 정도다. 엔지니어와 연구진은 GPT-5가 복잡한 프로그래밍과 연구 작업, 정보 수집에 있어 기존 모델보다 나아졌다고 평가한다. 기업용 챗GPT 가입자는 2개월 만에 500만 명으로 급증했다.
하지만, 미국 일리노이대학교 어바나-샴페인 AI연구원 박사과정생 수무크 샤시다르는 “일반 사용자는 큰 변화를 실감하지 못한다”며 “GPT-5가 매우 똑똑한 사람과 대화하는 듯한 기대에는 못 미친다”고 밝혔다. 실사용자들 사이에서도 “환각”으로 불리는 오류 답변과 잘못된 정보를 확신하는 사례가 꾸준히 이어져, 기대만큼 혁신적이지 않았다는 의견이 많다. 실제로 국내외 커뮤니티에서는 ‘AI스러움’이 지나치게 강해지고, 창의적이거나 감성적인 응답이 예전 GPT-4 계열보다 떨어졌다는 반응도 적지 않다.
그러나 오픈AI가 공개한 최신 벤치마크에서는 GPT-5가 여러 항목에서 뚜렷한 진전을 나타냈다. 수학(AIME 정답률) 94.6%, 코딩(SWEBench Verified) 74.9%, 멀티모달(시각·언어 복합) 이해 84.2%, 환각(오답·사실 오류 발생률)은 GPT-4o 대비 45%, GPT-3 대비 최대 80% 감소 등 개선되었고, 문맥 이해(토큰) 범위도 40만 개로 대폭 늘어나 복잡한 작업 처리에 더 강해졌다. 사용자 불만이 나온 정서 연결력이나 응답 감성은 줄었지만, 기술적 성능은 대폭 올랐다는 평가다.
오픈AI는 올해 매출이 130억 달러(약 18조 원)를 넘겼고, 연말까지 200억 달러(약 27조 7,000억 원)에 도달할 전망이다. 다만, 300억 달러(약 41조 5,000억 원) 규모 벤처 투자금 소진으로 비용 부담도 커지고 있다.
◇ ‘초지능’ 논란…실제 사용성에 집중하는 업계
오픈AI CEO 샘 올트먼은 “GPT-5에 대한 기업 수요가 출시 이틀 만에 두 배 가까이 늘었고, 어려운 기술 과제 해결에 집중하고 있다”고 밝혔다.
반면 AI·암호화폐 투자자 데이비드 색스는 “주요 AI 모델들이 비슷한 성능대에서 머물러 인간 검증이 여전히 필요하다”고 지적했다. 비영리 단체 컨트롤AI의 정책분석가 맥스 윙가는 “GPT-5가 인류 통제 범위를 벗어날 만큼 급진적 변화를 보이지 않았다”고 분석했다.
국내외 업계에서는 GPT-5가 ‘혁명적’ 변화보다는 실제 사용성을 높이는 수준에 그쳤다는 평이 우세하다. 전문가와 기업, 일반 이용자 사이에서 기대와 현실의 격차가 존재하며, 실효성에 초점을 맞춰 기술의 가치를 평가하는 분위기다.
박정한 글로벌이코노믹 기자 park@g-enews.com