이미지 확대보기회사 측은 17일(현지시각) 소네트 4.6을 "지금까지 가장 뛰어난 소네트 모델"로 소개하며, 코딩, 컴퓨터 활용, 장문 추론, 에이전트 계획 수립 등 전 영역에서 업그레이드를 이뤄냈다고 밝혔다.
소네트 4.6은 대부분의 성능지표에서 오퍼스 4.6에 근접하거나 일부를 초과했다.
코딩 능력 'SWE-벤치 베리파이드'는 오퍼스 4.6(80.8%)에 버금가는 79.6%, 컴퓨터 제어 에이전트 능력 'OS월드-베리파이드'는 72.5%(오퍼스 4.6 72.7%)를 기록했다.
소네트 4.6은 베타 단계에서 100만 토큰 컨텍스트 윈도우를 지원해 방대한 데이터 처리를 강화했다. 토큰은 AI가 처리하는 데이터 단위로, 영어 기준 1토큰이 약 1단어에 해당한다. 기업 고객용 단가는 100만 토큰당 3∼15달러로 전작과 동일하게 유지된다.
클로드 웹(claude.ai)과 '클로드 코워크'에서 소네트 4.6이 무료·프로 요금제의 기본 모델로 설정됐다.
앤트로픽은 개발자들이 소네트 4.6을 오퍼스 4.5보다 59∼70% 선호하며, 과도한 설계나 환각 현상이 줄고 지시 준수력이 높아졌다고 평가받았다고 전했다.
안전성 평가에서도 기존 모델과 동등 이상의 수준을 확인했다.
정준범 글로벌이코노믹 기자 jjb@g-enews.com
[알림] 본 기사는 투자판단의 참고용이며, 이를 근거로 한 투자손실에 대한 책임은 없습니다.
































