'객체 일관성 유지' 기술 적용
캐릭터 얼굴 왜곡 현상 최소화
외부 AI 플랫폼에도 모델 공개
캐릭터 얼굴 왜곡 현상 최소화
외부 AI 플랫폼에도 모델 공개

알파벳(구글)이 최신 AI 모델 '제미나이 2.5'에 새로운 이미지 생성 AI 모델 '플래시 이미지'를 업데이트했다. 기존 AI 모델의 문제점인 이미지 내 객체 왜곡 오류를 막는 데 초점을 맞췄다.
구글 AI 스튜디오 공식 블로그에는 미국 시각 26일 '제미나이 2.5 플래시 이미지', 이른바 '나노바나나(nano-banana)'에 대한 공지가 게재됐다. 해당 기능은 제미나이 앱과 제미나이 API, 버텍스 AI 등에 공식 적용된다.
제미나이 2.5 플래시 이미지의 가장 강력한 기술로 '객체 일관성 유지'가 언급됐다. 특정 인물, 동물 캐릭터를 다양한 배경에 배치하거나 명함, 유니폼 카드 등 여러 템플릿에 적용해도 생김새가 왜곡되지 않도록 했다.
객체 일관성 유지 기술에 힘입어 텍스트 프롬프트로 이미지를 수정할 때 보다 정밀한 편집이 가능해졌다. 구글 측은 피사체만 남긴 채 배경을 바꾸거나 흐리게 처리하기, 입고 있는 옷 중 일부분만 특정해 무늬를 바꾸거나 제거하기 등을 예시로 들었다.
텍스트 프롬프트 외에도 여러 이미지를 입력해 다양한 장면을 구현하는 '다중 이미지 융합' 기능 또한 추가됐다. 이 외에도 보다 사실적인 이미지 구현을 목표로 지형의 고저나 각도·선·면 등 기하학적 상식 등 '본질 세계 지식(Native World Knowledge)' 또한 학습시켰다.

테크 크런치 등 외신들에 따르면 구글은 이번 공식 발표에 앞서 몇 주 전부터 '나노바나나'란 가칭으로 AI 이미지 편집 기술을 활용한 사례들을 소셜 미디어를 통해 공개했다.
이미지 생성형 AI 이용자들은 보편적으로 인물이나 캐릭터의 눈빛, 표정 등 외형이 왜곡되는 현상을 겪는 만큼 '객체 일관성 유지'가 적절히 작동한다면 이용자들의 호평을 받을 전망이다.
AI 기술 경쟁에 있어 이미지 생성·편집 기술은 중요한 분야로 손꼽힌다. 올 3월 오픈AI '챗GPT'에서 스튜디오 지브리풍 이미지 편집 기능이 세계적으로 유행한 것이 대표적인 사례다.
구글의 제미나이는 최근 챗GPT, 앤스로픽 '클로드'와 더불어 미국 연방 정부에 공급할 수 있는 AI 서비스로 인정받았다. 그러나 이용자 지표 측면에선 챗GPT의 뒤를 추격하는 2인자로 꼽힌다.
순다르 피차이 구글 대표는 지난달 말 실적 발표 콘퍼런스 콜 중 제미나이의 월간 활성 이용자(MAU) 수가 4억5000만 명 수준이라고 밝혔다. 챗GPT의 경우 주간 활성 이용자(WAU)가 7억 명 수준인 것으로 알려져 있으며 월간 이용자 수는 훨씬 높을 것으로 짐작된다.
구글은 제미나이의 저변 확대를 위해 개발자 커뮤니티를 적극 공략한다는 계획이다. 이를 위해 제미나이 2.5 플래시 이미지 모델을 자체 플랫폼 외에도 오픈라우터(OpenRouter), 팔(Fal) 등 외부 AI 플랫폼에도 제공한다고 발표했다.
이원용 글로벌이코노믹 기자 wony92kr@naver.com