알리바바, 이미지 생성 AI 모델 'Qwen VLo' 공개… 오픈소스 AI 경쟁 심화

인간 예술가 수준 정교함, 다국어 지원 멀티모달 AI… 中 경쟁 치열 속 '리더십' 강화
3년간 520억 달러 AI 인프라 투자 약속… '오픈소스 AI 리더' 인정

알리바바 그룹 홀딩이 인간 예술가와 같은 기교로 이미지를 생성하고 편집할 수 있는 것으로 알려진 새로운 인공지능(AI) 모델 'Qwen VLo'를 출시하며, AI 리더로서 스스로를 재정의하려는 멀티모달 모델 경쟁을 심화시키고 있다.

이는 알리바바가 사용자를 확보하기 위해 '오픈소스 접근 방식'을 추구해 온 중국 AI 환경에서 치열한 경쟁을 가속할 것으로 보인다고 28(현지시각) 사우스차이나모닝포스트(SCMP)가 보도했다.

지난 27일에 출시된 Qwen VLo는 이전 모델인 QwenVL 및 Qwen2.5 VL의 "포괄적인 업그레이드" 버전이라고 알리바바는 밝혔다. 이 모델은 입력값을 더 잘 이해하고, 더 정확한 이미지를 생성하며, 개방형 명령을 수용하고, 중국어와 영어를 포함한 여러 언어를 지원할 수 있다. 현재 Qwen Chat에서 미리보기를 사용할 수 있다.

Qwen VLo는 또한 다양한 입력 및 출력 형식을 지원하여 사용자에게 향상된 유연성을 제공하며, 포스터, 일러스트레이션, 웹 배너 및 소셜 미디어 표지를 만드는 데 이상적이다. 알리바바 그룹은 사우스 차이나 모닝 포스트(SCMP)를 소유하고 있다.

바이트댄스, 센스타임과 같은 경쟁사들이 텍스트, 비디오, 오디오 등 다양한 유형의 입력 데이터를 해석하도록 설계된 자체 멀티모달 모델을 도입하기 위해 노력하고 있기 때문에, 이 새로운 모델 출시는 중국 인공지능 환경의 치열한 경쟁에 기름을 붓고 있다. 기존 AI 모델은 한 가지 유형의 입력만 처리하는 한계가 있었다.

알리바바는 AI와 클라우드 컴퓨팅에 대한 투자를 두 배로 늘리고 있으며, 무분별한 운영을 간소화하기 위해 노력하고 있다. 지난 2월, 알리바바는 향후 3년 동안 AI 인프라에 3,800억 위안(약 520억 달러, 한화 약 72조 원) 이상을 투자하겠다고 약속했다.

이 회사는 또한 Qwen 모델을 오픈 소스로 제공하겠다고 선언했으며, 조 차이(Joe Tsai) 회장은 이러한 결정이 AI 애플리케이션의 급증을 촉발하고 알리바바의 클라우드 컴퓨팅 비즈니스를 강화할 것이라고 믿고 있다.

알리바바는 최근 타임지(Time)가 선정한 '2025년 가장 영향력 있는 100대 기업'에 '오픈소스 AI의 리더'로 선정되며 그 혁신성을 인정받았다. Qwen 모델은 자동차 제조, 금융 및 교육을 포함한 다양한 부문의 수천 개 회사에서 사용되고 있다.

또한, 타임지는 암 진단에 대한 알리바바의 기여를 높이 평가했다. 이번 주, 알리바바의 다모 아카데미(Damo Academy)는 컴퓨터 단층 촬영(CT) 스캔을 통해 초기 단계에서도 위암을 감지할 수 있는 세계 최초의 AI 모델을 공개했다.

이는 2023년 췌장암 검출을 위한 유사 모델 개발에 이은 획기적인 발전이다. '다모 판다(Damo Panda)'라는 이름의 이 AI 도구는 지난 4월 미국 식품의약국(FDA)으로부터 '획기적인 장치'로 지정되어 신속한 검토 및 승인 절차를 가능하게 했다.

알리바바의 이번 이미지 생성 AI 모델 출시는 자체적인 기술 혁신을 통해 AI 분야의 리더십을 강화하고, 오픈소스 전략을 통해 생태계를 확장하며, 동시에 의료 분야와 같은 사회적 가치 창출에도 기여하려는 다각적인 노력을 보여준다.

신민철 글로벌이코노믹 기자 shincm@g-enews.com