MS '로알파' 전격 공개... 자연어 명령만으로 복잡한 양손 동작 완벽 제어
시각·언어 넘어 '촉각'까지 장착... 실수하면 인간에게 배워 실시간 진화
공장 밖으로 나온 로봇, 일상 속으로... 전 세계 로봇 산업 판도 뒤흔든다
시각·언어 넘어 '촉각'까지 장착... 실수하면 인간에게 배워 실시간 진화
공장 밖으로 나온 로봇, 일상 속으로... 전 세계 로봇 산업 판도 뒤흔든다
이미지 확대보기마이크로소프트 리서치는 로봇 공학 중심의 새로운 비전 언어 모델인 '로알파(Rho-alpha)'를 22일(현지시각) 공개했다. 이는 마이크로소프트의 경량 AI 모델인 '파이(Phi)' 시리즈에서 파생된 최초의 로봇 특화 모델로, 지능형 에이전트가 디지털 화면을 넘어 물리적 세계와 직접 상호작용하는 '물리적 AI(Physical AI)'로의 전환을 상징한다.
언어를 동작으로... 촉각 지능까지 더한 '적응형 로봇' 기존
이날 과학 기술 전문매체 인터레스팅 엔지니어링에 따르면 산업용 로봇이 사전에 입력된 엄격한 스크립트에 따라 움직였다면, 로알파는 자연어 명령을 실시간 제어 신호로 변환한다. 특히 양손을 사용하는 복잡한 조작 작업을 수행할 수 있도록 설계됐다.
가장 큰 특징은 시각과 언어 데이터에 '촉각(Tactile sensing)' 기능을 통합했다는 점이다. 이를 통해 로봇은 단순히 눈으로 보는 것에 그치지 않고 사물을 만지는 느낌을 바탕으로 미세하게 움직임을 조정한다. 마이크로소프트는 향후 버전에서 힘 감지 등 더욱 고도화된 감각 기능을 추가할 계획이다.
"틀리면 배운다"... 인간과의 상호작용으로 진화
로알파는 배포 후에도 지속적으로 개선되는 학습 능력을 갖췄다. 로봇이 작업 중 오류를 범할 경우, 작업자는 3D 입력 장치 등을 이용해 즉각 개입할 수 있다. 모델은 이러한 인간의 교정 피드백을 실시간 학습 데이터로 활용해 더욱 정교해진다.
애슐리 로렌스 MS 리서치 부사장은 "그동안 로봇 공학은 언어나 시각 AI 분야에 비해 발전이 더뎠지만, 이제 기계는 덜 구조화된 환경에서도 스스로 인지하고 추론하며 행동할 수 있게 됐다."라고 강조했다.
시뮬레이션으로 '데이터 한계' 극복... 생태계 확장 가속
로봇 학습의 고질적 문제였던 데이터 부족 현상은 마이크로소프트의 강력한 클라우드 인프라인 '애저(Azure)'를 통해 해결했다. 마이크로소프트는 실제 로봇 시연 데이터와 함께 가상 시뮬레이션을 통해 생성된 대규모 합성 데이터를 결합해 로알파를 학습시켰다.
업계 전문가들은 이러한 방식이 물리적으로 정확한 데이터를 대량 공급함으로써 복잡한 조작 기술 개발을 획기적으로 앞당길 것으로 보고 있다.
마이크로소프트는 로알파를 초기 연구용 조기 액세스 프로그램으로 제공한 뒤, 향후 자사 파운드리 플랫폼을 통해 일반 제조업체와 시스템 통합업체들이 자체 데이터를 결합해 활용할 수 있도록 보급을 확대할 방침이다.
이태준 글로벌이코노믹 기자 tjlee@g-enews.com
































