닫기

글로벌이코노믹

"어쩐지 비슷하더라"…구글 '바드', 오픈AI 챗GPT 데이터로 학습 의혹

공유
0

"어쩐지 비슷하더라"…구글 '바드', 오픈AI 챗GPT 데이터로 학습 의혹

구글 최고 AI 엔지니어 훈련 사실 폭로 후 사임

구글 '바드'가 오픈AI의 데이터로 학습했다는 논란이 일고 있다. 사진=로이터이미지 확대보기
구글 '바드'가 오픈AI의 데이터로 학습했다는 논란이 일고 있다. 사진=로이터
구글 인공지능(AI) 챗봇 '바드'가 챗봇 열풍을 몰고온 오픈AI의 챗GPT의 데이터로 학습했다는 의혹이 불거졌다.

31일(현지 시간) 더 인포메이션은 오픈AI가 인공지능 분야에서 큰 성공을 거두자 구글이 오픈AI의 챗GPT 데이터를 사용해 '바드'를 학습시켰다고 밝혔다.
보도에 따르면 '바드'는 오픈AI의 챗GPT 데이터와 셰어GPT(ShareGPT)라는 웹사이트에서 스크랩한 챗GPT 데이터를 사용해 학습했다.

셰어GPT는 지난해 12월 스티븐 테이와 돔 에클레스턴이 만든 크롬 확장 프로그램으로 사람들이 챗GPT와 나눈 대화 내용을 캡처하고 공유할 수 있다.

더 인포메이션은 구글 최고 AI 엔지니어 제이콥 데블린이 순다르 피차이 구글 CEO와 다른 최고 경영진에게 '바드'의 머신러닝 모델이 챗GPT를 사용해 훈련되고 있다는 사실을 알렸다고 보도했다.

데블린은 이는 오픈AI의 서비스 약관을 위반하는 행위로 '바드'의 답변이 챗GPT와 유사하게 들릴 수 있다고 경고한 후 사임했다.

제이콥 데블린은 구글에서 5년 이상 근무한 인공지능 엔지니어다. 데블린은 2018년 AI 붐을 일으켰던 검색 정확도를 위한 머신러닝 모델 훈련에 관한 연구 논문 BERT의 주 저자로 알려졌다.

더 인포메이션은 데블린의 연구로 구글과 오픈AI의 언어 모델에 큰 토대를 마련했다고 전했다. 또한 구글이 데블린의 경고 이후 챗GPT 데이터 사용을 중단했을 수 있으며 해당 부분을 폐기했을 가능성이 있다고 덧붙였다.
데블린은 지난 1월 구글을 떠난 후 현재 오픈AI에 합류한 것으로 알려졌다.

셰어GPT 설립자 스티븐 테이의 트윗 캡처. 사진=트위터이미지 확대보기
셰어GPT 설립자 스티븐 테이의 트윗 캡처. 사진=트위터


스티븐 테이 셰어GPT 설립자는 트위터에서 더 인포메이션 편집장의 글을 인용해 "사실 아주 오래전부터 알고 있었다. 구글 내부에서 오랫동안 이 이야기가 돌았고, 많은 직원들이 이에 대해 화를 내고 걱정하고 있다"고 트윗을 올렸다.

구글은 '바드'가 챗GPT의 어떤 데이터로도 학습하지 않았다고 주장하며 혐의를 전면 부인했다. 크리스 파파스 구글 대변인은 기술 전문 매체 버지(Verge)와의 인터뷰에서 "바드는 셰어GPT(ShareGPT)나 챗GPT의 어떤 데이터로도 학습하지 않았다"고 확신했다.

챗GPT의 인기 상승에 힘입어 구글은 지난 22일 AI기반 챗봇 바드를 공개했다. 바드는 에세이 작성, 여행일정 수립, 저녁식사 레시피 제안 등 챗GPT와 유사한 기능을 제공한다. 하지만 챗GPT와 달리 복합 모드 기능이 없고 코딩도 할 수 없는 것으로 알려졌다.

시시 샤오 구글 부사장은 바드가 공개적으로 이용 가능한 정보를 가지고 훈련을 받았다고 말했다.

한편 타임스오브인디아는 "셰어GPT의 데이터는 다른 사람들이 열람할 수 있다는 점도 주목할 만하다"고 전했다.


노훈주 글로벌이코노믹 기자 hunjuroh@g-enews.com