구글, 스스로 판단하는 인공지능 'GQN' 발표

기사입력:2018-06-15 14:45:01
[콘텐츠경제 김수인 기자] 2년 전 구글 딥마인드는 인공지능(AI) '알파고(AlphaGo)'를 선보였다. 알파고는 바둑계의 전설 이세돌 9과 바둑 대국에서 압승을 거둬 전 세계를 놀라게 했다.

인간을 넘어서는 AI를 개발한 구글 딥마인드가 이번에는 한 단계 더 진보된 AI를 선보였다. 현지시간 15일, 세계적인 과학저널 <사이언스>에 따르면 이 AI의 이름은 '제너러티브 쿼리 네트워크(GQN, Generative Query Network)'다.

center
(사진=구글 딥마인드)

◇ 스스로 학습하고 예측하는 인공지능, GQN


GQN은 2차원의 이미지를 스스로 학습하고 예측해 3차원의 이미지로 그려내는 AI다.

구글 딥마인드 연구팀이 새로 개발한 AI는 '표상 네트워크(Representation Network)'와 '생성 네트워크(Generation Network)' 두 가지 네트워크로 구성된다.

표상 네트워크는 샘플 이미지로부터 얻은 정보를 저장·기억하는 역할을 한다. 생성 네트워크는 표상 네트워크가 얻은 정보를 토대로 다른 각도에서 장면을 바라봤을 때 어떤 이미지가 그려지는지 추론해낸다.

연구팀은 2차원 평면으로 찍힌 도형 사진을 여러 장 보여 주면서 AI가 스스로 학습하도록 했다. GQN은 카메라 같은 외부기기를 통해 인식한 평면 이미지를 바탕으로 이미지에 있는 공간과 사물의 전체적인 입체 구조를 예측해 3차원의 이미지로 만든다.

덕분에 관찰하고 있는 각도에서는 볼 수 없었던 사물의 뒷면 등 모든 각도의 장면을 볼 수 있다.

이 AI의 개발로 스스로 주변을 인식하고 능동적으로 반응하는 로봇, 자율자동차 등을 개발하는 실마리가 될 것으로 전망된다.

알리 에슬라미 딥마인드 연구원은 "이번에 개발한 시각 AI는 물리적으로 구현해 낼 수 없는 부분에 대한 영상처리가 가능하기 때문에 가상·증강현실 기술을 더 현실적으로 구현하는 데 활용될 수 있다"며 "또 인간형 로봇의 눈, 스스로 위험과 상황을 판단하는 산업용 로봇팔에도 활용될 수 있을 것"이라고 설명했다.

◇ 학습의 차원이 다른 똑똑한 인공지능

center
(사진=구글 딥마인드)

GQN은 이전에 선보였던 인공지능(AI)들과 사뭇 다르다. 좀 더 똑똑하다.

기존의 AI 시각 시스템은 같은 사물을 다양한 각도로 촬영한 장면 등 여러 가지 정보를 입력해줘야 했다.

정면과 측면 등 다각도의 장면뿐만 아니라 장면 속 사물의 공간상 위치, 특정 사물의 픽셀 범위 등을 일일이 표시한 방대한 양의 학습 데이터가 필요했다.

학습 데이터를 만드는 데 많은 시간이 필요하다. 게다가 복잡한 공간이나 곡면으로 이뤄진 사물은 제대로 인식하지 못하는 한계가 있었다.

반면 GQN은 사람이 입력하는 학습 데이터에 의존하지 않는다는 특징이 있다. 공간과 사물을 여러 각도에서 관찰하면서 입체적인 구조를 스스로 파악하고, 볼 수 없었던 다양한 장면까지 이미지로 만들어낸다.

미로 안에서 구석구석을 관찰한 뒤 미로의 전체 3D 지도를 만들거나 공간을 동영상으로 살펴보는 것도 가능하다.

이경무 서울대 전기정보공학부 교수는 "사람이 일일이 가르쳐야 했던 머신러닝의 근본 한계를 뛰어넘은 결과로, 사람의 지각 능력에 가장 가깝게 다가섰다고 볼 수 있다"고 말했다.

(영상출처=Neural Scene Representation and Rendering 유튜브)

김수인 기자 news@