본문 바로가기
엑셈 경쟁력/전문가 기술기고

척척박사 윤박사가 들려주는 AI | 세 번째, 왓슨의 도전과 시사점

by EXEM 2017. 3. 29.

 

 

IBM은 1997년 체스 게임을 통해 인공지능의 미래를 소개하였다. 그 이후, IBM 연구팀의 폴 혼과 찰스 리켈은 새로운 도전을 찾던 중 제퍼디 게임에 주목하였고, 5년간의 개발 기간을 거쳐 사람의 말을 해석하고 답을 주는 왓슨을 개발하였다.

 

 

우리는 왓슨이 사람의 질문을 어떻게 해석하고, 그 질문에 대한 답을 줄 수 있을까? 라는 의문을 가질 것이다. 컴퓨팅 지식을 가지고 있다면, 그 답을 쉽게 풀 수 있다. 그리고 언어를 처리하는 기술도 인공지능의 한 영역이라고 전문가들은 답해 줄 것이다. 인공지능 영역에서 이것을 자연어 처리(NLP : Natural Language Processing)라 한다. 사람의 언어인 자연어는 문법이라는 체계적인 규칙을 가지고 있다. 자연어 처리는 언어의 규칙에 맞게 문장을 해석하고 처리하는 방법(알고리즘 : Algorithm)이 중요하다. 이는 사람의 언어가 국가나 지역에 따라 문법이 다르기 때문에 자연어를 처리하는 방법 또한 조금씩 차이가 있기 때문이다. 대표적인 예가 언어 간의 번역의 차이이다. 자동으로 언어를 번역하기 위해서는 언어가 가지고 있는 고유 패턴과 의미를 이해하는 방법 또한 중요하다. 그래서 현재 왓슨은 사람의 언어를 정확하게 번역하고 이해하기 위해 언어의 관계성을 학습하고 해석하는데 집중하고 있다.

 

 

 

- 왓슨의 처리 동작은
일반적으로 자연어를 처리하기 위해서는 언어의 규칙 즉, 문법에 맞도록 단어를 분리하고 정의한다. 이를 형태소 분석(Stemming)이라 하며, 형태소 분석 엔진이 잘 갖춰지기 위해서는 단어 사전의 역할 또한 중요하다. 형태소 분석이 완료되면, 단어가 가진 의미 가중치를 계산한다. 이 가중치는 단어 간의 연관이나 의미의 연결성을 결정하는데 필요한 값이다. 특히 수집된 문서들에서 형태소를 분석하고, 문서와 단어 간의 관계, 중요한 키워드를 판단하기 위한 단어의 특징을 의미 검색을 위한 구조로 변환한다. 그리고 사람의 질문에 대한 답을 찾아 화면에 출력한다. 이를 단계적으로 표현하면 아래의 그림 2와 같다. Watson은 수집된 문서에서 각 문장의 단어를 형태소 분석으로 추출하고, 이들 간의 관계와 가중치를 계산한다. 각 문장의 단어는 키워드 매칭 과정을 통해 단어의 유효성을 판단한다. 즉, 단어의 매칭을 통해 중심어가 될 수 있는 단어(주어 또는 명사)를 선정한다. 예를 들면 그림 3과 같이 두 개의 문장이 있고, 각각의 단어 관계와 키워드 매핑을 통해 질문에서 발견할 수 있는 단어인 “Gray”를 정답으로 하며, 이러한 과정을 컴퓨터가 반복해서 수행하고 학습하여 빠르고 정확한 답을 찾도록 한다. 이렇게 학습된 데이터의 정답셋을 검색엔진에 넣고, 사용자 또는 질문자가 넣은 질의어를 형태소 분석한다. 그리고 정답셋의 검색엔진을 통해 관계가 높은 답을 찾아 제공한다. 정답의 정확도를 높이기 위해 기계학습의 정답셋을 보정한 후, 다시 기계학습을 시키는 작업이 필요하다. 이 과정에서 사람의 손으로 보정하는 큐레이션(Digital Curation)이 필요하다. 정답셋의 예는 그림 4와 같다.

 

 

- 왓슨으로 무엇을

Watson의 데이터는 2억 페이지 이상의 정형, 비정형 페이지를 수집하여 정답셋을 구성하였다. 그리고 IBM 블루믹스 플랫폼에서 새로운 비즈니스 아이디어를 시범 운영 · 시험 · 배치하고 있다. 국내에서도 롯데그룹, SK 하이닉스, 대한항공 등에서 Watson을 도입한 지식서비스 구성을 계획하고 있다. 하지만 한글 사전의 정확도에 적용하기 위해서는 어느 정도의 시간이 소요될 것으로 예상한다. 현재 Watson은 금융, 방송, 의학, 쇼핑, 스마트 홈스피커 등과 같은 분야에서 다양하게 적용되고 있고, 자동 응답 메신저나 비서 서비스 등과 같은 산업 분야에서도 적용할 예정이다.

 

- 왓슨의 미래 모습은
Watson은 사람의 언어를 해석하고 필요한 지식 정보를 제공하는 시스템이다. 사람의 언어와 관련이 있는 행동과 습성을 컴퓨터에게 학습시키고, 지식을 전달하는 지능정보 서비스이다. 예를 들면, 학교에서 학생들의 수업을 보조하는 보조교사, 장애우들의 학습을 보완하고 지원하는 지식 단말 서비스, 차량의 주행과 운전 중의 사고를 예측하는 서비스 등은 좋은 예라 할 수 있다. 이렇듯 인공지능 시스템을 사람의 일자를 대신하는 것이 아닌, 보조적인 역할을 수행하는 방향으로 가다듬어 진화시킨다면, 인공지능의 보다 밝은 미래를 기대해 볼 수 있을 것이다.

 

왓슨에 이어 다음 시간에는 우리 사회를 압도한 인공지능의 화두, 알파고에 대해 이야기해 보고자 한다.

 

 

 

 

 

 

 

댓글