태터데스크 관리자

도움말
닫기
적용하기   첫페이지 만들기

태터데스크 메시지

저장하였습니다.

BigData만화| 빅 앤 데이라

척척박사 윤박사가 들려주는 AI | 최종, 인공지능의 역할과 도전

 

 

 

알파고 이후로 현재까지 인공지능 기계학습에 대한 우리의 관심은 지속적으로 높아지고 있다. 이제는 누구나 인공지능 사회에 대한 긍정과 부정을 얘기하면서 술자리의 안주와 먹거리로 이야기를 하는 시대이기도 하다. 이런 가운데 필자는 지난 1년 가까이 인공지능 기술 트렌드를 중심으로 소소한 이야기를 다루었다. 이제는 앞으로의 인공지능 기술과 4차 산업혁명에서 5차 산업혁명으로 이어지는 중간 다리 역할의 인공지능을 이야기로 기나긴 인공지능의 이야기를 마무리하고자 한다.

 

우리는 인공지능이 무엇이든 다 처리할 수 있는 만능으로 이야기 한다. 공상과학 영화를 많이 본 효과이기도 하지만 알파고가 한 역할이 너무 크기 때문이다. 그러나 단순하게 생각해 보면 알파고는 바둑밖에 못하는 인공지능이다. 알파고는 복잡한 연산은 잘 한다. 그리고 복잡한 계산으로 조합을 만들어 내기도 한다. 이유는 단순하다. 바둑을 배우기 위한 기보라는 데이터가 충실히 쌓여 있는 상태에서 훈련을 하였고, 그 결과를 사람이 튜닝해서 얻은 결과이다. 만약, 바둑의 기보가 없다면 알파고는 바둑을 잘 두었을까? 당연히 ’아니다’라는 결론을 얻을 것이다. 이러한 결론을 잘 이해하고 있다면, 인공지능을 도입하기 위한 방법과 준비 과정이 필요하다는 것을 알 수 있을 것이다. 막연한 인공지능 도입은 회사의 위험도를 높일 수 있고, 자칫하다간 기술 개발 실패의 아픔을 가질 수 있다. 그렇기 때문에 필자는 딥러닝을 도입하기 위한 준비 과정을 이야기 하였고, 딥러닝이 기계학습의 전부가 아니다 라는 이야기를 계속적으로 하였다. 성공적인 인공지능 도입과 추진을 위해서는 목적과 대상이 정확해야 한다. 그리고 아래와 같은 고민을 통해 문제의 정의와 학습의 방법을 준비해야 할 것이다.

 

- 기계학습을 위한 데이터는 어떻게 확보할 것인가?

 

 

- 기계학습을 위한 도메인 지식베이스는 어떻게 확보할 것인가?

 

- 학습된 결과는 어떻게 검증 할 것인가?

 

 

 

- 대상별 학습은 어떻게 할 것인가?

 

- 서비스의 대상에게 어떻게 학습된 결과를 서비스 할 것인가?

 

- 기계학습 결과의 반영 주기는 어떻게 할 것인가?

 

- 도입했을 때의 예상 효과는 어떻게 될 것인가?


- 기타 세부적인 도입 이슈는 어떤 것들이 있는가? 등

 

이러한 내용은 누구나 알고 있고 기본적으로 다루는 내용들이다. 잠시 잊고 있었다면 이제부터 다시 고민하고 깊이 생각해 보았으면 한다. 인공지능에서는 창조적인 생각도 중요하며, 자동화된 서비스를 만드는 것도 중요하다. 하지만 “어떤 데이터를, 누구를 위해서, 무엇 때문에” 라는 목적이 없는 인공지능 개발은 오히려 기술 개발 경쟁에서 밀려나고 자칫 혼란만 가중될 뿐이다.

 

그렇기 때문에 필자는 인공지능을 도입하기 위해 6하 원칙(5W1H : Who, When, Where, What, How, Why)을 토대로 도전하라고 권고하고 싶다. 그리고 인공지능 역할인 자동화라는 목적을 달성하기 위해서도 중요한 요소이다. 이 요소는 유비쿼터스 컴퓨팅(Ubiquitous Computing) 개념을 이해하고 있는 독자라면 누구나 알고 있을 것이다. 그리고 산업의 변화, 기술의 변화, 시대의 변화가 아무리 빨라도 기술의 주기는 반복과 확장이라는 것을 함께 이해했다면 인공지능의 도전 방향을 제대로 짚고 넘어갈 수 있을 것이다. 예를 들면, 무인 자동차의 경우를 보자. 어떤 데이터를 가지고 누구를 위해서 무엇 때문에 만들어지고 있는지가 명확하다. 무인자동차는 차량의 데이터와 도로 데이터, 지도 데이터, 영상 데이터 등을 가지고 안전하게 운전할 수 있는 자동화된 시스템을 만드는 것이 목적이다. 그리고 이 상태에서 어떤 기계학습 모델과 알고리즘을 사용할지는 개발하는 제조사에 따라 필요한 기술을 적용하고 확장할 것이다. 또 다른 예를 들어 보자. 최근에 등장하고 있는 소프트웨어 중에서 ‘디자이너’라는 이름으로 불리는 소프트웨어가 있다. 소프트웨어 개발을 모르는 분석가도 비즈니스 프로세스만 알고 있다면 보다 쉽게 자동화된 시스템을 만들 수 있도록 한 것이다. 이 기술은 프로그래밍 자동화를 위해 3차원 그래픽이나 영상 편집 소프트웨어를 결합하여 확장한 것이다. 이처럼 6하 원칙을 기반으로 무엇을 위해 어떻게 할 것인가에 대한 기준이 만들어진다면 인공지능의 다양한 모델과 기술, 즉 프레임 모델, 의사결정 모델, 규칙기반 모델, 기계학습 모델 등과 같은 자동화 모델을 선별적으로 적용할 수 있다. 그리고 가장 좋은 모델을 적용하여 최적의 결과를 얻는 것이 가장 좋은 방향이 될 것이다. 이렇게 하나씩 하나씩 완성되어 간다면 인공지능의 최종 목표인 스스로 학습하는 자기주도 학습(Self-Organization Machine Learning or Self-directed Machine Learning)이 가능할 것이다.

 

기나긴 기고를 마치면서 필자가 마지막으로 당부하고 싶은 것은 도전을 위해 단계별 목표(Cleansing / Integration –> Detecting –> Prediction –> Forecasting –> Reasoning)를 수립하고 서비스 도메인에 대한 이해도를 높이라는 것이다. 로마가 하루아침에 만들어지지 않은 것처럼 인공지능 서비스도 하루아침에 만들어지진 않을 것이다. 누군가의 고민이 모이고 생각이 모여서 기초를 만들고 여러 가지 인공지능 기술과 모델이 적용되면서 인공지능 서비스 기술은 발전할 수 있기 때문이다.

 

 

** 기고를 마치며
짧다면 짧고 길다면 긴 1년의 시간동안 매월 기고문을 기다려 주신 엑셈 글로벌마케팅본부에 깊은 감사를 드립니다. 많은 내용을 담고 싶었지만 저를 절제시켜주고 어려운 내용이 많아서 다듬는데 힘이 들었을 편집자님께도 감사드립니다. 그리고 재미없는 글을 읽어주신 분들께도 감사 인사를 드립니다. 이제는 홀가분한 마음으로 키보드를 두드려 보려고 합니다. 내년에도 힘찬 한해가되시길 기원합니다.

 

 

 

 

IT easy, IT is! | 여섯 번째, 천공카드와 IBM



 

 

 



  자카드와 천공카드


지난 『IT easy, IT is!』에서는 SQL과 관련된 이야기를 다뤘는데요. 오늘은 잠깐 컴퓨터 역사의 초기 시절, 굵직한 축을 이루었던 중요한 기업 등에 대한 이야기를 전해드리려 합니다. 

 

1801, 자카드(Joseph Marie Jacquard)라는 사람은 직조 산업에 센세이션을 일으킨 직조기를 발명합니다. 그 기계는 옷감을 만들 때 어떤 무늬를 그리기 원하는 부분에 구멍을 뚫고, 그 종이를 수직 집결로 올리면 그 명령대로 무늬가 찍히는 직조기입니다. 이런 류의 프린트를 자카드라고 부르며, 이렇게 구멍을 뚫고 올리는 것 또한 일종의 명령어로 볼 수 있습니다.

 

이 자카드 시스템의 응용이 천공카드라 볼 수 있습니다. OMR카드는 빛으로 명령을 읽는다면, 천공카드는 구멍으로 명령을 읽습니다. IBM 최초의 컴퓨터 저장장치는 지금처럼 메모리가 없었을 때 천공카드로 명령도 내리고 데이터도 저장하곤 했습니다.

 

 

 

 

   (그림 : 천공카드)

 


  CTR와 IBM


이러한 천공카드의 가치가 더욱 주목 받는 계기가 있었습니다. 19세기 말 미국에 엄청난 이민이 있었습니다. 그래서 인구통계를 내야 했는데, 생각보다 작업이 너무 오래 걸려 정부는 골머리를 앓았습니다. 그 때 허먼 홀러리스(Herman Hollerith)라는 사람이 인구통계를 쉽게 진행할 수 있는 방안으로 천공카드로 자동화하기라는 방안을 제시하였습니다. 홀러리스는 펀치카드 시스템을 사용해서 인구 통계를 엄청나게 혁신시켰고, 이를 바탕으로 1896, 그는 Tabulating Machine Company라는 회사를 회사를 차리게 됩니다. 그리고 이 회사는 1911, Computing-Tabulating-Recording Company (CTR)라는 회사로 이름을 바꾸게 됩니다.

 

 어느 날 이 회사에 이사가 한 명 들어오게 되는데, 그의 이름은 토마스 왓슨입니다. 당시 적자에 허덕이던 CTR을 굴지의 기업으로 일으킨 왓슨은, 1924년 회사 이름을 ‘International Business Machines’, 지금 우리가 잘 알고 있는 기업인 IBM으로 바꾸었습니다. 실제 지금 IBM의 인공지능도 이름이 왓슨인 것을 생각해보면, 토마스 왓슨이 IBM에서 얼마나 중요한 인물인지 다시금 생각해보게 됩니다.

 

IBM은 원래 사무자동화 시스템을 만드는 회사였습니다. 그러나 1950년대에 애니악 같은 컴퓨터들이 만들어지기 시작하면서, 토마스 왓슨은 아들인 토마스 왓슨 주니어에게 컴퓨터 산업을 시작해라라고 하였고, IBM은 인재들을 모아 컴퓨터 생산에 집중하기 시작합니다. 이 때 IBM의 컴퓨터는 수작이었기에, 추후 오라클에게 밀리기 전까지는 40년 동안 전 세계의 컴퓨터 산업을 지배하다시피 하였습니다.

 

 


        (그림 : 토마스 왓슨 주니어)




  에커트와 모클리, 유니시스


이 시기에 IBM과 더불어 양대산맥을 이루던 기업인 유니시스가 있었습니다. 유니시스에는 많은 회사들이 엮여있습니다. 앞서 말씀드렸던 허먼 홀러리스 외에도 제임스 파워(James Power)’라는 인구 조사국의 직원이 인구조사에 천공카드를 사용하며 성공을 거두었고, 이를 바탕으로 Power Tabulating Machine이라는 회사를 차렸습니다. 그러다 이 회사가 Remington Rand Organization라는 회사의 일부로 합병되었는데, 이 레밍턴 랜드가 애니악과 유니백의 아버지인 에커트와 모클리의 회사도 인수하게 됩니다. 그리고 이 레밍턴 랜드는 유니시스가 되게 됩니다.

 

 

 

        (그림 : 에커트와 모클리)

 


에커트와 모클리가 만든 유니백의 대표적인 일화로는 아이젠하워의 선거 예측사건이 있습니다. 2차 세계대전의 영웅이었던 아이젠하워는 갑작스레 대통령 선거에 나가게 됩니다. 이 때 유니백이 개표가 시작된 지 얼마 되지 않아 아이젠하워가 압승을 거두게 될 것이라는 정확한 선거 예측을 내놓았고, 사실 그 전에는 가치를 잘 인정받지 못했던 유니백이 이 사건 이후로 큰 주목을 받게 되었습니다.

 

 

 

 

 

                                              

 

 

 

 

                                                             

 




 

척척박사 윤박사가 들려주는 AI | 열한 번째, 융합 인공지능 – 양자 컴퓨팅 기술

 

 

양자 컴퓨팅(Quantum Computing)은 바로 이전 기고에서 설명한 DNA 컴퓨팅과 함께 꿈의 컴퓨팅 처리 기술로 불리고 있다. 기존의 비트(Bit) 단위의 이진 데이터 처리 방식에서 벗어나 다양한 표현을 시도하는 4진(Quantum) 구조의 데이터 처리를 목표로 하고 있다. 그렇기 때문에 기존의 불확실성을 계산하는 인공지능의 NP Problem과 같은 불확실성 문제의 해결을 통해 성능을 확인하고 있다. 만약, 양자 컴퓨팅이 성공적으로 실현된다면 여러분들은 어떤 분야에 이용할 수 있을까 생각할 것이다. 간단히 예를 들면, DNA 컴퓨팅과 함께 적용되어 매트릭스와 같은 가상의 세계가 실현될 수 있을 것이다. 그리고 먼 우주를 여행하기 위한 텔러포트와 같은 순간이동 시스템이 만들어질 수 있을 것이다. 즉, 스타게이트나 스타트랙에서 나오는 순간이동 시스템이 공상과학 영화만의 표현이 아니게 될 것이다. 그렇기 때문에 필자는 인공지능을 더 깊게 공부하고 싶어하는 독자들에게 미래의 컴퓨팅 기술인 뇌공학, DNA 컴퓨팅, 양자 컴퓨팅을 더욱 깊이 연구해 보라고 하고 싶다.

 

양자 컴퓨팅의 구상자는 리처드 파인만 교수로, 실질적인 동작 원리는 옥스퍼드대의 데이비드 도이치 박사가 고안하였다. 아래의 그림은 양자 컴퓨팅의 고안자인 리처드 파인만 교수가 코넬 대학에서 강의하는 모습이다. 그의 이론에 활용할 수 있는 알고리즘으로 쇼어 알고리즘이 나오면서 양자 컴퓨팅은 그 가능성을 확인하였다. 그리고 2011년 캐나다에서 최초의 상용화 양자 컴퓨팅으로 불리는 D-WAVE의 출현은 양자 컴퓨터를 이용한 새로운 기술 혁명을 예고하기도 했다. D-WAVE는 범용 양자 컴퓨터는 아니며, 양자 어널링이라는 특정한 양자 알고리즘을 특화한 것이다. 머신러닝, 음성인식, 자연어 처리를 위해 방대한 데이터 분석을 일반 컴퓨터보다 1억배 이상 빠른 속도로 처리할 수 있다고 보고 하였다. 하지만 범용적인 양자 컴퓨팅의 개발과 구성은 복잡도가 높기 때문에 NP 문제와 같은 복잡하고 고성능의 연산속도를 필요로 하고 있다. 우리나라에서도 양자 컴퓨팅에 대한 연구는 표준과학연구원, 기초과학연구원, 일부 대기업들을 중심으로 풀어가고 있다. 양자 컴퓨팅의 핵심은 양자 컴퓨팅에 이용할 여러 개의 양자를 분리해 빠르고 안정적으로 다룰 수 있느냐는 것이고, 나아가 여러 개의 양자를 다루는 일까지 성공한다면 진짜 양자 컴퓨터를 만드는 것이 가능할 것이다.

 

 

 

 

이런 의미에서 우리에게 최초의 양자 컴퓨터로 알려진 D-WAVE는 완전한 양자 컴퓨터라고 할 수 없다. 이는 초전도 상태를 가지는 양자 CPU에서 처리된 결과를 외부의 컴퓨터가 다시 읽어 처리하는 구조이기 때문이다. 이는 양자 컴퓨터의 핵심인 큐비트를 제대로 제어하기 어렵다는 것이다. 그리고 가장 제어가 용이하다는 전자의 스핀조차 실용적인 수준의 컴퓨팅을 구현하기에는 일정한 상태를 유지할 수 있는 시간이 짧기 때문이다. 그래서 많은 과학자들이 안정성이 높은 큐비트를 얻는 것이 목표이며, 이는 공학자보다는 기초과학자들이 주도하고 있다. 특히 전자의 스핀을 제어하는 연구 분야는 스핀트로닉스라는 이름으로 불리고 있다. 현재 연구 성과가 서서히 나오고 있으며, 기초과학연구원(IBS)의 원자제어 저차원 전자계 연구단이 추진 중인 밸리트로닉스가 대표적이라 할 수 있다. 양자 컴퓨터의 큐비트 원리는 블로흐 구를 통해 잘 설명되고 있다. 구의 표면은 두 가지 결과에 대한 확률값의 합이 1인 점으로 가능한 모든 사건이 일어나는 경우를 확률적으로 표현한 것이다. 고전적인 비트는 구의 '상단(북극)'과 '하단(남극)'에 해당하는 1과 0 값만 지닐 수 있지만 큐비트는 구의 어느 곳에도 존재할 수 있다. 상단과 하단을 제외한 나머지 표면에서는 1과 0이라는 두 가지 사건에 대한 확률이 공존한다. 중첩을 정확히 이해하려면 확률에 대한 일반적인 상식에서 다소 벗어나야 한다. 사실 중첩과 같은 현상은 우리가 지각할 수 있는 세계의 경험과 너무나 이질적이라서 적당한 시각화 방법이 없다[2]. 그렇기 때문에 양자 컴퓨터에서 큐비트를 표현하기란 어렵고, 안정화 시키는 것 또한 어렵다.

 

양자 컴퓨팅 종류는 초전도 현상을 이용하여 큐비트를 만들어내는 구조에 따라 이온트랩, 인공적인 원자 생성 방법, 마요라나 페르미온, 다이아몬드 등과 같은 방식으로 구분하고 있다. 이온트랩은 양자 컴퓨팅의 연구에서 가장 오래된 분야이다. 이온 트랩 방식은 바깥쪽 궤도에 전자를 하나만 남겨둔 다음에 레이저로 비춰서 전자의 에너지 상태가 올라가면 원자의 바깥쪽 궤도로 가거나 다시 안정돼서 안쪽 궤도로 되돌아오는 현상이 발생한다. 이때 안쪽과 바깥쪽 궤도를 계속 전자가 왔다 갔다 하면서 “중첩” 상태가 되는 것을 유지하면 바로 큐비트가 생성되는 원리이다. 다음으로 인텔에서 연구하고 개발하는 방법으로 인공적인 원자를 생성하는 방법이다. 이 방법은 순수한 실리콘에 인공적인 전자를 넣어서 만드는 방식으로, 인공적인 전자는 극초단파를 이용하여 제어하고 있다. 다음으로 마이크로 소프트가 개발 중인 양자 컴퓨터인 마요라나 페르미온 입자를 이용하는 방식이다. 마요라나 페르미온은 입자이면서 동시에 반입자라는 특징을 가지고 있다. 이 물질의 존재가 알려진 후로부터 80년간 관측되지 않은 물질이지만 성공할 경우에는 가장 범용성이 큰 양자 컴퓨터로 발전할 수 있다. 마지막으로 다이아몬드를 이용한 방식이다. 이 방법은 다이아몬드 속에 있는 정공(Vacancy)과 질소를 이용한다고 한다. 동작의 원리는 이온트랩과 비슷한 방법이다[3][4][5].

 

 

 

 

이렇듯 양자 컴퓨터는 우리의 일상생활과는 무관하게 연구되고 있는 것처럼 보이지만 어느 덧 세상에 알려지고 기존의 컴퓨터 처리 능력을 대신할 수 있는 연산 장치로 인지되고 있다. 문제는 양자 컴퓨터를 이용하여 무엇을 할 것인지 이며, 인공지능 알고리즘을 어떻게 적용해야 자동화된 연산이나 최적화된 연산을 수행할 수 있을까 라는 목표가 생겨나고 있다. 만약, 양자 컴퓨터에 관심이 있다면, 필자는 도전자에게 이런 고민을 해보라고 하고 싶다. 양자 컴퓨터의 범용화를 위해 인공지능으로 무엇을 할수 있을까? 큐비트의 안정화나 최적화를 위한 도전보다는 응용 쪽이 더욱 멋지고 재미있는 연구가 되지 않을까 생각한다.

 

다음 기고에서는 1년 동안 연재된 내용을 마무리하고, 인공지능의 기술 방향과 도전을 이야기하며 기나긴 기고를 마무리하고자 한다.

 

 

[참고자료]
[1] 위키, https://ko.wikipedia.org/wiki/양자_컴퓨터
[2] http://www.ibs.re.kr/newsletter/2014/12/sub_01.html
[3] http://netpilgrim.net/470
[4] http://mdl.dongascience.com/magazine/view/S201408N038
[5] http://scienceon.hani.co.kr/474039

 

 

 

 

 

 

 

 

 

  • 박광훈 2017.11.29 11:07 신고 ADDR 수정/삭제 답글

    좋은글 잘 읽었습니다

IT easy, IT is! | 다섯 번째, SQL과 OPTIMIZER




  SQL과 도널드 체임벌린


지난 『IT easy, IT is!』의 흥미로운 IT 이야기를 이어가겠습니다.

 

앞서 말씀 드렸던 ‘A Relational Model of Data for Large Shared Data Banks’라는, 데이터를 집합개념으로 관리할 수 있다고 제언한 논문을 쓴 E.F.Codd 박사로부터 시작된 IBM‘“System R” 프로젝트가 있습니다. 당시 “System R”에는 20~30명의 영웅들이 참여했었는데, 그 중 가장 대표적인 사람이 바로 짐 그레이 입니다. 짐 그레이는 지금 우리가 아는 리커버리, 트랜잭션 등 여러가지 DB의 매커니즘 개념을 다 만들어냈고, 짐 그레이의 책은 DB의 이론서로 뽑힙니다.


그리고 또 하나, “System R”의 가장 큰 유산은 우리가 익히 알고 있는 SQL이라는 랭귀지이고, 바로 도널드 체임벌린이라는 사람이 만들어냈습니다. 참고로 현재 “System R” 프로젝트의 내부에 관해 말씀 드리고 있는 이야기들은 체임벌린의 인터뷰나 논문에서 따온 것입니다.

 

그 체임벌린이 “System R”에 참여한지 1년 만인 1974년에, 레이먼드 보이스라는 사람과 논문을 써냈습니다. 그게 바로 SEQUEL에 대한 논문이며, 이것이 나중에 SQL로 발전하게 된 것입니다. 레이몬드 보이스 또한 밥 마이너나 짐 그레이처럼 역사에 남을 천재였는데, 안타깝게도 SEQUEL을 만든 지 1년 후에 질병으로 세상을 떠나게 됩니다. 그래서 레이몬드 보이스는 사진이 없습니다.

 

 

 

       (그림 : 도널드 체임벌린)

 


  3세대 언어와 4세대 언어


SQL에 대해 말씀 드리기 앞서, 최초의 고급언어는 포트란이었으며, 비슷한 시기에 코볼이 만들어지고 있었습니다. HOW, 데이터를 어떻게저장하느냐는 입력을 직접 해줘야 하는 프로그램인 포트란과 코볼, C랭귀지 같은 것들을 구조적 프로그램(STRUCTURED LANGAUGE)’이라고 하며, ‘3세대 언어라고 합니다. 그리고 이런 구조적 프로그램이 나오던 시기가 1950~1960년대의 상황입니다. 3세대 언어에서는 저장하고, 찾아오는 행위가 수월하지만은 않습니다.

 

그에 대한 어려움을 해결하기 위해 나온 것이 4세대 언어이며, 4세대 언어의 가장 대표적인 것이 바로 SQL입니다. 도널드 체임벌린과 레이먼드 보이스가 만든 SQL, 4세대 언어에서는 ‘HOW’라는 게 없습니다. 오로지 뭐 가져와~’와 같은 ‘WHAT’만 존재합니다.

 

예를 들면 4세대 랭귀지는 군 사령관이고, 3세대 언어는 작전과장입니다. 군 사령관은 저 고지를 점령해.’라고 명령을 내립니다. 군 사령관은 명령을 내리면 끝입니다. 어떻게 점령하는지는 작전과장이 계획을 짭니다. 그래서 구조적 프로그래밍은 어떻게라는 걸 다 기술해줘야 하는 반면, 4세대 랭귀지는 명령만 내리면 됩니다. 그러면 4세대 랭귀지에서 이 SQL을 코디네이터한테 날리는 거고, 이 코디네이터가 바로 DBMS입니다.

 

그래서 SQL DBMS에 날리면, DBMS가 작전계획을 짜줍니다. 지난 번 말씀 드린 IDS만 해도 이 SQL이 표준화되지 않았었는데, 이 때 SQL이 표준화돼서 만들어졌습니다. 그래서 DBMS가 바로 작전과장 역할을 하는 겁니다.

 

 

        (그림 : 군사령관 역할을 하는 4세대 언어와, 작전과장 역할을 하는 3세대 언어)




  Plan과 Optimizer


또한 그 어떻게라는 작전 계획을 바로 ‘PLAN’이라고 합니다. 작전계획이니까, 실제로 ‘EXECUTION PLAN’이라고도 합니다. 하나의 SQL을 던져지면, DBMS는 수 없이 많은 작전 계획을 고려합니다. 여기서 그 고려를 진행하는 DBMS의 모듈을 ‘OPTIMIZER’라고 합니다.


DBMS OPTIMIZER SQL 명령이 들어오면 그에 대한 ‘EXECUTION PLAN’을 고려해서 그 중에 하나를 비용기반으로 고르고 실행합니다. 참고로 이 비용기반 OPTIMIZER를 만든 사람은 패트리샤 셀링거’(patricia selinger)인데, 이 분에 대한 이야기는 추후에 자세히 전해드리도록 하겠습니다.

 

 

 

 

 

        (그림 : 페트리샤 셀링거)

 


이어서, OPTIMIZER가 수 많은 작전을 고려하고 그 중에 하나를 골랐는데, 사람이 보기에 그 작전 보다는 다른 작전을 고르는 것이 훨씬 더 효율적으로 공격할 수 있겠다는 판단이 들면, DBMS OPTIMIZER한테 너 생각은 그렇겠지만, 이렇게 해라.’라고 말하는 것이 바로 ‘SQL 튜닝이며, 이에 관련된 엑셈의 세미나가 바로 ‘SQL 튜닝의 시작 1,2’입니다.


이것은 마치 인간 작전과장이 OPTIMIZER한테 계곡으로 가서 이렇게 이렇게 공격하는 것이 훨씬 더 낫다.’, 힌트를 주는 것과 같습니다. SQL 힌트로 ‘~~하는 게 좋아.’라고 하면 대개의 경우에 오라클 OPTIMIZER가 작전을 바꿉니다. 작전계획 잘못된 걸 골라서 거기다가 힌트를 줘서 작전 계획을 새로 짜주는 SQL 튜닝도 이런 과정이라 설명할 수 있습니다. 그런 힌트를 얻으면, OPTIMIZER가 원래는 빙빙 돌면서 2시간, 5시간, 10시간을 잡아 먹던 작업을 최적화하여, 5, 1, 10초 만에 수행해내게 됩니다.

 

 

 

 

 

 

 

 

                                                            

 



 


척척박사 윤박사가 들려주는 AI | 열 번째, 융합 인공지능 – DNA 컴퓨팅 기술

 

 

 

 

DNA 컴퓨팅은 생명공학과 전자공학, 의료공학, 컴퓨터공학 등이 융합된 기술로 2000년 초반에 국내에 널리 알려진 바이오인포메틱스(Bioinformatics)와 함께 알려진 컴퓨팅 기술이다. 혹자는 DNA 컴퓨팅이 악마의 칩이라는 이름으로 거부감을 주는 위험한 기술이라고도 한다. 이유는 사람의 몸에 DNA 생체칩을 이식하고 이를 통해 사람의 행동과 생각을 통제한다고 생각하기 때문이다. 만약, 성공적으로 DNA 생체칩이 만들어진다면 행동은 통제할 수 있겠지만 생각까지 통제하기는 힘들 것이라는 게 필자의 생각이다. 그리고 인공지능을 깊이 공부하고 싶어하는 사람이 있다면, 뇌공학, 양자컴퓨팅과 함께 강력히 추천하는 인공지능 기술 중 하나이다.

 

먼저 DNA컴퓨팅이 무엇인지를 알기 위해서는 DNA 구조를 이해하고, 합성과 증폭, 변이에 대한 일련의 매커니즘에 대한 지식이 필요하다. 그리고 DNA 컴퓨팅이 디지털 컴퓨팅과 어떤 차이를 가지고 있는지를 이해하는 것도 중요하다. DNA 컴퓨팅과 디지털 컴퓨팅의 차이를 살펴보면 아래의 표와 같은 차이를 가진다.

 

 

 

DNA는 A(아데닌), T(티민), G(구아닌), C(시토신)이라는 4개의 염기로 구성된다. 그리고 이 네 개의 염기를 이용하여 생체 정보를 코딩한다. 염기 중 A와 T, C와 G는 상보적인 결합으로 관계를 가지고 있어 이중결합, 삼중결합이라는 화학적 결합의 강도를 가지고 있다. A 염기는 C 염기나 G 염기와 연결될 수 없다. 하지만 T와는 연결이 잘 된다. 그렇기 때문에 DNA 컴퓨팅은 4개의 염기를 어떻게 배치하느냐에 따라 좋은 연산 성능을 가지기도 하지만 반만에 연산이 실패할 확률도 높다. 그리고 2진으로 데이터를 저장하는 방식보다 4진으로 구성된 데이터 기록을 처리하기 때문에 저장 확장성을 가지고 있으며 적은 공간, 적은 무게로도 대용량의 데이터를 저장하고 관리할 수 있다. 이런 가능성을 가진 DNA 칩의 대표적인 연구는 초병렬성 컴퓨팅을 구성하고 성능을 검증하는 실험도 있다. 이 DNA 컴퓨팅은 DNA 서열을 합성시키고, 증폭시키는 일련의 과정을 자동화한다면 DNA로 코딩된 정보 1017개를 동시에 처리할 수 있다. 이것은 인공지능이 가지는 다른 분야에서의 목표이다. 즉 자기조직화(Self-Organization)를 가진 생체 컴퓨터가 되는 것이다.

 

 

DNA는 분자 구조이기 때문에 2차원의 형태지만 3차원으로 구성되어 있다. 그래서 DNA를 연산하는 합성단계나 증폭단계에서 작업자 실수, 잘못된 환경, DNA 오염 등과 같은 원인으로 잘못된 결합이 종종 발생하기도 한다. 그래서 아직까지는 실험실 수준에서 DNA 컴퓨팅 제품이 만들어지고 있다. 그리고 그림 2와 같이 DNA 염기서열 3개를 조합해서 아미노산 코드를 생산하는 특징도 가지고 있다. 그리고 DNA 컴퓨팅에서 가장 많이 알려진 인공지능 알고리즘은 유전자 알고리즘이다. 유전자 알고리즘은 그림 3에서 보는 것과 같이 초기 유전자 집단에서 우수한 유전자를 선별하고, 부모 개체보다 우수한 유전자를 생산하는 매커니즘이다. 그렇다보니 인공지능의 기계학습에서 학습의 재생산과 우수성이 보장되고 있기 때문에 신경망과 혼합한 모델을 구성하고 있다. 특히 복잡하고 풀기 어려운 문제들로 구성된 NP-Complete라는 문제를 풀기 위해서 사용되고 있다. 이와 같은 유전자 알고리즘과 유사한 알고리즘은 진화 알고리즘이 있으며 처리 모델은 유전자 알고리즘과 유사하다.

 

그렇다면 DNA 컴퓨팅에서 인공지능은 어떤 역할을 할까, 그리고 무엇을 할 수 있을까? 생각해 보자. 답은 의외로 간단하다. 이런 광고를 한번은 들어봤을 것이다. “생명연장의 꿈을 이루는 기업”, DNA 컴퓨팅의 근본적인 목적은 생명을 연장시키고 질병을 수술 없이 치료하는데 있다. 이러한 목적이 성공적으로 발전하기 위해서는 유전자 알고리즘으로 가장 최적의 유전자 매핑과 합성, 증폭을 정확하게 처리할 수 있도록 준비하여야 한다. 그렇기 때문에 DNA 컴퓨팅은 갈 길이 바쁘다.

 

다음 기고에서는 DNA 컴퓨팅과 유사한 모델인 양자컴퓨팅의 모델에 대하여 다루고자 한다. 양자컴퓨팅은 순간 연산이 이루어지는 고성능 분산 병렬과 데이터 암호화에 적용할 수 있는 기술이다.

 

 

 

 

 

 

 

 

IT easy, IT is! | 네 번째, Oracle의 완성과 밥 마이너







  Oracle의 완성


지난 기고는 Oracle 설립자들에 대한 이야기로 끝났었는데요. 그렇게 이들은 오라클을 1년 만에 만들고, 회사 이름을 SDL에서 RSI(relational software inc.)로 바꿨다가, 다시 오라클로 바꿨습니다. 그리고 앞선 IDS IMS/DB는 리더와 개발자들이 함께 코딩하여 개발한 DB인데 반해, 밥 마이너는 워낙 천재이다보니 혼자 초기 오라클을 코딩하며 개발했다고 합니다. 그래서 나타나는 오라클의 특징 중 하나가, 다른 DBMS들은 용어 등의 비슷한 점이 많은데 반해, 오라클만 용어가 다른 부분이 적잖이 있습니다.


하지만 오라클이 워낙 잘 만들어졌다보니, 오라클은 DE FACTO STANDARD, 실질적인 표준이라고 불러지게 되었습니다. 1980년대가 되면서 오라클은 DBMS 시장을 완전히 장악하기 시작했고, 86년도에 상장을 하게 됩니다. 그리고 92년도에 나온 오라클 버전 7, 지금의 오라클과 거의 유사한 모습으로 세상에 공개되었습니다.


그리고 안타깝지만, 밥 마이너와 래리 앨리슨이 다른 길을 가게 되는 사건이 있었는데요. 그 당시 밥 마이너는 사장직을 그만두고 개발책임자를 맡고 있었습니다. 그런데 그를 이어 사장을 맡고 있던 래리 앨리슨과 밥 마이너가 오라클 개발 일정을 두고 깊은 의견충돌이 생겼고, 이를 계기로 결국 밥 마이너는 92년도에 오라클에서 은퇴를 하게 되었습니다.




 


(그림 : 밥 마이너(좌)와 래리 앨리슨의 다툼(우))



 


  밥 마이너의 여생과 Oracle 와인


그리고 오라클의 개발책임자 자리를 데리 캡세닐(Derry Kabcenell)이라는 사람에게 물려주고, 포도농사를 하는 동시에 인류를 위한 소프트웨어를 개발하며 편하게 여생을 보내겠다 선언했습니다. 그런데 2년 뒤, 안타깝게도 밥 마이너에게 폐암이 발견되었고, 그는 곧 세상을 떠나게 되었습니다.


번외로 말씀드리자면, 앞서 말했던 실리콘밸리에 유명한 포도농사 지역인 나파밸리가 있습니다. 그 나파밸리에 가면 밥 마이너 부인이 하는 포도원이 있는데, 그 포도원에서 나는 포도주 이름이 로버트 와인입니다.


또한 같이 포도농사를 짓던 조카도 독립해서 또 포도원을 냈는데, 그 포도원에서 나는 포도주 이름은 오라클 와인입니다.






(그림 : 밥 마이너의 포도 농사(좌)와 오라클 와인(우))




 

  DBMS의 계보


정리하자면, 주요 DBMS의 계보는 다음과 같습니다. 찰스바크만 에서 번 와츠로, 번 와츠에서 코드 박사로, 코드 박사에서 짐 그레이로, 짐 그레이에서 밥 마이너로, DBMS에 있어서 선진들의 계보가 완성된 것이지요.










                                   




 

척척박사 윤박사가 들려주는 AI | 아홉 번째, 융합 인공지능 - 로봇 인공지능 기술

 

 

 

앞으로 10년 이후에 인공지능 기술은 어디까지 발전할까? 라는 물음에 필자를 포함하여 이글을 읽는 대부분의 사람들의 생각은 공상 과학 영화에 등장하는 로봇이나 사람의 말을 알아듣고 알아서 답을 해주는 컴퓨터를 생각할 것이다. 이러한 생각은 미래를 살아가는 우리에게 로봇이 위협적인 존재라는 형태로 각인되어 있고, 일자리를 빼앗는 존재라는 이미지로 공감대를 형성시키고 있다. 그래서 이번 기고에서는 미래의 걱정거리인 로봇이 가지는 인공지능 기술을 소개하고, 융합 형태의 서비스들을 다루어보고자 한다.


 

 

로봇 인공지능은 어떻게 구성되나
로봇(Robot)의 기본 개념은 위키피디아와 서울교과서의 로봇 기초라는 교과서에 잘 설명되어 있다. 이 두 자료에서는 로봇의 어원, 정의, 역사의 로봇 3대 원칙과 이용 분야, 국가별 로봇 이용 현황 등에 대해서 주제별로 잘 정리하고 있다. 이들은 로봇의 구성을 분야에 따라 산업용 로봇과 비산업용 로봇으로 구분하고 있다. 산업용 로봇은 일정한 패턴을 가지고 동작을 제어하는 구조로, 비산업용 로봇은 인간과 친숙한 환경에서 직간접적으로 서비스를 처리하는 구조로 구분된다.
산업용 로봇은 특정 위치에 고정되어 일정한 패턴을 가지고 동작하기 때문에 제어 기능에 중점을 둔다. 예를 들면, 제조 공정에서 조립을 담당하는 제조 로봇은 일정한 동작이 제어되면서 고장유무를 판단하여 알람을 주는 동작 제어 기능으로 구성된다. 이는 조립과정에서 일정한 패턴을 유지하는 로봇의 동작을 방해하는 요소들이 생겼을 때, 규칙기반의 의사결정으로 상태를 판단하는 단순 지능구조이다.
비산업용 로봇은 이동과 판단, 제어 등의 복합적인 상황에서 데이터를 통해 판단하고 제어하는 기능에 중점을 두고 있다. 사람의 모습을 닮은 휴머노이드 로봇의 경우, 사람의 감각기관과 유사한 처리를 위해 기계학습과 의사결정 처리를 함께 적용하고 있다. KIST가 개발하고 있는 키보는 인식 기능과 제어 기능으로 구분할 수 있다. 인식 기능은 얼굴, 음성, 장애물, 위치 등을 인식하는 기능을 가진다. 또한 제어 기능은 주행과 회피, 관절 및 고관절 제어, 표정 등으로 구성된다. 이 구성들은 독립적으로 동작하는 것보다는 데이터를 연계하여 복합적인 처리가 필요하다.

 

 

휴머노이드 로봇의 구성(KIST, 키보 3.0)

 

 

이와 같이 로봇의 구성은 기계공학부터 물리, 컴퓨터, 제어공학 등에 이르기까지 다양한 학문 분야에서 접근하고 있는 산업 기술이다. 또한 4차 산업혁명에서 요구하고 있는 기술을 복합적으로 처리하는 종합 기술체이기도 하다. 그렇기 때문에 단시간 내에 성공적인 구성을 할 수 없으며, 지금까지처럼 많은 실패와 고민이 필요할 것이다.

 

 

 

로봇의 지능은 얼마나 될까
로봇의 지능을 결정하는 것은 두 가지로 판단할 수 있다. 주어진 일에 대한 스스로의 의사결정 기능과 고장에 대한 진단에서 스스로 복구까지의 절차를 진행하는 자가진단 기능이다.

의사결정 기능은 로봇의 3원칙을 기준으로 어떠한 의사결정을 내리는가이다. 예를 들면 운전을 하는 자율주행 로봇의 경우를 생각해 보자. 운전자의 딜레마이기도 하다. 주행 중에 긴급으로 발생하는 사고 조건에서 운전자를 보호할 것인가? 아니면 차량 밖의 사람을 보호할 것인가? 이러한 딜레마의 조건에서 로봇은 자율적인 의사결정을 해야 한다. 당연히 빠른 의사결정과 처리가 필요하기 때문에 고성능의 시스템이 필요하고 네트워크의 자율성도 좋아야 한다. 만약 이 조건을 스스로 판단한다면 로봇의 3원칙 중에서 1원칙인 인간을 해쳐서는 안 된다는 조건이 성립된다. 만약 1원칙을 무시할 수 있는 규칙은 운전자의 결정에 따라 진행되는 경우가 될 것이다. 이 부분은 인공지능 기술에서도 많은 딜레마와 학습의 문제점을 가지고 있다. 그렇기 때문에 우리는 로봇과 인공지능 기술에 두려움을 가지는 것이 당연하다고 생각한다.

 

자율주행 로봇의 딜레마 – 사고 대응

 

 

다음으로 로봇의 인공지능에서 필요한 자가진단 기능이다. 이 기능은 로봇의 3대 원칙 중에서 3원칙에 해당한다고 볼 수 있다. 로봇은 1원칙과 2원칙을 지키면서 자기 스스로를 보호해야 한다는 조건이다. 이 조건은 인공지능 기술의 핵심이지만 풀기 어려운 난재(NP Complete)이다. 이 기능을 구현하기 위해서는 소프트웨어의 소스코드를 스스로 컴파일하고 에러가 발생한 부분을 학습하여 소스코드를 스스로 수정하는 기술이다. 하지만 운영체제와 소스코드 간에 의존성(dependancy)를 판단하는 로직과 소스코드에서 에러가 있는 전/후 과정을 판단하는 로직, 장애 여부를 판단하는 로직, 어떤 코드를 적용해야 전/후 상태에서 이상 없이 동작되는지를 판단하는 로직, 전체의 동작에 대한 최적화 상태를 판단하는 로직 등에 대한 복잡한 학습 과정이 필요하다. 이 학습을 위해서는 개발자들이 개발하는 과정을 전체적으로 모니터링하고 그 과정을 학습하는 절차가 요구된다. 또한 가장 중요한 것은 스스로 개선되었다고 판단해서 서비스 또는 시스템을 재시작 했을 때 이상 없이 동작이 이루어지는가도 스스로 판단해야 한다. 이러한 일련의 과정을 학습하는 것 또한 인공지능 로봇의 지능을 갖추는데 필요한 가장 큰 문제이다.

따라서 인공지능 기능을 갖춘 로봇의 지능은 단편적인 지능을 갖추거나 일정한 패턴에 대한 동작을 학습하는 것은 가능하지만 공상과학 영화에 나오는 자율 판단 로봇이나 아이언맨에 등장하는 자비스와 같은 시스템을 만족하기까지는 인프라의 상당한 발전과 개발의 시간이 필요할 것이다.

 

 

 

로봇 인공지능 방향
로봇 인공지능 기술은 스스로 의사결정을 할 수 있는 융합 제어 기술을 가진 완성체를 개발하기까지 많은 시간과 노력이 필요하다. 특히 로봇의 3원칙과 함께 학습 자유도를 실시간으로 처리할 수 있는 고성능 프로세서와 연산 장치가 통합된 로봇 전용칩의 개발도 필요하다. 그렇기 때문에 필자는 인공지능 기술을 두려워하는 많은 사람들에게 말하고 싶다. 아직은 인공지능 기술의 두려움을 체감하기까지 준비할 수 있는 시간이 많다. 두려움 때문에 기술의 편리함을 도입하지 않는다면 로봇의 발전은 실패의 길로 가거나 미완의 기술로 오랜 시간이 걸릴 것이다. 그래서 인공지능 기술은 양날의 검이라고 한다. 도입도 문제지만 도입하지 않았을 때도 문제이기 때문이다.

 

다음 기고에서는 인공지능 융합 기술 중에 생명공학과 결합된 DNA 컴퓨팅 기술을 다루고자 한다. DNA 컴퓨팅 기술은 사람의 특정 질병을 치료하는 치료기술 부분과 뇌공학이나 양자 컴퓨팅과 같이 전자기계를 사람과 연결시키는 커넥티드 장치(Connected Device) 부분으로 발전하고 있다. 이 부분에서 인공지능 기술이 어떻게 사용되고 있고, 적용되고 있는지를 사례들로 소개하고자 한다.

 

 

 

 

 

 

 

IT easy, IT is! | 세 번째, PostgreSQL과 Oracle





  PostgreSQL과 마이클 스톤 브레이크



지난 기고는 ‘System R’에 대한 이야기로 끝났었는데요. 이 당시 시스템 R이 사용하던 IBM의 연구소는 실리콘밸리의 산호세에 있었습니다. IBM 산호세 연구소에서 시스템 R은 천덕꾸러기 대접을 받으며 연구를 진행하고 있었습니다.


그 실리콘밸리에는 두 개의 유명한 대학이 있습니다. 하나는 스탠포드이고, 하나는 버클리입니다. 지금은 버클리 대학이 음악으로 유명하지만, 그 당시에는 BSD 라이선스(B는 버클리의 B입니다.)로 유명했습니다. UNIX라는 OS 또한 버클리 대학에서 나왔습니다.


1973년도에 시스템 R이 진행되는 것을 보고, 버클리 대학의 마이클 스톤 브레이크라는 교수가, ‘IBM 산호세 연구소에서 RDBMS라는 게 만들어지고 있다는데 우리도 해보자.’라고 해서 석박사 학생들을 끌어 모아 DBMS를 만들기 시작했습니다.


그 프로젝트 이름이 바로 Ingres입니다. 그리고 Ingres라는 이름이 추후 어떻게 바뀌냐면, In을 떼고 이 프로젝트를 새로 시작하며, Ingres의 후속버전이라는 뜻으로 Postgres가 됩니다. 그리고 이 Postgres가 시간이 지나 우리는 SQL을 지원한다.’는 뜻을 담아, 우리가 잘 아는 PostgreSQL으로 나오게 됩니다.


대학인 버클리에서 만들어진 PostgreSQL이기에, 상업적인 성격이 약하여 소스코드를 다 오픈하였습니다. 그런 이유로 비교적 최근에 나왔거나, 현재 나오고 있는 DB들이 이 PostgreSQL, 바로 Ingres의 소스코드를 참고하여 만들어 지게 된 것입니다. 그래서 Postgre, 혹은 IngresDBMS의 할아버지라 표현되기도 합니다. 

                       (그림 : 마이클 스톤 브레이크)             






  Oracle과 밥 마이너


1973, 버클리에서는 Ingres의 연구가 진행되고 있었고, IBM에서는 시스템 R로 인해 DBMS의 태동이 시작되고 있었습니다. 그 당시 또 한 명, 일리노이 대학 출신의 주목해야 할 천재가 있었는데요. 그 사람은 바로 밥 마이너입니다. 그는 앰팩스(Ampex)라는 회사로 IT업계에 입문하여 프로그램을 구축하는 등, 흔히 말하는 SI 사업을 하고 있었습니다.


그러던 어느 날, 밥 마이너의 친구 중 프로그래머이자 자유로운 영혼의 락커였던 에드 오츠가 그에게 잡지를 건내며 말했습니다


, 이거 괜찮은 거 같지 않아?’


그 논문이 바로 E.F.Codd 박사의 ‘A Relational Model of Data for Large Shared Data Banks’였습니다. 밥은 그 논문을 보더니 너무 멋진데? 우리가 한 번 구현해보자.’라고 하였고, 그 논의가 오갈 때 현재 오라클의 회장인 래리 앨리슨도 함께였습니다. 그리고 그 멤버들이 회사를 설립했던 것이 바로 SDL(Software Development Labatories)이라는 이름의 스타트업이었습니다


그리고 1년이 지난 후, 밥 마이너가 어셈블리어로 1년 만에 뚝딱뚝딱 만들어낸 것이 바로 그 오라클입니다.




(그림 : 밥 마이너(좌)와 에드 오츠(우))


 



  Oracle 설립자들의 이야기


그들은 1년 만에 오라클을 만들고, 자축행사를 가집니다. 그 자리엔 밥 마이너, 에드 오츠, 브루스 스캇, 그리고 현 오라클의 회장인 래리 앨리슨이 있었습니다.




(그림 : 래리 앨리슨(좌)과 Oracle 1주년 기념파티(우))



이들은 다들 개성이 넘치는 인물들이었습니다. 간단히 살펴보자면래리 앨리슨은 개인 비행기가 편대로 있을 정도의 부자이며요트도 선단으로 있을 정도입니다연봉이 약 800억원이며한 시간에 4천만원을 버는 꼴입니다.


밥 마이너 또한 상당한 부자였는데요. 86년에 오라클이 상장을 하면서초대 사장이었기에 주식을 많이 가지고 있어서 돈을 많이 벌었지만, 94년도에 암으로 세상을 떠나게 됩니다그의 미망인인 분은 현재 미국의 17대 부호 패밀리에 속해 있습니다. 


특이한 것은 밥 마이너와 그의 부인은 워낙에 검소하고 돈 쓸 줄 모르는 사람들이었으나, 래리 앨리슨은 그와 반대로 사치를 좋아하고, 바람둥이 기질이 있는 사람이었다는 점입니다. 밥 마이너는 오직 할 줄 아는 게 포도농사 밖에 없었습니다.


또한 에드 오츠는 앞서 말씀 드렸던 것처럼 자유로운 영혼의 락커입니다. 기타 치는 걸 정말 좋아했습니다. 그래서 나중에 오라클에서 은퇴를 하였을 때는, 하이엔드 홈시어터 같은 음향 산업에 뛰어들었고, 래리 앨리슨과 스티브 잡스도 그의 고객 중 한 명이었다고 합니다.

 







   



 

척척박사 윤박사가 들려주는 AI | 여덟 번째, 스마트 시대의 인공지능 사례 - 뇌공학과 인공지능

 

 

 

 

 

뇌공학은 스마트 인공지능의 목적지로, 사람 두뇌와 컴퓨터가 상호작용하는 차세대 융합 기술이다. 뇌공학은 사람의 뇌 신경망과 컴퓨팅 기계를 특정 네트워크(BCI : Brain-Computer Interface)로 연결하고, 뇌의 활동을 인지하거나 질환 치료, 컴퓨팅 기계를 사람의 뇌로 제어하는 등의 다양한 세부 분야로 기술 개발이 진행되고 있다. 뇌공학 기술이 성공적으로 진행된다면, 마이너리 리포트나 매트릭스와 같이 영화에서나 가능한 세계가 현실화될 가능성이 높아진다.

 

 

 

뇌공학의 정의와 국가 전략

뇌공학은 1973년 자퀴스 비달(미국, UCLA) 교수에 의해 식물인간 환자가 어떻게 외부와 의사소통을 할 수 있을까를 고민하면서부터 정립되기 시작하였다. 현재는 각국에서 뇌공학과 인공지능에 대한 연구와 투자가 적극적으로 진행되고 있으며 유럽연합은 2012년 “휴먼 브레인 프로젝트(HBP)”라는 뇌 연구 프로젝트에 10년간 10억 유로(약 1조 7천억원)를 투자하고 있다. 미국은 2013년 “브레인 이니셔티브(BRAIN Initiative)”를 출범시켜 10년간 30억 달러를 투자하기로 했다. 일본은 2014년부터 “Brain/MINDS”라는 300억원 규모의 연구 프로젝트를 진행하고 있다. 이렇듯 최근에 뇌공학은 인공지능과 같이 학문적 연구에서 벗어나 실생활에서 적용하기 위한 연구가 적극적으로 진행되고 있으며, 공학적 접근과 프로그래밍 기술 개발이 필요한 대표 연구 사업이다.

국내는 2014년 뇌공학 기술에 대한 진단을 실시하고, 선진국대비 절대적으로 열세인 뇌공학 기술에 대한 극복을 위해 국가적 투자 계획을 수립하였다. 그로부터 2년 뒤인 2016년 5월에 미래부(현 과학기술정보통신부) 주관으로 뇌과학 발전전략을 중점적으로 추진할 방안을 발표하였다. 보도자료에 따르면 사람의 뇌는 일정한 학습된 신호를 가지고 인지하는 고등인지 기능을 가지고 있으며, 지도로 표현하는 뇌지를 확보하는데 집중하고 있다. 고등 인지기능의 첫 관문인 대뇌피질(후두정엽) 설계도 확보를 위한 고위뇌기능 특화지도와 노화뇌질환 특화뇌지도 DB 2종을 확보할 계획을 수립하였다. 그리고 미래선점 뇌융합 챌린지 기술 개발을 추진하여 5년 이내에 가시적인 실용화 성과를 도출할 예정이다. 차세대 NI(Natural Intelligence)–AI(Artificial Intelligence) 연계 기술 개발을 통해 뇌 연구 분야의 기초 원천 연구를 지원할 예정이다. 아래의 표는 미래부에서 인공지능 기술 및 뇌 신경망과 연계 가능한 분야를 제시한 내용의 일부이다.

 

그리고 뇌 연구 생태계 기반 확충 전략 부분에서는 뇌연구인력 융합화 촉진, 뇌연구 자원 안정적 확보, 글로벌 연구역량 활용, 미래 뇌산업 준비 등의 세부 전략을 수립하고 추진 계획을 발표하였다[2].

 

 

뇌공학 연계를 위한 인공지능 모델
미래부에서 제시한 뇌공학과 인공지능의 연계 분야를 살펴보면, 뇌에서 발생되는 뇌신경신호를 인지하고 각각의 패턴을 학습하는 지각판단회로 분야와 감각 신호에 대한 측정과 제어하는 감각 지능 회로 분야, 감성영역의 신경회로가 작동되는 원리를 규명하는 감성 지능 회로 분야, 신경회로망을 구성하는 뉴런칩 활용 신경회로망 분야로 구분하고 있다. 이러한 분야에서 인공지능 기계학습 모델과 연계하기 위해서는 불확실성이라는 요소를 반드시 고려해야 한다. 왜냐하면 사람의 뇌에서 발생하는 신호는 행동과 생각에 따라 유사하지만 독특한 특징을 가진 불확실한 신호를 가지고 있다. 예를 들면, 벌레먹은 사과를 먹고 판단하는 뇌신호는 화를 내거나 짜증을 내거나 하는 인식정도에 따라 다른 행동과 반응 신호를 발생시킨다. 이는 사람마다 가지는 성장 및 교육 환경, 신경세포 전두엽과 후두엽의 연계 등 다양한 조건에 따라 반응하는 뇌신경 신호 체계가 서로 다르기 때문이다. 그렇기 때문에 사람의 뇌신경과 인공 신경망을 연계할 때는 동일한 행동에 대하여 인지 패턴 학습을 다르게 적용하여야 하며, 상황에 따라 수정과 보완이 실시간으로 진행되어야 한다. 따라서 사람의 뇌신호를 이해하면서 불확실성이 포함된 패턴을 추적하기 위해 인공 신경망의 딥러닝과 카오스 이론이 결합된 고기능의 딥러닝 알고리즘이 필요하다.

카오스 알고리즘은 복잡하고 불규칙해 보이는 현상 속에서 의외의 단조로운 패턴들을 찾아내고 이를 연결하여 하나의 모델로 구성하는 것을 말한다. 카오스 이론은 어떤 동력학계의 복잡하고 비 주기적이며 유인적인 궤도, 주기성이 없는 일종의 질서, 새롭게 인식된 보편적인 자연현상, 결정론적인 비선형 동력학계에 나타나는 불규칙적이고 예측 불가능한 형태 등으로 정의되고 있다. 이러한 카오스 이론은 물리학자들에 의해 비선형 함수의 극단적인 변화를 가지는 자연계에 대하여 질서 잡힌 변화들을 표현하고 안정적인 구조를 찾는 연구가 선행되었다. 이 중 대표적인 것이 끌개(Attractor) 이론이다. 물리학자들이 자연계에서 찾아낸 끌개 이론은 두 가지 이다. 그림 1에서 보는 것과 같이 변화의 추이가 일정한 주기성을 띄는 에운맴돌이(Limit Cycle) 끌개와 중앙점에서 변화를 추이하는 형태의 붙박이점(Fixed Point) 끌개이다.

 

 

 

그리고 카오스 이론이 등장하면서 물리학자들이 정의한 두 가지의 끌개 개념들이 조금씩 무너지면서 전혀 다른 종류의 끌개가 존재한다는 것이 확인되었다. 이를 기묘한 끌개(Strange)라고 하며, 최초의 기묘한 끌개는 기상학자 로렌츠가 발견한 로렌츠 끌개이다. 그림 2과 3은 로렌츠 끌개 이론의 대표적인 예들이다. 로렌츠는 자연계의 질서 잡힌 변화들을 상태 공간으로 표현하고 그 변화의 궤도를 안정적인 형태로 표현하면서 새로운 끌개 형태를 발견하였다. 그림 2에서 보는 것과 같이 로렌츠의 궤도는 미시적으로는 무질서하고 예측 불가능하다고 판단되었지만 거시적으로는 질서에 유사한 어떤 형태를 보여주고 있음을 확인하였다. 그리고 그림 3과 같이 갖가지 형태의 기묘한 끌개들을 찾아내어 카오스 뒤에 숨어있는 고차원적인 질서의 상징적 표현물들을 생성하였다.

 

 

 

카오스 이론처럼 인간의 뇌는 지식만을 학습하고 판단하는 것이 아니라, 도덕적이고 주변의 상태들이 고려된 지식을 생산하고 판단해야 하는 활동들이 수행되어야 한다. 특히 인공 신경망은 사람의 뇌 신경망과 같이 일종의 수정과 응용력을 필요로하기 때문에 불확실성이 함께 학습되어야 한다. 그리고 뇌 신경망과 연계했을 때 자연스러운 행동과 인지된 패턴 판단을 자연스럽게 수정하면서 응용 범위가 확장되도록 해야 할 것이다. 이를 위해 복잡하고 난해한 데이터를 학습하는 딥러닝 학습 모델과 불확실성을 처리하는 카오스 이론이 결합된 새로운 딥러닝 모델에 대한 연구가 같이 병행되어야 할 것이다. 결합된 새로운 딥러닝 알고리즘은 시각 장애나 지적 장애를 가진 사람들의 지각 인지와 판단을 지원하면서 사물 패턴 인식을 적극적으로 지원하는 뇌치료 서비스가 가능하지 않을까 한다.

 

 

뇌공학을 위한 인공지능 기술 개발의 방향
인공지능의 재 부흥을 알린 딥러닝 기계학습 모델은 다양성과 최적화를 보완하기 위해서 강화학습 알고리즘을 적용하고 있다. 하지만 뇌공학에서처럼 불확실한 패턴이 등장했을 때, 기계학습은 추적에 실패할 확률이 높으며, 패턴인지 과정을 딥러닝과 강화학습 만을 적용해서 불확실성에 대한 학습을 보완하기는 어려울 것이다. 그래서 뇌공학에서처럼 불확실성에 대한 대처를 위해서 필자는 카오스 알고리즘을 딥러닝 모델에 적용해 보는 것을 추천한다. 또한 인공지능에서 새로운 패턴을 추적하고자 한다면 딥러닝과 강화 알고리즘, 카오스 알고리즘이 결합된 딥러닝 모델을 개발하고 평가해 보는 것도 좋을 것이다. 특히 시계열 학습에 적합한 LSTM(RNN) 모델에 카오스 알고리즘을 적용한다면 새로운 패턴을 성공적으로 추적할 수 있는 탐지 모델이 되지 않을까 생각한다.

 

다음 기고에서는 많은 사람이 관심을 가지고 있는 로봇의 인공지능을 다루고자 한다. 로봇에 적용되는 기계학습 알고리즘들은 어떤 것들이 있으며, 인공지능을 배우는 사람들의 관심인 딥러닝을 어떻게 적용하고 있는지에 대한 사례들도 함께 이야기 하고자 한다.

 

 

- 참고문헌 및 자료
[1] 카오스 이론과 인지과학, http://www.aistudy.com/paper/culture/chaos_cognitive_kim.htm
[2] 미래부, 지능정보사회 도래를 대비한 “뇌과학 발전전략” 수립, 미래창조과학부 보도자료, 2016.05.31.