태터데스크 관리자

도움말
닫기
적용하기   첫페이지 만들기

태터데스크 메시지

저장하였습니다.

AI전문가, 강 인규 이사님이 들려주는 AI 이야기 - 시스템 관제 데이터 인공지능 분석 (시계열 분석)

 

엑셈 강남 인공지능 연구소에서는 2018년 초부터 시스템 관제 데이터에 대한 인공지능 분석과 관련된 작업을 수행하고 있다.

 

 


엑셈 강남AI연구소의 일차적인 목표는 엑셈이 가지고 있는 모니터링 솔루션(인터맥스/맥스게이지)에 인공지능 분석기능을 결합하여,


고객에게 전보다 자동화되어 편리하게 시스템을 통합 관제할 수 있는 기능을 제공하는 것이다.


 

이에 다음과 같은 여섯가지 기능을 목표로 작업을 진행하고 있습니다.

                                                                                                                                                                             


[1] 부하 예측 (Workload Forecast)

 

[2] 비정상 탐지 (Anomaly Detection)

 

[3] 장애 예측 (Failure Forecast)

 

[4] 부하 패턴 분석 (Workload Pattern Analysis)

 

[5] 인과 관계 분석 (Causality Analysis)

 

[6] 근본 원인 분석 (Root Cause Analysis)

                                                                                                                                                                             


 

오늘은 이 중에서 비정상 탐지 기능 구현을 위한 기반 기술인 시계열 분석에 대한 내용을 공유하려고 한다.

 

 

 

【시계열 분석이란 ?】 

 

시간의 흐름에 따라 분석 대상 데이터가 어떤 형태로 변화하는지를 분석하는 것이다.

 

 

 

분석 대상 데이터가 경향성(trend), 주기성(seasonality)를 나타내는지 확인하고 만약 데이터에 경향성이나 주기성이 있다면

이러한 특성을 이용하여 미래의 값까지 예측해 볼 수 있다.

 


우리가 사용하는 시스템 관제 데이터의 경우, 대부분 하루를 주기로 데이터가 주기성을 나타내는 경우가 많고, 주말 혹은 평일에 따라 서로 다른 양상을 보이기 때문에 이런 시계열 분석을 이용하면 다음날의 데이터 추세를 예측할 수 있고, 확률분포에 기반하여 실제 데이터가 예측값과 비교하여 차이가 많이 나는 경우 이를 비정상으로 보고 사용자에게 알람을 줄 수 있을 것이다.

 

 


본 문서에서는 Python을 이용하여 실제로 시계열 데이터를 분석하는 것을 설명할 예정이다. 특정 시스템(DB나 WAS)의 모니터링 데이터 대신,

최근 사람들의 관심을 많이 받고 있는 비트코인의 과거 가격 데이터를 분석하여 미래의 비트코인 가격을 예측하는 사례를 들어 설명할 예정이다.

 

 


단, 비트코인에 대한 가격 예측의 경우, 모델을 구성하기 위한 데이터 주기성이라든지 트랜드 등은 모두 글의 작성자가 임의로 선택한 값이기 때문에, 독자가 여기있는 내용을 기반으로 비트코인에 투자하는 것을 권하지 않고, 글의 작성자는 비트코인 투자에 대한 책임을 지지 않는 것을 명확히 해둔다.

 


 

우선 비트코인에 대한 가격 예측을 하기 위해서는 과거 데이터가 필요한데, 다행히 CoinGecko라는 사이트에서

2013년 4월부터의 비트코인의 USD 가격 데이터를 csv 형태로 다운받을 수 있다.

 

 


[ 데이터 출처 ]

 


비트코인 시세 차트 정보 출처 

 

https://www.coingecko.com/ko/

 

BTC-USD 데이터 (2013-04-28 ~ 2018-06-07) - btc-usd-max.csv


 

 

아래부터는 Python 코드를 직접 사용하여 시계열 분석하는 과정을 설명할 예정인데, 코드를 보기 어려운 경우에는 코드를 보지 않고 글만 읽더라도 시계열 데이터에 대한 분석을 어떻게 하는지에 대해 이해할 수 있을 것이다. 아래는 Python으로 시계열 분석을 하기 위해 필요한 라이브러리를 Import 하는 코드이다.

 

 

 


위에서 내려받은 데이터에 대해 우선 시각적으로 이해하기 위해 차트를 그려서 확인하면 다음과 같다.

단, 분석은 편의상 2017년 1월 1일부터 하기 위해  데이터의 앞부분을 잘라낸다.

 

 

 

 

 

[ 데이터 차트 (2017년 1월 1일 ~ 2018년 6월 7일) ]


 

 

 

비트코인 가격 데이터를 차트로 그리고 보니, 데이터 값이 지수 스케일로 증가를 하는 모양새이다.

분석의 편의를 위해 로그 스케일로 변환해보자.


 

 

 

 

[ 로그 스케일 (2017년 1월 1일 ~ 2018년 6월 7일) ]

 

 

 

 

로그 스케일의 데이터 차트를 보니, 데이터에 추세와 주기성이 어느정도 보이는 것 같다.

이에 대해 확인을 위해 STL Decomposition(Seasonal Trend Decomposition using Loses) 을 수행해본다.

 

 

 

 

[ STL  Decomposition ]

 

 

 

 

 

STL Decomposition은 시계열 데이터를 Trend와 Seasonal Component로 나누고 나머지를 Residual Component로 구분해주는 방식이다.

Decomposition을 수행할 때의 주기는 사용자의 입력을 받게 되어 있는데, 이번 분석에서는 작성자 임의로 63일을 주기로 사용했다. 

 


분석된 결과를 확인하면, Trend 자체는 2017년 12월 16일을 기점으로 최고점을 찍고 그 뒤로 완만한 하향세를 그리는 추세이고,

일부 주기성을 갖고 상승과 하강을 반복하는 모양을 나타내고 있다.  

 

 

이제, 비트코인 가격에 대한 추세를 확인했으니, ARIMA를 이용한 분석을 수행하도록 한다.

 

 

 

 

ARIMA는 Autoregressive Integrated Moving Average의 약자로, 1970년에 George Box와 Gwilym Jenkins가 개발한 자기회귀와 이동평균을 고려하는 시계열 분석 모형이다. (Box Jenkins 모형이라고도 한다. 여기서 Integrated는 차분을 이용하는 시계열 모형을 의미한다.)

 

 

ARIMA를 분석하기 위해서는 분석에 필요한 모형 파리미터를 결정해야 하는데, 분석을 많이 해보지 않은 사용자가 직관적으로 모형 파라미터 값을 결정하기는 힘들기 때문에, 아래에서는 여러가지 파라미터 값을 적용해서 계산후 가장 적합한 파라미터를 찾도록 한다.

 


 

 

 

위 코드 수행한 결과, 가장 AIC 값이 가장 작게 나오는 파라미터는 ARIMA(0, 0, 1)x(1, 0, 0, 63)으로 확인되었다.

여기서 AIC(Akaike Information Critera)이란 통계 모델이 얼마나 데이터에 잘 맞는지 그리고 얼마나 모델이 단순한지에 대한 평가 지표이다.

 

 


[ ARIMA 파라미터 찾기 ]

 

 

                                                                                                                                                                             

 

* ARIMA(0, 0, 0)x(0, 0, 0, 63) - AIC:2773.42309289084

* ARIMA(0, 0, 0)x(0, 0, 1, 63) - AIC:1920.0592765923088

* ARIMA(0, 0, 0)x(0, 1, 0, 63) - AIC:670.7812669178603

* ARIMA(0, 0, 0)x(0, 1, 1, 63) - AIC:625.4908107669571

* ARIMA(0, 0, 0)x(1, 0, 0, 63) - AIC:527.7086760864255

* ARIMA(0, 0, 0)x(1, 0, 1, 63) - AIC:460.57780794082373

* ARIMA(0, 0, 0)x(1, 1, 0, 63) - AIC:634.0389755642134

* ARIMA(0, 0, 0)x(1, 1, 1, 63) - AIC:627.4901156865175

* ARIMA(0, 0, 1)x(0, 0, 0, 63) - AIC:2059.139083871266

* ARIMA(0, 0, 1)x(0, 0, 1, 63) - AIC:1306.301430340262

* ARIMA(0, 0, 1)x(0, 1, 0, 63) - AIC:125.37137227818316

* ARIMA(0, 0, 1)x(0, 1, 1, 63) - AIC:156.5012219110579

* ARIMA(0, 0, 1)x(1, 0, 0, 63) - AIC:-0.007702231691581574

* ARIMA(0, 0, 1)x(1, 0, 1, 63) - AIC:-21.342298764273067

                                                                                                                                                                             

 

 

결정된 파라미터에 대해 ARIMA 모델을 생성하고 모델에 대한 간단한 진단 차트를 표시하면 다음과 같다.


 

 

[ Diagnostic ]

 

 

 

 

 

위에서 얻은 모델을 가지고 4월 26일부터의 비트코인 가격에 대한 예측은 다음과 같이 수행한다.

아래 차트는 4월 26일부터 최근 날짜까지의 실제 비트코인 가격과 예측 가격을 같이 그린 차트이다.


 

 

 

 

[ Dynamic Prediction ]

 

 

 

 

위의 그래프에서 2018년 1월 1일부터의 데이터를 확대해서 표시하면 다음과 같다.

 

 

 

 

[ Dynamic Prediction (Zoom) ]

 

 

 

 

본 글에서는 시계열 데이터를 분석하는 방법(STL Decomposition과 ARIMA)을 적용하여 비트코인 가격에 대한 예측을 하는 예제를 알아보았다.

약 한달간의 비트코인 가격에 대한 예측을 한 결과 어느정도 추세를 반영하여 실제 가격 그래프와 유사한 추세를 갖는 결과를 얻을 수 있었다. 

 

 

하지만, 이 분석에는 비트코인 가격이 자기회귀와 이동평균을 따라서 변동될 것이라는 가정비트코인 가격이 어느정도 주기성을 가지고 움직일 것이라는 가정하에 위와 같은 결과가 나온 것이기 때문에, 위 분석 내용을 근거로 실제로 비트코인에 투자하는 일은 없기를 바란다.


 

이번 글에서는 시계열 분석을 하는 한가지 사례로 대중적인 관심을 얻고 있는 비트코인의 가격에 대한 예측을 해본 것이고, 실제로는 엑셈 강남 인공지능 연구소에서는 아래 그림과 같이 어느 정도의 정확한 주기를 가지고 있는 시스템의 모니터링 데이터에 대한 시계열 분석 업무를 진행하고 있다.

 

 

 

 

 

 

강인규 이사님께서 이번 뉴스레터에서 "전문가 기술기고" 시스템 관제 데이터 인공지능 분석(시계열 분석)에 관하여 작성해주셨습니다.

 

바쁘신 업무 중 시간을 내어 기고문을 작성해주셔서 감사의 말씀 드립니다.

 

 

 

 

글 편집| 글로벌마케팅팀 캉 위에, 함승민

사진 편집| 디자인기획팀 김보명

 

고평석의 '잘 하는 것들의 비밀' | 다섯 번째, 많은 이들 앞에서 설득할 수 있는가?


 
 여러 
사람 앞에서 이야기를 하는 것은 떨리는 일이다. 자신의 이야기를 듣는 사람이 많을수록 긴장감은 더욱 올라간다. 똑 같은 내용을 전달하더라도 1명 앞에서 말하는 것과 100명 앞에서 말하는 것은 마음가짐이 달라진다. 심지어 대중 앞에서 연설하는 것은 죽음의 공포보다 강렬하다는 여론 조사 결과까지 있을 정도다. 



“2001년 갤럽조사 설문 중에서 지상 최대의 두려움을 열거하라는 문항에 대해 미국인 40퍼센트가 대중 앞에서 말하는 것이 최대의 두려움이라고 답했다. 이 수치는 뱀을 무서워한다고 대답한 51퍼센트에 이어 두 번째로 높은 것이었다. 2005년 조사에서도 비슷한 결과가 나왔다. 응답자 중에서 42퍼센트가 대중연설이라는 생각만으로도 두려움을 느꼈다. 반면 죽음을 두려워한 사람은 28퍼센트에 불과했다.”


(책 <스피치의 정석>, 스테판 루카스 저, 교보문고 간)



하지만 대중연설에 능한 사람조차 이런 불안감을 느낀다. 그들이 멋진 연설, 스피치로 사람들 마음을 들었다 놓았다 하는 동안 심장이 콩닥콩닥 뛰는 중이다. 명연설가로 손 꼽히는 에이브러험 링컨, 윈스턴 처칠 등이 무대공포증이 있었던 인물의 대표적 예다. 



“기업 이사 81퍼센트가 대중연설이야말로 가장 신경이 곤두서는 경험이었다고 말했다. 코미디언 제리 사인펠트의 다음 농담에는 어느 정도 진실이 담겨 있다. 우리 대부분은 만약 선택할 수만 있다면 장례식장에서 (애도를 하는) 조사를 하느니 차라리 관에 누워있고 싶어 할 겁니다.”


(책 <스피치의 정석>, 스테판 루카스 저, 교보문고 간)



그렇지만 이런 불안감을 극복하고 멋진 연설을 할 수 있어야 진짜 리더가 될 수 있다. 많은 사람의 마음을 자신의 말로써 움직여본 경험은 중요하다. 어떠한 일이든 자신의 뜻을 이루기 위해서는 여러 사람의 도움이 필요하며, 적극적이고 자발적인 도움을 끌어내는데 설득만큼 중요한 것이 없기 때문이다. 


다행히 여러 사람 앞에서 말할 때 불안감을 극복할 수 있는 방법은 명쾌하게 나와있다. 말하기 경험을 쌓고, 충분히 준비를 하며, (연설 결과를) 긍정적으로 생각을 하고, (연설 과정을) 시각화 하여 시뮬레이션 해 보면 된다. 하나 더, 완벽은 애당초 존재하지 않음을 명심하자.









편집 | 글로벌마케팅팀 홍성덕



IT easy, IT is! | 열두번째, 딥러닝의 대모 페이페이 리


세계 최초의 프로그래머로 인정받는 에이다 러브레이스, 코볼(COBOL) 랭귀지를 만드는데 기여했고 디버그(debug)라는 단어를 만든 그레이스 호퍼, IBM에서 RDBMS Cost Based Optimizer를 만든 페트리시아 셀링거 등 컴퓨터 역사에서 많은 여성 엔지니어들의 기여가 있었습니다최근 새로운 기술 트렌드를 주도하고 있는 머신러닝 분야에서도 독보적인 여성 엔지니어가 있는데, 바로 페이페이 리(Fei-Fei Li) 입니다. 오늘은 페이페이 리에 대해서 알아보겠습니다.


  아메리칸 드림을 이룬, 딥러닝의 대모 '페이페이 리' 


(이미지 출처: http://money.cnn.com/2016/07/21/news/economy/chinese-immigrant-stanford-professor/index.html


페이페이 리는 현재 스탠포드 대학에서 컴퓨터 비전 연구실을 이끌고 있는데요

16살에 부모님과 함께 중국에서 미국으로 이민을 와서 그야말로 아메리칸 드림을 이뤄낸 장본인이라고 할 수 있습니다.


(이미지 출처: http://money.cnn.com/2016/07/21/news/economy/chinese-immigrant-stanford-professor/index.html


  중국에서는 지식인이었지만 미국에 이민을 온 페이페이 리의 부모님은 카메라를 고치거나 캐셔로 일하면서 힘들게 페이페이 리의 뒷바라지를 했고, 페이페이 리는 가난한 부모님을 돕기 위해 업소용 세탁기를 구매하여 세탁소를 직접 차려서 학비를 벌기도 했습니다. 그녀는 프린스턴 대학 졸업 후 매킨지, 골드만삭스 등의 제의를 뿌리치고 인공지능 박사가 되었고, 스탠포드 대학에서 컴퓨터 비전 연구실을 이끌게 되었습니다


  이러한 페이페이 리를 유명하게 만든 것은 다름이 아니라 이미지넷(ImageNet)이라는 대회 덕분입니다. 2012년 이미지넷 대회에서 제프리 힌튼 교수의 슈퍼비전팀이 딥러닝 기술로 압도적 우승을 하여 세상을 깜짝 놀라게 했었습니다그 이후 해가 거듭함에 따라서 더욱 발전하여 드디어 2017년에는 에러율을 3% 대로 낮추게 되어 인간의 능력을 능가하게 되었습니다. 영상 이미지 딥러닝의 발전에서 이러한 이미지넷은 매우 큰 기여를 했는데수십 억장의 이미지를 모아서 아마존 MTurk(Amazon Mechanical Turk)라는 플랫폼을 사용하여 수십만의 종류를 분류한 것입니다.


(이미지 출처: https://gluon-cv.mxnet.io/build/examples_datasets/imagenet.html)


바로 이 이미지넷은 2007년 스탠포드대의 페이페이 리가 만들었습니다. 이 데이터베이스를 만들 때 돈이 부족해서 많은 어려움을 겪었지만, 2009년 드디어 이미지넷 데이터베이스를 만들었고 2010년부터 대회를 열어 2017년 인간을 능가하게 된 것입니다. 앞으로는 3차원 이미지 등 더 어려운 문제로 다시 대회를 열 예정이라고 합니다. 페이페이 리가 이미지넷을 만들 때 주변의 동료교수들은 비웃었고, 지원금도 잘 받을 수 없었다고 TED 강연을 통해서 밝힌 바가 있습니다. 그러나 페이페이 리는 2009 10억장과 수만명의 노력으로 레이블이 달린 10억장의 이미지 데이터베이스를 확보하여 무료로 제공하게 되었습니다. 또한 스탠포드의 유명한 cs231n 영상 이미지 딥러닝 강의를 제자인 안드레 카파시와 개설하여 유튜브를 통해 무료로 공개하였습니다(cs231n 영상: https://www.youtube.com/playlist?list=PL3FW7Lu3i5JvHM8ljYj-zLfQRF3EO8sYv


(이미지 출처: https://medium.com/syncedreview/fei-fei-li-in-google-cloud-next-17-annoucing-google-could-video-intelligence-api-and-more-cloud-3f5faa87c729) 


최근에는 구글 클라우드에 합류하여 구글과 새로운 작업을 하고 있다고 합니다. 최종적인 그녀의 꿈은 기계에게 눈을 가지게 하는 것이라고 하는데요, 기계가 볼 수 있게 될 때 인간과 세상에 더 많은 혜택을 줄 수 있다고 생각하는 그녀의 꿈이 이뤄지길 기대해 봅니다.


                                                 


글로벌마케팅본부| 권건우 상무



공동작성/편집 | 글로벌마케팅팀 박예영

2018 ITem | 네 번째 ITem, 자율주행 자동차






자율주행 자동차

 

어느새 스마트폰이 기술의 집합체가 되고, 플랫폼이 된 것처럼

멀지 않은 미래에는 자율주행 자동차가 하나의 스마트홈, 스마트폰과 같이

최신 기술이 펼쳐지는 삶의 플랫폼이 될 날을 기다립니다 : )

고평석의 '잘 하는 것들의 비밀' | 네 번째, 실패의 경험도 가치가 있을까




  어린 시절 어머니는 TV 드라마의 다음 내용을 미리 예측하곤 하셨다. 놀라울 정도의 정확도였다. 이야기를 따라 잡기도 어려운데 어떻게 가능할까 싶었다. 경이로운 마음에 다른 친구들에게 이야기하니, 자신들도 비슷한 경험을 했다고 털어 놓았다. 사실 나이가 들면 자연스럽게 지혜로워진다. 그 비법이 무엇일까? 바로 경험의 양 때문이다. 마치 인공지능이 문제를 해결하는 방식과 같다. 수십 년 동안 여러 차례 시도를 거쳐 정답에 가까운 근사치를 찾아 놓은 것이다. 일터에서 일에 매진하는 과정도 비슷하다. 시간을 들일수록, 경험이 쌓일수록 지혜가 쌓이고 전문가 수준에 도달한다



컴퓨터 기술의 역사를 연구하는 한 역사학자는 프로그래머들은 정보 시대의 장인, 기술자, 벽돌공, 건축가라고 선언했다. 그들이 하는 일은 손으로 하는 노동이라기보다는 머리를 쓰는 일처럼 보이기 때문에, 프로그래머를 장인이라고 부르는 것은 적절하지 않다고 생각될 수도 있다. 하지만 그들의 일을 조금만 자세히 들여다보면 과학 혁명의 최전선에 있었던 기술자들과 많은 공통점을 찾을 수 있다. 포트란(FORTRAN)이라는 프로그래밍 언어를 만든 존 백커스(John Backus)는 자신의 방식을 반복을 통한 혁신, 끝없는 시행착오라고 설명했다. 백커스의 말이 사실이라면, 컴퓨터 과학의 핵심은 이론보다도 경험에 의해 좌우된다.” 


(<과학의 민중사>, 클리퍼드 코너 저, 사이언스북스 간)



심지어 간접 경험도 도움이 크게 된다. 그만큼 경험의 힘은 강렬하다. 머릿속으로 시뮬레이션을 해 본 사람과 그렇지 않은 사람 간에 능력 차이가 생길 정도다. 의사들에게 한 실험에서도 그것이 확인된다.



오피오이드(opioid, 아편 비슷한 작용을 하는 합성 진통 마취제)를 한번 살펴보자. …. 의사들이 오피오이드 처방 규칙을 어떻게 가장 효과적으로 배울 수 있는지를 확인하기 위해 설계된 한 실험을 살펴보자. 한 그룹의 의사들에게는 단지 오피오이드 처방 시 주의해야 할 규칙에 대해서 말해주고 1주일 후에 그 내용들을 얼마나 기억하고 있는지 물어봤다. 의사들은 자신들이 배웠던 내용을 잘 기억하지 못했을 뿐만 아니라 실제로는 배우지도 않은 새로운 규칙들을 머릿속에서 만들어냈다. 다른 그룹의 의사들에게는 가상의 환자들에 대한 이야기를 통해 똑 같은 정보를 제공했따. 이 그룹은 규칙을 매우 잘 기억했다.” 


(책 <최고의 교육>, 로베르타 골린코프, 캐시 허시-파섹 저, 예문아카이브 간)



실패에 혹시 좌절하고 있다면, 숱한 시행착오에 지쳐가고 있다면, 만약 그로 인해 지금 일을 그만 둘 생각이라면 그곳에서 뒤돌아 보자. 많은 경험은 이미 자신을 정답에 가까이 다가가게 해 주고 있을지 모른다. 경험의 가치는 생각보다 크다.  






편집 | 글로벌마케팅팀 홍성덕


IT easy, IT is! | 열한번째, 딥러닝의 대부 제프리 힌튼


제프리 힌튼이라고 들어보셨나요? 이번 시간에는 요즘 핫한 인공지능! 딥러닝의 아버지인 제프리 힌튼에 대해서 알아보겠습니다.


   인공신경망을 구해 딥러닝의 대부 '제프리 힌튼'


 심볼릭 인공지능을 대표하는 세이모어 페퍼트는 스승인 마빈 민스키와 함께 1969 "퍼셉트론"이라는 책에서 로젠블랏의 단순 퍼셉트론이 XOR 문제를 해결할 없음을 다양한 수학적 방식으로 증명하였습니다 책의 영향으로 연결주의 인공지능을 대표하는 신경망 연구는 거의 모든 지원금이 끊겨, 소위 말하는 인공지능의 1 겨울을 맞이하게 됩니. 실제로 세이모어 페퍼트는 1988 에세이에서 자기 자신을 왕비가 백설공주를 죽이라고 보낸 사냥꾼에 비유하면서, 1969 퍼셉트론 출판을 통한 신경망 비판을 농담처럼 회상한 바가 있습니다


▲ 제프리 힌튼 교수 (출처: https://alchetron.com/Geoffrey-Hinton)


이후 깊은 수렁에 빠져 있던 신경망을 구해 내고, 신경망이 위기에 빠질 마다 해결사로 등장하여 지금의 딥러닝을 있게 사람은 바로 제프리 힌튼입니다. 영 기호논리학의 창시자인 조지 불의 후손이기도 제프리 힌튼은 고등학교 자기 보다 공부를  하던 친구로부터 쥐의 브레인 연구에 관한 이야기를 처음 듣고 뇌에 관심을 갖게 되었습니다. 이후에 그는 캠브리지에 있는 킹스칼리지에 입학하여 처음에는 생리학과 물리학을 했고, 이후 철학 그리고 다시 심리학으로 석사학위를 받았습니다. 그런데 심리학으로 브레인의 동작원리를 파악할 없다고 판단하여 에딘버러 대학의 히긴스 교수를 찾아가 인공신경망으로 박사학위를 취득하게 됩니.

 그런데 힌튼은 영국에서 적당한 자리를 잡을 없었습니다. 이에 그는 미국으로 건너가 캘리포니아 대학, 카네기 멜론 대학에서 신경망 연구를 계속하게 됩니. 최근 앤드루 응과의 인터뷰에서 힌튼은 당시 영국에서는 신경망 연구가 환영받지 못했는데 미국의 캘리포니아에서는 자유로운 분위기에서 럼멜하트 교수 같은 대가가 격려해 주어서 매우 좋았다고 회상한 바가 있습니.



 제프리 힌튼과 신경망 연구


▲ 존 홉필드 (출처: http://hobbylibrary.tistory.com/9)

   데이비드 럼멜하트 (출처: https://www.psychologicalscience.org/observer/david-rumelhart)


 미국에서 연구하게 되면서 제프리 힌튼은 운명적인 대가들을 만나게 되는데, 명은 신경망에 처음으로 에너지 개념을 도입하여 상호결합형 신경망 연구의 새로운 지평을 열고 있었던 존 홉필드 교수였고, 다른 한 명은 인지과학의 대가인 데이비드 럼멜하트 교수였습니다제프리 힌튼은 1984 홉필드 교수의 제자인 테리 세이노프스키와 홉필드 네트워크를 개선한 '볼츠만 머신'을 제안하였고, 1986년에는 '백프로게이션 알고리즘'을 되살린 럼멜하트 교수 기념비적인 논문에도 참여할 있는 기회를 얻었습니다. 때부터 제프리 힌튼은 신경망 연구의 중심인물로 떠오르게 됩니


▲ 인공 신경망


 인공 신경망은 노드들의 그룹으로 연결되어 있으며 이들은 뇌의 방대한 뉴런의 네트워크과 유사합니다. 위 그림에서 각 원모양의 노드는 인공 뉴런을 나타내고, 화살표는 하나의 뉴런의 출력에서 다른 하나의 뉴런으로의 입력을 나타냅니다.



▲ 얀 레쿤, 요수아 벤지오와의 연구 그룹 결성 (각 사진 출처: http://www.feiguyunai.com/index.php/2017/10/29/pythonai-nnbasee01/)


 그러나 당시 미국의 레이건 행정부는 냉전과 군비확장에 열을 올리고 있었고, 제프리 힌튼은 인공신경망 연구가 군사적 목적으로 사용되는 원치 않았기 때문에 캐나다 고등과학원의 초청을 받아들여 캐나다 토론토 대학으로 자리를 옮기게 됩니토론토 대학에 있으면서 뉴욕 대학의 레쿤, 몬트리올 대학의 요슈아 벤지오 함께 딥러닝 연구 그룹을 결성하여 딥러닝 연구의 대부로 활동하여 많은 제자를 길러내고, 2006 RBM 연구 수많은 딥러닝 성과에 ,간접적으로 기여하였습니다.



                                     



공동작성/편집 | 글로벌마케팅팀 박예영

IT easy, IT is! | 열 번째, 비잔틴 장군의 딜레마

 

 

 블록체인 기술은 컴퓨터 공학계에서 수십 년간 해결하지 못한 문제로 지적되어 온 비잔틴 장군의 딜레마를 극복했다는 점에서 높이 평가받고 있습니다. ‘비잔틴 장군의 딜레마... 그것은 무엇인지, 블록체인 기술은 이를 어떻게 해결하는지 함께 알아보시죠

 

  'X맨'은 누구인가? '비잔틴 장군의 딜레마' 

 

 비잔틴 장군의 딜레마(The Byzantine Generals Problem)’란 비잔티움 제국에서 실제 일어난 일은 아니며, 1982년 분산 컴퓨팅의 대가라 불린 미국의 레슬리 램포트라는 컴퓨터 공학자가 동료 2명과 함께 발표한 연구 논문에서 사용된 표현입니다. 지리적으로 떨어져 있는 비잔틴 장군들(분산 네트워크 상황)이 적군의 성을 공격하기 위해 합의하는 문제인데요. 가정된 상황은 다음과 같습니다.

 

  · 각 장군들이 일정 비율 이상 합동으로 출병해야만 적에게 승리할 수 있음

  · 각 장군들은 전령(messenger)을 통해 한 번에 일제히 공격 가능한 공격 시간을 연락

  · 각 장군들은 가장 근처의 장군에게 연락

  · 장군들 중 배신자가 존재, 배신자는 실제 메시지와 다른 공격 시간으로 위조

 

 

 

▲ 비잔틴 장군의 딜레마

 

 비트코인과 블록체인

 

블록체인은 이를 작업 증명(PoW, Proof-of-Work)’이라는 해법을 통해 해결합니다. 앞선 시간에 채굴(mining)’ 개념에 대하여 소개하였습니다. 10분에 한 번씩 풀릴 만한 Hash 함수 문제가 주어지는데, Hash 함수는 출력값을 보고 입력값을 알기 어려운 특성을 가집니다. 따라서 참여자들은 값을 하나하나 넣어보는 활동을 통해서 입력값을 찾아내는 작업을 하게 되는데, 이를 작업 증명이라고도 부른다고 설명드렸습니다. Hash 함수 문제를 푸는 특정한 작업을 했다는 증명을 거쳐 거래를 증명하는 셈입니다.

 

다시 비잔틴 장군의 딜레마로 넘어가서 작업 증명 규칙을 추가해 본다면....

 

· 모든 장군들이 머리를 맞대어 10분 정도 걸려야 해결할 수 있는 수학 문제를 계속 푼다.

· 해답을 먼저 찾아낸 장군이 모든 장군에게 해답을 공유한다.

· 첫 번째 문제의 해답부터 순서대로 연결되어 공유된다.

· 해답을 공유할 때는 10분간 문제를 해결한 작업의 증거와 다른 장군이 이전 문제를 해결한 이력을 함께 공유해야 한다.

· 모두 공유하여 해답이 확인되면, 모든 장군들이 다음 문제로 넘어간다.

· 10분씩 문제를 풀고 해답을 공유하는 활동을 여러 번 반복한다.  

 

이 과정을 통해 장군들은 과반수가 문제를 푸는 과정에 참여했고, 10분마다 문제와 답을 공유하면서 메시지가 중복 없이 정리됐다는 점을 확인하며, 신뢰를 생성하게 됩니다.

 

이렇게 블록체인은 작업 증명의 원리를 통해서 중앙 기관이 없이도 소위 ‘X을 방지할 수 있도록 합니다. 이를 통해 그동안 많은 이들에게 난제로 여겨져 왔던 분산 네트워크(P2P 네트워크)의 가장 큰 약점 중 하나로 불려왔던 신뢰와 합의의 문제를 practical 하게 해결했다고 볼 수 있습니다.

 

 

                                                  

 

공동작성/편집 | 연구컨텐츠팀 안은혜


2018 ITem | 세 번째 ITem, 스마트팩토리









스마트팩토리란…?

 

제조 장비와 물류 시스템들이 인간의 개입 없이 폭넓게 자율적으로 조절되고 운용되는 공장이다.

스마트팩토리의 기술적 기반은 사물인터넷의 도움으로 상호 커뮤니케이션하는 사이버물리시스템이다. 사이버물리시스템은 가상세계와 물리적 실체가 연동된 시스템을 말하며, 가상의 영역에 속하는 컴퓨팅, 통신, 제어를 실제 물리적 세계와 통합한다.


모든 설비와 장치가 무선통신으로 연결되어 있기 때문에 실시간으로 전 공정을 모니터링하고 분석할 수 있다. 공장 곳곳에 사물인터넷(IoT) 센서와 카메라를 부착시켜 데이터를 수집하고 플랫폼에 저장해 분석하며, 이렇게 분석된 데이터를 기반으로 어디서 불량품이 발생하였는지, 이상 징후가 보이는 설비는 어떤 것인지 등을 파악하여 전체적인 공정을 제어한다. 


고평석의 '잘 하는 것들의 비밀' | 세 번째, 뛰어난 재주만으로는 성공을 못한다.





  학창 시절 IQ가 기억나는가? IQ 검사 결과가 발표될 때 교실 여기저기선 탄식이 터져 나왔다. “내가 돌고래네.” “난 진돗개 수준이다.” 그런데, IQ로만 인간 지능을 측정하는 게 불완전하다. 수학과 언어적 인지능력 한 가지로 평가하기 때문이다. 그래서 하버드대학교 하워드 가드너 교수의 다중지능 이론이 등장했을 때 큰 파장이 있었다. 인간의 지능은 수학, 언어 외에도 공간 지능, 자연 지능, 음악 지능, 체육 지능 등 다양하다는 내용이다. 사람들은 그제서야 깨닫게 된다. ‘그래, 맞다. 지능이 한 가지일리가 없다!’ 특히 가드너 교수는 앞서 말한 지능 중 한 가지가 뛰어나야 하고, 동시에 자기 조절력(intrapersonal intelligence)과 대인 관계력(interpersonal intelligence)이 강력해야 한다고 말했다. , 수학이든, 체육이든, 과학이든 아무리 뛰어난 재주를 가지고 있어도, 스스로 통제할 줄 알고 다른 사람의 마음을 잘 읽어야 비로소 성공을 거두게 된다. 타인의 마음을 읽고 받아들이는 능력이 곧 공감 능력이다. 누군가가 천재 소리를 듣다가 결국 비운의 천재라는 평가를 받을 때, 우리는 그가 공감 능력이 부족한 사람이었음을 깨닫곤 한다. 특히 4차 산업혁명 시대에는 더욱 공감 능력이 중요하다. 공감이 기술 문명에 올라타 빠른 속도로 증식이 가능해진 상황덕분이다



커뮤니케이션과 IT기술은 이제 하나의 이론에 불과했던 좁은 세상 이론을 현실로 바꿀 수 있는 가능성을 높여 준다. 전 세계에 깔린 커뮤니케이션 네트워크로 우리는 공감의 증식 효과를 꿈꾸게 되었다. 인류를 같은 인류나 동물로부터 갈라 놓았던 전통적 경계 전반에 새로운 공감이 스며들고, 그 공감이 무수히 많은 다른 존재들의 삶으로 퍼져 나가 그들에게 영향을 미치면, 모든 인류는 머지않은 장래에 하나의 공감으로 둘러싸이게 될지 모른다.” 


(책  <공감의 시대>, 제러미 리프킨 저, 민음사 간)




사람들은 공감해 주는 사람(대상)에게 자신의 마음을 쉽게 준다. 세계 역사를 봐도 그 증거가 무수히 많다. 지금의 기독교가 있게 만든 사도 바울이 대표적 예다. 철학자 카를 야스퍼스가 이야기한 기원전 800년에서 서기 200년 사이에 축의 시대가 펼쳐졌다. 신기하게 이때 온갖 인류의 기본 사상들이 탄생한다. 공자, 노자, 붓다, 조로아스터, 소크라테스, 플라톤 그리고 예수가 등장한다. 이 중에서 자본주의와 세계화에까지 영향을 미친 것이 예수와 기독교다. 사도 바울은 기독교가 로마 제국의 작은 종파에 머무를 뻔한 상황을 공감 능력을 바탕으로 뒤집어 놓았다. 나를 잘 알아주고 공감해 줄 수 있는 신을 찾아 사람들이 모여들었다.



그때까지만 해도 신들은 저 멀리 있는 잔인하고 변덕스러운 존재로 여겨져 왔다. 무엇보다 신들은 범접하기가 힘들었다. 하지만 이것이 꼭 나쁘지만은 않았는데, 사람들은 신을 사랑하기보다는 두려워했기 때문이다. 신을 사랑한다는 것은 말도 안 되는 소리였다. 더 허무맹랑한 것은 신들이 인간 개개인을 알고 사랑할 수 있다는 생각이었다. 그런데 바울은 바로 그 점을 가르쳐주었다. … ‘모두를 위한 종교라는 구상은 혁명적이면서 초기 민주주의적이었다. 그 결과는 엄청났다.” 


(책  <세계사라는 참을 수 없는 농담>, 알렉산더 폰 쇤부르크 저, 추수밭 간)




2018 ITem | 두 번째 ITem, 딥러닝

딥러닝이란...?


딥 러닝은 인간의 두뇌가 수많은 데이터 속에서 패턴을 발견한 뒤 사물을

 구분하는 정보처리 방식을 모방해 컴퓨터가 사물을 분별하도록 기계를 학습시킨다.

딥 러닝 기술을 적용하면 사람이 모든 판단 기준을 정해주지 않아도 컴퓨터가 스스로 인지·추론·판단할 수 있게 된다.

 음성·이미지 인식과 사진 분석 등에 광범위하게 활용된다. 구글 알파고도 딥러닝 기술에 기반한 컴퓨터 프로그램이다