AI & Bigdata #1 Narrow AI, General AI 란? 딥러닝은 뭘까?
이번 포스팅에서는 AI Bigdata 직군의 면접을 가면 한 번쯤 듣게 되는, 혹은 굳이 AI Bigdata 관련 직군이 아니더라도 IT 업계 종사자라면 생각해 볼만한 AI의 개론적인 부분에 대해 포스팅해보고자 한다.
1. Narrow AI vs General AI
먼저, 인공지능이란 무엇일까? 인공지능(Artificial Intelligence)이란 말 그대로 사람이 인공적으로 만든 지능이라고 할 수 있는데, 일반적으로 좁은 관점의 인공지능(Narrow AI)과 일반적인 인공지능(General AI)으로 나뉘게 된다. 많은 사람들이 알파고 사건(?) 이후로 당장 인공지능에 의한 '일자리가 손실'과 더 나아가 '인류의 멸망'까지 걱정을 하는데, 아직 우리 사회에 개발된, 또는 가까운 미래에서 운영될 AI 서비스들은 'Narrow AI' 이기에 이러한 걱정은 시기상조라고 할 수 있다...!!
Narrow AI 즉, 좁은 관점의 인공지능은 딥러닝 모델을 응용한 자동차가 자율주행을 하거나, 페이스넷과 같은 API를 탑재한 디바이스로 얼굴인식을 하는 방식의 아주 일부분에만 적용되는 인공지능 기술이다. 이는 현대 산업에 적용되어 가고 있고, 또 보편적으로 보급될 기술이다.
링크의 글을 참고하시길 바란다 :) : https://hackernoon.com/general-vs-narrow-ai-3d0d02ef3e28
반면, 우리가 흔히 아이로봇, 매트릭스에서 봤던 만능 사고하고 감정을 느끼는 인공지능 로봇들은 General AI이다. 위의 General AI처럼 인간의 사고와 감정을 느끼게 구현하는 것은 매우 복잡한 로직이 필요하며 많은 컴퓨터 사이언티스트들도 현대 과학 기술로는 불가능하다고 인정하는 영역이다.
아무리 딥러닝이 각광받고 딥러닝으로 개발된 알파고가 사람을 이겨도 모든 부분에서 사람을 뛰어넘는 만능 인공지능을 만드는 것은 아직 어려운 부분이라는 것이다. 실제 블랙박스 인공지능이라고 불리며 결과 값을 제작자도 원인을 잘 알지 못하는 경우가 대부분이며 'XAI(설명 가능한 인공지능)'을 따로 연구하는 분들도 있다.
설명이 불가능한 '블랙박스 인공지능' 이 만들어지는 이유는 딥러닝을 사용하면 수많은 뉴런들이 조직되어, '컴퓨터가 스스로 인식, 분석' 하며 연산처리를 하는 것이 딥러닝의 특징이기 때문인데, 이러한 부분 때문에 당장 우리가 원하는 '자아를 가진 AI'를 만드는 것은 복잡하고 어렵다는 점이 있다.
따라서 General AI는 우리가 나아가야 하는 방향이며 이에 대한 우려와 걱정은 다음 세대가 다룰 문제가 될 것 같다.
2. 인공지능, 머신러닝, 딥러닝 도대체 무슨 차이지?
AI라고 하면 보통 인공지능, 머신러닝, 딥러닝에 대한 이야기가 나온다. 도대체 무슨 차이인데 면접에서 이리도 많이 물어보는 걸까??... 수많은 학자들도 의견이 분분 한데, 일개(?) 블로거가 일반인도 이해하기 쉽게 정리를 해보고자 하다. 보통 인공지능(AI), 머신러닝(ML), 딥러닝(DL)을 아래와 같이 분류한다.
AI 즉, 인공지능은 효율화와 최적화를 위한 도구이며 알고리즘과 같은 최소한의 모델 규칙을 인간이 제공할 시 컴퓨터가 특정 과제를 수행하고 결과 값을 예상하는 것입니다. 학문이라기보다는 기술에 가깝다고 할 수 있는데, 쉽게 말해 인간의 지능을 기계로 구현하는 것이라고 정의할 수 있을 것이다.
이와 같이 컴퓨터로 인공지능을 구현(모델제작) 하는 방법 중에는 머신러닝이라는 좋은 기법이 있다. 머신러닝은 기본적으로 알고리즘 기반(Algorithmic Intelligence)으로서 예측값에 영향을 주는 Parameter의 값을 개발자가 적절히 세팅하여 모델의 정확도를 향상하는 것이다. (Parameter의 개수가 많을수록 복잡도가 높아지게 된다.)
머신러닝 같은 경우 인간이 최소한의 조건을 기계에게 주어 특정 문제에 대한 예측을 하는 모델을 만들게 되는데, 여기서 요즘 유행하는 딥러닝 이야기를 해보려한다.
머신러닝과 딥러닝은 데이터를 학습한다는 측면에서는 동일한 인공지능 모델 기법이지만 앞서 말한 것처럼 머신러닝은 개발자가 최소한의 사전 알고리즘 설계(파라미터 값 조절 등의 지도 학습)가 필요한 반면, 딥러닝은 데이터 기반(Data-Driven)으로 컴퓨터가 데이터를 스스로 학습하며 특징을 찾아내고 분석하는 기법이다. 즉, 완전한 머신러닝을 구현하는 방법. 이상적인 방법이라고 할 수 있을 것 같다.
이는 딥러닝의 핵심인 '뉴럴 네트워크(Neural Network)'가 사람의 뇌를 본떠 만든 인공 신경망의 형태이며, 사람의 뇌처럼 이루어진 구조의 뉴런들로부터 활성 함수를 거쳐 데이터의 패턴을 스스로 분석하기 때문에 가능하다. 간단하게 정리하자면 최적화와 효율화를 위한 인공지능 기술의 범주안에 기계학습을 통한 머신러닝 기법이 있고, 머신러닝 기법 안에 알고리즘 기반이 아닌 컴퓨터가 스스로 데이터를 분석하는 딥러닝 기법이 있다고 보면 되겠다.
3. 왜 갑자기 모두 딥러닝을 외치는 걸까??
요즘은 IT 직군이 아닌 사람도 딥러닝에 관심이 있는 사람이 많다. 왜 그럴까? 필자의 생각에는 현재 딥러닝 기술 중 CNN기법을 활용한 'ResNet(2015)' 은 사람의 인식력을 뛰어넘을 정도의 수준이고 특히, 한국에서는 알파고와 이세돌 씨의 대국으로 AI에 대한 관심이 높아졌기 때문이라고 생각한다.
아주 핫한 기술처럼 보이지만, 딥러닝의 기초가 되는 ANN(인공신경망)의 역사는 상당히 오래되었다. 인공신경망의 역사는 1940년대부터 시작되었으나 기술 발전의 침체기로 몇 번의 빙하기를 거치다가 최근 토론토 대학 제프리 힌튼 교수님의 딥러닝으로 인공신경망은 다시 주목받기 시작했다.
이는 인공신경망의 역사를 잘 알아야 충분히 이해가 가능할 것이다. 관련된 것은 다음 포스팅에서 자세히 다룰 것이며 간략하게만 이해하고 넘어가자면..
ANN을 기초 베이스로 하여 DNN(Deep Neural Network)를 응용한 다양한 알고리즘이 만들어졌고, 이런 모델을 구현하는데 필요한 많은 양의 데이터(빅데이터)가 IoT&센서 네트워크의 발달로 수집이 가능해졌으며 결과를 산출하기 위한 연산처리 GPU의 발달로 현재의 딥러닝이 각광받고 있다고 이해하시면 될 것 같다.
현존하는 인공지능 기술 중 딥러닝이 성능이 우수하고 미래 지향적인 기법이 이라고 볼 수 있으나, 그렇다고 딥러닝이 모든 상황에서 가장 합리적으로 사용돼야 하는 인공지능 기술은 아니다. 딥러닝은 블랙박스 인공지능이 대부분으로 불안정하고, 이유를 알 수 없는 알고리즘으로 구현되어있다. 또한, 많은 양의 데이터가 있어야 컴퓨터가 스스로 데이터의 패턴을 확인하므로 비용이 많이 든다. 따라서 산업환경에 따라 효율적인 기술을 적용하여 사용해야 할 것이라는 말로 이번 포스팅을 마무리 한려한다.
댓글