본문 바로가기

인공지능

인공지능 1. 인공지능이란

인공지능에 대해 이야기하기 전에, 인공지능과 관련된 여러 가지 개념들에 대해 정리하고자 한다.

 

Machine Learning / Big Data

머신 러닝은 문자 그대로 기계 학습이다. 기계가 여러 가지 학습 방법으로 스스로 주어진 문제를 해결하는 방법이다.

빅데이터는 엄청난 양의 데이터를 말하고 실제로는 그 데이터들의 가치를 추출하고 결과를 분석하는 방법을 통틀어 빅데이터라고 한다.

 

머신 러닝은 빅데이터를 분석하고, 이해하고, 예측해 새로운 가치를 창출하기 위한 하나의 방법이다.

 

Machine Learning / Data Mining

‘데이터 마이닝’은 보유한 데이터를 다양한 관점에서 분석하고 그 결과를 유용한 정보로 조합하는 일을 가리킨다.
-> 삼성전자 뉴스룸

데이터 마이닝은 수많은 데이터 속에서 패턴과 상관성을 찾아내 가치를 부여한다. 이를 위해서 필요한 것은 정형화된 데이터(structured data)이다. 그러나 Machine Learning은 패턴이 없는 데이터이더라도 학습 알고리즘 등을 통해 경험을 기반으로 미래를 예측할 수 있다. 물론 Machine Learning의 학습 수단으로도 데이터 마이닝이 쓰일 수는 있겠다.

 

Machine Learning / Artificial Intelligence

Machine Learning이 가지고 있는 데이터에서 분석을 해 새로운 정보를 도출해냈다면 AI, 인공 지능은 인간처럼 새로운 사실을 추론할 수 있는 분석기법이다. 데이터가 제공해주지 못하는 사실들을 추론하고 판단할 수 있게 되는 것이다.

예를 들어, 기존의 데이터를 통해 기온이 낮을 경우 패딩의 판매량이 증가한다는 사실을 알고 있다면, 인공지능은 기온이 높다면 어느 옷의 판매량이 증가하는지도 추론할 수 있게 된다.

 

즉 Machine Learning은 어찌 되었건 기존의 데이터에 의존하는 반면, AI는 기존의 데이터보다는 새로운 추론에 더 초점을 맞추게 된다.

 

 

 

Machine Learning의 학습법

  • Supervised Learning (지도 학습)
  • Unsupervised Learning (비지도 학습)
  • Representation Learning (표현 학습)
  • Reinforcement Learning (강화 학습)

 

Supervised Learning (지도 학습)

입력 데이터와 원하는 결과값을 모두 알려준 상태에서 데이터를 구분할 수 있도록 하는 학습방법이다.

왼쪽 training data를 넣을 때, 이러한 사진들이 전부 자동차라는 사실을 미리 알려준 뒤에, test data가 자동차인지 아닌지 구분하는 형식이다.

 

지도 학습 : 이것이 자동차인가 아닌가? 

 

 

Unsupervised Learning (비지도 학습)

비지도 학습은 지도 학습처럼 training 데이터에 labeling이 없는 경우이다. 여러 이미지 중 컴퓨터가 자체적으로 패턴을 파악하고 웹 페이지 등을 조사해 기계 나름대로의 패턴의 의미를 파악해나갈 수 있다.

 

 

위 사진에는 자동차, 나무, 꽃 등 여러 종류와 형태의 사진이 있다. 비지도 학습에서는 이미지의 패턴을 스스로 인식해 특정 주어진 데이터에서 특정 카테고리를 식별할 수 있게 된다. 

 

비지도 학습 : 이것이 무엇인가?

 

 

Reinforcement Learning (강화 학습)

강화 학습은 시행착오를 통해 모델을 개선해나가는 방식이다. 과거에 효과가 있었던 방식을 시스템에 반영하면서 새로운 방법 또한 시스템에 반영할 수 있다. 이렇게 개선된 작업을 반복하며 새로운 통찰력이나 일처리 방식을 찾아낼 수 있는 것이 강화 학습의 장점이다. 그러나 아직까지 실전에 적용하기는 무리가 있고 개발 cost 또한 매우 높다는 것은 단점이다.

 

https://youtu.be/V1eYniJ0Rnk

 

아무런 데이터도 입력하지 않았는데 점수를 올려야 한다라는 하나의 규칙만 반영된 시스템이 강화 학습을 통해 점점 점수를 내는 방법을 터득해 나가는 유명한 게임 영상이다.

 

Representation Learning

표현 학습의 가장 대표적인 주제는 Deep Neural Network, 인공신경망이다.

뉴럴 네트워크 개념은 1950년대부터 있어왔으나 최근에 들어 주목받는 이유는 크게 2가지이다.

 

1. 과거에는 뉴럴 네트워크를 학습할만한 방대한 데이터가 없었고,

2. 기존 탐색 알고리즘을 대체할 만큼 필요성을 느끼지 못했다.

 

 

얼굴 인식을 예로 들어 살펴보자.

 

 

 

  • 1번 레이어에서는 픽셀 단위로 색, 명암을 파악한다.
  • 2번 레이어에서는 1번 레이어에서 판단한 색을 기반으로 선과 간단한 모양 등을 파악한다. 비슷한 색이 이어진다면 선으로 인식할 것이다.
  • 3번 레이어에서는 2번 레이어에서 판단한 선과 모양을 기반으로 조금 더 복잡한 형태의 모양이나 물체를 학습한다. 여기서 눈, 코, 입 등을 파악할 수 있게 된다.
  • 4번 레이어에서는 얼굴이라고 판단되는 물체를 파악할 수 있게 된다.

 

기존에는 눈을 파악하는 알고리즘, 코를 파악하는 알고리즘, 입을 파악하는 알고리즘이 각각 존재했다. 그러나 현대에 와서는 사진의 픽셀 수도 점점 많아지고 데이터의 양 또한 매우 방대해지기 때문에 이렇게 각각 알고리즘을 만들어서 처리를 하는 것보다 표현 학습을 이용해 얼굴의 형태를 찾아가는 것이 더 효율적인 방법이 되었다.

 

 

 

 

 

 

 

 

'인공지능' 카테고리의 다른 글

인공지능 7. Multinomial Classification  (0) 2020.04.08