사용안내 및 노트

홈으로/사용안내 및 노트
제목004. 기타 필수 개념2020-06-17 23:31:36
작성자

☐ 기타 필수 개념

 ○ AI 모델 (솔루션)을 개발하기 이전에 환경 (environment)을 분석해야 하는데, 환경 유형은 크게 4가지로 구분할 수 있다.

  - fully observable vs partially observable

  - deterministic vs stochastic

  - discrete vs continuous

  - benign vs adversarial

 ○ Fully Observable vs Partially Observable

  - 에이전트가 특정 시점에 감지한 내용이 최적의 결정을 내리기에 충분하다면 해당 환경을 fully observable 이라고 한다.

  - 카드 게임을 예로 든다면,

   · 모든 카드가 테이블 위에 놓여 있을 경우는 해당 환경이 최적의 선택을 하기에 충분하므로 fully observable 이라고 할 수 있으며

   · 일부 카드가 오픈되지 않은 상태인 경우는 이전의 움직임을 기억하고 반영하여야 더 나은 결정을 내릴 수 있는데 이를 partially observable 상태라고 할 수 있다.

   · 체스는 플레이어가 보드를 모두 볼 수 있으므로 fully observable에 속한다.

 ○ Deterministic vs Stochastic (필연 vs 우연) 

  - deterministic: 에이전트의 행위에 대한 결과를 분명하게 예측할 수 있을 때

  - stochastic: 에이전트의 행위에 대한 결과를 확률적으로만 예측할 수 있을 때 

 ○ Discrete vs Continuous 

  - discrete: 감지할 수 있는 대상과 취할 수 있는 행동의 수가 제한적일 때

  - continuous: 감지할 수 있는 대상과 취할 수 있는 행동의 수가 무제한일 때 

 ○ Benign versus Adversarial 

  - benign 환경은 랜덤 또는 확률적일 수 있지만, 자신의 목적에 모순되는 다른 목적을 가지고 있지는 않다. 

   · 즉, agent를 공격할 의도가 없다.

   · 날씨는 랜덤하게 나타나고 사람들의 행동에 영향을 줄 수 있지만 의도적으로 사람들의 행동을 방해하거나 통제하지는 않는다. 따라서 날씨는 benign 환경이다.

  - adversarial 환경은 agent를 공격할 의도를 내포하고 있다.

   · 체스와 같은 많은 게임은 상대방을 이기기 위한 목적을 가지고 있다.

   · 당연히 benign 환경보다 adversarial 환경에서 적절한 액션을 취하기가 더 어렵다. agent가 성취하고자 하는 것을 적극적으로 관찰하고 방해하는 환경이기 때문이다.

환경 유형

체커

포커

로봇 자동차

fully observable vs partially observable

fully

partially

partially

deterministic vs stochastic

deterministic

stochastic

stochastic

discrete vs continuous

discrete

discrete

continuous

benign vs adversarial

adversarial

adversarial

benign

 ○ AI와 불확실성(uncertainty)

  - AI는 컴퓨터 소프트웨어가 불확실성을 관리하는 기술이다.

  - AI = what to do when you don't know what to do

  - 불확실성이 발생하는 이유

   · sensor limit

   · adversaries

   · stochastic environments.

   · laziness

   · ignorance

 ○ Data의 종류

Nominal Data

Ordinal Data

▪예) 티셔츠 컬러

▪예) 직무

 ○ Continuous vs Discrete

  - 예측 값을 그래프에 선으로 표시할 수 있으면 continuous, 점으로만 표시할 수 있으면 discrete

 ○ regression 모델의 예측 값 특성은 ‘continuous’이고, classification 모델의 경우는 ‘discrete’라고 설명했다. 하지만, 이 모델 사이에는 겹치는 부분이 존재한다.

  - regression 모델의 예측 값이 ‘discrete’ 형태일 수 있지만, 이는 숫자를 discrete value로 표현한 것이다.

  - 반대로, classification 모델의 예측 값이 ‘continuous’ 형태일 수 있지만 이는 class label을 확률로 표현한 것이다.

 ○ decision trees나 artificial neural networks 알고리즘은 조금만 수정하면 regression 모델과 classification 모델에 모두 사용할 수 있다.

 ○ 하지만, linear regression과 logistic regression 모델은 각각 regression과 classification이라는 원래의 용도로만 사용할 수 있다.

  - discretization 이라는 방식을 통해 문제의 본질을 변경할 수는 있다.

 ○ Classification 예측 결과는 “accuracy”를 통해 평가하고, regression 예측 결과는 “MSE”, “RMSE” 등을 통해 평가할 수 있다.

 ○ ML 주요 알고리즘

 ○ ML 수행 순서

① 데이터 취합 (gathering data) 및 정리 (cleaning data)

② Feature Engineering

③ 모델링

④ 학습, 테스트, 예측, 평가