☐ 기타 필수 개념 ○ AI 모델 (솔루션)을 개발하기 이전에 환경 (environment)을 분석해야 하는데, 환경 유형은 크게 4가지로 구분할 수 있다. - fully observable vs partially observable - deterministic vs stochastic - discrete vs continuous - benign vs adversarial ○ Fully Observable vs Partially Observable - 에이전트가 특정 시점에 감지한 내용이 최적의 결정을 내리기에 충분하다면 해당 환경을 fully observable 이라고 한다. - 카드 게임을 예로 든다면, · 모든 카드가 테이블 위에 놓여 있을 경우는 해당 환경이 최적의 선택을 하기에 충분하므로 fully observable 이라고 할 수 있으며 · 일부 카드가 오픈되지 않은 상태인 경우는 이전의 움직임을 기억하고 반영하여야 더 나은 결정을 내릴 수 있는데 이를 partially observable 상태라고 할 수 있다. · 체스는 플레이어가 보드를 모두 볼 수 있으므로 fully observable에 속한다. ○ Deterministic vs Stochastic (필연 vs 우연) - deterministic: 에이전트의 행위에 대한 결과를 분명하게 예측할 수 있을 때 - stochastic: 에이전트의 행위에 대한 결과를 확률적으로만 예측할 수 있을 때 ○ Discrete vs Continuous - discrete: 감지할 수 있는 대상과 취할 수 있는 행동의 수가 제한적일 때 - continuous: 감지할 수 있는 대상과 취할 수 있는 행동의 수가 무제한일 때 ○ Benign versus Adversarial - benign 환경은 랜덤 또는 확률적일 수 있지만, 자신의 목적에 모순되는 다른 목적을 가지고 있지는 않다. · 즉, agent를 공격할 의도가 없다. · 날씨는 랜덤하게 나타나고 사람들의 행동에 영향을 줄 수 있지만 의도적으로 사람들의 행동을 방해하거나 통제하지는 않는다. 따라서 날씨는 benign 환경이다. - adversarial 환경은 agent를 공격할 의도를 내포하고 있다. · 체스와 같은 많은 게임은 상대방을 이기기 위한 목적을 가지고 있다. · 당연히 benign 환경보다 adversarial 환경에서 적절한 액션을 취하기가 더 어렵다. agent가 성취하고자 하는 것을 적극적으로 관찰하고 방해하는 환경이기 때문이다. 환경 유형 | 체커 | 포커 | 로봇 자동차 | fully observable vs partially observable | fully | partially | partially | deterministic vs stochastic | deterministic | stochastic | stochastic | discrete vs continuous | discrete | discrete | continuous | benign vs adversarial | adversarial | adversarial | benign |
○ AI와 불확실성(uncertainty) - AI는 컴퓨터 소프트웨어가 불확실성을 관리하는 기술이다. - AI = what to do when you don't know what to do - 불확실성이 발생하는 이유 · sensor limit · adversaries · stochastic environments. · laziness · ignorance ○ Data의 종류 
Nominal Data | Ordinal Data | ▪예) 티셔츠 컬러 | ▪예) 직무 | 
| 
|
○ Continuous vs Discrete - 예측 값을 그래프에 선으로 표시할 수 있으면 continuous, 점으로만 표시할 수 있으면 discrete 
○ regression 모델의 예측 값 특성은 ‘continuous’이고, classification 모델의 경우는 ‘discrete’라고 설명했다. 하지만, 이 모델 사이에는 겹치는 부분이 존재한다. - regression 모델의 예측 값이 ‘discrete’ 형태일 수 있지만, 이는 숫자를 discrete value로 표현한 것이다. - 반대로, classification 모델의 예측 값이 ‘continuous’ 형태일 수 있지만 이는 class label을 확률로 표현한 것이다. ○ decision trees나 artificial neural networks 알고리즘은 조금만 수정하면 regression 모델과 classification 모델에 모두 사용할 수 있다. ○ 하지만, linear regression과 logistic regression 모델은 각각 regression과 classification이라는 원래의 용도로만 사용할 수 있다. - discretization 이라는 방식을 통해 문제의 본질을 변경할 수는 있다. ○ Classification 예측 결과는 “accuracy”를 통해 평가하고, regression 예측 결과는 “MSE”, “RMSE” 등을 통해 평가할 수 있다. ○ ML 주요 알고리즘 
○ ML 수행 순서 
① 데이터 취합 (gathering data) 및 정리 (cleaning data) ② Feature Engineering ③ 모델링
④ 학습, 테스트, 예측, 평가 |