빅데이터의 다음 단계는 예측 분석이다
기계학습
- 컴퓨터에 명시적으로 프로그래밍 하지 않고 학습할 수 있는 영역 (Arthur Samuel , 1959)
만약 작업 T에 대해 기준 P로 측정한 성능이 E로 인해 향상되었다면, 그 프로그램은 작업 T에 대해 P의 관점에서 경험 E로부터 “배웠다”라고 말할 수 있다. (Tom Mitchell, Machine LEarning, 1998)
기계학습의 핵심
- 표현(representation)
- 기계학습 알고리즘이 어떻게 데이터의 특징을 잘 잡아내도록 할까?
- 일반화(generalization)
- 기계학습 알고리즘이 어떻게 이전에 보지 못한 데이터에서도 잘 작동하게 할까?
기계학습을 수행하기 위해 필요한 능력
머신러닝 3종류
- unsupervised learning
- supervised learning
- reinforcement learning
4차 산업혁명
- 1차 산업혁명: 증기기관을 활용하여 기계적 혁명 시작
- 2차 산업혁명: 공장에 전력이 공금되고 대량 생산이 가능
- 3차 산업혁명: 컴퓨터 & 인터넷의 발달로 발생된 정보혁명
- 4차 산업혁명: 디지털 기술에 의한 생산 혁명
데이터 리터러시
- 데이터를 목적에 맞게 활용하는 데이터 해석 능력
- 데이터 수집, 관리, 가공 및 분석, 시각화 ,기획 역량 등
비즈니스 애널리틱스
- 과거 데이터를 통해 밝히는 묘사 분석(Descriptive Analytics)
- 어떤 일이 있었는지(What happended?)
- 진단 분석(Diagnostic Analytics)
- 발생한 현상에 대한 원인을 찾는(Why did it happen?)
- 예측 분석(Predictive Analytics)
- 앞으로 어떤 일이 생길지 예측하는(What will happen?)
- 의사결정에 도움을 주는 처방 분석(Preseiptive Analytics)
- 예측 분석을 통해 예상할 수 있는 것들을 어떻게 만들어 낼 수 있는지