4. 프로젝트
소개
• 기계학습을 이용한 숫자인식기 제작
• 주요 개발 환경
• Python 2.7
• Keras, Pandas, Theano, Numpy, Scikit-learn
등의 라이브러리
• 고성능의 연산 처리 능력을 갖춘 하드웨어 장비 환경
• CUDA GPU, 32GB RAM 등
4
5. 기계학습
소개
• 대량의 데이터를 입력시키면
스스로 데이터에 대해 학습하는 알고리즘
• 데이터에서 패턴을 찾아내는 새로운 방법
• 기존의 규칙 기반의 알고리즘으로 불가능한 일을 해냄
• 숫자 인식, 음성 인식 등
• 분류, 예측 등 산업에 응용 분야가 다양
5
6. 숫자인식과
MNIST
• 손으로 쓴 우편번호 자동 인식기
• 수표에 기입한 금액 숫자 자동 인식기
• MNIST 데이터
• 28 X 28 Image
• Image Label: 0~9
6
7. 인공신경망 • 뉴런 세포의 작동 원리에서 아이디어를 얻음
• Hidden Layer의 역할로 강력한 학습 모델이 됨
(Non-linear Classifier)
• 적당한 파워의 모델을 찾기 어렵다
7
13. Deep
Learning
• Logistic Regression
• Perceptron
• Multi-layer Neural Network
• CNN (Convolutional Neural Network)
• RNN (Recurrent Neural Network)
• Hopfield Net
• Restricted Boltzmann Machine
• Deep Belief Net
13
14. 기계학습의
응용과
Kaggle
• 기업들이 기계학습으로 풀 수 있는 문제를
제시하고 상금을 건다.
• 전 세계의 Data Scientist들이 각자의 해법을 고
안하여 답안을 제출
• 기계학습이 실제로 사용되는 곳에 실제 데이터를
가지고 응용해 볼 수 있는 기회
https://www.kaggle.com/competitions
14