인공지능, 머신러닝의 이해 강의자료 2019.12.20

2019년 12월 20일
작성자: 정교윤
인공지능, 머신러닝의 이해
1

2
목차
• 디지털 트랜스포메이션으로 인한 비즈니스 환경의 변화
• 왜 디지털 트랜스포메이션이 인공지능 주도의 트랜스포메이션
인가?
• 인공지능(AI)에 대한 소개
• 데이터(Data)의 형태
• 머신러닝 기초 (Machine Learning Basics)
• 신경망(Neural Network)

3
디지털 트랜스포메이션으로 인한
비즈니스 환경의 변화

왜 디지털 트랜스포메이션인가?
전통기업과 혁신기업의 가치
2000년대 중반을 지나면서 모바일, 인공지능, IoT, 클라우드, 3D 프린팅, 로봇을 비롯한 디지털 기술의 급속한
발전과 혁신을 통해 기업 내외부의 업무의 자동화, 지능화가 이루어지면서 전통기업들은 기존의 전통적인 기업
운영방식으로는 기업을 경영하기 어려워졌고 닷컴 버블이 끝난 후 살아남은 거대 IT 기업들과 공유경제를 표방하
며 디지털 기반으로 수익을 내는 기업들을 비롯한 이른바 혁신기업들이 급속도로 성장하면서 전통기업들을 위협
하기 시작했고 시가총액면에서도 추월하기 시작했다. 2019년 기준으로 미국 내 시가총액 TOP 5에 드는 기업에
전통기업은 포함되어 있지 않다.

이런 상황에서 제조 및 유통에 기반을 둔 전통기업들은 생존을 위해 사내 업무를 자동화 및 지능화하는 데 집중하
는 한편, 잉여인력을 줄이고 혁신기업들과 협력하면서 전사적으로 모든 업무 프로세스를 디지털 기반으로 전환하
는 프로젝트를 진행하면서 디지털 트랜스포메이션(Digital Transformation)이라는 용어가 등장하게 되었고 이
용어의 의미는 점점 중요해지고 있다.
4
출처: Digital Information World 출처: 디지털 리테일 컨설팅 그룹

디지털 트랜스포메이션은 도대체 무엇인가?
디지털 트랜스포메이션(Digital Transformation)의 정의
‘트랜스포메이션’의 사전적 의미는 변화나 변신이지만 비즈니스적으로 보았을 때는 ‘대변환’이라는 의미에 가까
우며 기존에 진행해온 업무의 혁신이나 변화보다 한 차원 높은 근본적인 변화와 변혁을 의미한다.

디지털 트랜스포메이션(Digital Transformation)은 ‘디지털화된 모든 것(All things Digital)으로 인해 발생
하는 다양한 변화에 대응하여 디지털 기반으로 기업의 전략, 조직, 프로세스, 비즈니스 모델, 문화, 커뮤니케이션,
시스템을 근본적으로 변화시키는 경영전략을 의미한다.
5
출처: https://www.zdnet.com/article/the-sap-platform-and-digital-transformation/출처: The strategic indicators of digital transformation in education

디지털 트랜스포메이션을 어떻게 추진하는가?
디지털 트랜스포메이션(Digital Transformation) 프로세스
앞서 언급한 대로 디지털 트랜스포메이션은 기존의 업무 변화보다 한 차원 높은 단계로 근본적인 변화를 일으키
는 전략을 말하므로 이를 수행하기 위해서는 경영진의 지지 및 투자예산 확보, 명확한 비전과 범위 설정, CDO
(Chief Data Officer) 휘하의 디지털화 전담 조직 신설이 필요하고, 이와 더불어 해당 조직이 새롭고 어자일한
업무 방식 기반으로 사업 운영을 하면서, 사내 직원들이 디지털 문화에 적응하도록 도움을 주는 역할을 해야 함과
동시에 지속적으로 새로운 디지털 기반 사업 운영 모델을 개발하는 프로세스가 필요하다.
6
출처: https://www.mckinsey.com/industries/financial-services/our-insights/a-roadmap-for-a-digital-transformation

디지털 트랜스포메이션 운영 모델의 종류는?
디지털 오퍼레이팅 모델(Digital Operating Model)의 형태
글로벌 컨설팅 회사인 액센츄어(Accenture)에서 발간한 리포트에 따르면, 디지털 트랜스포메이션을 가속화하
고 지속적으로 운영할 수 있는 방식을 디지털 오퍼레이팅 모델로 정의하고 이 모델의 종류를 디지털화의 비즈니
스적인 중요성의 정도에 따라 Decentralized, Shared Services, Center of Excellence(CoE), Centralized
로 분류하였다.
7
출처: Digital Operating Model

디지털 트랜스포메이션의 리더는 누구인가?
CDO(Chief Data Officer)의 정의와 역할
CDO는 CEO, CIO, CFO, CXO, COO와 함께 C-level 임원으로 분류되며 사내 경영전략과 데이터 기반 IT 비즈
니스 전략을 둘 다 경험한 T자형 인재이다. CDO는 전사적인 디지털 트랜스포메이션을 이끌 리더로서 디지털화
전담 조직의 팀원들과 함께 사내 디지털 문화의 확산을 주도하고 회사의 근본적인 비즈니스 형태를 디지털 기반
으로 변화시키는 역할을 맡고 있다.

그런데, 앞서 언급한 4가지 운영 모델에서 디지털화의 중요도가 약한 것으로 판단하여 기업이 Decentralized 혹
은 Shared Services 형태로 디지털 트랜스포메이션 운영 전략을 수립하게 되면 CDO의 입지는 약화되며, 이런
상황에서 CDO의 권한을 어디까지 주어야 할 지는 쉽게 정의하기 어렵다.
8
출처: The new hero of big data and analytics: The Chief Data Officer

새로운 비즈니스 모델은 어떻게 만드는가?
디지털 경험이 물리적 경험을 충족시키는 지점에서 새로운 비즈니스 모델을 창조하라
전사적으로 디지털 트랜스포메이션 프로젝트를 실시하면서 새로운 비즈니스 모델을 만들기 위해 수익을 잘 내고
있는 오프라인 비즈니스 모델을 점검하고 고객에게 더 좋은 경험을 선사하기 위해 디지털화를 진행하여 온라인
비즈니스 영역으로 사업을 확장시킬 필요가 있을 것이다. 이 때, 다른 동종업계에 있는 경쟁사들과 다르게 차별화
된 자사만의 상품 및 서비스에 대한 고객 경험이 무엇인지 재정의하고 이에 맞게 비즈니스 운영 모델도 재정의를
먼저 해야 한다.

구체적으로 말하자면, 어느 지점에서 상품과 서비스가 물리적 경험을 넘어 디지털 경험으로 연결되는지, 고객들
이 자사 상품의 기대평을 소셜 네트워킹 사이트에 얼마나 자주 공유하는지, 새로운 디지털 경험과 기존 물리적 경
험의 통합의 정도를 확인할 필요가 있다.
9
출처: Digital transformation: Creating new business models where digital meets physical

10
왜 디지털 트랜스포메이션이 인공지
능 주도의 트랜스포메이션인가?

데이터 기반 의사결정의 부상
데이터 기반 의사 결정 (Data Driven Decision making)의 정의와 도입 이유
2000년대 초반 이후, 제조 및 유통에 기반을 둔 규모가 있는 대다수 전통기업들이 ERP, CRM, SRM, PLM과 같
은 비즈니스 소프트웨어를 앞다투어 도입하여 전사적으로 데이터를 통합하고 생산 및 유통 공정에서 매일매일 막
대한 양의 데이터가 사내 데이터베이스에 쌓이게 되면서 이른바 빅데이터라는 용어가 등장하고, 각 기업의 관리
자들은 본인만의 통찰력에 의존하여 의사결정을 내리기보다는 이러한 빅데이터를 활용한 의사결정에 점점 관심
을 가지게 되었다. 이러한 시류에 등장한 새로운 전문용어가 바로 데이터 기반 의사결정이라는 용어이다.

HBR(Havard Business Review)에서 발간한 기사에 따르면, 데이터 기반 의사결정을 채택한 제조업체의 수가
2005년부터 2010년까지 세 배로 늘어났으며, IT의 활용수준이 높고, 고학력 노동자의 수가 많고, 규모가 크고,
데이터 기반 의사결정의 가치를 잘 아는 회사일 수록 “데이터 기반 의사 결정”을 도입하기 용이하다고 밝혔다.
11
출처: The Rise of Data-Driven Decision Making Is Real but Uneven

인간 주도의 빅데이터 분석의 한계와 AI의 등장
데이터를 실시간으로 분석해서 결과를 도출하는 일은 인간이 할 수가 없다.
앞서 언급한 대로 이미 규모가 있는 모든 기업들은 ERP, CRM, SRM. PLM 등과 같은 비즈니스 소프트웨어를 구
축했고 막대한 데이터가 매일매일 사내 데이터베이스에 쌓이고 있다. 이러한 데이터를 활용하여 관리자들은 데이
터를 시각화를 하거나 통계 기법을 이용하고 자신만의 인사이트를 넣어서 경영 분석 보고서를 만들어 의사결정에
활용하고 있다.

그런데, 의사결정에 최신 데이터가 반영이 되어야 좋은 의사결정이 나올 수가 있는데 인간이 분석을 하게 되면 시
간차가 발생하고 빨라야 오늘 기준으로 어제의 데이터를 반영하므로 실시간으로 바뀌는 상품 혹은 서비스의 매출
혹은 추세 분석은 할 수가 없다. 그리고, 인간은 기본적으로 편견과 오류가 있는 동물이므로 진실이 가려질 수 있
다는 문제가 발생한다. 이러한 흐름을 타고 소프트웨어가 스스로 데이터를 학습해서 결과를 알려주는 기법으로
서, AI(Artificial Intelligence)에 속한 머신러닝(Machine Learning)이 대안으로 떠오르게 된다.
12
출처: Machine learning vs Big data: Let’s find the relationship between them

AI 기반 디지털 트랜스포메이션
AI가 제공하는 비즈니스적 혜택 및 가치
기업 내의 빅데이터를 실시간으로 분석할 수 있는 일은 인간이 아닌 AI만 할 수 있다. 그런데 이를 통해 기업이 얻
을 수 있는 혜택이 무엇이냐고 물어본다면 여러 가지 답변이 있을 수가 있는데, Deloitte가 발간한 보고서에 따르
면, AI를 기업의 비즈니스 프로세스에 적용을 하게 되면 기존 제품의 품질을 강화하거나 새로운 제품을 만드는 것,
내부 프로세스의 효율성이 증가되고 데이터 기반 의사결정을 도와주며 외부 운영을 최적화하고 인력 자원할당을
제대로 할 수 있다는 점을 들 수가 있다고 한다.

따라서, 전사적인 디지털 트랜스포메이션을 수행함에 있어서 AI는 주요 요소가 될 수밖에 없고 어찌 보면 인간의
의사결정을 대신할 수 있기 때문에 가장 중요한 핵심 요소라고 봐도 과언이 아니다.
13
출처: State of AI in the Enterprise, 2nd Edition

14
인공지능(AI)에 대한 소개

AI(Artiﬁcial Intelligence)란?
AI는 인공지능이라는 뜻 외에 머신러닝과 신경망을 포괄하는 용어로 사용된다.
1950년대부터 AI라는 용어가 등장했으며 오늘날의 컴퓨터와 인공지능에 대한 최초의 개념은 앨런 튜링(Alan
Turing)이라는 영국 출신의 암호해독가이자 수학자가 만들었으며, 그 이후 컴퓨터의 성능이 급속히 발전하면서
1980년대 이후 데이터를 컴퓨터가 스스로 학습한다는 머신러닝(Machine Learning)이란 용어가 등장했고,
1990년대로 접어들면서 인간의 두뇌를 본따서 만든 인공신경망(Artificial Neural Network)이 등장하면서 딥
러닝(Deep Learning)이란 용어가 등장했다.
15
출처: Introduction to Machine Learning 출처: Nvidia Deep Learning Blog

머신러닝과 딥러닝
16
머신러닝은 명시적인 프로그래밍이
없이도 컴퓨터가 스스로 학습하는 기
법을 말하며 특징과 예시는 아래와
같다.
‣ 사람이 데이터 파싱
‣ 사람이 모델을 만든 후 파싱된 데이터를
입력해서 모델이 스스로 패턴을 인지하
고 그 패턴으로부터 학습함
‣ 모델이 테스트 데이터를 통해 어떤 것을
결정하거나 예측
‣ 사람이 모델의 파라메터를 조정함 (예:
Weight)
‣ 다중 분류 모델 (Multi-class
classiﬁcation model): Support
Vector, Bayesian, Neural Network)
신경망 (Neural Network)
‣ 복수개의 인공 뉴런으로 쪼개져있다.
‣ 인간의 뇌 안에 무작위로 연결된 뉴런의
연결을 모방함
‣ Hidden Layer (히든 레이어): input(입
력)과 output(출력) 사이에 존재하는 인
공 뉴런을 연결한 층을 의미
‣ Deep Learning (딥러닝): 여러 개의
hidden layer를 가진 neural
network (신경망)
‣ GPU 지원 없이는 모델의 학습속도가 매
우 느리다.
‣ 머신러닝과 달리 데이터가 많아지면 많
아질 수록 학습 결과가 더 좋아지며, 비정
형 데이터로 분류되는 이미지, 음성, 자연
어처리 학습에 용이하다.

머신러닝과 딥러닝 관련 주요 용어
17
Terminology
‣ Instance (인스턴스): 예측하려는 대상. 웹페이지를 “고양이와 관련”, “고양이와 무관”으로 분류하려는 경우 웹페이지가 인스턴스임
‣ Label : 예측 작업에 관한 답으로, 머신러닝 시스템이 도출하거나 학습 데이터에서 제공된 정답
‣ Feature : 예측 작업에 사용되는 인스턴스의 속성. ‘웹페이지에 고양이란 단어가 나온 횟수’ 등을 예로 들 수 있음
‣ Feature Column : 관련된 feature의 집합. 예를 들어 사용자가 거주할 수 있는 모든 국가의 집합. Feature column은 Google에서만 사용되는 용어고,
Yahoo/Microsoft에선 namespace라고 함
‣ Example : Instance(Feature 포함) 및 Label
‣ Model : 예측 작업의 통계적 표현(statistical representation) example을 사용해 모델을 학습한 후, 그 모델을 사용해 예측함
‣ Metric : 모델 평가 측면에서 관심이 있는 수치. 직접 최적화될 수 있고, 아닐수도 있음
‣ Objective : 알고리즘에서 최적화하려는 Metric
‣ Pipeline : 머신러닝 알고리즘을 둘러싼 인프라. 프론트엔드는 데이터를 수집하고, Train 데이터 저장, 모델 Train, 모델 Production으로 내보내는 것을
포함함
‣ SOTA (State-Of-The-Art) : 어떤 모델이 동종 모델 대비 최고 성능을 기록했을 때 “This model got a state-of-the-art result from the test.” 이런
식으로 표현할 수 있음
‣ Epoch: 한 번의 epoch는 전체 데이터 셋에 대하여 한 번 학습을 완료한 상태를 의미하며, epoch 100 이라는 말은 전체 데이터를 100번 학습 했다는
뜻임
‣ Batch size: batch라는 것은 한 번의 학습이라는 뜻이고, batch size라는 것은 한 번에 학습할 때, 이용하는 데이터의 개수를 의미함. 가령 고양이와 강아
지 인식 학습에서 batch size가 100이라면, 인공신경망에 한 번에 넣는 이미지의 개수가 100개라는 뜻임
‣ Iteration: iteration은 epoch의 전체 데이터 개수와 batch size에 의하여 결정되며, 한 번의 batch에서 100개를 학습하고, 전체 데이터가 5000개라
면 전체 iteration은 5000/100 = 50이 됨

머신러닝과 딥러닝은 무엇이 다른가?
머신러닝에는 인간이 주도하는 작업이 존재하나 딥러닝에는 그러한 작업이 빠져있다.
머신러닝을 통해 인간이 문제를 해결할 때에는 인간이 스스로 데이터를 보고 특징(Feature)를 추출(Extraction)
해서 모델을 만들고 인간이 작성한 머신러닝 알고리즘을 통해 모델이 학습을 하는 과정이 포함이 되어있지만 딥
러닝을 통할 경우에는 모델 안에 존재하는 Deep Neural Network (Hidden Layer가 2개 이상인 Artificial
Neural Network) 스스로가 특징을 추출하고 분류해서 결과를 보여주기 때문에 인간이 개입하는 프로세스가 없
다.
18
출처: Introduction to Machine Learning

Analytics와 AI의 차이
19
Analytics:
‣ 사람이 모든 알고리즘을 작성
‣ Insight의 두 가지 종류:
- Descriptive: 과거 데이터를 묘사하며
설명
- Predictive: 과거 데이터를 기반으로
미래를 예측
AI
‣ AI 스스로 가정, 예측, 테스트, 학습, 적응
함
‣ 알고리즘이 스스로 적응함
‣ 인간의 능력을 넘어선 깊이와 디테일이
존재
‣ Narrow AI: 특정 도메인에서만 가져온
데이터를 통해 구체적 결과에 맞게 최적
화하는 인공지능
‣ 데이터 저변에 내재된 데이터 구조를 스
스로 이해

Agent로부터 스스로 학습하는 AI
20
출처: Agents in Artificial Intelligence
Agent의 의미와 AI와의 관계
Agent는 개인, 소프트웨어, 회사가 의사결정을 내리는 것 자체를 말하는데 AI 시스템은 이 Agent와 Agent를 둘
러싼 Enviroment로 구성되기 때문에 AI는 Agent를 통해 스스로 학습을 할 수 있다. Agent는 보통 Agent가 실
행하는 머신을 의미하는 Architecture와 Agent의 Function의 구현을 의미하는 Agent Program이 결합된 용
어이다. Architecutre는 robotic car, camera 혹은 PC가 될 수 있고 Agent Function은 특정 날짜까지 Agent
가 인지한 모든 것의 기록을 의미한다.

AI는 이 Agent로부터 학습을 해서 스스로 진화한다.

머신러닝의 학습방법
21
출처: Reinforcement Learning: What is, Algorithms, Applications, Example
머신러닝을 통해 AI 시스템은 어떻게 스스로 학습을 할 수 있는 것인가?
결론부터 말하자면, 머신러닝은 확률과 통계에 기반하여 어떤 데이터를 분류하거나 예측하는 것이다.

머신러닝에서 사용되는 학습방법은 지도학습(Supervised Learning), 비지도학습(Unsupervised
Learning) 및 강화학습(Reinforcement Learning) 총 세 가지로 분류된다.

AI 및 Data Science 분야의 주요 역할 Top 10
22
출처: Top 10 roles in AI and data science
AI 분야에서 좋은 성과를 내기 위해서는 Data Scientist 외 여러 이해관계자가 필요하다.
Data Scientist 가 AI 분야에서 반드시 필요한 역할인 것에는 의구심이 전혀 없지만 AI 분야에서 제대로 된 성과
를 내기 위해서는 Decision Maker, Data Engineer, Analyst, Statistician, Applied Machine Learning
Engineer, Analytics Manager, Qualitative Export 또는 Social Scientist, Researcher 가 필요하다.

다만, 확실한 것은 혼자서 모든 작업을 해낼 수 없으며 작은 팀이든 큰 팀이든 문제의 크기에 맞게 팀을 구성하여
AI 분야에서 제대로 된 성과를 내는 것이 중요하다.

글로벌 기업들의 클라우드 도입과 더불어 클라우드 안에서 End-to-End Machine Learning Platform 을 구
성해서 바로 비즈니스에 적용하는 사례가 늘고 있어서 단순 연구로 그치는 경우는 사실상 없다고 봐야 한다.

정형 데이터 (Structured Data)
24
정형 데이터의 의미
정형 데이터는 데이터 자체 내의 미리 정해진 구조가 존재하며 데이터에 속한 값들은 미리 정해진 데이터 타입이
있는 것이 특징이며, 관계형 데이터베이스에 저장된 데이터들이 대개 정형 데이터이다.

비정형 데이터 (Unstructured Data)
25
비정형 데이터의 의미
비정형 데이터는 고정된 구조나 형태가 없는 것이 특징이며 표준 프로그래밍 방식을 사용하여 처리하기에는 매우
어렵다.

반정형 데이터 (Semi-structured Data)
26
반정형 데이터의 의미
반정형 데이터는 JSON 또는 XML 파일처럼 고정된 구조로 연결된 데이터라고 보면 되며, 사실상 여러분들이 보
는 SNS의 Feed의 경우 대부분 반정형 데이터라고 볼 수 있다.

데이터의 차원 (Dimension of Data)
27
AI 분야에서 사용되는 데이터의 차원은 인간이 인지할 수 있는 차원보다 더 높다.
보통 사람이 인지할 수 있는 차원은 3차원인데 실제 AI분야에서 쓰는 데이터의 차원은 3차원 이상이라 시각화를
하려면 차원을 축소해서 보여준다.

고차원 데이터의 패턴은 인간의 눈으로 확인하긴 어렵다.

차원의 표현 (Dimension Representation)
28
AI 분야에서 사용되는 데이터의 차원을 표현하는 용어가 따로 존재한다.
차원이 0인 데이터를 Scalar라고 표현하며 1인 경우 Vector, 2인 경우 Matrix, 3부터는 Tensor로 표현한다.
출처: [딥러닝]02.신경망을 위한 데이터 표현

29
머신러닝 기초
(Machine Learning Basics)

머신러닝 프로세스 (ML Process)
30

머신러닝 워크플로우 (ML Workﬂow)
31
출처: Workflow of a Machine Learning project

기본적인 머신러닝 방법 (Basic ML Method)
32
출처: https://swalloow.github.io/pyml-intro1

머신러닝 모델 예시 (ML Model Example)
33
출처: Workflow of a Machine Learning project

Supervised vs Unsupervised
34
출처: Supervised Learning vs Unsupervised Learning. Which is better?
지도학습(Supervised Learning)과 비지도학습(Unsupervised Learning)간 비교
지도학습은 data의 태그에 정답을 의미하는 정확한 label이 부착된 labeled data를 가지고 학습을 해서 test
data가 들어왔을 때 AI가 그 데이터가 어느 labelled data와 일치하는지 여부를 판단하는 학습방법을 의미한다.
즉, 정답을 미리 정해놓고 학습을 시키는 방법이라고 보면 된다. 실생활에서 이메일이 스팸메일인지 정상적인 메
일인지 판단하는 문제를 해결할 때 이 학습방법을 사용한다.

비지도학습은 label이 없는 Unlabeled data를 가지고 학습을 해서 이 데이터로부터 숨어있는 형태나 패턴을 찾
아내기 위한 학습방법을 의미한다. 비지도학습에 비해 정답이 없는 데이터로부터 미래를 예측해야 하기 때문에
훨씬 어려운 학습방법이다. 실생활에서 법률 계약서에서 공통적인 문법을 가진 특징에 기반하여 계약들을 여러
개의 그룹으로 그룹화해야 할 때 이 학습방법을 사용할 수 있다.

Supervised Learning - Classiﬁcation
35
출처: GIF: www.cs.toronto.edu
지도학습(Supervised Learning)에 속한 Classification의 의미
Classification은 지도학습에 속한 학습방법으로서 데이터를 주어진 카테고리에 따라 분류하는 문제를 의미하
며 최근에 많이 사용하는 이미지 분류도 Classification에 속한다. 보통 분류 문제를 말할 때 정답이다 아니다라
고 분류를 하는데 이를 Binary Classification이라고 칭한다. 그러나, 분류 문제는 꼭 정답이다 아니다의 문제로
만 보는 게 아니라 학생의 전공 점수가 Pass 냐 Fail로 예측하는 문제도 분류 문제에 속하며 역시 Binary
Classification으로 볼 수 있다.

이외에, 학생의 전공점수를 A/B/C/D/E로 분류해야 하는 문제는 Multi-label classification이라고 한다.

Supervised Learning - Regression
36
출처: GIF: Introduction to Linear Regression
지도학습(Supervised Learning)에 속한 Regression의 의미
Regression도 지도학습에 속한 학습방법인데 Classification과 달리 고정된 값이 아니라 연속된 값을 예측하는
문제를 의미하며 주로 어떤 패턴이나 트렌드를 예측할 때 이 학습방법을 사용한다.

실생활에서 집의 크기에 따른 매매가격을 예측을 할 때 이 학습방법을 사용할 수 있다.

Unsupervised Learning - Clustering
37
출처: Clustering with Scikit with GIFs
비지도학습(Supervised Learning)에 속한 Clustering의 의미
Clustering은 비지도학습에 속한 학습방법으로서 Unlabeled data인 여러 개의 입력 데이터가 주어졌을 때
Cluster로 그룹화해주는 학습방법을 의미한다. 실제로 이 데이터의 label이나 category가 무엇인지 알 수 없는
경우가 많기 때문에 이러한 학습방법은 중요하다고 볼 수 있다.

Reinforcement Learning
38
출처: https://swalloow.github.io/pyml-intro1
강화학습(Reinforcement Learning)의 의미
Reinforcement Learning은 앞서 언급한 지도학습과 비지도학습과는 완전히 다른 개념으로서 데이터가 정답
이 있는 것도 아니고 주어진 데이터가 없을 수도 있다. 이 학습기법은 자신이 한 행동에 대한 “보상”을 알 수 있어
서 그로부터 학습하는 것을 의미한다.

예를 들면 아이가 걷는 것을 배우는 것처럼 어떻게 행동할 줄 모르지만 환경과 상호작용하며 걷는 법을 알아가는
것과 같은 학습방법을 Reinforcement Learning이라고 한다.

Reinforcement Learning은 게임에 적용이 많이 되고 있고 아타리 게임을 예로 들자면 학습대상(agent)는 움
직이면서 적을 물리치는 존재이고 이 학습대상은 움직이면서 적을 물리치면 보상(reward)를 받게 된다. 이러한
과정을 반복학습 (Trial and Error)를 통해 점수를 최대화하는 것이 목표가 된다.

머신러닝 프레임워크 (ML Framework)
39
출처: Which Machine Learning Frameworks To Try In 2019-20

딥러닝 - 신경망 (DL - Neural Network)
41
신경망(Neural Network)와 딥러닝(Deep Learning)의 의미
Neural Network는 인간의 뇌를 “느슨하게” 흉내내어 설계한 시스템이라고 말할 수 있으며 인공신경망
(Artificial Neural Network / ANN)을 통칭할 때 사용되는 용어이다. 인공신경망은 Hidden Layer를 최소 한
개 이상 포함하고 있는데 Hidden Layer 가 1개인 신경망을 Simple Neural Network 혹은 Shallow Neural
Network라고 통칭한다.

Hidden Layer 가 2개 이상인 신경망을 Deep Neural Network (DNN) 혹은 Deep Learning Neural
Network라고 통칭하며 우리가 말하는 딥러닝(Deep Learning)은 바로 Hidden Layer가 2개 이상인 Deep
Neural Network를 의미하는 용어이다.

Neural Network는 데이터 안에서 패턴을 인식하기 위해 많은 연산을 수행할 때 사용되며 연산 과정은 각각의
Layer 안에 캡슐화되어 있고, 하나의 Neural Network 에서 여러 개의 Layer들이 서로 각각 다 연결되어 있다.
HiddenLayer의수:1개 HiddenLayer의수:4개
노드(Noder)혹은뉴런(Neuron)

신경망 예시 (Neural Network Example)
42
Densely Connected Neural Networks
‣ 이전 Layer의 모든 노드(Node)가 다음 Layer의 모든 노드에 연결된 구조를 가진 Neural Network를 의미하며
여기서 노드(Node)는 뉴런(Neuron)이란 용어와 뜻이 동일함
‣ Fully Connected Layer로 구성된 Network라는 의미여서 Fully Connected Neural Network 라고도 부를 수
있음
‣ 가장 기본적인 Neural Network 지만 미리 정해진 Feature를 가진 데이터만 원활히 학습이 되고 시시각각
Feature가 변하는 이미지에서는 학습이 제대로 되지 않는 단점이 있음 -> 이를 보완하기 위해 Convolutional
Neural Network(CNN)가 등장함
출처: Gentle Dive into Math Behind Convolutional Neural Networks

43
Convolutional Neural Networks (CNNs)
‣ 데이터를 구성하는 같은 크기의 일정한 영역들에 대해 작은 특징
(Feature)에서 큰 특징으로 추상화
‣ 필터를 통해 특징들을 추출하여 하나의 Convolutional Layer를 만
들고 이 특징들에서 좀 더 복잡한 특징을 추출하는 새로운 레이어를 추
가하는 방식으로 여러 개의 Convolutional Layer들을 연결하고 마지
막에는 Back Proprogation을 통해 Parameter 업데이트를 하면서
Neural Network를 학습시키며, 추상화 단계별로 Neural Network
가 스스로 학습을 통해 필터를 만들어냄
‣ 주로 이미지 인식에 많이 사용되는 기법
필터
이미지를 구성하는 각 영역에 대해 작은 특징에서 큰 특징으로 추상화
출처: 딥러닝 합성곱 신경망(CNN) 개요

44
Recurrent Neural Networks (RNNs)
‣ 일부 Layer들의 Output을 다시 같은 Layer의 Input으로 다시 전달
되는 구조이며 이 Layer의 노드들은 방향을 가진 엣지로 연결된 순환
구조를 가지고 있음
‣ memory’를 가진 모델로서 Text-To-Speech 분야에 종종 사용됨
‣ 시간에 관한 구간이 존재하는 Time Series Data를 기반으로 한 학습
에 용이함
순환구조
출처: Ratsgo's Blog
RNN의 기본구조 Input: ‘hell’ -> Output: ‘hello’

딥러닝 모델 훈련 (Training a DL model)
45
딥러닝 모델 훈련시 알아두어야 할 사항
‣ Matrix Multiplication (행렬 곱)이 사용됨
‣ 첫 번째 행렬의 첫 번째 행의 각 요소들은 두 번째 행렬의 첫 번째 열의
요소들과 곱해지고 이 곱한 값들을 서로 더함
‣ 첫 번째 행렬을 신경망의 입력으로 고려할 수 있고 두 번째 행렬을 이
신경망의 weight으로 볼 수 있음
‣ VGG16 (16개의 hidden layer를 가진 CNN) 규모가 큰 모델은
weight와 bias에 해당하는 parameter의 수가 140만개 이상임
출처: ResearchGate.net

딥러닝 모델 구축 (Building a DL model)
46
딥러닝 모델 구축시 알아두어야 할 사항
‣ 딥러닝 모델의 각 Layer는 Weight와 Bias로 나열되어 있다.
‣ Weight와 Bias들은 딥러닝 모델이 보다 높은 정확도를 가지기 위해 훈련을 하는 동안 수정된다.
‣ Weight와 Bias는 각각 행렬로 구성되어 있다.
‣ 각 iteration 별로 변화되는 양을 learning rate라고 하며 이는 hyper parameter에 속한다.

딥러닝 모델 구축 (Building a DL model)
47
훈련이 된 딥러닝 모델이 포함하는 것
‣ 각 Layer들을 서술한 network deﬁnition 파일
‣ 해당 신경망 내에 각 Layer에 대한 Weight과 Bias정보

Image Recognition and Deep Learning
48
출처1: Review of Deep Learning Algorithms for Object Detection
이미지 인식(Image Recognition) 종류
‣ Classiﬁcation: 이미지 전체를 대상으로 Object의 종류(Class or Label)를 구분
‣ Localization: 모델이 주어진 이미지 안의 Object 가 이미지 안의 어느 위치에 있는지 위치 정보를 출력해주
는 것으로, 주로 Bounding box 를 많이 사용하며 주로 bounding box 의 네 꼭지점 pixel 좌표가 출력되는
것이 아닌 left top, right, bottom 좌표를 출력함
‣ Object Detection: 보통 Classiﬁcation 과 Localization을 동시에 수행하는 것을 말하지만 아래 그림의
경우 이미지 위에 모델이 학습한 Object 위치만 bounding box 로 표현되고 Class 종류는 구분하지 않음
‣ Instance Segmentation: Object Segmentation 기법을 써서 Object Detection 을 통해 검출된
Object 의 형상을 따라서 Object 의 영역을 표시하고, 같은 Class 더라도 서로 다른 Instance를 구분해주는
기법
출처2: 이미지 인식 용어 정리

모델 배포 (Deployment)
49
모델 배포와 관련하여 알아두어야 할 사항
‣ 훈련된 모델은 새로운 데이터에 기반하여 결과 예측을 할 때 사용될 수 있다.
‣ 모델은 Inference 혹은 Scoring을 위해 배포될 수 있다. Inference 혹은 Scoring은 훈련된 모델로 이미지
인식과 같은 실제 서비스를 수행하는 과정을 의미한다.
‣ 모델 배포시 딥러닝 프레임워크의 경량화 버전을 주로 이용한다. 예를 들자면 스마트폰에서도 실행할 수 있게
Tensorﬂow 대신 Tensorﬂow Lite를 쓰는 경우를 말한다.
‣ 모델 배포시 가장 일반적으로 사용하는 방법을 해당 모델과 연결할 Application Programming Interface
(API)를 만드는 것이다. 좀 더 기술적으로 말하자면 RESTful API를 만들어 URL 호출을 통해 모델을 테스트한
다.
모델 배포 후 서비스를 하고 있는 실제 사이트
출처: reiinakano.com

모델 평가 (Model Evaluation)
50
모델 평가시 알아두어야 할 사항
‣ 훈련된 모델에 대해 Inference를 하면 conﬁdence라는 value가 제공이 된다. 그런데 이 value는 해당 예
측할 때에만 관련이 있다.
‣ 모델의 정확도(accuracy)는 과거에 모델 훈련에 이용했던 Test data set 혹은 validation data set 안의
데이터가 얼마나 정확히 예측했는지에 따라 결정이 된다.
‣ 정확도(accuracy)는 모델(model)과 관련 있고, conﬁdence는 예측(prediction)과 관계가 있다.

Training vs Inference
51
Training과 비교하여 Inference 수행시 고려해야 할 사항
‣ Training 과 달리 Feedforward propagation 수행 후 Back propagation 을 수행하지 않아 Weight와 Bias가 업데이트되지 않는다.
‣ Inference 속도를 고려하여 일부 layer들을 병합(Merge) 혹은 제거(Prune)할 수 있다.
‣ Weight들을 양자화(quantize)를 통해 자연수로 셀 수 있는 양으로 변경할 수 있다. (FP32 -> INT16/8/4)
‣ 신경망(Neural Network)에 대해 속도(speed)에 주안점을 둘 것이냐 아니면 정확도(accuracy)에 주안점을 둘 것인지 고려해서 재설계
해야 한다.
‣ 많은 양의 데이터로 모델을 훈련시켰는데 Inference시 너무 적은 데이터가 들어오면 결과를 도출하는 데 있엇 지연시간(Latency)이 길어
질 수 있다. 그리고, Throughput은 초단위로 모델 훈련을 위해 처리되고 사용될 수 있는 최대 training sample의 개수를 말하는데
Inference시 이것에 대해서도 고려를 해야 한다. 예를 들면, 우리가 batch size를 4로 설정 후 DenseNet40을 훈련시켰을 때, 우리는 1
초 후 5개의 training step을 끝낼 수 있다. 그리고, 각 training step에서 4개의 image들이 처리된다. 그러므로, DenseNet40이란 모
델을 훈련시키기 위한 throughput 은 초당 20개의 샘플이다.
‣ Latency와 Throughput은 상충관계여서 Latency가 높아지면 Throughput은 낮아진다.
출처1: Discover the Difference Between Deep Learning Training and Inference 출처2: Performance Analysis and Characterization of Training Deep Learning Models on Mobile Devices

52
Reference (1)
• https://arxiv.org/pdf/1906.04278.pdf
• https://blog.exxactcorp.com/discover-difference-deep-learning-
training-inference/
• https://juni5184.tistory.com/8
• https://medium.com/zylapp/review-of-deep-learning-algorithms-for-
object-detection-c1f3d437b852?
• http://melonicedlatte.com/machinelearning/2019/06/23/154900.html
• https://www.researchgate.net/figure/A-diagram-of-the-deep-learning-
training-process-including-the-online-training-
component_fig11_317994811

53
Reference (2)
• https://databuzz-team.github.io/2018/11/05/Back-Propagation/
• https://sonofgodcom.wordpress.com/2018/12/31/cnn%EC%9D%84-
%EC%9D%B4%ED%95%B4%ED%95%B4%EB%B3%B4%EC%9E%90-fully-connected-
layer%EB%8A%94-%EB%AD%94%EA%B0%80/
• https://blog.goodaudience.com/most-intuitive-explanation-of-activation-functions-
fdf6d9b4a53a
• https://towardsdatascience.com/gentle-dive-into-math-behind-convolutional-neural-
networks-79a07dd44cf9
• http://taewan.kim/post/cnn/
• https://bkshin.tistory.com/entry/
%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-7-K-
%ED%8F%89%EA%B7%A0-%EA%B5%B0%EC%A7%91%ED%99%94-K-means-
Clustering

54
Reference (3)
• http://aidev.co.kr/deeplearning/782
• https://ratsgo.github.io/natural%20language%20processing/
2017/03/09/rnnlstm/
• https://swalloow.github.io/pyml-intro1
• https://www.cs.toronto.edu/~frossard/post/classification/
• https://towardsdatascience.com/workflow-of-a-machine-learning-
project-ec1dba419b94
• https://lawtomated.com/supervised-vs-unsupervised-learning-
which-is-better/

55
Reference (4)
• https://ssungkang.tistory.com/entry/
%EB%94%A5%EB%9F%AC%EB%8B%9D02%EC%8B%A0%EA%B2%BD%EB%A7%9D%E
C%9D%84-%EC%9C%84%ED%95%9C-%EB%8D%B0%EC%9D%B4%ED%84%B0-
%ED%91%9C%ED%98%84
• https://hbr.org/2016/02/the-rise-of-data-driven-decision-making-is-real-but-uneven
• https://www.slideshare.net/racskoreka/the-strategic-indicators-of-digital-transformation-
in-education
• https://www.dataversity.net/integrations-key-technology-enablers-digital-transformation/
• https://www.kdnuggets.com/2018/08/top-10-roles-ai-data-science.html
• https://www.ibm.com/ru-ru/events/think-summit/assets/pdf/Ekaterina_Guryankina.pdf
• https://www.youtube.com/watch?v=Ilg3gGewQ5U

인공지능, 머신러닝의 이해 강의자료 2019.12.20

Recomendados

Recomendados

Mais conteúdo relacionado

Mais procurados

Mais procurados (20)

Semelhante a 인공지능, 머신러닝의 이해 강의자료 2019.12.20

Semelhante a 인공지능, 머신러닝의 이해 강의자료 2019.12.20 (20)

인공지능, 머신러닝의 이해 강의자료 2019.12.20