2. 머신러닝-딥러닝문제해결전략
한 페이지 요약
• 책 분류
• 인공지능, 딥러닝, 머신러닝, 캐글 경진 대회
• 대상 독자
• 캐글 경진대회에 도전하고 싶은 (장래) 데이터 사이언티스트
• 머신러닝과 딥러닝 분야에서 전문가들의 비법을 엿보고 싶은 (초보) 데이
터 사이언티스트
• 특징
• 잘 정리된 다이어그램, 도표, 그래프, 코드 → 편집의 승리
3. 이 책의 목차
실제 경진 대회 문제를 분석해서 해결하는 방법을 차근차근 설명
[1부] 머신러닝 레벨업의 지름길, 캐글
01장 왜 캐글인가?
02장 캐글 정복 첫걸음
03장 문제해결 프로세스 및 체크리스트
04장 데이터를 한눈에 : 주요 시각화 그래프
[2부] 머신러닝 문제해결
05장 다시 살펴보는 머신러닝 주요 개념
06장 [경진대회] 자전거 대여 수요 예측 ★☆☆ → 회귀
07장 [경진대회] 범주형 데이터 이진분류 ★★☆ → 인코딩
08장 [경진대회] 안전 운전자 예측 ★★☆ → LightGBM,
XGBoost, 앙상블
09장 [경진대회] 향후 판매량 예측 ★★★ → 피처 엔지니어링
머신러닝-딥러닝문제해결전략
[3부] 딥러닝 문제해결
10장 다시 살펴보는 딥러닝 주요 개념
11장 [경진대회] 항공 사진 내 선인장 식별 ★☆☆
12장 [경진대회] 병든 잎사귀 식별 ★★☆
13장 [데이터셋] 흉부 엑스선 기반 폐렴 진단 ★★☆
4. 무엇이 이 책을 흥미롭게 만드는가?(1)
공략집: 책 바깥의 책
머신러닝-딥러닝문제해결전략
https://github.com/BaekKyunShin/musthave_mldl_problem_solving_strategy/tree/main/minimap
5. 무엇이 이 책을 흥미롭게 만드는가?(2)
문제 해결 방식에 정답은 없어도 패턴은 있다!
• 캐글 수상자 노트북을 리팩터링하면서 찾아낸 패턴을 정리
• 머신러닝과 딥러닝에 필요한 문제 해결 프로세스를 정리하고 이를 실제 문제 풀이에 적용하는 방법을 설명
• 정형 데이터(머신러닝)과 비정형 데이터(딥러닝) 양쪽을 모두 다룸
• 문제를 풀면서 필요한 이론을 본문에 잘 녹였기에 캐글 경진 대회 준비 목적 뿐만 아니라 현업에 가까운 샌드박스 내에서 학습하는 목적도
달성할 수 있음
• 일관된 문제해결 프로세스(경진대회 이해 → 탐색적 데이터 분석 → 베이스라인 모델 → 성능 개선 I (, II, III))에 따라 진행됨. 그러면서도 각
장별로 중점 영역을 배분해서 차별화에 성공
머신러닝-딥러닝문제해결전략
6. 책 vs 책
머신러닝-딥러닝문제해결전략
vs
• 조금 더 캐글 경진 대회에 집중함
• 주최자의 동기, 평가 척도, 승자의 지혜 부분이 좋음
• 캐글 경진 대회와 학습이라는 두 마리 토끼를 노림
• 다루는 사례가 많고, 편집이 좋음
7. 대상 독자
캐글에도 도전하고 실무 역량도 높이자!
• 주의: 머신러닝/딥러닝을 처음 공부하는 입문자는 이 책이 적합하지 않음
• 이론을 어느 정도 익혔지만 문제 해결 프로세스를 반복적으로 학습하고 싶은 (장래) 데이터 사이언티스트
• 캐글 경험이 없거나 현업에서 복잡한 문제를 단독으로 해결하기 위해 업그레이드가 필요한 (초보) 데이터 사이언티스트
머신러닝-딥러닝문제해결전략
8. 결론
**** 캐글 경진 대회도 도전하고, 실무 역량도 높이자
• 캐글에 도전하기 위해 필요한 정보가 잘 정리되어 있다
• 머신러닝/딥러닝을 활용해 실제 문제를 풀기위한 절차를 정형화했고, 각 단계별로 주의해야 하는 사항을 시각적으로 잘 정리했다
• 이론을 구현으로 바꾸는 과정을 차근차근 설명하고 이해도를 높이기 위해 풍부한 그래프와 다이어그램을 제공한다
• 프로세스의 단계별로 제시되는 코드에 대한 설명도 제공하므로 코드 학습에도 도움이 된다
• 바로 정답을 제시하는 대신 베이스라인을 구축한 다음에 이를 점진적으로 개선하는 방법을 설명하므로 실제 문제 풀이 과정에 가깝다
는 특성이 있다
머신러닝-딥러닝문제해결전략
9. 발표자 소개
기술 배경
전문 검색 엔진, 임베디드 시스템(리눅스 커널 디바이스 드라이버), 빅데이터/인공지능 연구 개발,
고성능 고가용성 데이터베이스
주요활동
IT 전문서 번역 (클린 코드, 피플웨어, 해커: 광기의 랩소디, 게임 엔진 블랙 북 등)
개발강의 (삼성전자, SK C&C, 삼성SDC, 현대자동차 기술 세미나와 교육)
활동채널
블로그: https://jhrogue.blogspot.com
슬라이드 셰어: https://www.slideshare.net/jrogue/presentations
유튜브: https://www.youtube.com/c/박재호dev
문의 jrogue@gmail.com
박재호