SlideShare a Scribd company logo
1 of 13
Download to read offline
Enhanced AI Platform
Produced by Tae Young Lee
NAS
Model
Model
Memory Limitation
Inference Speed
Worse Performance
Training Model
Model
Data
Data
Data
1)데이터 병렬화 2)모델 병렬화
GPU
그 이유는 같은 데이터에서 단순히 모델만을 키운다고
성능이 향상되진 않음
( 학습 데이터의 다양성 보장 필요 )
Serving Layer Model
학습에 필요한 gradient는 모델의 크기에 비례하기 때문에
분산 학습을 통해 학습 속도를 올리더라도,
모델이 커짐에 따라 학습에 보다 많은 시간이 소요
Training Speed
모델 크기가 증가하면서 추론에 걸리는 시간 역시
늘어나기 때문에 문제가 됨
모델이 커지면서 가장 먼저 문제가
될 수 있는 것은 메모리 사이즈임
Memory
Enhanced AI Platform
복수의 GPU를 사용한 학습을 통해 이 문제를 해결하려 함
하지만 분산 학습으로 모델을 학습하더라도 여전히 문제는
해결되지 않는다. ( GPU 구매는 NVidia만 좋은 일(?) )
GPU
가지치기 (Pruning)
가중치 분해 (Weight Factorization)
지식 증류 (Knowledge Distillation)
가중치 공유 (Weight Sharing)
양자화 (Quantization)
Pre-train vs. Downstream
Model 압축 기술
Model Training
Data Labeling
Model Evaluation
Data Versioning
Model Service
Model Prediction
Model Deployment Model Versioning
Serving Architecture
Legacy Interface
Scaling Hardware
Model Life Cycle 준용
모델 별 Training Image 반입
Workspace에서 Training 수행
Training 시 Shared Memory 설정
Training 시 Multi GPU 설정
Model Serving Monitoring
Inference 제공 Gateway
POD Monitoring
Rancher는 간단한 설정만으로 Node, Pod
상태를 모니터링 할 수 있는 기능을 제공
보다 상세한 상태를 파악하기 위해서는
Prometheus, Grafana 등을 사용하여 모니터링
Data Selection Data Cleaning
Data Pre-Processing
Model MetaData 관리
Model Validation
ML-Metadata
Model Registry
ML-Metadata Model Registry
Data Versioning
DW는 데이터의 재구성을 위해 원시 데이터 계층에서 획득된 서로 다른 데이터들을
이해할 수 있어야 하며 모델링 시에 활용되는 각각의 데이터셋들에 대한 이력을
유지해서 모델 트레이닝 시 학습된 모델과의 binding 관계를 표현할 수 있게
스냅샷 형태로의 저장이 필요하다.
운영 및 유지보수 관점에서 필요하다고 판단됨
학습 Data와 학습 모델의 단일화된 백업 관리
https://deview.kr/2019/schedule/310
Training과 Inference 시 Scaling Hardware
Training 시 구성되는 Data의 Size와 Scope에 따라 가용해야 하는 Training
Resource차이가 존재함
이를 위해서는 Data의 Size와 Scope에 따라 동적으로 Traing환경 구성에 필요한
IDE 자원할당 및 환경 구성을 Resource Clustering화하여 제공함
Inference 시에는 얼마나 트래픽이 들어올 지 몰라서 많은 GPU를 확보하고 시작
- Throughput 추정 불가 ( Resource 낭비 )
Inference를 하기 위한 최소한 장비 사양을 모름 (?)
Scaling Hardware
https://deview.kr/2020/sessions/393
Model Validation
모델을 변경하였을 때 Inference결과가 이상하게 나오는것 방지
Production(운영계)과 Staging(개발계)을 비교하기
https://deview.kr/2020/sessions/393
ML-metadata를 사용
Model Registry
모델과 부가 정보를 저장
- model-id, model-URI,
description, user, metrics 등
실제 모델 파일은 HDFS 또는
NAS에 저장
https://deview.kr/2020/sessions/393
Serving관련 다양한 환경 구성의 단일화
Inference Speed와 Response Time 보장에 필요한 Model Build 시 Base Image선택 필요 또한 일단위 처리량에 따른 유기적인 Base
Image Switching을 통한 리소스 효율화 필요
https://deview.kr/2019/schedule/310
모델 서비스 시 프로세스 구조도
https://deview.kr/2020/sessions/329
배포 단계 제어 및 이력 관리
CPU / GPU Cluster 배포 사내 주요 클러스터 오퍼레이터 구현
선언적 배포 구성 파일 도입
라우팅 자동화 엔드포인트 자동 등록 / 관리 기능
새로운 인스턴스 배포
기존 인스턴스 재시작
EndPoint 정보
업데이트
동적 엔드포인트 디스커버리
AI Platform 고도화에서 고려해야 할 사항
Scaling Hardware
Model Versioning
장애 탐지 라우팅
자동화

More Related Content

What's hot

OPEN_POWER8_SESSION_20150316
OPEN_POWER8_SESSION_20150316OPEN_POWER8_SESSION_20150316
OPEN_POWER8_SESSION_20150316
기한 김
 
Ndc2012 최지호 텍스쳐 압축 기법 소개
Ndc2012 최지호 텍스쳐 압축 기법 소개Ndc2012 최지호 텍스쳐 압축 기법 소개
Ndc2012 최지호 텍스쳐 압축 기법 소개
Jiho Choi
 
Compute shader
Compute shaderCompute shader
Compute shader
QooJuice
 
[NDC08] 최적화와 프로파일링 - 송창규
[NDC08] 최적화와 프로파일링 - 송창규[NDC08] 최적화와 프로파일링 - 송창규
[NDC08] 최적화와 프로파일링 - 송창규
ChangKyu Song
 

What's hot (20)

[데브루키/141206 박민근] 유니티 최적화 테크닉 총정리
[데브루키/141206 박민근] 유니티 최적화 테크닉 총정리[데브루키/141206 박민근] 유니티 최적화 테크닉 총정리
[데브루키/141206 박민근] 유니티 최적화 테크닉 총정리
 
Cuda intro
Cuda introCuda intro
Cuda intro
 
Ibm과 nvidia가 제안하는 딥러닝 플랫폼
Ibm과 nvidia가 제안하는 딥러닝 플랫폼Ibm과 nvidia가 제안하는 딥러닝 플랫폼
Ibm과 nvidia가 제안하는 딥러닝 플랫폼
 
OPEN_POWER8_SESSION_20150316
OPEN_POWER8_SESSION_20150316OPEN_POWER8_SESSION_20150316
OPEN_POWER8_SESSION_20150316
 
모바일 게임 최적화
모바일 게임 최적화 모바일 게임 최적화
모바일 게임 최적화
 
병렬프로그래밍과 Cuda
병렬프로그래밍과 Cuda병렬프로그래밍과 Cuda
병렬프로그래밍과 Cuda
 
Ndc2012 최지호 텍스쳐 압축 기법 소개
Ndc2012 최지호 텍스쳐 압축 기법 소개Ndc2012 최지호 텍스쳐 압축 기법 소개
Ndc2012 최지호 텍스쳐 압축 기법 소개
 
Compute shader DX11
Compute shader DX11Compute shader DX11
Compute shader DX11
 
Tiny ml study 20201031
Tiny ml study 20201031Tiny ml study 20201031
Tiny ml study 20201031
 
진화하는 컴퓨터 하드웨어와 게임 개발 기술의 발전
진화하는 컴퓨터 하드웨어와 게임 개발 기술의 발전진화하는 컴퓨터 하드웨어와 게임 개발 기술의 발전
진화하는 컴퓨터 하드웨어와 게임 개발 기술의 발전
 
Openface
OpenfaceOpenface
Openface
 
이기종 멀티코어 기반의 Open cv 응용 사례 및 효율적인 어플리케이션 디자인
이기종 멀티코어 기반의 Open cv 응용 사례 및 효율적인 어플리케이션 디자인이기종 멀티코어 기반의 Open cv 응용 사례 및 효율적인 어플리케이션 디자인
이기종 멀티코어 기반의 Open cv 응용 사례 및 효율적인 어플리케이션 디자인
 
2015 제2회 동아리 해커 세미나 - 병렬컴퓨팅 소개 (16기 김정현)
2015 제2회 동아리 해커 세미나 - 병렬컴퓨팅 소개 (16기 김정현)2015 제2회 동아리 해커 세미나 - 병렬컴퓨팅 소개 (16기 김정현)
2015 제2회 동아리 해커 세미나 - 병렬컴퓨팅 소개 (16기 김정현)
 
Compute shader
Compute shaderCompute shader
Compute shader
 
Data-Oriented Design과 유니티 DOTS
Data-Oriented Design과 유니티 DOTSData-Oriented Design과 유니티 DOTS
Data-Oriented Design과 유니티 DOTS
 
[264] large scale deep-learning_on_spark
[264] large scale deep-learning_on_spark[264] large scale deep-learning_on_spark
[264] large scale deep-learning_on_spark
 
게임프로젝트에 적용하는 GPGPU
게임프로젝트에 적용하는 GPGPU게임프로젝트에 적용하는 GPGPU
게임프로젝트에 적용하는 GPGPU
 
[NDC08] 최적화와 프로파일링 - 송창규
[NDC08] 최적화와 프로파일링 - 송창규[NDC08] 최적화와 프로파일링 - 송창규
[NDC08] 최적화와 프로파일링 - 송창규
 
이기종 멀티코어 프로세서를 위한 프로그래밍 언어 및 영상처리 오픈소스
이기종 멀티코어 프로세서를 위한 프로그래밍 언어 및 영상처리 오픈소스이기종 멀티코어 프로세서를 위한 프로그래밍 언어 및 영상처리 오픈소스
이기종 멀티코어 프로세서를 위한 프로그래밍 언어 및 영상처리 오픈소스
 
Chapter2 ap group11
Chapter2 ap group11Chapter2 ap group11
Chapter2 ap group11
 

Similar to Enhanced ai platform

The Data tech for AI based innovation(기업의 AI기반 혁신을 지원하는 데이터 기술)
The Data tech for AI based innovation(기업의 AI기반 혁신을 지원하는 데이터 기술)The Data tech for AI based innovation(기업의 AI기반 혁신을 지원하는 데이터 기술)
The Data tech for AI based innovation(기업의 AI기반 혁신을 지원하는 데이터 기술)
SANG WON PARK
 
ER/Studio 데이터 모델링 솔루션으로 마이그레이션(from ERwin)
ER/Studio 데이터 모델링 솔루션으로 마이그레이션(from ERwin)ER/Studio 데이터 모델링 솔루션으로 마이그레이션(from ERwin)
ER/Studio 데이터 모델링 솔루션으로 마이그레이션(from ERwin)
Devgear
 
AWS CLOUD 2018- AWS의 새로운 통합 머신러닝 플랫폼 서비스, Amazon SageMaker (김무현 솔루션즈 아키텍트)
AWS CLOUD 2018- AWS의 새로운 통합 머신러닝 플랫폼 서비스, Amazon SageMaker (김무현 솔루션즈 아키텍트)AWS CLOUD 2018- AWS의 새로운 통합 머신러닝 플랫폼 서비스, Amazon SageMaker (김무현 솔루션즈 아키텍트)
AWS CLOUD 2018- AWS의 새로운 통합 머신러닝 플랫폼 서비스, Amazon SageMaker (김무현 솔루션즈 아키텍트)
Amazon Web Services Korea
 

Similar to Enhanced ai platform (20)

Infra as a model service
Infra as a model serviceInfra as a model service
Infra as a model service
 
Create a solution including deep learning models
Create a solution including deep learning modelsCreate a solution including deep learning models
Create a solution including deep learning models
 
Transfer learning usage
Transfer learning usageTransfer learning usage
Transfer learning usage
 
The Data tech for AI based innovation(기업의 AI기반 혁신을 지원하는 데이터 기술)
The Data tech for AI based innovation(기업의 AI기반 혁신을 지원하는 데이터 기술)The Data tech for AI based innovation(기업의 AI기반 혁신을 지원하는 데이터 기술)
The Data tech for AI based innovation(기업의 AI기반 혁신을 지원하는 데이터 기술)
 
2015 SINVAS USER CONFERENCE - MDD/MDA 개발방법론을 통한 정보시스템 개발방안
2015 SINVAS USER CONFERENCE - MDD/MDA 개발방법론을 통한 정보시스템 개발방안2015 SINVAS USER CONFERENCE - MDD/MDA 개발방법론을 통한 정보시스템 개발방안
2015 SINVAS USER CONFERENCE - MDD/MDA 개발방법론을 통한 정보시스템 개발방안
 
AWS기반 서버리스 데이터레이크 구축하기 - 김진웅 (SK C&C) :: AWS Community Day 2020
AWS기반 서버리스 데이터레이크 구축하기 - 김진웅 (SK C&C) :: AWS Community Day 2020AWS기반 서버리스 데이터레이크 구축하기 - 김진웅 (SK C&C) :: AWS Community Day 2020
AWS기반 서버리스 데이터레이크 구축하기 - 김진웅 (SK C&C) :: AWS Community Day 2020
 
AWS기반 서버리스 데이터레이크 구축하기 - 김진웅 (SK C&C) :: AWS Community Day 2020
AWS기반 서버리스 데이터레이크 구축하기 - 김진웅 (SK C&C) :: AWS Community Day 2020 AWS기반 서버리스 데이터레이크 구축하기 - 김진웅 (SK C&C) :: AWS Community Day 2020
AWS기반 서버리스 데이터레이크 구축하기 - 김진웅 (SK C&C) :: AWS Community Day 2020
 
좌충우돌 Data Engineering 학습기
좌충우돌 Data Engineering 학습기좌충우돌 Data Engineering 학습기
좌충우돌 Data Engineering 학습기
 
ER/Studio 데이터 모델링 솔루션으로 마이그레이션(from ERwin)
ER/Studio 데이터 모델링 솔루션으로 마이그레이션(from ERwin)ER/Studio 데이터 모델링 솔루션으로 마이그레이션(from ERwin)
ER/Studio 데이터 모델링 솔루션으로 마이그레이션(from ERwin)
 
PR-383: Solving ImageNet: a Unified Scheme for Training any Backbone to Top R...
PR-383: Solving ImageNet: a Unified Scheme for Training any Backbone to Top R...PR-383: Solving ImageNet: a Unified Scheme for Training any Backbone to Top R...
PR-383: Solving ImageNet: a Unified Scheme for Training any Backbone to Top R...
 
[AWS Innovate 온라인 컨퍼런스] 수백만 사용자 대상 기계 학습 서비스를 위한 확장 비법 - 윤석찬, AWS 테크 에반젤리스트
[AWS Innovate 온라인 컨퍼런스] 수백만 사용자 대상 기계 학습 서비스를 위한 확장 비법 - 윤석찬, AWS 테크 에반젤리스트[AWS Innovate 온라인 컨퍼런스] 수백만 사용자 대상 기계 학습 서비스를 위한 확장 비법 - 윤석찬, AWS 테크 에반젤리스트
[AWS Innovate 온라인 컨퍼런스] 수백만 사용자 대상 기계 학습 서비스를 위한 확장 비법 - 윤석찬, AWS 테크 에반젤리스트
 
AWS의 비용 효율적 고성능기계학습(ML) 플랫폼 뛰어들기 - 윤석찬 수석 테크 에반젤리스트, AWS :: AWS Innovate 2019
AWS의 비용 효율적 고성능기계학습(ML) 플랫폼 뛰어들기 - 윤석찬 수석 테크 에반젤리스트, AWS :: AWS Innovate 2019AWS의 비용 효율적 고성능기계학습(ML) 플랫폼 뛰어들기 - 윤석찬 수석 테크 에반젤리스트, AWS :: AWS Innovate 2019
AWS의 비용 효율적 고성능기계학습(ML) 플랫폼 뛰어들기 - 윤석찬 수석 테크 에반젤리스트, AWS :: AWS Innovate 2019
 
딥러닝 세계에 입문하기 위반 분투
딥러닝 세계에 입문하기 위반 분투딥러닝 세계에 입문하기 위반 분투
딥러닝 세계에 입문하기 위반 분투
 
권기훈_포트폴리오
권기훈_포트폴리오권기훈_포트폴리오
권기훈_포트폴리오
 
링크드인의 Big Data Recommendation Products - 어제의 데이터를 통해 내일을 예측한다
링크드인의 Big Data Recommendation Products - 어제의 데이터를 통해 내일을 예측한다링크드인의 Big Data Recommendation Products - 어제의 데이터를 통해 내일을 예측한다
링크드인의 Big Data Recommendation Products - 어제의 데이터를 통해 내일을 예측한다
 
AWS CLOUD 2018- AWS의 새로운 통합 머신러닝 플랫폼 서비스, Amazon SageMaker (김무현 솔루션즈 아키텍트)
AWS CLOUD 2018- AWS의 새로운 통합 머신러닝 플랫폼 서비스, Amazon SageMaker (김무현 솔루션즈 아키텍트)AWS CLOUD 2018- AWS의 새로운 통합 머신러닝 플랫폼 서비스, Amazon SageMaker (김무현 솔루션즈 아키텍트)
AWS CLOUD 2018- AWS의 새로운 통합 머신러닝 플랫폼 서비스, Amazon SageMaker (김무현 솔루션즈 아키텍트)
 
Pycon korea 2018 kaggle tutorial(kaggle break)
Pycon korea 2018 kaggle tutorial(kaggle break)Pycon korea 2018 kaggle tutorial(kaggle break)
Pycon korea 2018 kaggle tutorial(kaggle break)
 
머신러닝과 사이킷런의 이해
머신러닝과 사이킷런의 이해머신러닝과 사이킷런의 이해
머신러닝과 사이킷런의 이해
 
Microsoft loves communities - Korea DevRel Team
Microsoft loves communities - Korea DevRel TeamMicrosoft loves communities - Korea DevRel Team
Microsoft loves communities - Korea DevRel Team
 
데이터 과학자를 위한 신규 인공지능 서비스 - 김대근, 이유동, AWS AI/ML 스페셜리스트 솔루션즈 아키텍트 / 소성운, 카카오스타일 ...
데이터 과학자를 위한 신규 인공지능 서비스 - 김대근, 이유동, AWS AI/ML 스페셜리스트 솔루션즈 아키텍트 / 소성운, 카카오스타일 ...데이터 과학자를 위한 신규 인공지능 서비스 - 김대근, 이유동, AWS AI/ML 스페셜리스트 솔루션즈 아키텍트 / 소성운, 카카오스타일 ...
데이터 과학자를 위한 신규 인공지능 서비스 - 김대근, 이유동, AWS AI/ML 스페셜리스트 솔루션즈 아키텍트 / 소성운, 카카오스타일 ...
 

More from Tae Young Lee

Recommendation System History
Recommendation System HistoryRecommendation System History
Recommendation System History
Tae Young Lee
 

More from Tae Young Lee (20)

Review of the Paper on Capabilities of Gemini Models in Medicine
Review of the Paper on Capabilities of Gemini Models in MedicineReview of the Paper on Capabilities of Gemini Models in Medicine
Review of the Paper on Capabilities of Gemini Models in Medicine
 
A future that integrates LLMs and LAMs (Symposium)
A future that integrates LLMs and LAMs (Symposium)A future that integrates LLMs and LAMs (Symposium)
A future that integrates LLMs and LAMs (Symposium)
 
LLMs Service that provides what users want to know
LLMs Service that provides what users want to knowLLMs Service that provides what users want to know
LLMs Service that provides what users want to know
 
Exploring Deep Learning Acceleration Technology Embedded in LLMs
Exploring Deep Learning Acceleration Technology Embedded in LLMsExploring Deep Learning Acceleration Technology Embedded in LLMs
Exploring Deep Learning Acceleration Technology Embedded in LLMs
 
LLM 모델 기반 서비스 실전 가이드
LLM 모델 기반 서비스 실전 가이드LLM 모델 기반 서비스 실전 가이드
LLM 모델 기반 서비스 실전 가이드
 
Recommendation System History
Recommendation System HistoryRecommendation System History
Recommendation System History
 
검색엔진에 적용된 ChatGPT
검색엔진에 적용된 ChatGPT검색엔진에 적용된 ChatGPT
검색엔진에 적용된 ChatGPT
 
검색엔진에 적용된 딥러닝 모델 방법론
검색엔진에 적용된 딥러닝 모델 방법론검색엔진에 적용된 딥러닝 모델 방법론
검색엔진에 적용된 딥러닝 모델 방법론
 
PaLM Paper Review
PaLM Paper ReviewPaLM Paper Review
PaLM Paper Review
 
The Deep Learning Compiler
The Deep Learning CompilerThe Deep Learning Compiler
The Deep Learning Compiler
 
History of Vision AI
History of Vision AIHistory of Vision AI
History of Vision AI
 
Aws architecture
Aws architectureAws architecture
Aws architecture
 
Real estate trust solution
Real estate trust solutionReal estate trust solution
Real estate trust solution
 
Bayesian learning
Bayesian learningBayesian learning
Bayesian learning
 
Deep learning financial product recommendation model
Deep learning financial product recommendation modelDeep learning financial product recommendation model
Deep learning financial product recommendation model
 
Deep Learning Through Various Processes
Deep Learning Through Various ProcessesDeep Learning Through Various Processes
Deep Learning Through Various Processes
 
Reinforcement learning
Reinforcement learningReinforcement learning
Reinforcement learning
 
Jenkins in finance
Jenkins in financeJenkins in finance
Jenkins in finance
 
HistoryOfCNN
HistoryOfCNNHistoryOfCNN
HistoryOfCNN
 
금융분야 취업을 위한 커리어 설계
금융분야 취업을 위한 커리어 설계금융분야 취업을 위한 커리어 설계
금융분야 취업을 위한 커리어 설계
 

Enhanced ai platform

  • 1. Enhanced AI Platform Produced by Tae Young Lee
  • 2. NAS Model Model Memory Limitation Inference Speed Worse Performance Training Model Model Data Data Data 1)데이터 병렬화 2)모델 병렬화 GPU 그 이유는 같은 데이터에서 단순히 모델만을 키운다고 성능이 향상되진 않음 ( 학습 데이터의 다양성 보장 필요 ) Serving Layer Model 학습에 필요한 gradient는 모델의 크기에 비례하기 때문에 분산 학습을 통해 학습 속도를 올리더라도, 모델이 커짐에 따라 학습에 보다 많은 시간이 소요 Training Speed 모델 크기가 증가하면서 추론에 걸리는 시간 역시 늘어나기 때문에 문제가 됨 모델이 커지면서 가장 먼저 문제가 될 수 있는 것은 메모리 사이즈임 Memory Enhanced AI Platform 복수의 GPU를 사용한 학습을 통해 이 문제를 해결하려 함 하지만 분산 학습으로 모델을 학습하더라도 여전히 문제는 해결되지 않는다. ( GPU 구매는 NVidia만 좋은 일(?) ) GPU 가지치기 (Pruning) 가중치 분해 (Weight Factorization) 지식 증류 (Knowledge Distillation) 가중치 공유 (Weight Sharing) 양자화 (Quantization) Pre-train vs. Downstream Model 압축 기술
  • 3. Model Training Data Labeling Model Evaluation Data Versioning Model Service Model Prediction Model Deployment Model Versioning Serving Architecture Legacy Interface Scaling Hardware Model Life Cycle 준용 모델 별 Training Image 반입 Workspace에서 Training 수행 Training 시 Shared Memory 설정 Training 시 Multi GPU 설정 Model Serving Monitoring Inference 제공 Gateway POD Monitoring Rancher는 간단한 설정만으로 Node, Pod 상태를 모니터링 할 수 있는 기능을 제공 보다 상세한 상태를 파악하기 위해서는 Prometheus, Grafana 등을 사용하여 모니터링 Data Selection Data Cleaning Data Pre-Processing Model MetaData 관리 Model Validation ML-Metadata Model Registry ML-Metadata Model Registry
  • 4. Data Versioning DW는 데이터의 재구성을 위해 원시 데이터 계층에서 획득된 서로 다른 데이터들을 이해할 수 있어야 하며 모델링 시에 활용되는 각각의 데이터셋들에 대한 이력을 유지해서 모델 트레이닝 시 학습된 모델과의 binding 관계를 표현할 수 있게 스냅샷 형태로의 저장이 필요하다. 운영 및 유지보수 관점에서 필요하다고 판단됨
  • 5. 학습 Data와 학습 모델의 단일화된 백업 관리 https://deview.kr/2019/schedule/310
  • 6. Training과 Inference 시 Scaling Hardware Training 시 구성되는 Data의 Size와 Scope에 따라 가용해야 하는 Training Resource차이가 존재함 이를 위해서는 Data의 Size와 Scope에 따라 동적으로 Traing환경 구성에 필요한 IDE 자원할당 및 환경 구성을 Resource Clustering화하여 제공함 Inference 시에는 얼마나 트래픽이 들어올 지 몰라서 많은 GPU를 확보하고 시작 - Throughput 추정 불가 ( Resource 낭비 ) Inference를 하기 위한 최소한 장비 사양을 모름 (?)
  • 8. Model Validation 모델을 변경하였을 때 Inference결과가 이상하게 나오는것 방지 Production(운영계)과 Staging(개발계)을 비교하기 https://deview.kr/2020/sessions/393
  • 10. Model Registry 모델과 부가 정보를 저장 - model-id, model-URI, description, user, metrics 등 실제 모델 파일은 HDFS 또는 NAS에 저장 https://deview.kr/2020/sessions/393
  • 11. Serving관련 다양한 환경 구성의 단일화 Inference Speed와 Response Time 보장에 필요한 Model Build 시 Base Image선택 필요 또한 일단위 처리량에 따른 유기적인 Base Image Switching을 통한 리소스 효율화 필요 https://deview.kr/2019/schedule/310
  • 12. 모델 서비스 시 프로세스 구조도 https://deview.kr/2020/sessions/329
  • 13. 배포 단계 제어 및 이력 관리 CPU / GPU Cluster 배포 사내 주요 클러스터 오퍼레이터 구현 선언적 배포 구성 파일 도입 라우팅 자동화 엔드포인트 자동 등록 / 관리 기능 새로운 인스턴스 배포 기존 인스턴스 재시작 EndPoint 정보 업데이트 동적 엔드포인트 디스커버리 AI Platform 고도화에서 고려해야 할 사항 Scaling Hardware Model Versioning 장애 탐지 라우팅 자동화