106.
시스템 기획
(분석 대상, 데이터, 알고리즘)
시스템 기획
(분석 도메인만 결정,
마케팅, 생산성 향상, ... )
시스템 비용 및 ROI 산정
관련 데이터 수집
(기업 내부, 외부)
업체 선정
개발
운영
3 ~ 6개월 이상 소요
데이터 가지고 놀기
가치 발굴
시스템에 반영
지속적인 활동
195.
임시 저장소인 Queue 장애 시 방안?
분석 중 일부 분석 서버 장애 시
임시 분석 결과는 어떻게?
분석 결과 저장소의 성능은?
분석 결과 서비스 제공 시
충분한 기능 제공?
http://highlyscalable.wordpress.com/2013/08/20/in-stream-big-data-processing/
470.
Load in memory
hash(url)
IP-City
Data
URL, Count(1)
Group by URL
Log Parsing
WorkGroup #1
(LogType=URL)
time batch 60 sec.
TOP 100
Order by count
Desc
URL, Count(1)
Group by URL
log
data
Log Parsing
Log Parsing
Count
(Distinct User)
HBase Table
hash(user_id)
Count
(Distinct User)
WorkGroup #2
(LogType=User)
time batch 20 sec.
804.
실시간 색인 클러스터(최신 데이터)
읽기 전용 클러스터(전체 데이터)
Server1
Hadoop FileSy
stem
(for Analytic)
index1
(SAS or SATA)
Collector
HDFSSink
ElasticSearc
h
Sink
Hadoop FileSystem
(for elastcisearch)
ElasticSearch
Server2
index
7
Index
Migration
Tool
index
8
index
9
index
10
index
11
index
12
ElasticSearch
Server1
Application
Searcher
HDFS
Gateway
ElasticSearch
index2
(SAS or SATA)
Server2
HDFS
Gateway
ElasticSearch
947.
Uploader
Application Server
ZooKeeper
Master Server
Server Cluster Membership
Genome Browser
Uploader
JDBC
Data Server Failover
Master Election
Client
Indexer
Genome Allocation
Cluster Configuration
Meta Management
Meta Infomation
Data Server #1
…
Genome Unit #1
Disk
Index
Memory
Index
Data
File
Index
File
Index
File
Index
File
Index
File
Data
File
Index
File
Data
File
Index
File
Data
File
Index
File
Data
File
Index
File
Data
File
Index
File
Data
File
Index
File
Data
File
Index
File
Data
File
Hadoop DataNode
Hadoop DataNode
…
Index
File
Data
File
Index
File
Data
File
Index
File
Data
File
Index
File
Data
File
Hadoop DataNode
1152.
새로운 분석 대상
데이터 추가
Hive 테이블
메타 정보
시스템 담당자
기획자
파라미터 튜닝
룰 생성
분석 대상
오브젝트 등록
시스템 담당자
분석 룰 디자인
Ad-hoc
질의 실행
분석 룰 관리
/실행
시스템 담당자
자동/배치
오브젝트
메타 정보
오브젝트
메타 정보
실행 결과
파라미터 튜닝
결과 조회
기획자
결과 제공
API
1207.
분석 결과
(HDFS)
HFileUploader
분석 결과 저장소
Active Cluster
Table
Table
Table
HBase
WAS
StandBy Cluster
Table
Table
Table
HBase
(분석용 클러스터 활용)
WAS
Active Cluster 관리
ZooKeeper