Cbt,fgt,obt를 통한 game data mining 기법

Chanman Jo
Chanman Josystem designer
CBT,FGT,OBT를 통한 GAME DATA MINING 기법
                             By-조찬만
                       ourlostcity@naver.com
지난번에서는…
•   리텐션의 산출과 활용을 실전에서 활용할 수 있도록 예제를 통해 알아보았
    습니다. 그럼 이번 시간에는…


    CBT, FGT, OBT 등 각종 테스트를 통해 Data를 얻고 그 Data를
    Mining 하는 기법에 대해 알아보도록 하겠습니다.
    상당히 다양한 방법들이 있겠지만 시간 관계상 1개만…



    Ps. 몇 일 동안 계속 잠 줄여가면서 이 짓 하니 잠이 모자라네요… 어우.. 지금 00시 37분…
•   이용자 선정은 최대한 다양한 객체들로 구성하는 편이 Data의 신뢰성을 높
    일 수 있습니다. 단, 예외적인 상황이 있는데 이를테면 주 고객 타겟층을 특
    정 집단을 겨냥하고 만들어진 게임이라면 그 집단이 형성될 수 있도록 이용
    자를 선정해서 모집하는 것이 좋겠죠.


    최대한 다양한 객체로 구성 시
    : 나이, 성별, 좋아하는 게임 장르, 평균 게임시간, 해본 게임들, 기타 등등


    특정 집단 겨냥 (초등학생 겨냥 시)
    : 초등학생 50% 중학생~고등학생 30~40% 기타 성인 10~20%
DATA라고 하면 Log를 심고 그것을 기반으로 추출된 것만을 Data라고 여기
는 경우도 종종 있는데 사실, 이용자에게 얻을 수 있는 모든 피드백이 Data입
니다.


이번 시간에 다룰 것은 그 중 정량 Data Mining이며 정성 Data는 간략한 소
개만 하고 넘어가겠습니다.
자유게시판, 커뮤니티, 설문지, 모니터링을 통한 관찰 등 이용자들의 ‘말로서 풀
어쓰는 것’, 즉 수치화가 어려운 Data
아래의 특징을 가집니다.


1. 정량화에 소모되는 시간이 매우 큼
2. 이용자의 감정이 포함된 피드백이 가능
3. 게임을 떠나는 이탈자는 피드백을 하지 않는 경우가 일반적
4. 일부 하드코어한 이용자들의 치우쳐진 정보들로 진실이 왜곡 될 수 있음
대표적인 예
이용자들이 남긴 Log를 통해 Data를 수집하고 수치화 하는 것들을 의미합니다.
아래의 특징을 가집니다.


1. 머신, 기술, 리소스 비용이 크다.
2. Data는 거짓말을 못하지만 분석자는 진실을 말하지 않을 수 있다.
3. 개인의 Log가 집단의 Log에 파묻히는 경향이 존재
4. 추측, 추리는 가능하지만 진실된 감정을 알기 어렵다.
5. 분석자에 따라 정치적 수단, 성과 위장 등 악용 가능성이 농후하다.
Data는 정성, 정량 두 가지 모두를 종합적으로
보고 분석해야 합니다. 어느 한쪽에 치우치면
의미있는 Data를 얻어내기 힘듭니다.

분석자는 양심적으로 분석해야 합니다.
자신에게 유리한 방향으로 진실을 왜곡하는 것에
능하신 분은 당장 국회로 나가세요.
★ CBT 진행
★ 용량 = 이용자 수
Client Data Save

                 Sever&DB



                                               Mail To
                                               Develop Team




Sever Data Save 방식          Client Data Save 방식
                            이용자들의 개인 PC에서 Data를
과부하 등 이슈로 인해
                            쌓고 Mail을 통해 전달받는 방식
한계가 존재하며                    클라이언트 배포 시 약관 동의 형태로

세부적인 Data Log 남기기 어려움       진행하여 Mail로 전달해주는 사용자들에게 어
                            드벤티지를 약속하는 형태
두 방법 모두 일장일단이 존재하지만 기술적 한계가 없다고 하면
Sever&DB Save 방식이 효율적이며


한계가 존재할 경우
Client Save 방식으로 진행하면 됨


Client Save 라면 Data 저장 방식은 Xml로 남기는 편이 마이닝 하기 편합니다.
Sever&DB Save로 한다면 SQL이나 다른 DB를 사용하면 되겠습니다.
(이 부분은 프로그래머와 논의하세요.)


단, Client Save 방식은 로컬에서 Data를 쌓기 때문에 그 Data를
개발사에 전달해주지 않으면 말짱꽝임.
국내에서 널리 알려진 편인 던전&파이터로 예제를 시작하겠습니다.
(참고로 본인은 해당 개발사와 전혀 연관이 없습니다.)
게임 디자인 흐름에 따라 Data를 얻을 영역을 분할하고 Log를 심을
항목들에 대해 구상을 합니다.
던전&파이터는 MORPG 형태의 게임이고 씬을 분리하면
‘마을’과 ‘던전’2가지 상태로 크게 분리가 가능합니다.
따라서 Data 수집 상태를 마을에서 추출 가능한 부분과 던전에서 추출 가능한
부분 크게 2개의 씬으로 구분해서 진행해보도록 하겠습니다.
로그가 찍힌 시각과 UID

Event Log의 분류    이벤트 쿼리별로 남기는 세부
                 데이터 로그들
캐릭터의 상태 체크
Event 중 Move가 있습니다.
Move 이벤트는 약 5초 단위로 로그를 찍습니다.
로그를 찍을 때 Move Event에는 FieldID와 좌표값인 X,Y,Z를 남깁니다.


이 값이 시간 흐름에 따라 계속해서 찍힐 경우 우리는 유저의 ‘이동동선’을
확인할 수 있고, 이 Data는 기획자가 디자인한 이동동선과 실제 유저의 이동동선
을 비교해서 체크해볼 수 있게 만드는 Data가 됩니다.
이벤트 쿼리별로 남기는 세부
Event Log의 분류
                데이터 로그들
1. 스킬 사용 빈도 파악
Event 중 Hit enemy 는 MonID로 분류된 오브젝트에 데미지를 가할 때
로그가 찍히게 됩니다. 하위 카테고리에는 SkillID와 Damage가 찍힙니다.
이 Low Data를 Mining하여 실제로 유저가 던전을 플레이 할 때
해당 캐릭터의 어떤 스킬들을 자주 사용하는지를 알 수 있습니다.
빈도수 같은 것을 정확히 예측하고 싶다면 CoolTime 대비 사용 가능 횟수
등까지 고려해서 값을 측정하게 되면 스킬 사용 빈도수를 알 수 있게 되겠죠.
이는 스킬 디자인에 활용할 수 있겠죠


2. 던전 난이도 조절
Kill Event를 확인하면 던전에서 PC들이 얼마나 많이 죽는지를 확인할 수 있고
그를 통해 던전 난이도를 조절할 수 있겠죠.
3. 경제
획득에 대한 쿼리를 이용 Money, Item 등을 Level 별로 누적 재화를 확인 가능
상점 쿼리를 이용해 Spend kind도 확인 가능


4. 이탈 사용자의 마지막 행동
리텐션 부분에서 이탈사용자로 필터
이탈사용자들에 대한 Log를 통해 마지막 행동을 알아봄으로 인해
무엇 때문에 이탈했을지에 대한 추측 가능


5. 기타 등등…
Data를 남기는 양에 따라 그밖에 다양한 상황들을 파악할 수 있음.
이러한 Data 분류는 시간흐름에 따라
유저가 게임상에서 일으킬 수 있는 Event들을
쿼리로 만들어 Log를 찍는 형태입니다.

이를 세분화하면 할수록 유저의 행동 패턴을
Data로 알아보기가 쉬어집니다.

이 단계에서는 가급적 최대한 상세하게 Event들
을 분류해서 Log만으로 유저 Play를 역추적까지
할 수 있는 상태로 만드는 것이 좋습니다.

즉, Data를 통해 유저의 플레이를 재현해서
디자인의 의도대로 흘러가는지에 대한 체크가
가능해지는 것이죠.
•   위의 형태처럼 Low Data를 남겼다면 이제 Mining을 진행해야 합니다.
•   Mining은 엑셀의 피벗테이블을 사용하면 손쉽게 정리가 가능합니다.
•   Data를 남길 때 위의 예시처럼 Low Data의 형태를 엑셀에서 손쉽게
    편집이 가능한 형태가 되도록 미리 상의할 필요가 있습니다.
•   피벗 테이블은 매우 사용하기 쉽습니다. 인터넷에 피벗테이블 검색하세요.
•   방대한 양의 Data를 통해 ‘유의미 Data’, ‘불의미 Data’ 파악
•   유의미했던 Data들의 정량화 작업
•   실서비스 시 해당 Data들을 언제든 손쉽게 볼 수 있게 정형화


※ Flurry 같이 웹 등에서 손쉽게 볼 수 있는 형태로 변형하면 게임 서비스를 운
영하는데 매우 큰 참고를 할 수 있습니다.
지난 시간에 쭈욱 이야기해왔던 리텐션을 올리는데 이번 시간
에 소개한 Data들이 있다면 많은 활용이 가능해집니다.

또한 유료화 부분을 설계할 때도 유저들이 어떤 시점에서
최초로 결제를 시도하는지 파악도 가능해지죠.

Data를 세분화하고 Mining해서 볼 수만 있다면 전략적 디자
인이 가능해집니다.
다만, 이 디자인은 감각 디자인 후에 후천적으로 파생되는
디자인이라는 점은 잊지 마시고, Data에만 의존하는
바보도 되지 마세요. 결국 Data에 기반하는 디자인도
수 많은 디자인 방법 중 하나일 뿐이니까요.
1 de 21

Recomendados

실전 예제) 난이도로 인한 리텐션 올리기 por
실전 예제) 난이도로 인한 리텐션 올리기실전 예제) 난이도로 인한 리텐션 올리기
실전 예제) 난이도로 인한 리텐션 올리기Chanman Jo
2.2K visualizações16 slides
리텐션의 산출과 활용 por
리텐션의 산출과 활용리텐션의 산출과 활용
리텐션의 산출과 활용Chanman Jo
7K visualizações29 slides
[Gaming on AWS] 모바일 게임 데이터의 특성과 100% 활용법 - 5Rocks por
[Gaming on AWS] 모바일 게임 데이터의 특성과 100% 활용법 - 5Rocks[Gaming on AWS] 모바일 게임 데이터의 특성과 100% 활용법 - 5Rocks
[Gaming on AWS] 모바일 게임 데이터의 특성과 100% 활용법 - 5RocksAmazon Web Services Korea
4.3K visualizações18 slides
[5Rocks] 게임데이터 분석 세미나 por
[5Rocks] 게임데이터 분석 세미나[5Rocks] 게임데이터 분석 세미나
[5Rocks] 게임데이터 분석 세미나Tapjoy X 5Rocks
11.8K visualizações25 slides
Blackbox 기획안 por
Blackbox 기획안Blackbox 기획안
Blackbox 기획안Chul hee Yeon
1.2K visualizações10 slides
244 5rocks-deview por
244 5rocks-deview244 5rocks-deview
244 5rocks-deviewNAVER D2
5.8K visualizações27 slides

Mais conteúdo relacionado

Destaque

복귀 이벤트를 해도 유저가 돌아오지 않는 이유 por
복귀 이벤트를 해도 유저가 돌아오지 않는 이유복귀 이벤트를 해도 유저가 돌아오지 않는 이유
복귀 이벤트를 해도 유저가 돌아오지 않는 이유Chanman Jo
6.4K visualizações27 slides
02. 게임 전투 공식 por
02. 게임 전투 공식02. 게임 전투 공식
02. 게임 전투 공식Chanman Jo
3.1K visualizações24 slides
전투 시스템 기획(Canvas 스터디 1차) por
전투 시스템 기획(Canvas 스터디 1차)전투 시스템 기획(Canvas 스터디 1차)
전투 시스템 기획(Canvas 스터디 1차)Chanman Jo
4.5K visualizações45 slides
리텐션율 의미와 산출방법 por
리텐션율 의미와 산출방법리텐션율 의미와 산출방법
리텐션율 의미와 산출방법Chanman Jo
29.1K visualizações26 slides
[GAMENEXT] 성공적인 사용자 리텐션 관리 (AD FRESCA) por
[GAMENEXT] 성공적인 사용자 리텐션 관리 (AD FRESCA)[GAMENEXT] 성공적인 사용자 리텐션 관리 (AD FRESCA)
[GAMENEXT] 성공적인 사용자 리텐션 관리 (AD FRESCA)GAMENEXT Works
3.4K visualizações31 slides
Dm ml study_roadmap por
Dm ml study_roadmapDm ml study_roadmap
Dm ml study_roadmapKang Pilsung
5.1K visualizações16 slides

Destaque(17)

복귀 이벤트를 해도 유저가 돌아오지 않는 이유 por Chanman Jo
복귀 이벤트를 해도 유저가 돌아오지 않는 이유복귀 이벤트를 해도 유저가 돌아오지 않는 이유
복귀 이벤트를 해도 유저가 돌아오지 않는 이유
Chanman Jo6.4K visualizações
02. 게임 전투 공식 por Chanman Jo
02. 게임 전투 공식02. 게임 전투 공식
02. 게임 전투 공식
Chanman Jo3.1K visualizações
전투 시스템 기획(Canvas 스터디 1차) por Chanman Jo
전투 시스템 기획(Canvas 스터디 1차)전투 시스템 기획(Canvas 스터디 1차)
전투 시스템 기획(Canvas 스터디 1차)
Chanman Jo4.5K visualizações
리텐션율 의미와 산출방법 por Chanman Jo
리텐션율 의미와 산출방법리텐션율 의미와 산출방법
리텐션율 의미와 산출방법
Chanman Jo29.1K visualizações
[GAMENEXT] 성공적인 사용자 리텐션 관리 (AD FRESCA) por GAMENEXT Works
[GAMENEXT] 성공적인 사용자 리텐션 관리 (AD FRESCA)[GAMENEXT] 성공적인 사용자 리텐션 관리 (AD FRESCA)
[GAMENEXT] 성공적인 사용자 리텐션 관리 (AD FRESCA)
GAMENEXT Works3.4K visualizações
Dm ml study_roadmap por Kang Pilsung
Dm ml study_roadmapDm ml study_roadmap
Dm ml study_roadmap
Kang Pilsung5.1K visualizações
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰 por JeongHeon Lee
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰
빅데이터 분야를 위한 이미지 마이닝 기술동향 및 산업 동향 고찰
JeongHeon Lee9.1K visualizações
집단지성 프로그래밍 02-추천시스템 만들기 por Kwang Woo NAM
집단지성 프로그래밍 02-추천시스템 만들기집단지성 프로그래밍 02-추천시스템 만들기
집단지성 프로그래밍 02-추천시스템 만들기
Kwang Woo NAM11.4K visualizações
집단지성 프로그래밍 06-의사결정트리-01 por Kwang Woo NAM
집단지성 프로그래밍 06-의사결정트리-01집단지성 프로그래밍 06-의사결정트리-01
집단지성 프로그래밍 06-의사결정트리-01
Kwang Woo NAM17.3K visualizações
모바일/온라인 게임의 매출시뮬레이션 por Sunnyrider
모바일/온라인 게임의 매출시뮬레이션모바일/온라인 게임의 매출시뮬레이션
모바일/온라인 게임의 매출시뮬레이션
Sunnyrider 11K visualizações
집단지성 프로그래밍 01-데이터마이닝 개요 por Kwang Woo NAM
집단지성 프로그래밍 01-데이터마이닝 개요집단지성 프로그래밍 01-데이터마이닝 개요
집단지성 프로그래밍 01-데이터마이닝 개요
Kwang Woo NAM6.6K visualizações
R 기본-데이타형 소개 por Terry Cho
R 기본-데이타형 소개R 기본-데이타형 소개
R 기본-데이타형 소개
Terry Cho25.8K visualizações
R 프로그래밍-향상된 데이타 조작 por Terry Cho
R 프로그래밍-향상된 데이타 조작R 프로그래밍-향상된 데이타 조작
R 프로그래밍-향상된 데이타 조작
Terry Cho28.3K visualizações
[NDC 발표] 모바일 게임데이터분석 및 실전 활용 por Tapjoy X 5Rocks
[NDC 발표] 모바일 게임데이터분석 및 실전 활용[NDC 발표] 모바일 게임데이터분석 및 실전 활용
[NDC 발표] 모바일 게임데이터분석 및 실전 활용
Tapjoy X 5Rocks38.1K visualizações
R 프로그래밍 기본 문법 por Terry Cho
R 프로그래밍 기본 문법R 프로그래밍 기본 문법
R 프로그래밍 기본 문법
Terry Cho28.3K visualizações
머신 러닝 입문 #1-머신러닝 소개와 kNN 소개 por Terry Cho
머신 러닝 입문 #1-머신러닝 소개와 kNN 소개머신 러닝 입문 #1-머신러닝 소개와 kNN 소개
머신 러닝 입문 #1-머신러닝 소개와 kNN 소개
Terry Cho69.2K visualizações
기계학습 / 딥러닝이란 무엇인가 por Yongha Kim
기계학습 / 딥러닝이란 무엇인가기계학습 / 딥러닝이란 무엇인가
기계학습 / 딥러닝이란 무엇인가
Yongha Kim61.7K visualizações

Similar a Cbt,fgt,obt를 통한 game data mining 기법

[NDC 2011] 게임 개발자를 위한 데이터분석의 도입 por
[NDC 2011] 게임 개발자를 위한 데이터분석의 도입[NDC 2011] 게임 개발자를 위한 데이터분석의 도입
[NDC 2011] 게임 개발자를 위한 데이터분석의 도입Hoon Park
5.7K visualizações73 slides
탐사분석을통한작업장탐지 por
탐사분석을통한작업장탐지탐사분석을통한작업장탐지
탐사분석을통한작업장탐지Eun-Jo Lee
1.5K visualizações82 slides
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다 por
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다승화 양
38.1K visualizações50 slides
[NDC18] 야생의 땅 듀랑고의 데이터 엔지니어링 이야기: 로그 시스템 구축 경험 공유 por
[NDC18] 야생의 땅 듀랑고의 데이터 엔지니어링 이야기: 로그 시스템 구축 경험 공유[NDC18] 야생의 땅 듀랑고의 데이터 엔지니어링 이야기: 로그 시스템 구축 경험 공유
[NDC18] 야생의 땅 듀랑고의 데이터 엔지니어링 이야기: 로그 시스템 구축 경험 공유Hyojun Jeon
15.8K visualizações243 slides
GA로 게임 로그 분석하기 por
GA로 게임 로그 분석하기GA로 게임 로그 분석하기
GA로 게임 로그 분석하기Alan Kang
15.4K visualizações55 slides
[Gastudy.net] Google Analytics basic por
[Gastudy.net] Google Analytics basic[Gastudy.net] Google Analytics basic
[Gastudy.net] Google Analytics basicSeHeung Oh
3.8K visualizações41 slides

Similar a Cbt,fgt,obt를 통한 game data mining 기법(20)

[NDC 2011] 게임 개발자를 위한 데이터분석의 도입 por Hoon Park
[NDC 2011] 게임 개발자를 위한 데이터분석의 도입[NDC 2011] 게임 개발자를 위한 데이터분석의 도입
[NDC 2011] 게임 개발자를 위한 데이터분석의 도입
Hoon Park5.7K visualizações
탐사분석을통한작업장탐지 por Eun-Jo Lee
탐사분석을통한작업장탐지탐사분석을통한작업장탐지
탐사분석을통한작업장탐지
Eun-Jo Lee1.5K visualizações
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다 por 승화 양
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
승화 양38.1K visualizações
[NDC18] 야생의 땅 듀랑고의 데이터 엔지니어링 이야기: 로그 시스템 구축 경험 공유 por Hyojun Jeon
[NDC18] 야생의 땅 듀랑고의 데이터 엔지니어링 이야기: 로그 시스템 구축 경험 공유[NDC18] 야생의 땅 듀랑고의 데이터 엔지니어링 이야기: 로그 시스템 구축 경험 공유
[NDC18] 야생의 땅 듀랑고의 데이터 엔지니어링 이야기: 로그 시스템 구축 경험 공유
Hyojun Jeon15.8K visualizações
GA로 게임 로그 분석하기 por Alan Kang
GA로 게임 로그 분석하기GA로 게임 로그 분석하기
GA로 게임 로그 분석하기
Alan Kang15.4K visualizações
[Gastudy.net] Google Analytics basic por SeHeung Oh
[Gastudy.net] Google Analytics basic[Gastudy.net] Google Analytics basic
[Gastudy.net] Google Analytics basic
SeHeung Oh3.8K visualizações
[IGC2015] 아라소판단 김성욱-게임 기획을 변경하게 되는 요인 por 강 민우
[IGC2015] 아라소판단 김성욱-게임 기획을 변경하게 되는 요인[IGC2015] 아라소판단 김성욱-게임 기획을 변경하게 되는 요인
[IGC2015] 아라소판단 김성욱-게임 기획을 변경하게 되는 요인
강 민우3K visualizações
학교에서는 배울 수 없는 스타트업 엔지니어링 (연세대 특강) por Lab80
학교에서는 배울 수 없는 스타트업 엔지니어링 (연세대 특강)학교에서는 배울 수 없는 스타트업 엔지니어링 (연세대 특강)
학교에서는 배울 수 없는 스타트업 엔지니어링 (연세대 특강)
Lab802.8K visualizações
NDC 2016 김정주 - 기계학습을 활용한 게임어뷰징 검출 por 정주 김
NDC 2016 김정주 - 기계학습을 활용한 게임어뷰징 검출 NDC 2016 김정주 - 기계학습을 활용한 게임어뷰징 검출
NDC 2016 김정주 - 기계학습을 활용한 게임어뷰징 검출
정주 김18.7K visualizações
게임제작개론 : #9 라이브 서비스 por Seungmo Koo
게임제작개론 : #9 라이브 서비스게임제작개론 : #9 라이브 서비스
게임제작개론 : #9 라이브 서비스
Seungmo Koo11.2K visualizações
How to Create Value from Data, and Its Difficulty por Dataya Nolja
How to Create Value from Data, and Its DifficultyHow to Create Value from Data, and Its Difficulty
How to Create Value from Data, and Its Difficulty
Dataya Nolja209 visualizações
게임 서비스 품질 향상을 위한 데이터 분석 활용하기 - 김필중 솔루션즈 아키텍트:: AWS Cloud Track 3 Gaming por Amazon Web Services Korea
게임 서비스 품질 향상을 위한 데이터 분석 활용하기 - 김필중 솔루션즈 아키텍트:: AWS Cloud Track 3 Gaming게임 서비스 품질 향상을 위한 데이터 분석 활용하기 - 김필중 솔루션즈 아키텍트:: AWS Cloud Track 3 Gaming
게임 서비스 품질 향상을 위한 데이터 분석 활용하기 - 김필중 솔루션즈 아키텍트:: AWS Cloud Track 3 Gaming
Amazon Web Services Korea2.7K visualizações
로그 기깔나게 잘 디자인하는 법 por Jeongsang Baek
로그 기깔나게 잘 디자인하는 법로그 기깔나게 잘 디자인하는 법
로그 기깔나게 잘 디자인하는 법
Jeongsang Baek16K visualizações
Log Design Case Study por Dataya Nolja
Log Design Case StudyLog Design Case Study
Log Design Case Study
Dataya Nolja100 visualizações
Big Data Analytics and Data Mining por SuHyun Jeon
Big Data Analytics and Data MiningBig Data Analytics and Data Mining
Big Data Analytics and Data Mining
SuHyun Jeon2.3K visualizações
Google analytics in business por Tae Young Lee
Google analytics in businessGoogle analytics in business
Google analytics in business
Tae Young Lee2.1K visualizações
Itsm팀 내부세미나 사용자스토리_정희찬 por 정 희찬
Itsm팀 내부세미나 사용자스토리_정희찬Itsm팀 내부세미나 사용자스토리_정희찬
Itsm팀 내부세미나 사용자스토리_정희찬
정 희찬1.2K visualizações
이벤트 로그 설계 구축기.pdf por ssuser0f6f15
이벤트 로그 설계 구축기.pdf이벤트 로그 설계 구축기.pdf
이벤트 로그 설계 구축기.pdf
ssuser0f6f15214 visualizações
빅데이터실습교육 소비분야 영남대_언론정보_20141117 por Han Woo PARK
빅데이터실습교육 소비분야 영남대_언론정보_20141117빅데이터실습교육 소비분야 영남대_언론정보_20141117
빅데이터실습교육 소비분야 영남대_언론정보_20141117
Han Woo PARK2K visualizações
KGC 2014 가볍고 유연하게 데이터 분석하기 : 쿠키런 사례 중심 , 데브시스터즈 por Minwoo Kim
KGC 2014 가볍고 유연하게 데이터 분석하기 : 쿠키런 사례 중심 , 데브시스터즈KGC 2014 가볍고 유연하게 데이터 분석하기 : 쿠키런 사례 중심 , 데브시스터즈
KGC 2014 가볍고 유연하게 데이터 분석하기 : 쿠키런 사례 중심 , 데브시스터즈
Minwoo Kim36.2K visualizações

Cbt,fgt,obt를 통한 game data mining 기법

  • 1. CBT,FGT,OBT를 통한 GAME DATA MINING 기법 By-조찬만 ourlostcity@naver.com
  • 2. 지난번에서는… • 리텐션의 산출과 활용을 실전에서 활용할 수 있도록 예제를 통해 알아보았 습니다. 그럼 이번 시간에는… CBT, FGT, OBT 등 각종 테스트를 통해 Data를 얻고 그 Data를 Mining 하는 기법에 대해 알아보도록 하겠습니다. 상당히 다양한 방법들이 있겠지만 시간 관계상 1개만… Ps. 몇 일 동안 계속 잠 줄여가면서 이 짓 하니 잠이 모자라네요… 어우.. 지금 00시 37분…
  • 3. 이용자 선정은 최대한 다양한 객체들로 구성하는 편이 Data의 신뢰성을 높 일 수 있습니다. 단, 예외적인 상황이 있는데 이를테면 주 고객 타겟층을 특 정 집단을 겨냥하고 만들어진 게임이라면 그 집단이 형성될 수 있도록 이용 자를 선정해서 모집하는 것이 좋겠죠. 최대한 다양한 객체로 구성 시 : 나이, 성별, 좋아하는 게임 장르, 평균 게임시간, 해본 게임들, 기타 등등 특정 집단 겨냥 (초등학생 겨냥 시) : 초등학생 50% 중학생~고등학생 30~40% 기타 성인 10~20%
  • 4. DATA라고 하면 Log를 심고 그것을 기반으로 추출된 것만을 Data라고 여기 는 경우도 종종 있는데 사실, 이용자에게 얻을 수 있는 모든 피드백이 Data입 니다. 이번 시간에 다룰 것은 그 중 정량 Data Mining이며 정성 Data는 간략한 소 개만 하고 넘어가겠습니다.
  • 5. 자유게시판, 커뮤니티, 설문지, 모니터링을 통한 관찰 등 이용자들의 ‘말로서 풀 어쓰는 것’, 즉 수치화가 어려운 Data 아래의 특징을 가집니다. 1. 정량화에 소모되는 시간이 매우 큼 2. 이용자의 감정이 포함된 피드백이 가능 3. 게임을 떠나는 이탈자는 피드백을 하지 않는 경우가 일반적 4. 일부 하드코어한 이용자들의 치우쳐진 정보들로 진실이 왜곡 될 수 있음
  • 6. 대표적인 예 이용자들이 남긴 Log를 통해 Data를 수집하고 수치화 하는 것들을 의미합니다. 아래의 특징을 가집니다. 1. 머신, 기술, 리소스 비용이 크다. 2. Data는 거짓말을 못하지만 분석자는 진실을 말하지 않을 수 있다. 3. 개인의 Log가 집단의 Log에 파묻히는 경향이 존재 4. 추측, 추리는 가능하지만 진실된 감정을 알기 어렵다. 5. 분석자에 따라 정치적 수단, 성과 위장 등 악용 가능성이 농후하다.
  • 7. Data는 정성, 정량 두 가지 모두를 종합적으로 보고 분석해야 합니다. 어느 한쪽에 치우치면 의미있는 Data를 얻어내기 힘듭니다. 분석자는 양심적으로 분석해야 합니다. 자신에게 유리한 방향으로 진실을 왜곡하는 것에 능하신 분은 당장 국회로 나가세요.
  • 8. ★ CBT 진행 ★ 용량 = 이용자 수
  • 9. Client Data Save Sever&DB Mail To Develop Team Sever Data Save 방식 Client Data Save 방식 이용자들의 개인 PC에서 Data를 과부하 등 이슈로 인해 쌓고 Mail을 통해 전달받는 방식 한계가 존재하며 클라이언트 배포 시 약관 동의 형태로 세부적인 Data Log 남기기 어려움 진행하여 Mail로 전달해주는 사용자들에게 어 드벤티지를 약속하는 형태
  • 10. 두 방법 모두 일장일단이 존재하지만 기술적 한계가 없다고 하면 Sever&DB Save 방식이 효율적이며 한계가 존재할 경우 Client Save 방식으로 진행하면 됨 Client Save 라면 Data 저장 방식은 Xml로 남기는 편이 마이닝 하기 편합니다. Sever&DB Save로 한다면 SQL이나 다른 DB를 사용하면 되겠습니다. (이 부분은 프로그래머와 논의하세요.) 단, Client Save 방식은 로컬에서 Data를 쌓기 때문에 그 Data를 개발사에 전달해주지 않으면 말짱꽝임.
  • 11. 국내에서 널리 알려진 편인 던전&파이터로 예제를 시작하겠습니다. (참고로 본인은 해당 개발사와 전혀 연관이 없습니다.)
  • 12. 게임 디자인 흐름에 따라 Data를 얻을 영역을 분할하고 Log를 심을 항목들에 대해 구상을 합니다. 던전&파이터는 MORPG 형태의 게임이고 씬을 분리하면 ‘마을’과 ‘던전’2가지 상태로 크게 분리가 가능합니다. 따라서 Data 수집 상태를 마을에서 추출 가능한 부분과 던전에서 추출 가능한 부분 크게 2개의 씬으로 구분해서 진행해보도록 하겠습니다.
  • 13. 로그가 찍힌 시각과 UID Event Log의 분류 이벤트 쿼리별로 남기는 세부 데이터 로그들 캐릭터의 상태 체크
  • 14. Event 중 Move가 있습니다. Move 이벤트는 약 5초 단위로 로그를 찍습니다. 로그를 찍을 때 Move Event에는 FieldID와 좌표값인 X,Y,Z를 남깁니다. 이 값이 시간 흐름에 따라 계속해서 찍힐 경우 우리는 유저의 ‘이동동선’을 확인할 수 있고, 이 Data는 기획자가 디자인한 이동동선과 실제 유저의 이동동선 을 비교해서 체크해볼 수 있게 만드는 Data가 됩니다.
  • 15. 이벤트 쿼리별로 남기는 세부 Event Log의 분류 데이터 로그들
  • 16. 1. 스킬 사용 빈도 파악 Event 중 Hit enemy 는 MonID로 분류된 오브젝트에 데미지를 가할 때 로그가 찍히게 됩니다. 하위 카테고리에는 SkillID와 Damage가 찍힙니다. 이 Low Data를 Mining하여 실제로 유저가 던전을 플레이 할 때 해당 캐릭터의 어떤 스킬들을 자주 사용하는지를 알 수 있습니다. 빈도수 같은 것을 정확히 예측하고 싶다면 CoolTime 대비 사용 가능 횟수 등까지 고려해서 값을 측정하게 되면 스킬 사용 빈도수를 알 수 있게 되겠죠. 이는 스킬 디자인에 활용할 수 있겠죠 2. 던전 난이도 조절 Kill Event를 확인하면 던전에서 PC들이 얼마나 많이 죽는지를 확인할 수 있고 그를 통해 던전 난이도를 조절할 수 있겠죠.
  • 17. 3. 경제 획득에 대한 쿼리를 이용 Money, Item 등을 Level 별로 누적 재화를 확인 가능 상점 쿼리를 이용해 Spend kind도 확인 가능 4. 이탈 사용자의 마지막 행동 리텐션 부분에서 이탈사용자로 필터 이탈사용자들에 대한 Log를 통해 마지막 행동을 알아봄으로 인해 무엇 때문에 이탈했을지에 대한 추측 가능 5. 기타 등등… Data를 남기는 양에 따라 그밖에 다양한 상황들을 파악할 수 있음.
  • 18. 이러한 Data 분류는 시간흐름에 따라 유저가 게임상에서 일으킬 수 있는 Event들을 쿼리로 만들어 Log를 찍는 형태입니다. 이를 세분화하면 할수록 유저의 행동 패턴을 Data로 알아보기가 쉬어집니다. 이 단계에서는 가급적 최대한 상세하게 Event들 을 분류해서 Log만으로 유저 Play를 역추적까지 할 수 있는 상태로 만드는 것이 좋습니다. 즉, Data를 통해 유저의 플레이를 재현해서 디자인의 의도대로 흘러가는지에 대한 체크가 가능해지는 것이죠.
  • 19. 위의 형태처럼 Low Data를 남겼다면 이제 Mining을 진행해야 합니다. • Mining은 엑셀의 피벗테이블을 사용하면 손쉽게 정리가 가능합니다. • Data를 남길 때 위의 예시처럼 Low Data의 형태를 엑셀에서 손쉽게 편집이 가능한 형태가 되도록 미리 상의할 필요가 있습니다. • 피벗 테이블은 매우 사용하기 쉽습니다. 인터넷에 피벗테이블 검색하세요.
  • 20. 방대한 양의 Data를 통해 ‘유의미 Data’, ‘불의미 Data’ 파악 • 유의미했던 Data들의 정량화 작업 • 실서비스 시 해당 Data들을 언제든 손쉽게 볼 수 있게 정형화 ※ Flurry 같이 웹 등에서 손쉽게 볼 수 있는 형태로 변형하면 게임 서비스를 운 영하는데 매우 큰 참고를 할 수 있습니다.
  • 21. 지난 시간에 쭈욱 이야기해왔던 리텐션을 올리는데 이번 시간 에 소개한 Data들이 있다면 많은 활용이 가능해집니다. 또한 유료화 부분을 설계할 때도 유저들이 어떤 시점에서 최초로 결제를 시도하는지 파악도 가능해지죠. Data를 세분화하고 Mining해서 볼 수만 있다면 전략적 디자 인이 가능해집니다. 다만, 이 디자인은 감각 디자인 후에 후천적으로 파생되는 디자인이라는 점은 잊지 마시고, Data에만 의존하는 바보도 되지 마세요. 결국 Data에 기반하는 디자인도 수 많은 디자인 방법 중 하나일 뿐이니까요.