O documento discute a classificação binária de dados do telescópio Cherenkov MAGIC para identificar raios gama e partículas de hádrons. A precisão de classificação simples não é significativa para esses dados, sendo melhor comparar classificadores usando curva ROC. Métricas como precisão, recall e F1 score são apresentadas para avaliar os classificadores.
Mini-Curso: Introdução à Big Data e Data Science - Aula 4 - O que é Data Scie...
Criando modelos preditivos com Azure Machine Learning
1. Criando modelos preditivos com
Azure Machine Learning
Utilizando classificação binária para
identificar os elementos do CTA (Cherenkov
Telescope Array) em Raio Gama e partículas de
Hadrons.
Diego Nogare
Data Scientist @ NGR Solutions
nogare@ngrsolutions.com.br
10. MAGIC Gamma Telescope Data Set
1. fLength: # major axis of ellipse [mm]
2. fWidth: # minor axis of ellipse [mm]
3. fSize: # 10-log of sum of content of all pixels [in #phot]
4. fConc: # ratio of sum of two highest pixels over fSize [ratio]
5. fConc1: # ratio of highest pixel over fSize [ratio]
6. fAsym: # distance from highest pixel to center, projected onto major axis [mm]
7. fM3Long: # 3rd root of third moment along major axis [mm]
8. fM3Trans: # 3rd root of third moment along minor axis [mm]
9. fAlpha: # angle of major axis with vector to origin [deg]
10. fDist: # distance from origin to center of ellipse [mm]
11. class: g,h # gamma (signal), hadron (background)
https://archive.ics.uci.edu/ml/datasets/
MAGIC+Gamma+Telescope
11. MAGIC Gamma Telescope Data Set
A precisão de classificação simples não é significativa
para esses dados, uma vez que classificar um evento
de radiação cósmica de fundo como sinal é pior do
que classificar um evento de sinal como radiação
cósmica de fundo. Para a comparação de diferentes
classificadores deve ser utilizada uma Curva ROC. Os
pontos relevantes nesta curva são aqueles em que a
probabilidade de aceitar um evento de radiação
cósmica de fundo como sinal está abaixo de um dos
seguintes limiares: 0,01, 0,02, 0,05, 0,1, 0,2
dependendo da qualidade necessária da amostra dos
eventos aceitos para diferentes experimentos.
Falem que o evento é gratuito pra todos, e que os patrocinadores são os responsáveis por garantir o coffee e a infra-estrutura basica pro evento acontecer. Em contra partida, eles querem mostrar seus produtos e serviços, é legal aos participantes conhecerem o que eles tem a oferecer e aceitar receber contatos deles via email.