ATIVIDADE 1 - SISTEMAS DISTRIBUÍDOS E REDES - 52_2024.docx
Machine learning usando scikits
1. Machine Learning usando scikits.learn Marcelo Gomes Pereira de Lacerda Engenharia da Computação Escola Politécnica de Pernambuco Universidade de Pernambuco PUG-PE - Julho de 2011
2. Roteiro Elementos Básicos Aprendizagem Supervisionada Seleção de Modelo Aprendizagem Não-Supervisionada Conclusão PUG-PE - Julho de 2011
3. Elementos Básicos Base de dados (features = Array 2D, labelsArray 1D) Estimator Evaluator PUG-PE - Julho de 2011
4. Aprendizagem Supervisionada Encontrar relação entre dois datasets: X e Y A aprendizagem ocorre sob “orientações” do humano, o qual diz se uma resposta dada pelo modelo está correta ou não e qual a resposta certa. X => Array 2D. Ex.: [[1,2,3],[3,4,5],[5,6,7]] Y => Array 1D (na maioria dos casos). Ex.: [0,0,1] fit(X,Y) predict(p) PUG-PE - Julho de 2011
12. Regressão para Classificação Regressão Linear não é recomendada Dá muito peso a elementos distantes da fronteira de decisão! Solução: Regressão Logística (Sigmóide) PUG-PE - Julho de 2011
13. Regressão para Classificação PUG-PE - Julho de 2011 logistic = linear_model.LogisticRegression(C=1e5) logistic.fit(iris_X_train, iris_y_train) LogisticRegression(C=100000.0, intercept_scaling=1, dual=False, fit_intercept=True, penalty='l2', tol=0.0001)
14. SupportVector Machines (SVM) Achar a combinação de amostras de treinamento de forma que maximize a margem entre as classes PUG-PE - Julho de 2011
24. K-Means (Clusterização “Plana”) Desempenho do K-Means depende da inicialização dos clusters scikits.learn cuida disso por debaixo dos panos! PUG-PE - Julho de 2011