O slideshow foi denunciado.
Utilizamos seu perfil e dados de atividades no LinkedIn para personalizar e exibir anúncios mais relevantes. Altere suas preferências de anúncios quando desejar.

Machine Learning: O que é, por onde começar e desafios

1.851 visualizações

Publicada em

Machine Learning: O que é, por onde começar e desafios

Publicada em: Educação
  • Entre para ver os comentários

Machine Learning: O que é, por onde começar e desafios

  1. 1. Machine Learning O que é, por onde começar e desafios Evento: Day Tech, 29/06/2019, 15h40 Elaine Cecília Gatto (Cissa) www.professoracissagatto.com.br
  2. 2. O que é Machine Learning? 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 2
  3. 3. O que é Machine Learning? • O que é Machine Learnig por Marcelo Tas: https://youtu.be/Z1YHbl0lh88 • Início na década de 40 (aproximadamente) • Técnica de Inteligência Artificial • Arthur Samuel, Engenheiro do MIT, em 1959, cria o termo Machine Learning • Existem várias definições 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto-MachineLearning 3
  4. 4. O que é Machine Learning? “Um campo de estudo que dá aos computadores a habilidade de aprender sem terem sido programados para tal” (Arthur Samuel) “A capacidade de melhorar o desempenho na realização de alguma tarefa por meio da experiência” (Tom Mitchell) Reflita: 1. Como eu aprendo? 2. Como fazer uma máquina aprender, da mesma forma que um humano aprende? 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 4
  5. 5. Breve Timeline • Filosofia, Ciência e Matemática: Luger, George F. Inteligência Artificial. 6.ª ed. São Paulo: Pearson Prentice Hall, 2013. Capítulo 1. • 40 – 60: • Inicio formal da Inteligência Artificial • Filme: O Jogo da Imitação, 2014 • 70 – 80: Primeiro inverno • 80 – 90: Sistemas Especialistas • 90 – 2000: Segundo inverno • 2000 – 2019: Retomada da área. Torna-se predominante no mundo. 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 5
  6. 6. Breve Timeline 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 6 Big Data Hardware IoT Redes Neurais Google Mídias Sociais Watson IBM Amazon Deep Learning Microsoft Cloud Blochain e Bitcoin
  7. 7. Aplicações 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 7 Agronomia Farmácia, Medicina e Saúde Biologia e Ecologia Meio Ambiente Indústria 4.0 e Automação em geral Meios de Transporte Varejo e Comércio Robótica Astronomia Energia Imagem, Áudio, Vídeo e Texto Redes de Computadores e Telecomunicações Finanças e Economia TUDO
  8. 8. A trindade do ML! 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 8
  9. 9. A trindade do ML 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 9 Matemática Estatística Programação P.s.: Alguns chamam ML de bruxaria, magia negra e também alquimia! Python R C/C++ Java Scala INGLÊS
  10. 10. 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 10 A trindade do ML
  11. 11. 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 11
  12. 12. Dados 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 12 Atributos Contínuos. Exemplos: peso, tamanho, etc. Atributos Discretos. Exemplo: sim ou não; V ou F Quantitativo Numérico: inteiro, real ou binário Qualitativo: Simbólico ou categórico Exemplos: - vermelho, azul, verde - pequeno, médio, grande • Quantas classes existem? • Existe alguma hierarquia? • Uma observação (ou instância ou exemplo) pode pertencer a mais de uma classe ao mesmo tempo?
  13. 13. Dados • Flags Dataset • Este conjunto de dados contém dados sobre as nações e suas bandeiras nacionais. Uma tarefa de classificação pode ser predizer as cores que aparecem nas bandeiras. Características: • Instâncias: 194 • Atributos: 19 (9 nominais e 10 numéricos) • Rótulos: 7 (red, green, blue, yellow, white, black, orange) • Domínio: imagens Fonte: http://archive.ics.uci.edu/ml/machine-learning- databases/flags/ 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 13
  14. 14. Dados 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 14 Colunas são Atributos Linhas são Exemplos
  15. 15. Dados 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 15 LANDMASS: 1 = America do Norte 2 = America do Sul 3 = Europa 4 = África 5 = Ásia 6 = Oceania
  16. 16. Dados 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 16 ZONE Quadrante da zona geográfica, baseado em Greenwich e no Equador. 1 = Nordeste 2 = Sudeste 3 = Sudoeste 4 = Noroeste
  17. 17. Dados 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 17 AREA: Área em milhares de km quadrados.
  18. 18. Dados 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 18 POPULAÇÃO:
  19. 19. Dados 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 19 LÍNGUA: 1 = inglês 2 = espanhol 3 = francês 4 = alemão 5 = eslavo 6 = outro indo-europeu 7 = chinês 8 = árabe 9 = japonês / turco / finlandês 10 = Outras
  20. 20. Dados 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 20 RELIGIÃO 0 = Católica 1 = Outros Cristãos 2 = Muçulmanos 3 = Budistas 4 = Hindus 5 = Étnicos 6 = Marxistas 7 = Outros
  21. 21. Dados 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 21 BARS: número de barras verticais na bandeira
  22. 22. Dados 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 22 STRIPES: número de listras horizontais na bandeira
  23. 23. Dados 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 23 COLOURS: Número de diferentes cores na bandeira
  24. 24. Dados 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 24 CIRCLES: Número de círculos na bandeira
  25. 25. Dados 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 25 CROSSES: número de cruzes verticais na bandeira
  26. 26. Dados 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 26 SALTIRES: número de cruzes horizontais na bandeira
  27. 27. Dados 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 27 QUARTERS: número de seções divididas em quartos
  28. 28. Dados 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 28 SUNSTARS: número de símbolos de sol ou estrela.
  29. 29. Dados 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 29 CRESCENT: 1 = tem um símbolo de lua crescente 0 = não tem
  30. 30. Dados 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 30 TRIANGLE: 1 = tem símbolos na forma de triângulo 0 = não tem
  31. 31. Dados 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 31 ICON: 1 = se tem uma imagem inanimada presente (por exemplo, um barco) 0 = caso contrário
  32. 32. Dados 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 32 ANIMATE: 1 = se tem uma imagem animada presente (por exemplo, uma águia, uma árvore, uma mão humana) 0 = caso contrário
  33. 33. Dados 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 33 TEXT: 1 = se houver letras ou escrita na bandeira (por exemplo, um lema ou slogan) 0 = caso contrário
  34. 34. Dados 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 34 VERMELHO, VERDE, AZUL, AMARELO, BRANCO, PRETO e/ou LARANJA: 1= tem a cor 0 = não tem a cor
  35. 35. Dados • Outros exemplos não perfeito de bases de dados: • exprindiv_ara_FUN.train • cellcycle_FUN.train • cellcycle_GO.train • https://www.kaggle.com • https://www.openml.org 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 35
  36. 36. Dados 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 36 Pré- processamento Limpeza Completude Consistência Redundância Ruído Transformação Simbólico  Numérico Numérico  Simbólico Normalização Dimensionalidade Agregar Selecionar
  37. 37. Aprendizado 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 37 Aprendizado por reforço
  38. 38. Métodos Preditivos 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 38 Distância: k-NN Otimização: RNA’s e SVM Probabilístico: Naive Bayes “Procura”: Árvores de Decisão Mineração de Padrões Frequentes: Apriori Agrupamento: K-means Métodos Descritivos
  39. 39. Uma forma de aprender 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 39 Conjunto de dados de Treinamento Algoritmo de Machine Learning (Aprendizado) MODELO (Aprendeu) MODELO Conjunto de dados de Teste Novos dados Classificados, Agrupados. etc. Depende de 2. ENTRADA DE DADOS PROCESSAMENTO SAÍDA Fase 1 Fase 2 1 2 3 4 5 6
  40. 40. E os resultados? • Os resultados são bons? Se sim, por que são bons? • Meu algoritmo é melhor ou pior? Por que? • Como avaliar? • Comparar com outros algoritmos • Consultar um especialista da área • Inúmeras Medidas de Avaliação • Diferem conforme a natureza do problema • Ensembles e combinações de algoritmos diferentes • Etc. 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 40
  41. 41. Cursos Online e Iniciativas • EDX: https://www.edx.org/course/subject/data-science • Data Science Academy: https://www.datascienceacademy.com.br/pages/todos-os-cursos-dsa • Coursera: https://www.coursera.org/specializations/machine-learning • Microsoft: https://www.microsoft.com/pt-br/academia • Linkedin: https://www.linkedin.com/learning/fundamentos-da- ciencia-de-dados 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 41
  42. 42. Cursos Online e Iniciativas • Udemy: • https://www.udemy.com/curso-data-science-completo • https://www.udemy.com/visualizacao-de-dados-com-python • https://www.udemy.com/deep-learning-com-python-az-curso- completo • https://www.udemy.com/ingles-inteligencia-artificial-pronuncia- perfeita • https://www.udemy.com/machine-learning-e-data-science-com-r • https://www.udemy.com/machine-learning-e-data-science-com- python-y • https://www.udemy.com/python-para-data-science-e-machine- learning • https://www.udemy.com/tensorflow-machine-learning-deep- learning-python 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 42
  43. 43. Cursos Online e Iniciativas • Amazon: https://www.aws.training/LearningLibrary • Caltech: https://work.caltech.edu/telecourse.html • Udacity: • https://www.udacity.com/school-of-data-science • https://classroom.udacity.com/courses/ud120 • OpenAI: https://openai.com/ • School of AI: https://www.theschool.ai/ • Não se esqueça dos livros e artigos científicos! 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 43
  44. 44. Cursos Presenciais • Graduação em Ciência de Dados na UFSCar • Especialização em Ciência de Dados na UFSCar 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 44
  45. 45. 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 45
  46. 46. Desafios • Interpretabilidade: como tomou essa decisão? • Machine learning has become alchemy. Ali Rahimi (Google) https://youtu.be/x7psGHgatGM • https://universoracionalista.org/pesquisadores-de-i-a-alegam-que-machine- learning-se-tornou-alquimia/ • Ética: • Tay, da Microsoft, bot de mídia social que aprendeu a dizer coisas inadequadas e ofensivas. Preconceito, homofobia, etc. • http://agenciabrasil.ebc.com.br/internacional/noticia/2019-04/europa-lanca- diretrizes-eticas-para-o-uso-da-inteligencia-artificial • Empregabilidade: conflito de gerações! Resistência à evolução? Novas Profissões: Engenheiro de Dados, Cientista de Dados, etc. 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 46
  47. 47. Desafios • Segurança: restrição e acesso aos dados • Algoritmos e Técnicas: evolução do que já existe ou criação de novos. • Mindset: empresas de todos os tipos terão de mudar sua cultura organizacional • Captura e qualidade de dados: os dados que alimentam os algoritmos de ML precisam ser “melhores” de forma que resulte em boas previsões. • Hardware + Armazenamento + Rede = Mas ainda não tá bom? Não! • Inúmeros Problemas do mundo real 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 47
  48. 48. Desafios • Diretrizes Europeias para IA Ética • Intervenção e supervisão humana • Robustez e segurança • Privacidade e governança de dados • Transparência • Diversidade, equidade e não-discriminação • Bem-estar social e ambiental • Prestação de contas • Etc. 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 48
  49. 49. REFERÊNCIAS • Machine Learning. Disponível em: <https://en.wikipedia.org/wiki/Machine_learning>. Acessado em 20/06/2019, 20:00 • Aprendizado de Máquina. Disponível em: <https://pt.wikipedia.org/wiki/Aprendizado_de_m%C3%A1quina>. Acessado em 20/06/2019, 20:00 • 17 casos de uso de Machine Learning. Disponível em: <http://datascienceacademy.com.br/blog/17-casos-de-uso-de- machine-learning/>. Acessado em 21/06/2019, 10:00. • Machine Learning Studio (Microsoft). Disponível em> <https://azure.microsoft.com/pt-br/services/machine-learning- studio/>. Acessado em 22/06/2019, 15:00. • Google Machine Learning. Disponível em: <https://cloud.google.com/products/ai/> Acessado em 22/06/2019, 17:00 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 49
  50. 50. REFERÊNCIAS • Amazon Machine Learning. Disponível em: <https://aws.amazon.com/pt/machine-learning/>. Acessado em 24/06/2019, 14:00. • Inteligência Artificial: Questões Éticas a serem Enfrentadas. Disponível em <http://abciber.org.br/anaiseletronicos/wp- content/uploads/2016/trabalhos/inteligencia_artificial_questoes_eticas _a_serem_enfrentadas_dora_kaufman.pdf>. Acessado em 24/06/2019, 14:44. 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 50
  51. 51. 29/06/2019 DayTech-SãoCarlos-29/06/19-ElaineCecíliaGatto 51

×