SlideShare uma empresa Scribd logo
1 de 9
DETECÇÃO DE FAKE
NEWS USANDO DATA
SCIENCE
Mestrado em Métodos Quantitativos para a
Decisão Económica e Empresarial
Gestão de Dados
Professor Carlos Costa
Pedro Costa Escária
O QUE SÃO AS FAKE NEWS?
CURIOSIDADE
O QUE É A DATA SCIENCE?
• Corresponde ao processo de extrair informação relevante a partir de
dados que, isoladamente, carecem de sentido ou de significado. Neste
sentido, recorre a notícias de diferentes origens e cruza as suas
informações para retirar conclusões acerca da veracidade das mesmas.
O QUE FOI FEITO?
Pré-
Processamentos
Word2vec
Bag-of-Words
LIWC
TF-IDF
TF
DTM Stanford NLP
Algoritmos de
Machine Learning
SVM
Logistic
Regression
K-Neighbour
Random
Forrest
Decision
Tree
Stochastic
Gradient
Descent
METODOLOGIA GERAL
Conjunto de
Dados (Notícias)
Pré-Processamentos EXEMPLOS DE ALGORITMOS
PARA Pré-Processamentos:
Word2vec, Stanford NLP, N-grams,
LIWC, Bag-of-words, TF-IDF,
DCDistance, Document-Term Matrix
(DTM)
Remover Números do texto
Eliminar caracteres de pontuação do texto
Filtrar caracteres que contêm elementos <N
Aplicar ao conversor
Remover Stop Words
Derivar os dados textuais
Modelo de Avaliação
Exemplos de algoritmos de machine learning:
Stochastic Gradient Descent, Decision Tree,
Random Forest, Classifier, K-Nearest
Neighbour, Logistic Regression, Kernel e SVM .
Verificar a eficiência do
algoritmo de inteligência
artificial
Seleccionar algoritmo de inteligência
artificial
Testar os algoritmos selecionados
Fake News

Mais conteúdo relacionado

Semelhante a Fake News

Capitulo-01-Ciencia-de-Dados-Conceitos-Básicos.pptx
Capitulo-01-Ciencia-de-Dados-Conceitos-Básicos.pptxCapitulo-01-Ciencia-de-Dados-Conceitos-Básicos.pptx
Capitulo-01-Ciencia-de-Dados-Conceitos-Básicos.pptx
VitorFaust
 
Trabalho de TSPD - Sistemas
Trabalho de TSPD - SistemasTrabalho de TSPD - Sistemas
Trabalho de TSPD - Sistemas
Tulio Belem
 
Ti douglas parte_i
Ti douglas parte_iTi douglas parte_i
Ti douglas parte_i
alessacristi
 

Semelhante a Fake News (20)

TDC2018SP | Trilha Comp Cognitiva - Quer ter um bom chatbot ? Entao vamos com...
TDC2018SP | Trilha Comp Cognitiva - Quer ter um bom chatbot ? Entao vamos com...TDC2018SP | Trilha Comp Cognitiva - Quer ter um bom chatbot ? Entao vamos com...
TDC2018SP | Trilha Comp Cognitiva - Quer ter um bom chatbot ? Entao vamos com...
 
Design da Vida Algorítmica - DCEX 2017
Design da Vida Algorítmica - DCEX 2017Design da Vida Algorítmica - DCEX 2017
Design da Vida Algorítmica - DCEX 2017
 
People analytics - O RH Data Driven
People analytics - O RH Data DrivenPeople analytics - O RH Data Driven
People analytics - O RH Data Driven
 
Business Analytics como ferramenta de Revenue Management
Business Analytics como ferramenta de Revenue ManagementBusiness Analytics como ferramenta de Revenue Management
Business Analytics como ferramenta de Revenue Management
 
Introdução ao Big Data para Desenvolvedores Python
Introdução ao Big Data para Desenvolvedores PythonIntrodução ao Big Data para Desenvolvedores Python
Introdução ao Big Data para Desenvolvedores Python
 
Machine learning java ce conference 2012 - fortaleza ce
Machine learning java ce conference 2012 - fortaleza ceMachine learning java ce conference 2012 - fortaleza ce
Machine learning java ce conference 2012 - fortaleza ce
 
Introdução a Ciência de Dados
Introdução a Ciência de DadosIntrodução a Ciência de Dados
Introdução a Ciência de Dados
 
Data science
Data scienceData science
Data science
 
Componentes dos Sistemas de Informação - Proª Cristiane fidelix
Componentes dos Sistemas de Informação - Proª Cristiane fidelixComponentes dos Sistemas de Informação - Proª Cristiane fidelix
Componentes dos Sistemas de Informação - Proª Cristiane fidelix
 
Componentes dos Sistemas de Informação
Componentes dos Sistemas de InformaçãoComponentes dos Sistemas de Informação
Componentes dos Sistemas de Informação
 
Entendo Business Intelligence
Entendo Business IntelligenceEntendo Business Intelligence
Entendo Business Intelligence
 
Capitulo-01-Ciencia-de-Dados-Conceitos-Básicos.pptx
Capitulo-01-Ciencia-de-Dados-Conceitos-Básicos.pptxCapitulo-01-Ciencia-de-Dados-Conceitos-Básicos.pptx
Capitulo-01-Ciencia-de-Dados-Conceitos-Básicos.pptx
 
Trabalho de TSPD - Sistemas
Trabalho de TSPD - SistemasTrabalho de TSPD - Sistemas
Trabalho de TSPD - Sistemas
 
Data mining
Data miningData mining
Data mining
 
Mineração
MineraçãoMineração
Mineração
 
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014 Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
 
Mineração_de_Dados.pptx
Mineração_de_Dados.pptxMineração_de_Dados.pptx
Mineração_de_Dados.pptx
 
Pentaho Weka latinoware
Pentaho Weka latinowarePentaho Weka latinoware
Pentaho Weka latinoware
 
Ti douglas parte_i
Ti douglas parte_iTi douglas parte_i
Ti douglas parte_i
 
Sistemas de Gestão Empresarial
Sistemas de Gestão EmpresarialSistemas de Gestão Empresarial
Sistemas de Gestão Empresarial
 

Mais de eurosigdoc acm

Projeção do Crowdfunding em Portugal: a plataforma ppl
Projeção do Crowdfunding em Portugal: a plataforma pplProjeção do Crowdfunding em Portugal: a plataforma ppl
Projeção do Crowdfunding em Portugal: a plataforma ppl
eurosigdoc acm
 
Implementação de uma aplicação em Power Apps – Low Code
Implementação de uma aplicação em Power Apps – Low CodeImplementação de uma aplicação em Power Apps – Low Code
Implementação de uma aplicação em Power Apps – Low Code
eurosigdoc acm
 
CLOUD COMPUTING E SUSTENTABILIDADE EMPRESARIAL
CLOUD COMPUTING E SUSTENTABILIDADE EMPRESARIALCLOUD COMPUTING E SUSTENTABILIDADE EMPRESARIAL
CLOUD COMPUTING E SUSTENTABILIDADE EMPRESARIAL
eurosigdoc acm
 
CROWDFUNDING: IMPACTO DA GAMIFICAÇÃO NAS PLATAFORMAS DE CROWDFUNDING
CROWDFUNDING: IMPACTO DA GAMIFICAÇÃO NAS PLATAFORMAS DE CROWDFUNDINGCROWDFUNDING: IMPACTO DA GAMIFICAÇÃO NAS PLATAFORMAS DE CROWDFUNDING
CROWDFUNDING: IMPACTO DA GAMIFICAÇÃO NAS PLATAFORMAS DE CROWDFUNDING
eurosigdoc acm
 
Low code: O futuro do desenvolvimento de aplicações
Low code: O futuro do desenvolvimento de aplicaçõesLow code: O futuro do desenvolvimento de aplicações
Low code: O futuro do desenvolvimento de aplicações
eurosigdoc acm
 
Crowdsourcing: DEFINIÇÕES E APLICAÇÕES NA ÁREA DA SAÚDE
Crowdsourcing: DEFINIÇÕES E APLICAÇÕES NA ÁREA DA SAÚDECrowdsourcing: DEFINIÇÕES E APLICAÇÕES NA ÁREA DA SAÚDE
Crowdsourcing: DEFINIÇÕES E APLICAÇÕES NA ÁREA DA SAÚDE
eurosigdoc acm
 
Blockchain: viável ou em luta com o meio ambiente?
Blockchain: viável ou em luta com o meio ambiente?Blockchain: viável ou em luta com o meio ambiente?
Blockchain: viável ou em luta com o meio ambiente?
eurosigdoc acm
 
Cloud Computing e a sua Implementação na Educação no Contexto de Pandemia COV...
Cloud Computing e a sua Implementação na Educação no Contexto de Pandemia COV...Cloud Computing e a sua Implementação na Educação no Contexto de Pandemia COV...
Cloud Computing e a sua Implementação na Educação no Contexto de Pandemia COV...
eurosigdoc acm
 

Mais de eurosigdoc acm (20)

Blockchain e o Futuro do Setor Financeiro
Blockchain e o Futuro do Setor FinanceiroBlockchain e o Futuro do Setor Financeiro
Blockchain e o Futuro do Setor Financeiro
 
No code – Caso Prático no App Inventor - BroTrip
No code – Caso Prático no App Inventor - BroTripNo code – Caso Prático no App Inventor - BroTrip
No code – Caso Prático no App Inventor - BroTrip
 
The oracle problem nos smart contracts
The oracle problem nos smart contractsThe oracle problem nos smart contracts
The oracle problem nos smart contracts
 
Robotic process automation
Robotic process automation Robotic process automation
Robotic process automation
 
Robotic Process Automation: caso de estudo Delloite
Robotic Process Automation: caso de estudo DelloiteRobotic Process Automation: caso de estudo Delloite
Robotic Process Automation: caso de estudo Delloite
 
Projeção do Crowdfunding em Portugal: a plataforma ppl
Projeção do Crowdfunding em Portugal: a plataforma pplProjeção do Crowdfunding em Portugal: a plataforma ppl
Projeção do Crowdfunding em Portugal: a plataforma ppl
 
Implementação de uma aplicação em Power Apps – Low Code
Implementação de uma aplicação em Power Apps – Low CodeImplementação de uma aplicação em Power Apps – Low Code
Implementação de uma aplicação em Power Apps – Low Code
 
Proteção de dados e redes sociais
Proteção de dados e redes sociaisProteção de dados e redes sociais
Proteção de dados e redes sociais
 
CLOUD COMPUTING E SUSTENTABILIDADE EMPRESARIAL
CLOUD COMPUTING E SUSTENTABILIDADE EMPRESARIALCLOUD COMPUTING E SUSTENTABILIDADE EMPRESARIAL
CLOUD COMPUTING E SUSTENTABILIDADE EMPRESARIAL
 
CROWDFUNDING: IMPACTO DA GAMIFICAÇÃO NAS PLATAFORMAS DE CROWDFUNDING
CROWDFUNDING: IMPACTO DA GAMIFICAÇÃO NAS PLATAFORMAS DE CROWDFUNDINGCROWDFUNDING: IMPACTO DA GAMIFICAÇÃO NAS PLATAFORMAS DE CROWDFUNDING
CROWDFUNDING: IMPACTO DA GAMIFICAÇÃO NAS PLATAFORMAS DE CROWDFUNDING
 
Low code: O futuro do desenvolvimento de aplicações
Low code: O futuro do desenvolvimento de aplicaçõesLow code: O futuro do desenvolvimento de aplicações
Low code: O futuro do desenvolvimento de aplicações
 
Robotic Process Automation
Robotic Process AutomationRobotic Process Automation
Robotic Process Automation
 
Crowdsourcing: DEFINIÇÕES E APLICAÇÕES NA ÁREA DA SAÚDE
Crowdsourcing: DEFINIÇÕES E APLICAÇÕES NA ÁREA DA SAÚDECrowdsourcing: DEFINIÇÕES E APLICAÇÕES NA ÁREA DA SAÚDE
Crowdsourcing: DEFINIÇÕES E APLICAÇÕES NA ÁREA DA SAÚDE
 
Business Intelligence e o Desporto
Business Intelligence e o DesportoBusiness Intelligence e o Desporto
Business Intelligence e o Desporto
 
Blockchain
Blockchain Blockchain
Blockchain
 
Blockchain: viável ou em luta com o meio ambiente?
Blockchain: viável ou em luta com o meio ambiente?Blockchain: viável ou em luta com o meio ambiente?
Blockchain: viável ou em luta com o meio ambiente?
 
Cloud Computing e a sua Implementação na Educação no Contexto de Pandemia COV...
Cloud Computing e a sua Implementação na Educação no Contexto de Pandemia COV...Cloud Computing e a sua Implementação na Educação no Contexto de Pandemia COV...
Cloud Computing e a sua Implementação na Educação no Contexto de Pandemia COV...
 
Viabilidade das NFT’s a Longo Prazo
Viabilidade das NFT’s a Longo Prazo Viabilidade das NFT’s a Longo Prazo
Viabilidade das NFT’s a Longo Prazo
 
Outsystems e o Universo do Low-Code
Outsystems e o Universo do Low-CodeOutsystems e o Universo do Low-Code
Outsystems e o Universo do Low-Code
 
ERP
ERPERP
ERP
 

Fake News

  • 1. DETECÇÃO DE FAKE NEWS USANDO DATA SCIENCE Mestrado em Métodos Quantitativos para a Decisão Económica e Empresarial Gestão de Dados Professor Carlos Costa Pedro Costa Escária
  • 2. O QUE SÃO AS FAKE NEWS?
  • 4. O QUE É A DATA SCIENCE? • Corresponde ao processo de extrair informação relevante a partir de dados que, isoladamente, carecem de sentido ou de significado. Neste sentido, recorre a notícias de diferentes origens e cruza as suas informações para retirar conclusões acerca da veracidade das mesmas.
  • 5. O QUE FOI FEITO?
  • 8. METODOLOGIA GERAL Conjunto de Dados (Notícias) Pré-Processamentos EXEMPLOS DE ALGORITMOS PARA Pré-Processamentos: Word2vec, Stanford NLP, N-grams, LIWC, Bag-of-words, TF-IDF, DCDistance, Document-Term Matrix (DTM) Remover Números do texto Eliminar caracteres de pontuação do texto Filtrar caracteres que contêm elementos <N Aplicar ao conversor Remover Stop Words Derivar os dados textuais Modelo de Avaliação Exemplos de algoritmos de machine learning: Stochastic Gradient Descent, Decision Tree, Random Forest, Classifier, K-Nearest Neighbour, Logistic Regression, Kernel e SVM . Verificar a eficiência do algoritmo de inteligência artificial Seleccionar algoritmo de inteligência artificial Testar os algoritmos selecionados