1. DETECÇÃO DE FAKE
NEWS USANDO DATA
SCIENCE
Mestrado em Métodos Quantitativos para a
Decisão Económica e Empresarial
Gestão de Dados
Professor Carlos Costa
Pedro Costa Escária
4. O QUE É A DATA SCIENCE?
• Corresponde ao processo de extrair informação relevante a partir de
dados que, isoladamente, carecem de sentido ou de significado. Neste
sentido, recorre a notícias de diferentes origens e cruza as suas
informações para retirar conclusões acerca da veracidade das mesmas.
8. METODOLOGIA GERAL
Conjunto de
Dados (Notícias)
Pré-Processamentos EXEMPLOS DE ALGORITMOS
PARA Pré-Processamentos:
Word2vec, Stanford NLP, N-grams,
LIWC, Bag-of-words, TF-IDF,
DCDistance, Document-Term Matrix
(DTM)
Remover Números do texto
Eliminar caracteres de pontuação do texto
Filtrar caracteres que contêm elementos <N
Aplicar ao conversor
Remover Stop Words
Derivar os dados textuais
Modelo de Avaliação
Exemplos de algoritmos de machine learning:
Stochastic Gradient Descent, Decision Tree,
Random Forest, Classifier, K-Nearest
Neighbour, Logistic Regression, Kernel e SVM .
Verificar a eficiência do
algoritmo de inteligência
artificial
Seleccionar algoritmo de inteligência
artificial
Testar os algoritmos selecionados