Palestra ministrada pela Patrícia Maia no 2o Seminário sobre Análise de Dados na Administração Pública @ http://www.brasildigital.gov.br/ Resumo: O trabalho consistiu na aplicação de técnicas de mineração de textos para identificação dos principais assuntos abordados nas auditorias dos últimos cinco anos. Foram utilizadas duas abordagens: a abordagem supervisionada aplicando classificação de textos com o algoritmo Random Forest e a abordagem não supervisionada através da técnica de modelagem de tópicos Latent Dirichlet Allocation (LDA). O projeto piloto foi validado com as constatações de TI e está agora sendo estendido a constatações relacionadas a outros temas. O objetivo é permitir catalogar o histórico de constatações emitidas e categorizar automaticamente novos registros. Com isso, os servidores poderão recuperar situações semelhantes para aplicação em novos trabalhos ou, ainda, tratar problemas recorrentes de forma estruturante. Além disso a mesma lógica pode ser usada para gerar conhecimento a partir de outros tipos de texto: pedidos com base na Lei de Acesso à Informações, manifestações do e-OUV, processos analisados pela CRG, notícias de interesse do órgão, etc. Palestrante: Patrícia Maia - Ministério da Transparência, Fiscalização e Controle Currículo: Possui mestrado em Computação Aplicada pela Universidade de Brasília (UNB), especialização em Modelagem de Processos e Engenharia de Requisitos pela Universidade Federal do Rio Grande do SUL (UFRGS) e graduação em Tecnologia da Informação. Tem experiência profissional nas áreas de mineração de textos, ETL, banco de dados e controle governamental. Trabalha atualmente no Ministério da Transparência, Fiscalização e Controle (MTFC), exercendo suas atividades na Diretoria de Pesquisas e Informações Estratégicas.