Atualizámos a nossa política de privacidade. Clique aqui para ver os detalhes. Toque aqui para ver os detalhes.
Ative o seu período de avaliaçõo gratuito de 30 dias para desbloquear leituras ilimitadas.
Ative o seu teste gratuito de 30 dias para continuar a ler.
Baixar para ler offline
Cours sur le topic modeling - UPEM - Master Méthode computationnelle et analyse de contenu
I: Topic Modeling
* Nature et applications
* Approche Deterministe: LSA
* Approche Probabiliste: LDA
* Quelques librairies en R et python
II: Le package STM en R
* Parametres
* Métriques: exclusivité et cohérence sémantique
* Appliqué a un corpus propre
LAB - R STM
* Le corpus: résumés d'articles tech, IEEE et Arstechnica
* Le package STM en R
* Comment determiner le nombre optimal de topics?
* Comment interpreter les résultats?
* Jupyter Notebook et Script R
III: forum Alt-right sur Facebook
* 500.000 commentaires provenant du forum alt-right God Trump Emperor
* De la nécessité de travailler le contenu
* Filtrer le bruit avec
* Lemmatization, tokenization
* Part of Speech tagging
* Named entity recognition
* Jupyter Notebook et Script R
IV: Application au Francais
* Quelles sont les librairies pour:
* Part of Speech
* Tokenization
* Lemmatization
V: Resources
* Articles et blogs
Cours sur le topic modeling - UPEM - Master Méthode computationnelle et analyse de contenu
I: Topic Modeling
* Nature et applications
* Approche Deterministe: LSA
* Approche Probabiliste: LDA
* Quelques librairies en R et python
II: Le package STM en R
* Parametres
* Métriques: exclusivité et cohérence sémantique
* Appliqué a un corpus propre
LAB - R STM
* Le corpus: résumés d'articles tech, IEEE et Arstechnica
* Le package STM en R
* Comment determiner le nombre optimal de topics?
* Comment interpreter les résultats?
* Jupyter Notebook et Script R
III: forum Alt-right sur Facebook
* 500.000 commentaires provenant du forum alt-right God Trump Emperor
* De la nécessité de travailler le contenu
* Filtrer le bruit avec
* Lemmatization, tokenization
* Part of Speech tagging
* Named entity recognition
* Jupyter Notebook et Script R
IV: Application au Francais
* Quelles sont les librairies pour:
* Part of Speech
* Tokenization
* Lemmatization
V: Resources
* Articles et blogs
Parece que você já adicionou este slide ao painel
Você recortou seu primeiro slide!
Recortar slides é uma maneira fácil de colecionar slides importantes para acessar mais tarde. Agora, personalize o nome do seu painel de recortes.A família SlideShare acabou de crescer. Desfrute do acesso a milhões de ebooks, áudiolivros, revistas e muito mais a partir do Scribd.
Cancele a qualquer momento.Leitura ilimitada
Aprenda de forma mais rápida e inteligente com os maiores especialistas
Transferências ilimitadas
Faça transferências para ler em qualquer lugar e em movimento
Também terá acesso gratuito ao Scribd!
Acesso instantâneo a milhões de e-books, audiolivros, revistas, podcasts e muito mais.
Leia e ouça offline com qualquer dispositivo.
Acesso gratuito a serviços premium como Tuneln, Mubi e muito mais.
Atualizámos a nossa política de privacidade de modo a estarmos em conformidade com os regulamentos de privacidade em constante mutação a nível mundial e para lhe fornecer uma visão sobre as formas limitadas de utilização dos seus dados.
Pode ler os detalhes abaixo. Ao aceitar, está a concordar com a política de privacidade atualizada.
Obrigado!