Este documento fornece uma introdução à processamento de linguagem natural (NLP) em português utilizando a biblioteca SpaCy em Python. Explica conceitos básicos como tokenização, análise gramatical, similaridade, Word2Vec e lemmatização e fornece links para material de estudo adicional.
2. Letícia S. Pedroso
Data Scientist- BRQ Digital Solutions
Formação: Análise e Desenvolvimento de Sistemas (FATEC-MC)
LeticiaSPedroso
linkedin.com/in/letícia-pedroso-b062b698
3. Tente explicar para um estrangeiro a
diferença entre ‘bota a calça’ e ‘calça a
bota’
19. doc = nlp(u’ estava, estavam, estarão,
estariam’)
[token.lemma_ for token in doc if token.pos_
== 'VERB']
1
2
3
4
5
6
[estar, estar, estar, estar]
20. Material para Estudo
• Meu Repositório com todos os exemplos:
https://github.com/LeticiaSPedroso/NLP-with-Spacy
• Spacy Documentation:
https://spacy.io/usage/spacy-101