Esta palestra aborda o problema de processamento de linguagem natural em php, onde não temos a disposição nenhuma ferramenta para este tipo de trabalho e o lançamento do Texta - Text Analizer
5. dado um corpus,
analisa o conteúdo TF-IDF
calculando a Term Frequency-Inverse
importância relativa
de um termo. Document Frequency
Wednesday, October 19, 11
7. O desafio de um ser humano não eh deixar para tras a
condição de estudante mas descobrir o que estudar.
Extração de informação
Wednesday, October 19, 11
13. O desafio de um ser humano não é deixar para tras a
condição de estudante mas descobrir o que estudar.
$BIGRAM=Array(
(null,‘o’),(‘o’,‘desafio’),(‘desafio’,’de’),(‘de’,’um’),(‘um’,‘ser’),
(‘ser’,‘humano’),(‘humano’ ,‘não’),(‘não,’’é’),(‘é’,‘deixar’),
(‘deixar’,‘para’),(‘para’,‘tras’),(‘tras’,‘condicao’),
(‘condicao’,’de’),(‘de’,‘estudante’),(‘estudante’,‘mas’),
(‘mas’,‘descobrir’),(‘descobrir’,’o’),(‘o’,‘que’),(‘que’,‘estudar’),
(‘estudar’,null)
);
n-gram(bigram,trigram,...)
Wednesday, October 19, 11
14. Distância Euclidiana
Coeficiente de Relção de Pearson
Coeficiente de Jaccard
Filtro Bayesiano
Coef. Dice Análise
Qui-quadrado
Wednesday, October 19, 11
15. Termos
Homógrafos
ordem não importa
Problemas da abordagem tf-idf
Wednesday, October 19, 11
16. dado um corpus,
analisa o conteúdo
e busca NLP
compreensão do
todo.
Wednesday, October 19, 11
17. É uma área da inteligência arti cial e da linguística
que estuda os problemas da geração e compreensão automática
de linguas humanas naturais.(wikipedia)
Wednesday, October 19, 11