O slideshow foi denunciado.
Utilizamos seu perfil e dados de atividades no LinkedIn para personalizar e exibir anúncios mais relevantes. Altere suas preferências de anúncios quando desejar.

Simple Text Analytics Extending from Getting Started on Hadoop

21.241 visualizações

Publicada em

Simple Text Analytics

Extending from how “WordCount” works, we’ll add multiple kinds of output
tuples, plus two stages of mappers and reducers, to generate different kinds
of text analytics products:

• inverted index
• co-occurrence analysis
• TF-IDF filter
• social graph

While doing that, we'll also perform other statistical
analysis and data visualization using R and Gephi

Publicada em: Tecnologia
  • Seja o primeiro a comentar

×