16. Inhaltserschliessung (I-II): Manuelle und automatische
Indexierung
Analyse documentaire (I-II): indexation manuelle et automatique
Historisches
Institut
Indexation/Classification/Clusters
16
II – Indexation automatique : Modèle booléen
Les vecteurs créés (les termes) sont libres.
Ils sont générés par hypothèse :
Soit B la base vectorielle des mots contenus dans le document.
Toute requête R est traitée de la même manière et ne contient que
les mots significatifs.
Le vecteur (le terme) de la requête est l’union des vecteurs de ses termes
significatifs dans B. Le résultat peut être nul.
17. Inhaltserschliessung (I-II): Manuelle und automatische
Indexierung
Analyse documentaire (I-II): indexation manuelle et automatique
Historisches
Institut
Indexation/Classification/Clusters
17
II – Indexation automatique : Modèle vectoriel
• A partir d‘un ensemble de termes, normalisation des termes et
élimination des stopwords
• Création d‘une matrice avec les termes restant pour chaque
document