5. Recherche full text MySQL
http://dev.mysql.com/doc/refman/5.0/fr/fulltext-search.html
Retourne les enregistrements avec leur pertinence
Gère les opérateurs booléens + et –
Peut convenir pour un développement spécifique
T3UNI11
01.07.2011
TYPO3 et les moteurs de recherche
6. Recherche full text MySQL
http://dev.mysql.com/doc/refman/5.0/fr/fulltext-search.html
Trop simpliste
Modifie la structure de la table (MyISAM)
Performances faibles sur des gros volumes
T3UNI11
01.07.2011
TYPO3 et les moteurs de recherche
7. Recherche full text MySQL
T3UNI11
01.07.2011
TYPO3 et les moteurs de recherche
9. indexed_search
Est développée depuis 2004 (Kasper Skaarhoj)
Est intégrée et configurée dans les sources de TYPO3
Indexe toutes les pages/contenus et documents (catdoc / pdftotext)
Gère les espaces authentifiés
Dispose d’un crawler externe (CRON) ou indexation à la visite (aucune configuration)
T3UNI11
01.07.2011
TYPO3 et les moteurs de recherche
10. indexed_search
Convient parfaitement pour des sites à faible et moyen trafic
Ne gère pas de manière poussée les opérateurs et le filtrage
Est difficile à surcharger pour ajouter des fonctionnalités (XCLASS, hooks…)
T3UNI11
01.07.2011
TYPO3 et les moteurs de recherche
12. Google Search (version gratuite)
http://www.google.com/cse/
Très simple à mettre en place
Aucun contrôle :
Retours
Mise en forme
Indexation dépend de votre SEO
T3UNI11
01.07.2011
TYPO3 et les moteurs de recherche
13. Google Search (version payante)
http://www.google.com/sitesearch/
Toujours aussi simple
Gestion des synonymes
Pondération de certains résultats
Pas de publicité
Flux XML
Filtrage par catégorie simple
Dépend toujours de l’indexation de Google
T3UNI11
01.07.2011
TYPO3 et les moteurs de recherche
14. Google Search et TYPO3
ya_googlesearch
googlecse
google_api_search
ltg_googlesearch
so_gsearch
ajax_google_search
…
T3UNI11
01.07.2011
TYPO3 et les moteurs de recherche
15. MnoGoSearch
http://www.mnogosearch.org/
Ecrit en C
Composé d’un crawler et d’un moteur de recherche
Supporte la plupart des base de données
Support de l’UTF8
Gestion du multilinguisme (70 langues)
Indexation et recherche rapide
Indexation des pages et documents
Existence d’une extension PHP (http://php.net/manual/fr/book.mnogosearch.php)
T3UNI11
01.07.2011
TYPO3 et les moteurs de recherche
16. MnoGoSearch et TYPO3
1 seule extension : mnogosearch (2009)
Développée par Dmitry Dulepov (realurl, templavoila, pagebrowse…)
Simple (nécessite par contre l’installation sur le serveur)
Supporte les pages authentifiées et les documents
Peu d’options disponibles pour les recherches (tris, filtres…)
T3UNI11
01.07.2011
TYPO3 et les moteurs de recherche
17. Sphinx
http://www.sphinxsearch.com/
Ecrit en C++
Spécialement conçu avec la performance à l’esprit
Composé d’un crawler et d’un moteur de recherche
Couvre les mêmes fonctionnalités que mnogosearch
Plus rapide que mnogosearch (ou les autres) pour les deux traitements
Supporte la plupart des base de données (ou des fichiers XML)
Possibilité de recherches distribuées pour les très gros sites
De bonnes références : wordpress, dailymotion, mozilla
Craigslist : 5 billions de documents, 6 TB de données, 50 millions de recherches/jour
T3UNI11
01.07.2011
TYPO3 et les moteurs de recherche
18. Sphinx et TYPO3
Rien ! Tout est à faire
SphinxAPI compatible PHP (SphinxAPI, SphinxSE et SphinxQL)
Peut-être une implémentation de SphinxQL dans le core de TYPO3 4.6?
T3UNI11
01.07.2011
TYPO3 et les moteurs de recherche
19. Apache SOLR
http://lucene.apache.org/solr/
Ecrit en Java (nécessite un serveur d’application Java)
Composé d’un moteur d’indexation et de recherche (Lucene)
Propose une interface de recherche (SOLR)
Solution très rapide
Pas besoin de base de données
Interface sous forme d’API XML / JSON exploitable de n’importe où et avec
n’importe quelle technologie (SolrPHPClient)
De bonnes références : Cnet, Panasonic, Porsche…
Nécessite de la configuration et un serveur « convenable »
T3UNI11
01.07.2011
TYPO3 et les moteurs de recherche
20. Apache SOLR
Beaucoup de fonctionnalités :
Possibilité de choisir exactement ce qui est indexé
Indexation des documents puissante (Apache Tika)
Recherche avec des opérateurs
Recherche par facette
Réplication des index
Recherche distribuée
Interface d’administration
Interaction possible avec d’autres systèmes (Liferay, AlFresco)
T3UNI11
01.07.2011
TYPO3 et les moteurs de recherche
21. Apache SOLR et TYPO3
http://www.typo3-solr.com/
Projet débuté en 2008
Projet soutenu par dkd
Une version gratuite
Une version payante
Bien intégré
Pages authentifiées
Facettes
Tris
Filtres
Auto-complétion
Installation facilitée
…
T3UNI11
01.07.2011
TYPO3 et les moteurs de recherche
22. Apache SOLR et TYPO3
http://www.typo3-solr.com/
Toute la configuration est faite en typoscript
Paramétrage
Ajout de champs, facettes…
Objets typoscript
T3UNI11
01.07.2011
TYPO3 et les moteurs de recherche
23. Apache SOLR et TYPO3
http://www.typo3-solr.com/
Et si l’extension ne fait pas ce que je veux?
Possibilité de surcharger le typoscript (userfunc)
Des hooks aux bons endroits
Une XCLASS?
T3UNI11
01.07.2011
TYPO3 et les moteurs de recherche
25. Merci
Retrouvez cette présentation sur www.site-ngo.fr
Yohann CERDAN <yohann@site-ngo.fr>
Thomas LEROY <thomas@site-ngo.fr>
T3UNI11
01.07.2011
TYPO3 et les moteurs de recherche