Formation M2i - Femmes entrepreneures : soyez actrices du changement
Tutoriaux
1. TUTORIAUX POUR OUTILS
NECESSAIRES A LA
VEILLE STRATEGIQUE
Charles FRANCART
Pyrénées Industries Céramiques
2. SOMMAIRE
TUTORIEL NETVIBES..................................................................................... 3
1. INTRODUCTION........................................................................................................... 3
2. PRISE EN MAIN RAPIDE..............................................................................................3
a) Ajouter/Supprimer une source ...................................................................................3
b) Ajouter/Supprimer un dashboard ...............................................................................4
3. PERSONNALISATION DU DASHBOARD.....................................................................4
a) Organiser les Widgets ...............................................................................................4
b) Renommer et éditer les onglets et les Widgets .........................................................4
4. PROBLEMES COURANTS............................................................................................5
TUTORIEL Yahoo.Pipes.................................................................................. 7
1. INTRODUCTION........................................................................................................... 7
2. PRISE EN MAIN RAPIDE..............................................................................................7
a) Générer un flux ......................................................................................................... 7
b) Format des informations sous Yahoo.Pipes ..............................................................8
c) Manipuler des flux .....................................................................................................8
i – Filtrer des flux ........................................................................................................ 8
ii– Fusionner des flux ..................................................................................................9
iii – Traduire des flux ...................................................................................................9
3. LES AUTRES OPERATEURS DE FLUX.....................................................................10
4. GERER ET OPTIMISER L’UTILISATION DES SOURCES..........................................12
5. MODIFIER ET TRAITER L’INFORMATION.................................................................13
6. LES « BUILDER » D’OBJETS.....................................................................................14
7. LES INTERACTIONS AVEC L’UTILISATEUR (USER INPUTS)..................................14
8. PROBLEMES DE LIAISONS ENTRE OBJETS...........................................................14
3. I – Tutoriel Netvibes
1. INTRODUCTION
Netvibes est un logiciel en ligne permettant un affichage sous forme de
dashboard des flux provenant de sources internet (typiquement de sites
internet).
Netvibes est appelé agrégateur de flux RSS dans le sens où il permet
l’affichage de plusieurs de ces derniers sur un même dashboard au moyen
de fenêtre appelées Widgets.
Ce logiciel a été choisi car c’est celui qui permet l’affichage le plus
ergonomique parmi les agrégateurs de flux RSS et il est également
GRATUIT (dans la version basique largement suffisante).
Il faut savoir que pour que vos dashboards créés soient sauvegardés, il est
nécessaire de s’enregistrer sur le site de Netvibes.
2. Prise en main rapide
a) Ajouter/Supprimer une source
Pour ajouter une source, cliquer sur l’onglet en haut à gauche sur
l’onglet « ajouter du contenu ». Un menu s’affiche alors contenant trois
choix :
- « explorer les catégories » permettant une veille à partir de
sources génériques de sujets très large (sports, voyage, …)
- « widgets essentiels » regroupe un ensemble d’outils très utiles
permettant d’adapter la mise en page du dashboard ou encore de
contourner certaines difficultés dues aux sources que nous verrons plus
tard
4. − «ajouter un flux » est certainement l’outil le plus utilisé du
logiciel. En effet, ce dernier permet de récolter les flux RSS par un
simple copier/coller de l’adresse URL de la source (le logiciel trouve
tout seul le flux quelle que soit page Web active du site). Le logiciel
vous proposera ensuite le ou les flux de la source et la création d’un
Widget se fera automatiquement après le choix de l’utilisateur.
Pour supprimer une source, il suffit de cliquer sur le l’icône symbolisée
par une croix dans un cercle en haut à droite du Widget associé à la
source que l’on désire supprimer.
b) Ajouter/Supprimer un dashboard
Pour ajouter un nouveau dashboard, il faut cliquer sur le champ « nouvel
onglet » situé tout à la fin des onglets de dashboards déjà existant. Le logiciel
vous propose à lors deux options : réaliser une veille automatique avec des
sources grossièrement choisies ou alors créer un onglet vide personnalisable
avec des sources choisies spécifiques.
Pour supprimer un dashboard, il faut cliquer sur la petite flèche à droite du titre
du dashboard (sur l’onglet). Un menu apparaît alors et tout à droite se trouve
l’option de suppression de l’onglet et donc du dashboard.
5. 3. PERSONNALISATION DU DASHBOARD
a) Organiser les widgets
Si l’organisation par défaut des widgets ne vous plaît pas, il existe différentes
configurations possibles dites en « boxes de widgets » allant de 1 à 4 boxes
pouvant chacun contenir un grand nombre de widgets. Pour choisir
l’organisation souhaitée, il suffit de se rendre dans le menu déroulant associé
au dashboard en question en cliquant sur la flèche à droite de son titre sur
l’onglet et de regarder dans la section « affichage ».
Il est à savoir que plus le choix de boxes est grands, plus il y a de possibilités
d’organisation (factorielles obligent ….).
Pour déplacer un widget sur le dashboard, un simple glisser/déplacer avec la
souris est suffisant.
b) Renommer et éditer les onglets et les widgets
Pour renommer les onglets, il suffit de se rendre dans le menu
déroulant associé au dashboard et de retaper un nouveau titre dans la
section options générales.
6. Pour renommer un widget, il faut cliquer sur l’icône « éditer »
symbolisée par un engrenage à côté du choix de suppression du
widget.
Un menu déroulant apparaît alors et un choix de titre vous est alors
proposé. Les autres champs changent en fonction du type de widget
(lien, page web, flux direct,…), les plus courants restent cependant
l’affichage d’une miniature de la page, une description du widget (pour
les liens), affichage de l’URL, taille du widget, …
4. PROBLEMES COURANTS
L’utilisation est la prise en main du logiciel est très simple et les principaux
problèmes techniques ne seront en général jamais dus à celui-ci.
Les problèmes proviendront à 99% des sources, en effet, celle-ci ne
présentent pas toujours de flux exploitables pour diverses raisons :
- Il n’y a tout simplement pas de flux sur la source.
- Les flux existe et sont visibles mais une erreur de codage ou une
protection ne permet pas leur collecte.
- Le format des flux n’est pas compatible avec Netvibes (cas rares ou
inexplicables autrement).
Dans ces cas présents, la plupart du temps les informations proviennent de
sources de sites mal encodés ou « artisanaux » ne présentant pas de flux
réguliers dont l’intérêt reste limité.
Cependant, il se peut que la source soit réellement intéressante et qu’une
veille soit nécessaire à partir de celle-ci car les informations sont critiques,
il existe alors des solutions permettant de créer des flux RSS à partir de
sources n’en présentant pas à l’origine.
Le logiciel présenté dans ce tutoriel se nomme Yahoo.Pipes (ce dernier
nécessite un compte gmail, facebook ou une adresse mail yahoo pour se
connecter et stocker vos flux ainsi créer). Cependant, il est à savoir que de
nombreux sites ne présentent pas de compatibilités avec Yahoo.Pipes
pour des raisons de conception du site contenant la source.
7. L’autre intérêt majeur de Yahoo.Pipes est de trier et de manipuler les flux
pour n’en garder que les informations les plus pertinentes.
Pour ces derniers, si une veille de ces sources se révèle indispensable, il
existe deux solutions certes moins élégantes pour la réaliser :
- L’utilisation du widget « Web page » qui va afficher dans un widget la
page Web contenant les informations (les informations ne seront
cependant pas triables).
- L’utilisation du widget « liens » qui va afficher le lien direct vers la page
Web de la source (prend nettement moins de place que le widget de la
page Web).
Une astuce concernant une difficulté récurrente à obtenir un flux RSS avec
Netvibes consiste à ne pas être sur la bonne page Web. En effet,
nombreux sont les sites à ne pas héberger le flux sur leur site. Pour
résoudre ce problème, il faut cliquer sur l’icône symbolisant le flux RSS ou
sur d’autres sites sur « RSS » pour aboutir sur une page Web hébergeant
le flux lui-même. Et là, Netvibes accepte cette URL comme source (il est à
noter que Yahoo.Pipes accepte rarement ce type de source pour les trier).
8. Pyrénées Industries Céramiques – Tutoriaux veille stratégique 2012
II – Tutoriel Yahoo.Pipes
1. INTRODUCTION
Ce logiciel GRATUIT en ligne nécessite un compte facebook, gmail ou une
adresse mail yahoo pour pouvoir stocker vos données créer.
Yahoo.Pipes permet de créer des flux RSS pour permettre de récolter des
informations nécessaires à la veille à partir de sources ne présentant à
l’origine aucun flux de ce type ou explmoitables par Netvibes.
Cependant, il est à préciser qu’il ne s’agit pas d’une solution « miracle »
pour tous les cas, en effet, de nombreuses sources ne sont pas
compatibles faute d’un site compatible avec Yahoo.Pipes.
Le second intérêt de Yahoo.Pipes est sa faculté à trier, traduire, … les flux
ainsi collectés et permettre une amélioration de leur pertinence.
2. PRISE EN MAIN RAPIDE
Ce logiciel est nettement moins ergonomique que Netvibes et sa prise en
mains et plus compliquée. Des termes techniques sont à connaître pour
utiliser un minimum les capacités du logiciel.
8
9. Pyrénées Industries Céramiques – Tutoriaux veille stratégique 2012
a) Générer un flux
La première tâche à effectuer est de vérifier si la source est compatible
avec Yahoo.Pipes. Pour cela, exécutez un glisser/déplacer de la case
« Find First Site Feed ». Deux cases apparaissent alors sur le plan de
travail, une d’entrée, « Find First Site Feed » dans laquelle il faut copier
l’URL de la page Web contenant la source et une de sortie, « Pipe
Output » contenant le flux final créé.
Si aucune erreur n’apparaît dans le Debugger (partie étirable en bas de
l’écran), alors le site est compatible et les titres des informations
apparaissent (cependant certaines sources peuvent être vide (dans ce
cas rien n’apparaît).
Le flux créé en reliant les deux cases peut être sauvegardé dans le
compte Yahoo.Pipes de l’utilisateur. Pour l’intégrer ensuite au logiciel
Netvibes, il suffit de se rendre à la page Web de consultation du flux
créé sur votre compte et de copier l’URL de cette page dans la section
« ajouter un flux » de Netvibes.
9
10. Pyrénées Industries Céramiques – Tutoriaux veille stratégique 2012
b) Format des informations sous Yahoo.Pipes
Il est important de comprendre comment se décompose une
information sur ce logiciel pour pouvoir par la suite effectuer des
opérations de tri ou de traduction.
Chaque information est caractérisée par les parties (terme employé
dans ce tutoriel) suivantes :
- Un titre
- Son lien URL de consultation
- Une description brève (à vérifier avant toute manipulation de cette
dernière, parfois ce sont des fichiers .pdf ou .jpg non traitables).
- Sa date de publication
- Le créateur de l’information (celui qui la postée sur le Web)
- La permanence du lien (important pour les soucis d’archivage
d’information avec Scrapbook), cette permanence est signalée par
« false » ou « true » après le terme «isPermaLink » après avoir déroulé
« guid » dans la liste des informations.
- Les autres informations sont nettement moins pertinentes pour le travail
(heure de publication, …)
10
11. Pyrénées Industries Céramiques – Tutoriaux veille stratégique 2012
c) Manipuler des flux
i- Filtrer les flux
Parfois, si la source traite de domaines trop vastes pour la veille, il
sera nécessaire d’effectuer un tri.
Pour réaliser un tri, il faut insérer une case « Filtrer » entre les cases
d’entrée et de sortie (en faisant les liaisons nécessaires).
Il y a deux types de filtres : celui qui bloque et celui qui autorise. Le
choix est celui de l’utilisateur en fonction des choix suivants.
Une seconde option très importante est le mode de suivi des règles
de filtrage : le filtre s’opère si au moins une des règles établies est
respectée avec « any » ou si elles sont toutes respectées avec
« all ».
Se trouve ensuite les règles à établir (jusqu’à un maximum de 10
par filtres).
Les règles se forment ainsi :
o On commence par choisir la partie de l’information sur laquelle
opérée la règle (titre, description, auteur, …).
o On choisit ensuite la condition à réaliser pour que le filtre s’opère
(contient, ne contient pas, information temporelle et hiérarchique,
…).
o On finit enfin par choisir le mot-clé ou le groupe de mots clés à
associer à cette règle pour terminer la condition de filtrage (il est
à noter qu’il faut se méfier des groupes de mots-clés car il est
possible qu’ils ne soient pas présentés ainsi dans les
informations collectées, il est donc préférable d’éditer une
nouvelle règle pour chaque mot si on en a la possibilité).
Ce mode de tri permet une sélection très pertinente de l’information
pour la veille et se révèle presque obligatoire si on en a la possibilité.
11
12. Pyrénées Industries Céramiques – Tutoriaux veille stratégique 2012
ii- Fusionner des flux
Si plusieurs sources traitent du même sujet et que l’on souhaite visionner
les informations collectés sur ce sujet dans le même Widget (avec
Netvibes), il est nécessaire de fusionner les flux.
Pour cela il faut utiliser l’opérateur « Union » qui permet de fusionner
jusqu’à 5 flux entre eux.
12
13. Pyrénées Industries Céramiques – Tutoriaux veille stratégique 2012
iii- Traduire des flux
Il est courant que des sources pertinentes ne soient pas dans une langue
comprise par l’ensemble des utilisateurs de la veille (comme l’allemand, le
chinois ou encore le japonais).
L’opération de traduction sous Yahoo.Pipes s’impose alors. Cette
opération est nettement plus délicate que les précédentes pour deux
raisons :
- Il faut respecter les étapes de la marche à suivre dans le bon ordre
sinon cela ne marche pas.
- Certaine traduction donne des résultats incompréhensibles si l’on
choisit mal la langue finale.
Etape 1 – Entre les cases d’entrée et de sortie insérer une case de
l’opérateur « loop » et effectuer les liaisons de cases nécessaires.
Etape 2 – Dans la case « loop » insérer une case « Translate » qui se
trouve dans le menu déroulant « String ».
Etape 3 – Choisir alors la partie de l’information à traduire (titre,
description,…) ainsi que la nature de la traduction (langue de départ propre
à la source et langue d’arrivée au choix). Cependant, il est préférable de
traduire les langues comme l’allemand ou le chinois en anglais plutôt qu’en
français sous peine d’obtenir des résultats incompréhensibles (les
informations en anglais peuvent être traduites en anglais).
Pour traduire plusieurs parties de l’information, il faut effectuer l’opération
un série une deuxième fois.
13
14. Pyrénées Industries Céramiques – Tutoriaux veille stratégique 2012
3. LES AUTRES OPERATEURS DE FLUX
De nombreuses autres opérations sur les flux sont réalisables :
- L’opérateur « reverse » permet d’inverser l’ordre de sortie des
informations
- L’opérateur « unique » permet de prendre en compte les informations
possédant les mêmes titre, description ou auteur et de n’en garder
qu’une au final peut être utile en cas de fusion de divers flux.
- L’opérateur « split » permet de dupliquer une source.
- L’opérateur « Truncate » permet de limiter le nombre d’information
obtenue de la source à un nombre arbitrairement choisi.
- L’opérateur « Sort » permet de trier les résultats suivant un ordre
ascendant ou descendant (comprendre alphabétique ou inversement
pour les critères basés sur une chaîne de caractères).
- L’opérateur « Count » permet de connaître le nombre d’informations
collectée sur une source donnée ou un ensemble de source (et plus
généralement du flux sélectionné).
- L’opérateur « Rename » permet de renommer une partie de
l’information (titre, description, date de publication,…) ou encore
d’associer une de ces partie à une autre (en utilisant la fonction « copy
as »).
14
15. Pyrénées Industries Céramiques – Tutoriaux veille stratégique 2012
- L’opérateur « Regex » est très utile dans certain cas. En effet, il permet
de remplacer toutes les occurrences d’un certain mot par un autre dans
une partie choisie de l’information.
- L’opérateur « Tail » permet d’afficher les n dernières informations du
flux sélectionné.
- L’opérateur « Sub-element » permet d’afficher la partie voulue (titre,
description, auteur) de l’ensemble des informations du flux sélectionné.
- L’opérateur « Loop » permet d’effectuer des opérations à répétitions sur
toutes informations du flux (comme la traduction). L’option « emit
results » permet d’afficher directement les résultats et juste ceux-là
(donc une traduction des titres avec cette option ne permettra de n’avoir
en sortie que les titres traduit). Pour avoir les résultats comme ces titres
dans l’ensemble e l’information, il faut cocher « assign results as » et
choisir la partie souhaitée (ici ce serait les titres). Il est à noter que les
résultats avec l’option « emit results » sont afficher en cliquant sur des
chiffres désignant le numéro associé à l’information dans la boucle.
- L’opérateur « Create RSS » est n’est pas le plus simple à prendre en
main. En effet, il permet de modifier le format et le contenu des flux
récoltés à partir d’une source. Cet opérateur se place entre les cases
d’entrée et de sortie.
L’opérateur est composé de trois parties :
Une partie principale dans laquelle on décide ce que l’on
attribue à chacune des partie de l’information (par
exemple le titre n’est pas très explicite dans le sens où il
s’agit de l’auteur de l’article, on peut modifier en lui
attribuant le début de la description de l’article).
Les deux autres parties de l’opérateur sont déroulables.
La partie « media : content » permet de rajouter des
informations concernant la source comme l’URL, l’auteur,
la date de publication,…
La partie « media : thumbnail » permet de rajouter les
mêmes informations mais non visibles.
- L’opérateur « Location Extractor » permet de déterminer
automatiquement les coordonnées (latitude et longitude) des lieux
contenus dans les informations récoltées. Celles-ci apparaissent en tant
que nouvelle partie à la fin de la liste des parties de l’information sous le
nom « y : location ». Attention cet opérateur fonctionne en lisant
l’information, il est possible que si les mots décrivant le lieu ne sont le
15
16. Pyrénées Industries Céramiques – Tutoriaux veille stratégique 2012
bon format, l’opérateur ne fasse rien (les noms en majuscules en sont
un exemple, passer par un opérateur « Regex » peut alors s’imposer).
- L’opérateur « Web Service » sort du cadre de Yahoo. Pipes. En effet,
ce dernier permet de convertir les flux dans un format pour les exporter
vers des agrégateurs externes différents pour permettre aux
développeurs d’avoir une plus grande liberté.
16
17. Pyrénées Industries Céramiques – Tutoriaux veille stratégique 2012
4. GERER ET OPTIMISER L’UTILISATION DES SOURCES
« Find First Site Feed » a déjà été étudié comme moyen le plus simple et
le plus direct de générer des flux RSS d’une page Web. Cependant, il
existe d’autres options pour cela. Il est à noter que toutes les cases
associées à ces moyens de recherche d’informations sont des cases
d’entrée de flux.
- « Fetch Feed » permet de récupérer les informations distribuée par un
flux RSS déjà existant (ne génère pas d’informations). Il est possible
que certains flux RSS ne soit pas compatibles avec ce mode.
- « YQL » permet de personnaliser sa recherche à partir d’une requête
sur URL précise. Ce mode de recherche est difficile à utiliser dans le
sens où les requêtes doivent suivre une syntaxe précise très peu
intuitive.
Il existe cependant un générateur de requêtes concernant quelques
sujet généraux mais modifiables au besoin
(developer.yahoo.com/yql/console/).
Le Debugger intégré à la console permet de déceler les erreurs de
syntaxe. La console permet également de formater la requêter en
langage XML ou JSON (pour les exportations).
- « Flickr » permet de chercher les images depuis la banque d’images
Web Flickr. Cependant, ce mode nécessite une clé API que l’on obtient
en créant un compte Flickr. Le champ « near » correspond à une
localisation (coordonnées GPS), compatible avec l’opérateur « Location
Extractor ».
- « Fetch CSV » est un outil complexe permettant de traiter des sources
où les informations sont séparer par des caractères («, » ou « ; » ou
« | » ou tab ou autre). Ces informations sont alors séparées les unes
des autres pour pouvoir être ensuite traitées indépendamment.
Cependant, cet outil ne permet pas d’extraire les informations mais
juste de préparer un tableau pour pouvoir les traiter par la suite.
- « Feed Auto-Discovery » est un outil pouvant se révéler utile pour
découvrir tous les flux déjà existant à partir d’une source en fournissant
leur URL.
17
18. Pyrénées Industries Céramiques – Tutoriaux veille stratégique 2012
- « Yahoo ! Local » permet de découvrir dans un rayon à définir autour
d’une localisation un lieu ou élément à fournir en mot-clé. La recherche
sur fait avec comme sources les sites officiels de Yahoo ! .
- « Fetch Data »
- « Item Builder »
- « XPath Fetch Page »
18
19. Pyrénées Industries Céramiques – Tutoriaux veille stratégique 2012
5. MODIFIER ET TRAITER L’INFORMATION
Il a déjà été vu comment traduire une information récoltée à partir d’une
source étrangère grâce à l’outil « Translate » figurant dans la liste
« String » de Yahoo.Pipes. Tous les outils du 5 figurent dans cette liste.
- « String Replace » permet de remplacer les occurrences d’une chaîne
de caractères par une autre (la première, la dernière ou toutes).
- « Sub String » permet de récupérer une partie spécifique d’une chaîne
de caractères en précisant le caractère de départ et la longueur de la
chaîne à extraire (sachant que le premier caractère est numéroté 0).
- « Term Extractor » permet de déterminer les termes importants d’une
information automatiquement. Cet outil fonctionne comme
« Translate », il faut placer la case « Term extractor » dans une case
« Loop ». On choisit ensuite quelle partie de l’information analyser et
quelle forme doit prendre le résultat (liste ou un seul élément). Ce
résultat apparaît à la fin de liste des parties concernant l’information en
question.
- « String Regex »
19
20. Pyrénées Industries Céramiques – Tutoriaux veille stratégique 2012
6. LES « BUILDER » D’OBJETS
Dans la multitude de fonctions que propose Yahoo.Pipes se trouve une
catégorie très simple permettant de créer des objets pour automatiser
l’information plus simplement pour la personnaliser de manière optimale. Il
est question des outils :
« String Builder » pour créer une chaîne de caractères
« Date Builder » pour créer une date
« Location Builder » pour créer une localisation
« Private String » pour créer une chaîne caractère visible seulement
par l’utilisateur de Yahoo.Pipes.
« URL Builder » pour insérer si besoin une URL qui n’est pas
utilisée comme source.
7. LES INTERACTIONS AVEC L’UTILISATEUR (USER INPUTS)
Ces options étant incompatibles avec Netvibes, leur description sera
succincte. Yahoo.Pipes peut dans son interface de consultation des flux
personnalisés créés interagir avec l’utilisateur en lui demandant de rentrer
des inputs.
Plusieurs types sont possible et cela entre en compte dans l’algorithme de
filtrage des informations, ce sont des données d’entrée.
L’utilisateur peut entrer :
Un texte privé
Une date
Un nombre
Une URL
Un texte non privé
Une localisation
20
21. Pyrénées Industries Céramiques – Tutoriaux veille stratégique 2012
8. PROBLEMES DE LIAISONS ENTRE OBJETS
Il arrive souvent que certains liens entre objets ne soient pas possibles. En
effet, les objets (ou cases) ont des types (text, URL, date, number, string,
…). Pour savoir ce qui convient pour réaliser les bonnes liaisons, placer le
curseur de la souris sur le rond de liaison d’entrée (s’il y en a un).
Apparaissent alors les types d’objets dont la liaison est possible. Pour
savoir quel type d’objet fourni une case, placer votre curseur sur le rond de
sortie.
21