SlideShare uma empresa Scribd logo
1 de 145
Baixar para ler offline
Vandy BERTEN 
Section Recherche 
Social Media & eGovernment 
flickr.com/infocux
Table des matières 
Introduction 
Use case 1 : Recherche par mots-clés 
Use case 2 : Page Facebook 
Use case 3 : Network Analytics 
Conclusions 
Vandy Berten
www.socialmediasmarketing.com 
Introduction
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 4/145 
Introduction Contexte 
eGov belge 
À l’étranger 
Réseaux sociaux 
Uses cases 
Mots-clés 
Page Facebook 
Network Analytics 
Conclusions 
Table des matières 
Vandy Berten
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 5/145 
• Réseaux/médias sociaux : au centre de la 
communication de la grande majorité des 
« communicants » (marques, entreprises, 
personnalités, presse …) 
• Diffusion de publicités, campagnes… 
• Networking, création « d’ambassadeurs » 
• Feedback des clients/utilisateurs/fans… (direct ou 
indirect, volontaire ou non) 
• Support clients (en partie par les clients) 
Contexte 
Focus de l’exposé : médias 
sociaux en tant que source 
d’information
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 6/145 
• Expression d’avis, de sentiment, de protestation, 
de mécontentement… 
• Amplification de messages (presse, « amis », 
personnalité…) 
• Rumeurs, hoax, dénigrement, désinformation… 
Canal idéal, rapide et (quasi) incontrôlable ! 
• Évènement plus vite sur les réseaux sociaux que 
sur les « médias traditionnels » 
Informations ?
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 7/145 
« Dérapage » faciles, sans contrôle
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 8/145 
Médias sociaux et actualité 
Émeutes de Londres, 2011 
Rôle majeur de Twitter dans la propagation 
de rumeurPs,u lke kdeélpplaocpe,m 2e0n1t 1d es foules 
Réseau téléphonique saturé, mais pas Twitter. 
Message pour les proches, hébergement, … 
Daesh (IS), 2014 
Outil principal de propagande
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 9/145 
• Services actifs : Intégration sociale, ONP, ONSS 
(+student@work), Fedasil, AFSCA, Finances, 
armée… 
• Services présents, mais inactifs : ONEM 
• Présence partielle : CPAS Forest 
• Police : grande « fragmentation » 
– @PolFed_presse, @police_temoin, @Polsupport_F, 
@HELI_FEDPOLFED, @polinfo_fr, @Jobpol_F (+NL) 
– @PolitieLeuven, @Politie_Halle, @PZSintNiklaas, 
@Politie5418, @ZPNamur, @polzonepuy, @PZWLW 
• Qui fait réellement du monitoring/webcare ? 
Difficile à savoir… 
Situation actuelle eGov Belge
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 10/145 
• Dans presque tous les pays, des institutions sont 
présentes 
• Quelques pays ont une vraie politique « médias 
sociaux » 
• Nouvelle-Zélande (référence pour Gartner) : 
lignes de conduites (générales, en cas de 
problème, …), toolbox… 
• Canada : beaucoup d’organismes présents 
• … 
À l’étranger
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 11/145 
• Cette présentation n’est pas : 
– Une intro à « comment démarrer sur les médias 
sociaux » 
• → SPF « Personnel & Organisation » 
• Littérature abondante 
– Comment écrire un tweet percutant, réussir une 
campagne… 
– Un catalogue d’outils de monitoring 
– Un tutorial des API 
• Focus : 
– Identification de problèmes, plus que mesure de 
performance d’une campagne/d’une marque 
– Présentation de techniques, plus que des outils 
Cette présentation est/n’est pas …
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 12/145 
Réseaux sociaux
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 13/145 
Réseaux sociaux 
Facebook 
• 1,3 milliards d’utilisateurs actifs 
• 1 Belge sur 2 (5.6 millions) ! 
• Présence massive du politique, des 
entreprises, des people… 
• Beaucoup d’expression d’opinion 
• Une API permettant de récolter 
beaucoup de données, mais uniquement 
pour ce qui est « public » (pages + 
utilisateurs d’application) 
• Énormément d’informations personnelles
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 14/145 
Réseaux sociaux 
LinkedIn 
• 300 millions d’utilisateurs actifs 
• 2.2 millions de Belges 
• Plus un espace de networking que 
d’expression 
• API disponible
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 15/145 
Réseaux sociaux 
Twitter 
• 200 millions d’utilisateurs 
• 1 million en Belgique (?) 
• Beaucoup d’opinion exprimée 
• Relations plus basées sur l’intérêt que 
l’amitié 
• Tout est public ! (sauf direct messages) 
• API complète, mais limitations 
temporelles (requête/minutes et passé 
restreint)
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 16/145 
Réseaux sociaux 
WhatsApp 
• Outil de communication, similaire au SMS 
• Uniquement des messages privés, rien 
n’est public 
• Pas d’API
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 17/145 
Réseaux sociaux 
Google+ 
• 1 millions de Belges, mais peu actifs 
• Vient avec un compte Gmail 
• API disponible 
• Public très « branché » [opinion !]
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 18/145 
Réseaux sociaux 
Snapchat 
• Similaire à WhatsApp 
• Outil de communication 
• Uniquement des messages privés, rien 
n’est public 
• Tout s’efface en quelques secondes … pas 
d’API par définition !
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 19/145 
Réseaux sociaux 
Netlog 
• Similaire à Facebook 
• Principalement pour les 
adolescents 
• Réseau belge, a été 
populaire en Belgique, 
surtout en Flandre, 
• Est « en voie 
d’extinction » ! 
• API disponible, mais très 
mal documentée
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 20/145 
Réseaux sociaux 
Pinterest 
• Plateforme de partage 
de photos 
• Pas beaucoup d’opinion 
exprimée 
• API disponible
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 21/145 
Réseaux sociaux 
Instagram 
• Plateforme de partage 
de photos 
• Idem que Pinterest, pas 
beaucoup d’opinion 
exprimée (en 
Belgique ?) 
• API disponible
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 22/145 
• Use case 1 – Twitter : recherche par mots-clé ; 
Comment identifier les « hot topics » ? Sur un 
sujet particulier ? Comment collecter 
l’information et la traiter ? Comment identifier 
des pics de discussion ? De quoi parle-t-on ? 
• Use case 2 – Page Facebook : Quels sont les 
sujets de discussion ? Peut-on identifier des 
moments de tension ? Les citoyens sont-ils 
critiques ? Qui sont les citoyens qui s’expriment ? 
• Use case 3 – Network analytics : À partir d’un 
ensemble d’informations publiques, que peut-on 
reconstruire ? 
Uses cases
mysmn.com 
Use case 1 : Mots-clés
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 24/145 
Table des matières 
Introduction 
Use case 1: 
Mots-clé 
Introduction 
Hot topics 
Recherche ciblée 
Détection d’évènement 
Page Facebook 
Network Analytics 
Conclusions 
Vandy Berten
INTRODUCTION 
Mots-clés
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 26/145 
Contexte 
• Twitter : tous les tweets publics ! (FB : pages 
publiques) 
• Limite des 140 caractères : on va à l’essentiel 
• Très utilisé pour identifier les sujets populaires 
• Contraintes API Twitter : 
– Temporelle : # requêtes/minutes limité 
– Contenu : accès (borné à 1%) au 7 derniers jours 
• Certains outils ont un accès complet (Firehose)
HOT TOPICS 
Mots-clés
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 28/145 
« Hot topics » 
• Identification de sujets « chauds » sans savoir ce 
qu’on cherche 
• À faire en parallèle à des recherches plus ciblées, 
pour identifier les nouveaux sujets 
• Se base sur les mots qui reviennent le plus 
souvent dans une zone géographique précise
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 29/145 
Twitter.com 
• Sur la page d’accueil 
• https://twitter.com/i/discover
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 30/145 
Trendsmap.com 
www.trendsmap.com
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 31/145 
Trendsmap.com 
www.trendsmap.com
RECHERCHE CIBLÉE 
Mots-clés
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 33/145 
Recherche ciblée 
• Si on connait les « mots-clés » à examiner, il 
existe de nombreux outils 
• Certains se basent sur le passé, d’autres 
nécessitent la mise en place d’une « écoute » 
• Un certain nombre de moteurs de recherche 
permettent juste de lister les tweets répondant à 
une requête → limite l’intérêt 
• Pour la suite, on s’intéresse surtout à Twitter
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 34/145 
Difficultés 
ONSS 
Jvai traversé le mur du onss! 
C du bon onss 
kom met onss 
Onss fait un bouffe? 
Dimona 
Capac 
DMFA 
Dimethylformamide 
Direct Marketing 
Fundraisers Association 
Društvo matematikov, 
fizikov in astronomov 
RSZ 
http://instagram.com/p/s-RSz-TDFd/
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 35/145 
Contourner les difficultés 
• Critère linguistique : « dimona lang:fr » 
→ langue du profil, pas du message 
• Rajouter des mots-clés : « déclaration dimona » 
→ limite Israël, mais trop restrictif (6 tweets !) 
• Exclure des mots : « dimona -israel -israélien 
-palestinien -palestine -nucléaire -gaza -missile » 
→ Pas encore suffisant ! 
• Critère géographique : « dimona near:brussels 
within:150km » 
→ Doit être renseigné (profil ou tweet)
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 36/145 
Méthodes d’extraction 
Plusieurs méthodes d’extraction de tweets : 
• Configurer un outil (Engagor, Mention.com…) 
avec une recherche programmée (passé souvent 
limité) 
• Utiliser l’API : 
– « search » : tweets jusqu’à une semaine en arrière 
– « stream » : « réveillé » dès qu’un nouveau tweet arrive 
• Web crawler : version « Web » de Twitter donne 
plus de résultats que l’API (plus anciens) → 
possibilité d’extraction, mais laborieux
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 37/145 
« Tax-on-web » : Google trends
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 38/145 
« Tax-on-web » : Topsy.com
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 39/145 
« Tax-on-web » : Mention.com
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 40/145 
« Tax-on-web » : API + tableur (/jour)
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 41/145 
« Tax-on-web » : API + tableur (/heure) 
• @FOD_Finance : 
• « Al meer dan 2.000.000 aangiftes 
binnen via #taxonweb. (…) » (5RT) 
• « Laatste rechte lijn (…) 
#taxonweb. (…) » (5RT) 
• @SPF_Finance : 
• « Déjà 2.000.000 de déclarations 
via #taxonweb. (…) ? » (2RT) 
• « Dernière ligne droite (…) 
#taxonweb. (…) » (3RT) 
• → 19 tweets en quelques minutes 
« Tax-on-web down... » ; « Lap: 
#taxonweb is down. » ; « Bijna zo 
down als de mensen die er gebruik van 
wilden maken. » ; « Typisch : […] aan 
zijn #taxonweb dan ligt het systeem 
weer plat. #fb » ; « Heeft iedereen […] 
#crash #serverdown » ; « Een "groene" 
dag op #taxonweb , maar helaas: site 
niet beschikbaar :-( . Elk jaar een 
probleem ... volgend jaar dan maar 
terug op papier? » ; « Lap #taxonweb 
#down. Even geduld dus » ; « pfff 
#taxonweb est down, juste quand 
Jour j'allais m'y mettre ! » 
Heure
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 42/145 
Forem (web crawling) 
0 
50 
100 
150 
200 
250 
300 
350 
400 
2007/06 
2008/01 
2008/04 
2008/09 
2008/12 
2009/03 
2009/06 
2009/09 
2009/12 
2010/03 
2010/06 
2010/09 
2010/12 
2011/03 
2011/06 
2011/09 
2011/12 
2012/03 
2012/06 
2012/09 
2012/12 
2013/03 
2013/06 
2013/09 
2013/12 
2014/03 
2014/06 
Forem (fr) 
#Tweets
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 43/145 
Forem (Twitter) : topic extraction 
0 
10 
20 
30 
40 
50 
60 
70 
80 
90 
2007/06 
2009/05 
2010/08 
2011/03 
2011/06 
2011/09 
2011/10 
2011/12 
2012/01 
2012/02 
2012/03 
2012/05 
2012/06 
2012/07 
2012/09 
2012/10 
2012/12 
2013/01 
2013/01 
2013/01 
2013/01 
2013/01 
2013/02 
2013/02 
2013/04 
2013/05 
2013/05 
2013/06 
2013/08 
2013/09 
2013/09 
2013/10 
2013/11 
2014/01 
2014/01 
2014/02 
2014/03 
2014/05 
0 
10 
20 
30 
40 
50 
60 
70 
80 
90 
2007/06 
2009/05 
2010/08 
2011/03 
2011/06 
2011/09 
2011/10 
2011/12 
2012/01 
2012/02 
2012/03 
2012/05 
2012/06 
2012/07 
2012/09 
2012/10 
2012/12 
2013/01 
2013/01 
2013/01 
2013/01 
2013/01 
2013/02 
2013/02 
2013/04 
2013/05 
2013/05 
2013/06 
2013/08 
2013/09 
2013/09 
2013/10 
2013/11 
2014/01 
2014/01 
2014/02 
2014/03 
2014/05 
emploi 
formation 
wallon 
maroc 
charleroi 
Belgique 
chômeur 
helpdesk 
délocalisation 
actiris 
Janv. 2013
DÉTECTION D’ÉVÈNEMENTS 
Mots-clés
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 45/145 
Détection d’évènement 
• De plus en plus, les témoins d’un incident le 
tweet directement 
• Un évènement majeur (attentat, catastrophe, …) 
génère un grand nombre de tweets localisés, 
avec des mots en commun 
• Certains outils (Dataminr, Twitcident) s’en servent 
pour automatiquement détecter un évènement 
sur base de critères 
• Pas encore d’outil gratuit ?
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 46/145 
Mots-clés: l’essentiel 
Basé sur des 
noms de projet, 
d’organisme, de 
personne 
Identification + 
compréhension des 
pics de tension 
Difficile sur des 
acronymes courts, peu 
uniques 
Y réfléchir quand on crée 
un projet ? Créer des 
comptes ou hashtags ? 
Support « non 
structuré » (≠ page FB) 
bruit à filtrer
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 47/145 
Mots-clés: les outils 
Rech erche ciblée (listing): 
- Twitter.com 
- Tweetdeck 
- Topsy 
- Socialmention 
Recherche ciblée (listing 
+stats) : 
- Engagor (15j+€) 
- Hootsuite (subset+€) 
- Simplymeasured (15j+€) 
- Topsy (€) 
- … 
- Détection évènement 
- Dataminr (€) 
- Twitcident (€) 
- Google Trends 
Pour les plus branchés : 
- API search & stream 
- Selenium (Web crawling) 
Hot topics : 
- Trendsmap (subset+€) 
- Geofeedia (€) 
- Trends topics (Twitter)
facebook.com 
Use case 2 : Page Facebook
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 49/145 
Table des matières 
Introduction 
Mots-clé 
Use case 2 : 
Page Facebook 
Introduction 
Analyse de fréquence 
Topic extraction 
Sentiment Analysis 
Network Analytics 
Network Analytics 
Conclusions 
Vandy Berten
INTRODUCTION 
Page Facebook
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 51/145 
Contexte 
• Page Facebook : Vitrine d’une société, d’un 
organisme, d’un projet (≠ profil) 
• Tout est public, connexion pas nécessaire 
(→ indexé par Google) 
• Contenu accessible via API 
• Partie centrale : Timeline (Journal), composée de 
posts et de commentaires 
• 3 niveaux d’interaction : 
– Posts par le gestionnaire, commentaires bloqués 
– Posts par le gestionnaire, commentaires acceptés 
– Posts par tout le monde, commentaires acceptés
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 52/145 
Contexte 
• AFSCA : Agence Fédérale pour la Sécurité de la 
Chaîne Alimentaire (= FAVV) 
• Compétente pour l’alimentation (magasin, 
restaurants, usines, fêtes…) mais également pour les 
animaux (vaccins, commerce…) domestiques et 
d’élevage 
• Page Facebook : annonce de contrôle, rappels de 
produits, annonces diverses 
• Comme toute agence de contrôle : pas que des 
amis ! 
• Mais enjeux et responsabilités considérables !
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 53/145 
Contexte : exemple d’annonce
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 54/145 
Commentaires 
• 209 posts 
• 590 commentaires 
• 335 commentateurs 
• 302 post likes 
• 974 comment likes
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 55/145 
Questions 
• Peut-on « mesurer » cette situation ? 
• À quel point est-elle problématique ? 
• Est-ce un phénomène passager ? 
• Les « contestataires » forment-ils une 
« communautés » 
• Sont-ils représentatifs de la société en général ?
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 56/145 
Outils disponibles 
• Pour sa propre page Facebook : nombreux outils 
(gratuits ou non) disponibles 
• Pour une page quelconque : quelques outils… 
pourtant le contenu d’une page est public ! 
– Engagor 
– Quintly 
– SimplyMeasured 
– Aucun gratuit ? 
• Une autorité peut avoir besoin de monitorer les 
pages de ses différentes entités… 
• … ou de suivre des pages liées à « l’opposition »
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 57/145 
Engagor 
Page AFSCA, posts (rouge) et commentaires (bleu) par jour
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 58/145 
Engagor
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 59/145 
À quoi a-t-on affaire ? 
• Une communauté régulière et active avec un pic 
d’activité ? 
• 2-3 personnes qui se sont lancées dans un débat 
sans fin ? 
• Des visiteurs uniques soudainement intéressés 
par un post ? 
• Des gens qui se connaissent mutuellement ? Non 
liés entre eux ? 
• Quel est le sujet du débat ?
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 60/145 
Facebook API 
• Facebook permet d’extraire de l’information au 
travers d’API (Application Programming Interface) dans 
différents langages (principalement PHP et javascript) 
• Authentification et délégation : oAuth 
• Très peu d’accès aux profils perso, mais accès 
complet aux pages 
• Certaines « application Facebook » (p.ex. Netvizz) 
permettent une extraction « toute faite »
ANALYSE DES FRÉQUENCES 
Page Facebook
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 62/145 
Facebook API + Google charts 
Post du 12/1: « La 
rage est une maladie 
endémique en 
Espagne […] » 
Post du 29/1 : « Vous 
pouvez laisser des 
commentaires […] mais 
il y a quelques règles à 
respecter ! […] » 
9/1, DH.be: « Basile 
le podenco a été 
exécuté par l’Afsca » 3 mars 
17-18 février 
Janvier 
? 
15/2, DH.be: « Ces 
34 chiots "sont en train 
de mourir de faim " »
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 63/145 
Facebook API + Google charts
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 64/145 
Facebook API + Google charts 
29 janvier
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 65/145 
Fréquence : lessons learned 
• Deux pics de commentaires, liés à deux 
évènements identifiés (Basile, quarantaine) 
• Première phase : beaucoup de commentaires, 
peu de commentateurs 
• Seconde phase : beaucoup de commentateurs 
• Critiques peu liées au post commenté
TOPIC EXTRACTION 
Page Facebook
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 67/145 
Topic extraction 
• Objectif : connaitre le sujet d’une conversation 
• Basé sur la fréquence d’apparition, présence dans 
des dictionnaires thématique, classifications 
• Tag cloud : 
Wordle.net
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 68/145 
0 
5 
10 
15 
20 
25 
30 
35 
40 
45 
50 
animal 
chien/chiot 
honte 
rage 
vaccin 
quarantaine 
AFSCA (Facebook) : API + Excel 
Janvier 2014 17-18 février 3 mars
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 69/145 
AFSCA (Twitter) : Crawler + Excel 
0 
5 
10 
15 
20 
25 
30 
35 
40 
45 
2007/8 
2010/8 
2011/3 
2011/6 
2011/7 
2012/3 
2012/5 
2012/7 
2012/8 
2012/10 
2012/12 
2013/2 
2013/2 
2013/3 
2013/5 
2013/7 
2013/7 
2013/8 
2013/10 
2013/11 
2013/11 
2013/11 
2013/12 
2013/12 
2014/1 
2014/2 
2014/3 
2014/4 
2014/5 
2014/6 
contrôle 
résultat 
cheval 
viande 
tonne 
rappel 
contamination 
tarte 
inspection
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 70/145 
AFSCA (Twitter) : Crawler + Excel 
0 
5 
10 
15 
20 
25 
30 
35 
40 
45 
2007/8 
2010/8 
2011/3 
2011/6 
2011/7 
2012/3 
2012/5 
2012/7 
2012/8 
2012/10 
2012/12 
2013/2 
2013/2 
2013/3 
2013/5 
2013/7 
2013/7 
2013/8 
2013/10 
2013/11 
2013/11 
2013/11 
2013/12 
2013/12 
2014/1 
2014/2 
2014/3 
2014/4 
2014/5 
2014/6 
contrôle 
résultat 
cheval 
viande 
tonne 
rappel 
contamination 
tarte 
inspection 
Sur la page Facebook : 10 
mentions de « cheval »
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 71/145 
AFSCA (Twitter) : Crawler + Excel 
0 
5 
10 
15 
20 
25 
30 
35 
40 
45 
2007/8 
2010/8 
2011/3 
2011/6 
2011/7 
2012/3 
2012/5 
2012/7 
2012/8 
2012/10 
2012/12 
2013/2 
2013/2 
2013/3 
2013/5 
2013/7 
2013/7 
2013/8 
2013/10 
2013/11 
2013/11 
2013/11 
2013/12 
2013/12 
2014/1 
2014/2 
2014/3 
2014/4 
2014/5 
2014/6 
contrôle 
résultat 
cheval 
viande 
tonne 
rappel 
contamination 
tarte 
inspection 
Sur la page Facebook : 5 
mentions de « tarte »
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 72/145 
AFSCA (Twitter) : Crawler + Excel 
0 
5 
10 
15 
20 
25 
30 
35 
40 
45 
2007/8 
2010/8 
2011/3 
2011/6 
2011/7 
2012/3 
2012/5 
2012/7 
2012/8 
2012/10 
2012/12 
2013/2 
2013/2 
2013/3 
2013/5 
2013/7 
2013/7 
2013/8 
2013/10 
2013/11 
2013/11 
2013/11 
2013/12 
2013/12 
2014/1 
2014/2 
2014/3 
2014/4 
2014/5 
2014/6 
contrôle 
résultat 
cheval 
viande 
tonne 
rappel 
contamination 
tarte 
inspection
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 73/145 
Topic extraction: lessons learned 
• Facebook : sujet = animaux 
– Première phase (Janvier) : rage (vaccin, quarantaine) 
– Seconde phase (Février) : animaux, honte 
• Twitter : sujet = alimentation 
– Viande de cheval 
– Tarte 
– Publication des contrôles 
• Permet d’orienter une campagne d’information 
vers le bon public cible
SENTIMENT ANALYSIS 
Page Facebook
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 75/145 
Sentiment analysis 
• Idée : déterminer si un texte est positif, négatif 
ou neutre 
• Domaine de recherche issu de la linguistique 
computationelle, surtout développé en anglais. 
Quelques outils en français, peu en néerlandais 
• Gère mal les fautes d’orthographe, « langage 
sms », l’ironie 
• Pas utile à l’échelle d’un message, mais pour des 
tendances plus larges, des comparaisons 
• Remarque : on s’exprime plus pour râler que 
pour complimenter !
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 76/145 
Forem Lynda Lemay AFSCA 
Sentiment analysis
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 77/145 
Sentiment analysis 
• Évolution ? 
3 mars 
17-18 février 
Janvier
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 78/145 
Sentiment analysis: lessons learned 
• Donne une information générale, mais technique 
pas encore très mature en français 
• Pas utilisable plus « localement »
NETWORK ANALYTICS 
Page Facebook
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 80/145 
Network analytics : acteurs 
12 janvier 
Aucune réaction 
29 janvier 
Beaucoup de visites uniques 
Posts 
Users 
Comment, like
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 81/145 
Networks analytics : commentaires 
80% users : 1 commentaire 
95,5% : ≤ 5 commentaires 
Posts 
Users 
Comment
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 82/145 
Network analytics : Smals (acteurs) 
Posts 
Users 
Comment, like
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 83/145 
Network analytics 
• On pourrait aller plus loin, avec ce qui est 
accessible sur la version Web mais pas avec l’API 
• On ne pourra trouver qu’une partie de 
l’information 
• Exemple : Relations d’amitié entre les « acteurs » 
ou les « likers » de la page
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 84/145 
Network analytics : liens d’amitié 
Approximation 
(25% connex. 
manquantes) 
Liste privée 
Liste publique 
Amitié
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 85/145 
Network analytics : liens d’amitié 
Approximation
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 86/145 
Autre exemple : Student@Work 
• Student@Work : application de l’ONSS pour les 
étudiants jobistes 
• Page Facebook sur laquelle tout le monde peut 
créer un post 
• Sert à la fois d’outil de communication et de 
« service desk » pour les problèmes techniques
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 87/145 
Student@Work : toutes les interactions 
Posts sans réponse 
Student@Work 
Posts populaires 
créés par S@W 
(visiteurs de 
passage) 
Posts 
Users 
Comment, like
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 88/145 
Student@Work : sans S@W 
Posts 
Utilisateurs 
La plupart des interactions : 
un user (qui ne revient pas) 
avec un post
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 89/145 
Student@Work : posts et commentaires 
Uniquement création et 
commentaires (pas likes) 
Les grappes : composées 
essentiellement de likes
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 90/145 
Network analytics: lessons learned 
• La grande majorité des commentaires viennent 
de gens de passage… 
• … et est condensée sur un seul post 
• Partie non négligeable des utilisateurs très 
sensible à la cause animale → pas représentatif 
de la population en général
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 91/145 
Page Facebook : l’essentiel 
Analyse de fréquence : 
identification des pics 
de réaction et des 
évènements liés 
Sentiment analysis : 
polarité du message. 
OK pour analyse 
macro uniquement 
Topic extraction : 
De quoi parle-t-on 
+ évolution 
Network analytics : 
qui réagit, à quoi
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 92/145 
Page Facebook : les outils 
Pour les gestionnaires de page : 
- Facebook 
- Hootsuite (subset+€) 
Pour analyser d’autres pages : 
- Engagor (15j+€) 
- SimplyMeasured (15j+€) 
- Quintly (15j+€) 
Pour les plus 
branchés : API 
Outils classiques : 
orientés 
« performances », 
plus qu’analyse de 
problèmes
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 93/145 
Questions ?
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 94/145 
Pause !
www.socialseomanagement.com 
Use case 3 : Network Analytics
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 96/145 
Table des matières 
Introduction 
Page Facebook 
Mots-clé 
Use case 3 : 
Network 
Analytics 
Introduction 
Structure 
Centralité 
Inférence 
Reconstruction 
Évolution 
Conclusions 
Vandy Berten
INTRODUCTION 
Network Analytics
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 98/145 
Contexte 
• Les médias sociaux (Facebook en particulier) 
regorgent d’informations sur leurs utilisateurs : 
– Des informations qu’ils fournissent eux-mêmes 
– Des informations fournies par leurs « amis » 
– Des informations « implicites » (induites ou structurelles) 
• On ne peut pas totalement contrôler cette 
information : 
– Parce qu’elle est divulguée par d’autres 
– Parce qu’elle est implicite, et qu’on peut la reconstruire à 
partir d’autres éléments 
– Parce qu’on en est en général pas conscient
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 99/145 
Intérêt 
• Conscientiser sur l’information personnelle disponible 
• Informations très précieuses pour le hacking par 
« social engineering », l’usurpation d’identité 
• Mieux connaitre sa communauté (Facebook, Twitter…) 
• Améliorer la lutte contre la fraude et la criminalité 
Avec certaines techniques, il est facile de 
« dépasser les limites » (P/R vie privée ou EULA 
Facebook)… à utiliser avec précaution ! 
Nous utiliserons des informations publiques, 
sans aucune technique de hacking ou phishing
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 100/145 
Médias sociaux et délits 
• Les médias sociaux de plus en plus souvent 
utilisés dans des enquêtes (policière, fiscales…) 
• Rarement un preuve, aide à orienter une enquête 
• Techniques similaires basées sur les réseaux (liens 
entre entreprises, clients…) déjà utilisées (Fisc, ONSS) 
• Exemples : 
– Vol de billet à la Banque de France (sept 2014) : 
publication de photo de vacances, nouvelle cuisine… 
– De nombreux délinquants publient eux-mêmes les 
photos de leur méfaits 
• Facebook ne fournit pas toujours des données à 
la justice (Belgique : +/- 30% de refus) ! 
https://govtrequests.facebook.com/
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 101/145 
Médias sociaux et fraude 
• Hypothèse : si on identifie quelques 
fraudeurs/suspects dans un groupe « fortement 
connecté », s’intéresse à l’ensemble du groupe 
• Parmi une population de fraudeurs, identifier les 
plus influents, les leaders, les « connecteurs » 
• Recherche d’un « chemin » entre deux personnes 
(ami, ami d’ami…) 
• Recherche des liens d’amitié entre un groupe de 
personnes 
– Identifiés hors Facebook 
– Membre d’un groupe, fan d’une page
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 102/145 
Fil rouge 
• Pour la suite, on se place dans la peau d’un 
« attaquant » visant la « cible » vandy.berten : 
– N’a jamais publié de photo (hormis le profil), ne s’y est 
jamais taggué (mais l’a été par d’autres) 
– A « sécurisé » son compte de façon à cacher ses photos, 
son mur, sa liste d’amis aux « inconnus » 
– N’a rien mis de visible sur son profil (parcours scolaire…) 
• On va reconstituer : 
– Ses groupes d’amis 
– Ses amis proches, sa famille 
– Son parcours scolaire, (une partie de) ses loisirs 
• À partir d’un compte « bidon », sans aucun ami
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 103/145 
Préambule : « Graph Search » 
• « Graph Search » : (nouvel) outil de Facebook 
permettant de faire des recherches (version US) 
• Par exemple : 
– « Photos of XXX » 
– « Photos commented on by XXX » 
– « XXX's friends who work at Smals » 
– « People tagged in XXX's photos » 
– « XXX’s events », « Events that were attended by XXX » 
– « People who like Hitler Adolph and work at Smals » 
• Trouve des informations déjà accessibles, mais 
noyées dans la masse jusqu’ici
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 104/145
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 105/145 
Liste d’amis : très instructif 
• Liste d’amis : ressource très précieuse 
• Permet d’identifier les groupes sociaux : famille, 
travail, étude, loisir… 
• Permet identifier les liens « forts », ainsi que 
l’influence/la popularité (notion de centralité) 
• Même masquée, la liste d’amis peut être 
reconstruite en grande partie 
• On peut étudier les « structures » autour d’une 
personne, d’une page ou d’un groupe
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 106/145 
Réseau personnel 
• Réseau de niveau 
1.5 : la « cible », 
ses amis et les 
connexions entre 
eux 
• Pas les amis de amis 
(non-mutuels) 
• Facebook : relation 
symétrique (≠ Twitter) 
• Via API : 
uniquement son 
propre réseau
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 107/145 
Réseau personnel 
Suite : 
• Structure 
• Centralité 
• Inférence 
• Reconstruction 
• Évolution
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 108/145 
Outils 
• On va se servir de l’outil « Gephi » de 
manipulation/visualisation de graphes 
• 1er étape : importation d’un compte personnel via 
l’API (ou une application comme « Netvizz ») 
• Une partie de la suite se base sur un « crawling » 
de la version Web
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 109/145 
Gephi
STRUCTURE 
Network Analytics
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 111/145 
Structures de communauté 
Communauté « connexe » Agglomérat de petits groupes 
Communauté peu « connexe »
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 112/145 
Structures de communauté 
• À partir d’un graphe, on peut identifier des 
« partitions » (ou communauté, ou cluster) : sous-ensemble 
particulièrement connecté 
• Correspond en général à des « groupes sociaux » 
dans la réalité : famille, amis des études, d’un 
loisir, … 
• Pour comprendre à quoi correspondent ces 
groupes, il faudra faire de l’inférence
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 113/145 
Partitions
CENTRALITÉ 
Network Analytics
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 115/145 
Mesure de centralité 
• Différentes façons de mesurer l’importance, la 
popularité, l’influence, la centralité… d’un acteur 
(personne, page, post, tweet…) 
• Une personne peut être importante « dans le 
monde », mais pas dans un groupe social 
particulier… et vice-versa 
• Permet aussi d’identifier les « connecteurs » 
entre plusieurs groupes sociaux
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 116/145 
Mesure de centralité 
Degree 
centrality : 
#voisins, 
globalement 
(#likes, friends, 
followers…) 
ou localement 
(#mutual 
friends) 
Betweenness 
centrality : 
importance en 
tant 
qu’intermédiaire 
(# de shortest 
path passant par 
le noeud) 
Closeness 
centrality : 
Inverse de la 
distance 
moyenne à tous 
les autres noeuds 
Eigenvector 
centrality : 
PageRank de 
Google 
http://en.wikipedia.org/wiki/Centrality
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 117/145 
Mesure de centralité
INFÉRENCE 
Network Analytics
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 119/145 
Inférence 
• Idée : repérer au sein d’une « partition » des 
informations (publiques) similaires pour 
caractériser la partition 
• Puisque la « cible » fait partie de toutes ses 
partitions, elle possède (probablement) la même 
caractéristique 
• Exemple : 
– 2% des « amis » travaillent (« publiquement ») chez 
« Smals » → pas significatif 
– Partition « P » : 40 % travaillent chez « Smals » (info 
cachée chez les autres), les autres : 0-1% 
– Partition « P » : probablement les collègues de 
« Smals » … comme la cible ! (passé ou présent) 
• Nécessite des techniques 
avancées, hors API, pas 
accessibles en quelques clics ! 
• On sort du cadre des EULA de 
Facebook !
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 120/145 
Inférence (About / Work & Education) 
• Section « About / Work & Education »: 
publique dans +/- 40% 
• Pas accessible via l’API, mais sur la version web
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 121/145 
Inférence (About / Work & Education) 
Saint-Dominique ULB 
Taille 
partition 
% 
publique 
Total 562 38% 
Partition 1 142 53% 
Partition 2 83 46% 
Partition 3 42 50% 
Partition 4 95 37% 
53% 25% 
4% 3% 
0% 57% 
8% 5% 
12% 12%
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 122/145 
Inférence (Groupes) 
• Idem pour les groupes : appartenance à un 
groupe (non secret) toujours publique 
• Graph search : « Vandy Berten’s groups » 
• Exemple : présence de « Croix-Rouge », « CRB » 
ou « CR » dans les noms de groupe : 
– En général : 13% 
– 3 partitions avec 28%, 35% et 50% 
– Toutes les autres : 0-1% 
• Alternative possible : se baser sur les « likes »
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 123/145 
Inférence (Famille) 
• En regardant les noms de famille, on peut parfois 
identifier le réseau « familial » 
• En général, peu de personnes ont le même nom 
de famille dans un groupe social … sauf s’il s’agit 
d’une famille ! 
• Si le top 3 des noms de famille d’un groupe 
comprend une proportion élevée, c’est sans 
doute le groupe familial
RECONSTRUCTION 
Network Analytics
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 125/145 
Reconstruction 
• On pense parfois pouvoir contrôler ce qui se 
trouve à son propos sur Facebook 
• Problème : pas de contrôle sur les autres 
• Liste d’amis : deux méthodes pour reconstruire 
une « liste cachée » 
– Créer un profil « bidon », inviter la cible, puis regarder 
« People You May Know » (PYMK) 
– Grâce aux « mutuals friends »
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 126/145
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 127/145 
Reconstruction 
• Sur la version Web, on voit plus de choses 
qu’avec l’API 
• Cas « simple » : liste d’amis visible 
• Sinon : on apparait dans la liste d’amis de ses 
(certains de ses) amis ! 
• Dans quelques conditions, on peut obtenir les 
« mutual friends » de deux profils 
• En partant de quelques amis connus, on peut 
reconstituer une grande partie du réseau d’un 
compte, en quelques minutes, sans en être ami
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 128/145
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 129/145 
Reconstruction 
• Liste d’amis de « T » privée 
• Liste d’amis de « A » publique 
• La liste d’amis de « T » est vide, mais 
sur la liste de « A », on voit « T » 
T 
A
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 130/145
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 131/145 
Reconstruction 
• On soupçonne B d’être proche de T 
(ami direct ou non) 
• On demande à FB : « Mutual friends of 
T and B » … il répond A → A et T sont 
donc amis 
• On réessaye avec A : « Mutual friends 
of T and A »… 
T 
B 
A
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 132/145 
Reconstruction de vandy.berten 
• Depuis ce compte (via API) : 
561 noeuds (298 pub, 53%), 5059 connexions 
• Si liste privée, « People tagged in… » + « PYMK » : 
296 noeuds (52,9%, 99% de ce qui est public !) 
1638 connexions (32%) 
• Si liste publique, par « crawling » : 
561 noeuds (100%), 4136 connexions (81%)
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 133/145 
Reconstruction 
Réseau reconstruit Réseau original 
• Entre 85 et 100% des noeuds 
ont été placés dans la 
« bonne » partition 
• Plus de la moitié des 
différences viennent de 
deux partitions « proches »
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 134/145 
Reconstruction : deviner 
• Peut-on « suspecter » d’autres personnes d’êtres 
amies avec la cible ? 
• Hypothèse : deux personnes qui ont beaucoup 
d’amis communs ont des chances d’être 
également amis 
• On recherche les amis d’amis fréquents 
• Si beaucoup d’amis de T disent être amis avec A 
(même si A et T cachent leur liste), il y a des 
chances que A et T se connaissent
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 135/145 
Reconstruction : deviner 
Amis d’amis 
Amis de la « cible » 
A 
B 
C 
F 
E 
D
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 136/145 
Reconstruction : deviner 
• Sur vandy.berten : 
• Impossible de le savoir en général ! 
• Autre possibilité : « Friendship page » 
(https://www.facebook.com/user1?and=user2) 
Seuil Amis FB 
(cachés) 
Connus 
(hors FB) 
Inconnu/ 
vague 
Total 
15 61 8 3 72 
10 120 32 21 173
ÉVOLUTION 
Network Analytics
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 138/145 
Évolution 
• On peut voir depuis quand deux personnes sont 
« Facebook friends » 
• www.facebook.com/o*****n?and=vandy.berten : 
• La dynamique des réseaux est très souvent 
instructive
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 139/145 
Et alors ? 
• On pourrait appliquer la même technique pour 
deviner la religion, les préférences politiques ou 
l’orientation sexuelle de quelqu’un 
• Sans doute pas un problème chez nous … pas 
anodin si on a des amis vivant dans des régimes 
plus « sévères » 
• Même chez nous : un « cambrioleur » pourrait se 
servir des profils de vos amis pour savoir que 
vous n’êtes pas chez vous ! 
• Usurpation d’identité facilitée
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 140/145 
Amélioration du phishing ? 
Bonjour XXX 
Ce week-end j'ai 
discuté avec YYY et 
ZZZ à la fête de AAA, 
qui m'ont dit que tu 
serais intéressé par 
cette application/ce 
site web … 
Votre nom 
Un ami avec 
une haute 
centralité de 
degré 
Autre ami 
ayant bcp 
d'amis en 
commun 
avec YYY 
Grâce à des photos ou 
évènements trouvés 
par « Graph Search »
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 141/145 
Network analytics: l’essentiel 
Grande quantité 
d’informations sur 
des individus et sur 
leur relations 
Même avec une 
« cible » méfiante 
Peut être long, mais 
pas de matériel 
complexe/puissant 
Petit exemple des 
possibilités 
montrées ici
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 142/145 
Network analytics: les outils 
Extraction compte : 
- Netvizz 
- NameGenWeb 
- Twitter : NodeXL 
Analyse de son compte : 
- wolframalpha.com/ 
facebook 
- Touchgraph 
Visualisation, partitions, 
centralité… : Gephi 
Pour les plus branchés : 
- API Facebook 
- Web crawling : 
selenium (Python)
socialstrand.com 
Conclusions 
infocux
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 144/145 
Conclusions 
Souvent, méta-information 
plus 
intéressante que 
l’info elle-même 
Les citoyens 
s’expriment sur 
les médias 
sociaux, il est 
nécessaire de les 
suivre 
Prise de connaissance d’un 
problème/évènement plus 
rapide qu’avec les médias 
« traditionnels » 
La quantité de données 
rend l’information 
difficile à comprendre… 
mais des outils sont 
disponibles
Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 145/145 
Vandy Berten 
02/787.57.32 
vandy.berten@smals.be 
More on Smals Research : 
Website : www.smals.be 
Blog : www.smalsresearch.be 
Twitter : @SmalsResearch 
Blog (www.smalsresearch.be/author/berten/) 
- Contacter un citoyen sur Facebook ? 
- La vie privée selon Facebook 
- Ce qu’un réseau social peut nous apprendre 
- Facebook : peut-on vraiment cacher sa liste 
d’amis ? [6/11]

Mais conteúdo relacionado

Destaque

Valtech - Décollage d’une plateforme digitale vers le Cloud Azure
Valtech - Décollage d’une plateforme digitale vers le Cloud AzureValtech - Décollage d’une plateforme digitale vers le Cloud Azure
Valtech - Décollage d’une plateforme digitale vers le Cloud AzureValtech
 
Valtech - DOs and DON'Ts of Social Analytics
Valtech - DOs and DON'Ts of Social AnalyticsValtech - DOs and DON'Ts of Social Analytics
Valtech - DOs and DON'Ts of Social AnalyticsValtech
 
Valtech - La Fidélisation à l’ère du digital, quel potentiel pour le prépayé !
Valtech - La Fidélisation à l’ère du digital, quel potentiel pour le prépayé !Valtech - La Fidélisation à l’ère du digital, quel potentiel pour le prépayé !
Valtech - La Fidélisation à l’ère du digital, quel potentiel pour le prépayé !Valtech
 
Valtech - Du BI au Big Data, une révolution dans l’entreprise
Valtech - Du BI au Big Data, une révolution dans l’entrepriseValtech - Du BI au Big Data, une révolution dans l’entreprise
Valtech - Du BI au Big Data, une révolution dans l’entrepriseValtech
 
Valtech / Adobe - Résultats du Baromètre Marketing Digital 2015
Valtech / Adobe - Résultats du Baromètre Marketing Digital 2015Valtech / Adobe - Résultats du Baromètre Marketing Digital 2015
Valtech / Adobe - Résultats du Baromètre Marketing Digital 2015Valtech
 
UX at York: starting small and scaling up (#nclxux)
UX at York: starting small and scaling up (#nclxux)UX at York: starting small and scaling up (#nclxux)
UX at York: starting small and scaling up (#nclxux)Ned Potter
 
Soft Computing & IBM : Digital, Big Data & DMP
Soft Computing & IBM : Digital, Big Data & DMPSoft Computing & IBM : Digital, Big Data & DMP
Soft Computing & IBM : Digital, Big Data & DMPSoft Computing
 
Tendances digitales et créatives // Cannes Lions 2015
Tendances digitales et créatives // Cannes Lions 2015Tendances digitales et créatives // Cannes Lions 2015
Tendances digitales et créatives // Cannes Lions 2015Valtech
 
Valtech - Internet of Things & Big Data : un mariage de raison
Valtech - Internet of Things & Big Data : un mariage de raisonValtech - Internet of Things & Big Data : un mariage de raison
Valtech - Internet of Things & Big Data : un mariage de raisonValtech
 
Pensamiento crítico
Pensamiento críticoPensamiento crítico
Pensamiento críticoEdison Garcia
 
Taller 1 saandra milena guzman
Taller 1  saandra milena guzmanTaller 1  saandra milena guzman
Taller 1 saandra milena guzmanMilena Guzman
 
Taller 10 seminaro sandra milena
Taller 10 seminaro sandra milenaTaller 10 seminaro sandra milena
Taller 10 seminaro sandra milenaMilena Guzman
 
Seleccionar técnicas bajo el criterio del desarrollo sustentable
Seleccionar técnicas bajo el criterio del desarrollo sustentableSeleccionar técnicas bajo el criterio del desarrollo sustentable
Seleccionar técnicas bajo el criterio del desarrollo sustentablealumnagris
 
Taller 4 sandra milena g
Taller 4  sandra milena gTaller 4  sandra milena g
Taller 4 sandra milena gMilena Guzman
 
Guide DSE 2013
Guide DSE 2013Guide DSE 2013
Guide DSE 2013CROUS35
 

Destaque (19)

Valtech - Décollage d’une plateforme digitale vers le Cloud Azure
Valtech - Décollage d’une plateforme digitale vers le Cloud AzureValtech - Décollage d’une plateforme digitale vers le Cloud Azure
Valtech - Décollage d’une plateforme digitale vers le Cloud Azure
 
Valtech - DOs and DON'Ts of Social Analytics
Valtech - DOs and DON'Ts of Social AnalyticsValtech - DOs and DON'Ts of Social Analytics
Valtech - DOs and DON'Ts of Social Analytics
 
Valtech - La Fidélisation à l’ère du digital, quel potentiel pour le prépayé !
Valtech - La Fidélisation à l’ère du digital, quel potentiel pour le prépayé !Valtech - La Fidélisation à l’ère du digital, quel potentiel pour le prépayé !
Valtech - La Fidélisation à l’ère du digital, quel potentiel pour le prépayé !
 
Valtech - Du BI au Big Data, une révolution dans l’entreprise
Valtech - Du BI au Big Data, une révolution dans l’entrepriseValtech - Du BI au Big Data, une révolution dans l’entreprise
Valtech - Du BI au Big Data, une révolution dans l’entreprise
 
Valtech / Adobe - Résultats du Baromètre Marketing Digital 2015
Valtech / Adobe - Résultats du Baromètre Marketing Digital 2015Valtech / Adobe - Résultats du Baromètre Marketing Digital 2015
Valtech / Adobe - Résultats du Baromètre Marketing Digital 2015
 
UX at York: starting small and scaling up (#nclxux)
UX at York: starting small and scaling up (#nclxux)UX at York: starting small and scaling up (#nclxux)
UX at York: starting small and scaling up (#nclxux)
 
Soft Computing & IBM : Digital, Big Data & DMP
Soft Computing & IBM : Digital, Big Data & DMPSoft Computing & IBM : Digital, Big Data & DMP
Soft Computing & IBM : Digital, Big Data & DMP
 
Tendances digitales et créatives // Cannes Lions 2015
Tendances digitales et créatives // Cannes Lions 2015Tendances digitales et créatives // Cannes Lions 2015
Tendances digitales et créatives // Cannes Lions 2015
 
Valtech - Internet of Things & Big Data : un mariage de raison
Valtech - Internet of Things & Big Data : un mariage de raisonValtech - Internet of Things & Big Data : un mariage de raison
Valtech - Internet of Things & Big Data : un mariage de raison
 
Capacitación
CapacitaciónCapacitación
Capacitación
 
Pensamiento crítico
Pensamiento críticoPensamiento crítico
Pensamiento crítico
 
Whisky du monde 2014
Whisky du monde 2014Whisky du monde 2014
Whisky du monde 2014
 
Taller 1 saandra milena guzman
Taller 1  saandra milena guzmanTaller 1  saandra milena guzman
Taller 1 saandra milena guzman
 
Entrevistas palacios
Entrevistas palaciosEntrevistas palacios
Entrevistas palacios
 
Taller 10 seminaro sandra milena
Taller 10 seminaro sandra milenaTaller 10 seminaro sandra milena
Taller 10 seminaro sandra milena
 
Seleccionar técnicas bajo el criterio del desarrollo sustentable
Seleccionar técnicas bajo el criterio del desarrollo sustentableSeleccionar técnicas bajo el criterio del desarrollo sustentable
Seleccionar técnicas bajo el criterio del desarrollo sustentable
 
Taller 4 sandra milena g
Taller 4  sandra milena gTaller 4  sandra milena g
Taller 4 sandra milena g
 
Ses résultats2013
Ses résultats2013Ses résultats2013
Ses résultats2013
 
Guide DSE 2013
Guide DSE 2013Guide DSE 2013
Guide DSE 2013
 

Semelhante a 20141023 social media & e government infosession

Utiliser Twitter pour la veille et la communication
Utiliser Twitter pour la veille et la communicationUtiliser Twitter pour la veille et la communication
Utiliser Twitter pour la veille et la communicationURFIST de Rennes
 
ANT Rhône-Alpes - 13-Veille numérique mutualisée
ANT Rhône-Alpes  - 13-Veille numérique mutualiséeANT Rhône-Alpes  - 13-Veille numérique mutualisée
ANT Rhône-Alpes - 13-Veille numérique mutualiséeApidae (ex-Sitra)
 
Webinar Social Media 22-05
Webinar Social Media 22-05Webinar Social Media 22-05
Webinar Social Media 22-05FINN
 
Présentation du projet postrelay.info
Présentation du projet postrelay.infoPrésentation du projet postrelay.info
Présentation du projet postrelay.infomanumazu
 
2014 03 arcade j2 haguenau_app_itg_j_vds
2014 03 arcade  j2 haguenau_app_itg_j_vds2014 03 arcade  j2 haguenau_app_itg_j_vds
2014 03 arcade j2 haguenau_app_itg_j_vdsJean Vanderspelden
 
Social média à la ville de Lausanne 29-06-2016
Social média à la ville de Lausanne 29-06-2016Social média à la ville de Lausanne 29-06-2016
Social média à la ville de Lausanne 29-06-2016Thierry Weber
 
Content marketing et medias sociaux en B2B
Content marketing et medias sociaux en B2BContent marketing et medias sociaux en B2B
Content marketing et medias sociaux en B2BChristelle Austruy
 
Outils numériques à l'usage des bibliothécaires
Outils numériques à l'usage des bibliothécairesOutils numériques à l'usage des bibliothécaires
Outils numériques à l'usage des bibliothécairesFlora Gousset
 
Les réseaux sociaux : présentation de Delphine Houel au Réseau-Doc
Les réseaux sociaux : présentation de Delphine Houel au Réseau-DocLes réseaux sociaux : présentation de Delphine Houel au Réseau-Doc
Les réseaux sociaux : présentation de Delphine Houel au Réseau-DocDelphine Houel
 
Séance 1: Richard Moreau (multi learn institute) Mettre en place une stratégi...
Séance 1: Richard Moreau (multi learn institute) Mettre en place une stratégi...Séance 1: Richard Moreau (multi learn institute) Mettre en place une stratégi...
Séance 1: Richard Moreau (multi learn institute) Mettre en place une stratégi...Web2LLP
 
Le web et les réseaux sociaux : pour mieux partager
Le web et les réseaux sociaux : pour mieux partagerLe web et les réseaux sociaux : pour mieux partager
Le web et les réseaux sociaux : pour mieux partagerNadia Seraiocco
 
Atelier websocial - CCI limoges
Atelier websocial - CCI limogesAtelier websocial - CCI limoges
Atelier websocial - CCI limogesKevin Gallot
 
Présentation powerpoint
Présentation powerpointPrésentation powerpoint
Présentation powerpointsacha.cma14
 
Competitic twitter - numerique en entreprise
Competitic   twitter - numerique en entrepriseCompetitic   twitter - numerique en entreprise
Competitic twitter - numerique en entrepriseCOMPETITIC
 
SEO : comment obtenir des liens puissants grâce à un contenu décalé
SEO : comment obtenir des liens puissants grâce à un contenu décaléSEO : comment obtenir des liens puissants grâce à un contenu décalé
SEO : comment obtenir des liens puissants grâce à un contenu décaléLaurent Peyrat
 
Quelques pistes pour identifier des données de marché, BFR Consultants
Quelques pistes pour identifier des données de marché, BFR ConsultantsQuelques pistes pour identifier des données de marché, BFR Consultants
Quelques pistes pour identifier des données de marché, BFR ConsultantsBéatrice Foenix-Riou
 
CEFQ - Les médias sociaux : le temps de s'y mettre
CEFQ - Les médias sociaux : le temps de s'y mettreCEFQ - Les médias sociaux : le temps de s'y mettre
CEFQ - Les médias sociaux : le temps de s'y mettreCEFQ
 
Doctorants, comment utiliser les réseaux sociaux pour augmenter sa visibilité...
Doctorants, comment utiliser les réseaux sociaux pour augmenter sa visibilité...Doctorants, comment utiliser les réseaux sociaux pour augmenter sa visibilité...
Doctorants, comment utiliser les réseaux sociaux pour augmenter sa visibilité...Ozil Conseil
 

Semelhante a 20141023 social media & e government infosession (20)

Utiliser Twitter pour la veille et la communication
Utiliser Twitter pour la veille et la communicationUtiliser Twitter pour la veille et la communication
Utiliser Twitter pour la veille et la communication
 
ANT Rhône-Alpes - 13-Veille numérique mutualisée
ANT Rhône-Alpes  - 13-Veille numérique mutualiséeANT Rhône-Alpes  - 13-Veille numérique mutualisée
ANT Rhône-Alpes - 13-Veille numérique mutualisée
 
Webinar Social Media 22-05
Webinar Social Media 22-05Webinar Social Media 22-05
Webinar Social Media 22-05
 
Présentation du projet postrelay.info
Présentation du projet postrelay.infoPrésentation du projet postrelay.info
Présentation du projet postrelay.info
 
2014 03 arcade j2 haguenau_app_itg_j_vds
2014 03 arcade  j2 haguenau_app_itg_j_vds2014 03 arcade  j2 haguenau_app_itg_j_vds
2014 03 arcade j2 haguenau_app_itg_j_vds
 
Social média à la ville de Lausanne 29-06-2016
Social média à la ville de Lausanne 29-06-2016Social média à la ville de Lausanne 29-06-2016
Social média à la ville de Lausanne 29-06-2016
 
Content marketing et medias sociaux en B2B
Content marketing et medias sociaux en B2BContent marketing et medias sociaux en B2B
Content marketing et medias sociaux en B2B
 
Outils numériques à l'usage des bibliothécaires
Outils numériques à l'usage des bibliothécairesOutils numériques à l'usage des bibliothécaires
Outils numériques à l'usage des bibliothécaires
 
Les réseaux sociaux : présentation de Delphine Houel au Réseau-Doc
Les réseaux sociaux : présentation de Delphine Houel au Réseau-DocLes réseaux sociaux : présentation de Delphine Houel au Réseau-Doc
Les réseaux sociaux : présentation de Delphine Houel au Réseau-Doc
 
Séance 1: Richard Moreau (multi learn institute) Mettre en place une stratégi...
Séance 1: Richard Moreau (multi learn institute) Mettre en place une stratégi...Séance 1: Richard Moreau (multi learn institute) Mettre en place une stratégi...
Séance 1: Richard Moreau (multi learn institute) Mettre en place une stratégi...
 
Le web et les réseaux sociaux : pour mieux partager
Le web et les réseaux sociaux : pour mieux partagerLe web et les réseaux sociaux : pour mieux partager
Le web et les réseaux sociaux : pour mieux partager
 
Atelier websocial - CCI limoges
Atelier websocial - CCI limogesAtelier websocial - CCI limoges
Atelier websocial - CCI limoges
 
Présentation powerpoint
Présentation powerpointPrésentation powerpoint
Présentation powerpoint
 
Atelier page facebook
Atelier page facebookAtelier page facebook
Atelier page facebook
 
Competitic twitter - numerique en entreprise
Competitic   twitter - numerique en entrepriseCompetitic   twitter - numerique en entreprise
Competitic twitter - numerique en entreprise
 
SEO : comment obtenir des liens puissants grâce à un contenu décalé
SEO : comment obtenir des liens puissants grâce à un contenu décaléSEO : comment obtenir des liens puissants grâce à un contenu décalé
SEO : comment obtenir des liens puissants grâce à un contenu décalé
 
C2I D4 FST TD2 Veille, blogs, recherche d'articles en ligne
C2I D4 FST TD2 Veille, blogs, recherche d'articles en ligneC2I D4 FST TD2 Veille, blogs, recherche d'articles en ligne
C2I D4 FST TD2 Veille, blogs, recherche d'articles en ligne
 
Quelques pistes pour identifier des données de marché, BFR Consultants
Quelques pistes pour identifier des données de marché, BFR ConsultantsQuelques pistes pour identifier des données de marché, BFR Consultants
Quelques pistes pour identifier des données de marché, BFR Consultants
 
CEFQ - Les médias sociaux : le temps de s'y mettre
CEFQ - Les médias sociaux : le temps de s'y mettreCEFQ - Les médias sociaux : le temps de s'y mettre
CEFQ - Les médias sociaux : le temps de s'y mettre
 
Doctorants, comment utiliser les réseaux sociaux pour augmenter sa visibilité...
Doctorants, comment utiliser les réseaux sociaux pour augmenter sa visibilité...Doctorants, comment utiliser les réseaux sociaux pour augmenter sa visibilité...
Doctorants, comment utiliser les réseaux sociaux pour augmenter sa visibilité...
 

Mais de Smals

Wat zijn chatbots en waarvoor gebruiken we ze
Wat zijn chatbots en waarvoor gebruiken we zeWat zijn chatbots en waarvoor gebruiken we ze
Wat zijn chatbots en waarvoor gebruiken we zeSmals
 
Wat is augmented reality en waarvoor gebruiken we het nl
Wat is augmented reality en waarvoor gebruiken we het nlWat is augmented reality en waarvoor gebruiken we het nl
Wat is augmented reality en waarvoor gebruiken we het nlSmals
 
Named entity recognition hoe werkt het wat kunnen we er mee doen nl
Named entity recognition hoe werkt het wat kunnen we er mee doen nlNamed entity recognition hoe werkt het wat kunnen we er mee doen nl
Named entity recognition hoe werkt het wat kunnen we er mee doen nlSmals
 
Natural language generation nederlands
Natural language generation nederlandsNatural language generation nederlands
Natural language generation nederlandsSmals
 
Wat is ai en wat kan het nl
Wat is ai en wat kan het nlWat is ai en wat kan het nl
Wat is ai en wat kan het nlSmals
 
Realite augmentee
Realite augmenteeRealite augmentee
Realite augmenteeSmals
 
Internet des objets
Internet des objetsInternet des objets
Internet des objetsSmals
 
Chatbots comment ca marche a quoi ca sert
Chatbots comment ca marche a quoi ca sertChatbots comment ca marche a quoi ca sert
Chatbots comment ca marche a quoi ca sertSmals
 
Analyse predictive comment ca marche a quoi ca sert
Analyse predictive comment ca marche a quoi ca sertAnalyse predictive comment ca marche a quoi ca sert
Analyse predictive comment ca marche a quoi ca sertSmals
 
Traduction vocale quasi instantanee introduction
Traduction vocale quasi instantanee introductionTraduction vocale quasi instantanee introduction
Traduction vocale quasi instantanee introductionSmals
 
Automatisation des processus robotises introduction
Automatisation des processus robotises introductionAutomatisation des processus robotises introduction
Automatisation des processus robotises introductionSmals
 
Interfaces conversationnelle introduction
Interfaces conversationnelle introductionInterfaces conversationnelle introduction
Interfaces conversationnelle introductionSmals
 
Reconnaissance d'entites nommees introduction
Reconnaissance d'entites nommees introductionReconnaissance d'entites nommees introduction
Reconnaissance d'entites nommees introductionSmals
 
Generation automatique de textes
Generation automatique de textesGeneration automatique de textes
Generation automatique de textesSmals
 
Intelligence artificielle etroite introduction
Intelligence artificielle etroite introductionIntelligence artificielle etroite introduction
Intelligence artificielle etroite introductionSmals
 
Named entity recognition hoe werkt het wat kunnen we er mee doen
Named entity recognition hoe werkt het wat kunnen we er mee doenNamed entity recognition hoe werkt het wat kunnen we er mee doen
Named entity recognition hoe werkt het wat kunnen we er mee doenSmals
 
Real time voice translation handig maar hoe ver staat het
Real time voice translation   handig  maar hoe ver staat hetReal time voice translation   handig  maar hoe ver staat het
Real time voice translation handig maar hoe ver staat hetSmals
 
Wat is predictive analytics en waarvoor kun je het gebruiken
Wat is predictive analytics en waarvoor kun je het gebruikenWat is predictive analytics en waarvoor kun je het gebruiken
Wat is predictive analytics en waarvoor kun je het gebruikenSmals
 
Wat is robotic process automation en wat kun je er mee doen
Wat is robotic process automation en wat kun je er mee doenWat is robotic process automation en wat kun je er mee doen
Wat is robotic process automation en wat kun je er mee doenSmals
 
Exemples europeens comme source d inspiration
Exemples europeens comme source d inspirationExemples europeens comme source d inspiration
Exemples europeens comme source d inspirationSmals
 

Mais de Smals (20)

Wat zijn chatbots en waarvoor gebruiken we ze
Wat zijn chatbots en waarvoor gebruiken we zeWat zijn chatbots en waarvoor gebruiken we ze
Wat zijn chatbots en waarvoor gebruiken we ze
 
Wat is augmented reality en waarvoor gebruiken we het nl
Wat is augmented reality en waarvoor gebruiken we het nlWat is augmented reality en waarvoor gebruiken we het nl
Wat is augmented reality en waarvoor gebruiken we het nl
 
Named entity recognition hoe werkt het wat kunnen we er mee doen nl
Named entity recognition hoe werkt het wat kunnen we er mee doen nlNamed entity recognition hoe werkt het wat kunnen we er mee doen nl
Named entity recognition hoe werkt het wat kunnen we er mee doen nl
 
Natural language generation nederlands
Natural language generation nederlandsNatural language generation nederlands
Natural language generation nederlands
 
Wat is ai en wat kan het nl
Wat is ai en wat kan het nlWat is ai en wat kan het nl
Wat is ai en wat kan het nl
 
Realite augmentee
Realite augmenteeRealite augmentee
Realite augmentee
 
Internet des objets
Internet des objetsInternet des objets
Internet des objets
 
Chatbots comment ca marche a quoi ca sert
Chatbots comment ca marche a quoi ca sertChatbots comment ca marche a quoi ca sert
Chatbots comment ca marche a quoi ca sert
 
Analyse predictive comment ca marche a quoi ca sert
Analyse predictive comment ca marche a quoi ca sertAnalyse predictive comment ca marche a quoi ca sert
Analyse predictive comment ca marche a quoi ca sert
 
Traduction vocale quasi instantanee introduction
Traduction vocale quasi instantanee introductionTraduction vocale quasi instantanee introduction
Traduction vocale quasi instantanee introduction
 
Automatisation des processus robotises introduction
Automatisation des processus robotises introductionAutomatisation des processus robotises introduction
Automatisation des processus robotises introduction
 
Interfaces conversationnelle introduction
Interfaces conversationnelle introductionInterfaces conversationnelle introduction
Interfaces conversationnelle introduction
 
Reconnaissance d'entites nommees introduction
Reconnaissance d'entites nommees introductionReconnaissance d'entites nommees introduction
Reconnaissance d'entites nommees introduction
 
Generation automatique de textes
Generation automatique de textesGeneration automatique de textes
Generation automatique de textes
 
Intelligence artificielle etroite introduction
Intelligence artificielle etroite introductionIntelligence artificielle etroite introduction
Intelligence artificielle etroite introduction
 
Named entity recognition hoe werkt het wat kunnen we er mee doen
Named entity recognition hoe werkt het wat kunnen we er mee doenNamed entity recognition hoe werkt het wat kunnen we er mee doen
Named entity recognition hoe werkt het wat kunnen we er mee doen
 
Real time voice translation handig maar hoe ver staat het
Real time voice translation   handig  maar hoe ver staat hetReal time voice translation   handig  maar hoe ver staat het
Real time voice translation handig maar hoe ver staat het
 
Wat is predictive analytics en waarvoor kun je het gebruiken
Wat is predictive analytics en waarvoor kun je het gebruikenWat is predictive analytics en waarvoor kun je het gebruiken
Wat is predictive analytics en waarvoor kun je het gebruiken
 
Wat is robotic process automation en wat kun je er mee doen
Wat is robotic process automation en wat kun je er mee doenWat is robotic process automation en wat kun je er mee doen
Wat is robotic process automation en wat kun je er mee doen
 
Exemples europeens comme source d inspiration
Exemples europeens comme source d inspirationExemples europeens comme source d inspiration
Exemples europeens comme source d inspiration
 

20141023 social media & e government infosession

  • 1. Vandy BERTEN Section Recherche Social Media & eGovernment flickr.com/infocux
  • 2. Table des matières Introduction Use case 1 : Recherche par mots-clés Use case 2 : Page Facebook Use case 3 : Network Analytics Conclusions Vandy Berten
  • 4. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 4/145 Introduction Contexte eGov belge À l’étranger Réseaux sociaux Uses cases Mots-clés Page Facebook Network Analytics Conclusions Table des matières Vandy Berten
  • 5. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 5/145 • Réseaux/médias sociaux : au centre de la communication de la grande majorité des « communicants » (marques, entreprises, personnalités, presse …) • Diffusion de publicités, campagnes… • Networking, création « d’ambassadeurs » • Feedback des clients/utilisateurs/fans… (direct ou indirect, volontaire ou non) • Support clients (en partie par les clients) Contexte Focus de l’exposé : médias sociaux en tant que source d’information
  • 6. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 6/145 • Expression d’avis, de sentiment, de protestation, de mécontentement… • Amplification de messages (presse, « amis », personnalité…) • Rumeurs, hoax, dénigrement, désinformation… Canal idéal, rapide et (quasi) incontrôlable ! • Évènement plus vite sur les réseaux sociaux que sur les « médias traditionnels » Informations ?
  • 7. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 7/145 « Dérapage » faciles, sans contrôle
  • 8. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 8/145 Médias sociaux et actualité Émeutes de Londres, 2011 Rôle majeur de Twitter dans la propagation de rumeurPs,u lke kdeélpplaocpe,m 2e0n1t 1d es foules Réseau téléphonique saturé, mais pas Twitter. Message pour les proches, hébergement, … Daesh (IS), 2014 Outil principal de propagande
  • 9. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 9/145 • Services actifs : Intégration sociale, ONP, ONSS (+student@work), Fedasil, AFSCA, Finances, armée… • Services présents, mais inactifs : ONEM • Présence partielle : CPAS Forest • Police : grande « fragmentation » – @PolFed_presse, @police_temoin, @Polsupport_F, @HELI_FEDPOLFED, @polinfo_fr, @Jobpol_F (+NL) – @PolitieLeuven, @Politie_Halle, @PZSintNiklaas, @Politie5418, @ZPNamur, @polzonepuy, @PZWLW • Qui fait réellement du monitoring/webcare ? Difficile à savoir… Situation actuelle eGov Belge
  • 10. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 10/145 • Dans presque tous les pays, des institutions sont présentes • Quelques pays ont une vraie politique « médias sociaux » • Nouvelle-Zélande (référence pour Gartner) : lignes de conduites (générales, en cas de problème, …), toolbox… • Canada : beaucoup d’organismes présents • … À l’étranger
  • 11. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 11/145 • Cette présentation n’est pas : – Une intro à « comment démarrer sur les médias sociaux » • → SPF « Personnel & Organisation » • Littérature abondante – Comment écrire un tweet percutant, réussir une campagne… – Un catalogue d’outils de monitoring – Un tutorial des API • Focus : – Identification de problèmes, plus que mesure de performance d’une campagne/d’une marque – Présentation de techniques, plus que des outils Cette présentation est/n’est pas …
  • 12. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 12/145 Réseaux sociaux
  • 13. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 13/145 Réseaux sociaux Facebook • 1,3 milliards d’utilisateurs actifs • 1 Belge sur 2 (5.6 millions) ! • Présence massive du politique, des entreprises, des people… • Beaucoup d’expression d’opinion • Une API permettant de récolter beaucoup de données, mais uniquement pour ce qui est « public » (pages + utilisateurs d’application) • Énormément d’informations personnelles
  • 14. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 14/145 Réseaux sociaux LinkedIn • 300 millions d’utilisateurs actifs • 2.2 millions de Belges • Plus un espace de networking que d’expression • API disponible
  • 15. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 15/145 Réseaux sociaux Twitter • 200 millions d’utilisateurs • 1 million en Belgique (?) • Beaucoup d’opinion exprimée • Relations plus basées sur l’intérêt que l’amitié • Tout est public ! (sauf direct messages) • API complète, mais limitations temporelles (requête/minutes et passé restreint)
  • 16. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 16/145 Réseaux sociaux WhatsApp • Outil de communication, similaire au SMS • Uniquement des messages privés, rien n’est public • Pas d’API
  • 17. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 17/145 Réseaux sociaux Google+ • 1 millions de Belges, mais peu actifs • Vient avec un compte Gmail • API disponible • Public très « branché » [opinion !]
  • 18. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 18/145 Réseaux sociaux Snapchat • Similaire à WhatsApp • Outil de communication • Uniquement des messages privés, rien n’est public • Tout s’efface en quelques secondes … pas d’API par définition !
  • 19. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 19/145 Réseaux sociaux Netlog • Similaire à Facebook • Principalement pour les adolescents • Réseau belge, a été populaire en Belgique, surtout en Flandre, • Est « en voie d’extinction » ! • API disponible, mais très mal documentée
  • 20. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 20/145 Réseaux sociaux Pinterest • Plateforme de partage de photos • Pas beaucoup d’opinion exprimée • API disponible
  • 21. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 21/145 Réseaux sociaux Instagram • Plateforme de partage de photos • Idem que Pinterest, pas beaucoup d’opinion exprimée (en Belgique ?) • API disponible
  • 22. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 22/145 • Use case 1 – Twitter : recherche par mots-clé ; Comment identifier les « hot topics » ? Sur un sujet particulier ? Comment collecter l’information et la traiter ? Comment identifier des pics de discussion ? De quoi parle-t-on ? • Use case 2 – Page Facebook : Quels sont les sujets de discussion ? Peut-on identifier des moments de tension ? Les citoyens sont-ils critiques ? Qui sont les citoyens qui s’expriment ? • Use case 3 – Network analytics : À partir d’un ensemble d’informations publiques, que peut-on reconstruire ? Uses cases
  • 23. mysmn.com Use case 1 : Mots-clés
  • 24. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 24/145 Table des matières Introduction Use case 1: Mots-clé Introduction Hot topics Recherche ciblée Détection d’évènement Page Facebook Network Analytics Conclusions Vandy Berten
  • 26. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 26/145 Contexte • Twitter : tous les tweets publics ! (FB : pages publiques) • Limite des 140 caractères : on va à l’essentiel • Très utilisé pour identifier les sujets populaires • Contraintes API Twitter : – Temporelle : # requêtes/minutes limité – Contenu : accès (borné à 1%) au 7 derniers jours • Certains outils ont un accès complet (Firehose)
  • 28. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 28/145 « Hot topics » • Identification de sujets « chauds » sans savoir ce qu’on cherche • À faire en parallèle à des recherches plus ciblées, pour identifier les nouveaux sujets • Se base sur les mots qui reviennent le plus souvent dans une zone géographique précise
  • 29. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 29/145 Twitter.com • Sur la page d’accueil • https://twitter.com/i/discover
  • 30. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 30/145 Trendsmap.com www.trendsmap.com
  • 31. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 31/145 Trendsmap.com www.trendsmap.com
  • 33. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 33/145 Recherche ciblée • Si on connait les « mots-clés » à examiner, il existe de nombreux outils • Certains se basent sur le passé, d’autres nécessitent la mise en place d’une « écoute » • Un certain nombre de moteurs de recherche permettent juste de lister les tweets répondant à une requête → limite l’intérêt • Pour la suite, on s’intéresse surtout à Twitter
  • 34. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 34/145 Difficultés ONSS Jvai traversé le mur du onss! C du bon onss kom met onss Onss fait un bouffe? Dimona Capac DMFA Dimethylformamide Direct Marketing Fundraisers Association Društvo matematikov, fizikov in astronomov RSZ http://instagram.com/p/s-RSz-TDFd/
  • 35. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 35/145 Contourner les difficultés • Critère linguistique : « dimona lang:fr » → langue du profil, pas du message • Rajouter des mots-clés : « déclaration dimona » → limite Israël, mais trop restrictif (6 tweets !) • Exclure des mots : « dimona -israel -israélien -palestinien -palestine -nucléaire -gaza -missile » → Pas encore suffisant ! • Critère géographique : « dimona near:brussels within:150km » → Doit être renseigné (profil ou tweet)
  • 36. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 36/145 Méthodes d’extraction Plusieurs méthodes d’extraction de tweets : • Configurer un outil (Engagor, Mention.com…) avec une recherche programmée (passé souvent limité) • Utiliser l’API : – « search » : tweets jusqu’à une semaine en arrière – « stream » : « réveillé » dès qu’un nouveau tweet arrive • Web crawler : version « Web » de Twitter donne plus de résultats que l’API (plus anciens) → possibilité d’extraction, mais laborieux
  • 37. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 37/145 « Tax-on-web » : Google trends
  • 38. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 38/145 « Tax-on-web » : Topsy.com
  • 39. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 39/145 « Tax-on-web » : Mention.com
  • 40. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 40/145 « Tax-on-web » : API + tableur (/jour)
  • 41. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 41/145 « Tax-on-web » : API + tableur (/heure) • @FOD_Finance : • « Al meer dan 2.000.000 aangiftes binnen via #taxonweb. (…) » (5RT) • « Laatste rechte lijn (…) #taxonweb. (…) » (5RT) • @SPF_Finance : • « Déjà 2.000.000 de déclarations via #taxonweb. (…) ? » (2RT) • « Dernière ligne droite (…) #taxonweb. (…) » (3RT) • → 19 tweets en quelques minutes « Tax-on-web down... » ; « Lap: #taxonweb is down. » ; « Bijna zo down als de mensen die er gebruik van wilden maken. » ; « Typisch : […] aan zijn #taxonweb dan ligt het systeem weer plat. #fb » ; « Heeft iedereen […] #crash #serverdown » ; « Een "groene" dag op #taxonweb , maar helaas: site niet beschikbaar :-( . Elk jaar een probleem ... volgend jaar dan maar terug op papier? » ; « Lap #taxonweb #down. Even geduld dus » ; « pfff #taxonweb est down, juste quand Jour j'allais m'y mettre ! » Heure
  • 42. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 42/145 Forem (web crawling) 0 50 100 150 200 250 300 350 400 2007/06 2008/01 2008/04 2008/09 2008/12 2009/03 2009/06 2009/09 2009/12 2010/03 2010/06 2010/09 2010/12 2011/03 2011/06 2011/09 2011/12 2012/03 2012/06 2012/09 2012/12 2013/03 2013/06 2013/09 2013/12 2014/03 2014/06 Forem (fr) #Tweets
  • 43. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 43/145 Forem (Twitter) : topic extraction 0 10 20 30 40 50 60 70 80 90 2007/06 2009/05 2010/08 2011/03 2011/06 2011/09 2011/10 2011/12 2012/01 2012/02 2012/03 2012/05 2012/06 2012/07 2012/09 2012/10 2012/12 2013/01 2013/01 2013/01 2013/01 2013/01 2013/02 2013/02 2013/04 2013/05 2013/05 2013/06 2013/08 2013/09 2013/09 2013/10 2013/11 2014/01 2014/01 2014/02 2014/03 2014/05 0 10 20 30 40 50 60 70 80 90 2007/06 2009/05 2010/08 2011/03 2011/06 2011/09 2011/10 2011/12 2012/01 2012/02 2012/03 2012/05 2012/06 2012/07 2012/09 2012/10 2012/12 2013/01 2013/01 2013/01 2013/01 2013/01 2013/02 2013/02 2013/04 2013/05 2013/05 2013/06 2013/08 2013/09 2013/09 2013/10 2013/11 2014/01 2014/01 2014/02 2014/03 2014/05 emploi formation wallon maroc charleroi Belgique chômeur helpdesk délocalisation actiris Janv. 2013
  • 45. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 45/145 Détection d’évènement • De plus en plus, les témoins d’un incident le tweet directement • Un évènement majeur (attentat, catastrophe, …) génère un grand nombre de tweets localisés, avec des mots en commun • Certains outils (Dataminr, Twitcident) s’en servent pour automatiquement détecter un évènement sur base de critères • Pas encore d’outil gratuit ?
  • 46. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 46/145 Mots-clés: l’essentiel Basé sur des noms de projet, d’organisme, de personne Identification + compréhension des pics de tension Difficile sur des acronymes courts, peu uniques Y réfléchir quand on crée un projet ? Créer des comptes ou hashtags ? Support « non structuré » (≠ page FB) bruit à filtrer
  • 47. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 47/145 Mots-clés: les outils Rech erche ciblée (listing): - Twitter.com - Tweetdeck - Topsy - Socialmention Recherche ciblée (listing +stats) : - Engagor (15j+€) - Hootsuite (subset+€) - Simplymeasured (15j+€) - Topsy (€) - … - Détection évènement - Dataminr (€) - Twitcident (€) - Google Trends Pour les plus branchés : - API search & stream - Selenium (Web crawling) Hot topics : - Trendsmap (subset+€) - Geofeedia (€) - Trends topics (Twitter)
  • 48. facebook.com Use case 2 : Page Facebook
  • 49. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 49/145 Table des matières Introduction Mots-clé Use case 2 : Page Facebook Introduction Analyse de fréquence Topic extraction Sentiment Analysis Network Analytics Network Analytics Conclusions Vandy Berten
  • 51. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 51/145 Contexte • Page Facebook : Vitrine d’une société, d’un organisme, d’un projet (≠ profil) • Tout est public, connexion pas nécessaire (→ indexé par Google) • Contenu accessible via API • Partie centrale : Timeline (Journal), composée de posts et de commentaires • 3 niveaux d’interaction : – Posts par le gestionnaire, commentaires bloqués – Posts par le gestionnaire, commentaires acceptés – Posts par tout le monde, commentaires acceptés
  • 52. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 52/145 Contexte • AFSCA : Agence Fédérale pour la Sécurité de la Chaîne Alimentaire (= FAVV) • Compétente pour l’alimentation (magasin, restaurants, usines, fêtes…) mais également pour les animaux (vaccins, commerce…) domestiques et d’élevage • Page Facebook : annonce de contrôle, rappels de produits, annonces diverses • Comme toute agence de contrôle : pas que des amis ! • Mais enjeux et responsabilités considérables !
  • 53. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 53/145 Contexte : exemple d’annonce
  • 54. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 54/145 Commentaires • 209 posts • 590 commentaires • 335 commentateurs • 302 post likes • 974 comment likes
  • 55. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 55/145 Questions • Peut-on « mesurer » cette situation ? • À quel point est-elle problématique ? • Est-ce un phénomène passager ? • Les « contestataires » forment-ils une « communautés » • Sont-ils représentatifs de la société en général ?
  • 56. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 56/145 Outils disponibles • Pour sa propre page Facebook : nombreux outils (gratuits ou non) disponibles • Pour une page quelconque : quelques outils… pourtant le contenu d’une page est public ! – Engagor – Quintly – SimplyMeasured – Aucun gratuit ? • Une autorité peut avoir besoin de monitorer les pages de ses différentes entités… • … ou de suivre des pages liées à « l’opposition »
  • 57. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 57/145 Engagor Page AFSCA, posts (rouge) et commentaires (bleu) par jour
  • 58. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 58/145 Engagor
  • 59. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 59/145 À quoi a-t-on affaire ? • Une communauté régulière et active avec un pic d’activité ? • 2-3 personnes qui se sont lancées dans un débat sans fin ? • Des visiteurs uniques soudainement intéressés par un post ? • Des gens qui se connaissent mutuellement ? Non liés entre eux ? • Quel est le sujet du débat ?
  • 60. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 60/145 Facebook API • Facebook permet d’extraire de l’information au travers d’API (Application Programming Interface) dans différents langages (principalement PHP et javascript) • Authentification et délégation : oAuth • Très peu d’accès aux profils perso, mais accès complet aux pages • Certaines « application Facebook » (p.ex. Netvizz) permettent une extraction « toute faite »
  • 61. ANALYSE DES FRÉQUENCES Page Facebook
  • 62. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 62/145 Facebook API + Google charts Post du 12/1: « La rage est une maladie endémique en Espagne […] » Post du 29/1 : « Vous pouvez laisser des commentaires […] mais il y a quelques règles à respecter ! […] » 9/1, DH.be: « Basile le podenco a été exécuté par l’Afsca » 3 mars 17-18 février Janvier ? 15/2, DH.be: « Ces 34 chiots "sont en train de mourir de faim " »
  • 63. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 63/145 Facebook API + Google charts
  • 64. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 64/145 Facebook API + Google charts 29 janvier
  • 65. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 65/145 Fréquence : lessons learned • Deux pics de commentaires, liés à deux évènements identifiés (Basile, quarantaine) • Première phase : beaucoup de commentaires, peu de commentateurs • Seconde phase : beaucoup de commentateurs • Critiques peu liées au post commenté
  • 67. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 67/145 Topic extraction • Objectif : connaitre le sujet d’une conversation • Basé sur la fréquence d’apparition, présence dans des dictionnaires thématique, classifications • Tag cloud : Wordle.net
  • 68. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 68/145 0 5 10 15 20 25 30 35 40 45 50 animal chien/chiot honte rage vaccin quarantaine AFSCA (Facebook) : API + Excel Janvier 2014 17-18 février 3 mars
  • 69. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 69/145 AFSCA (Twitter) : Crawler + Excel 0 5 10 15 20 25 30 35 40 45 2007/8 2010/8 2011/3 2011/6 2011/7 2012/3 2012/5 2012/7 2012/8 2012/10 2012/12 2013/2 2013/2 2013/3 2013/5 2013/7 2013/7 2013/8 2013/10 2013/11 2013/11 2013/11 2013/12 2013/12 2014/1 2014/2 2014/3 2014/4 2014/5 2014/6 contrôle résultat cheval viande tonne rappel contamination tarte inspection
  • 70. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 70/145 AFSCA (Twitter) : Crawler + Excel 0 5 10 15 20 25 30 35 40 45 2007/8 2010/8 2011/3 2011/6 2011/7 2012/3 2012/5 2012/7 2012/8 2012/10 2012/12 2013/2 2013/2 2013/3 2013/5 2013/7 2013/7 2013/8 2013/10 2013/11 2013/11 2013/11 2013/12 2013/12 2014/1 2014/2 2014/3 2014/4 2014/5 2014/6 contrôle résultat cheval viande tonne rappel contamination tarte inspection Sur la page Facebook : 10 mentions de « cheval »
  • 71. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 71/145 AFSCA (Twitter) : Crawler + Excel 0 5 10 15 20 25 30 35 40 45 2007/8 2010/8 2011/3 2011/6 2011/7 2012/3 2012/5 2012/7 2012/8 2012/10 2012/12 2013/2 2013/2 2013/3 2013/5 2013/7 2013/7 2013/8 2013/10 2013/11 2013/11 2013/11 2013/12 2013/12 2014/1 2014/2 2014/3 2014/4 2014/5 2014/6 contrôle résultat cheval viande tonne rappel contamination tarte inspection Sur la page Facebook : 5 mentions de « tarte »
  • 72. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 72/145 AFSCA (Twitter) : Crawler + Excel 0 5 10 15 20 25 30 35 40 45 2007/8 2010/8 2011/3 2011/6 2011/7 2012/3 2012/5 2012/7 2012/8 2012/10 2012/12 2013/2 2013/2 2013/3 2013/5 2013/7 2013/7 2013/8 2013/10 2013/11 2013/11 2013/11 2013/12 2013/12 2014/1 2014/2 2014/3 2014/4 2014/5 2014/6 contrôle résultat cheval viande tonne rappel contamination tarte inspection
  • 73. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 73/145 Topic extraction: lessons learned • Facebook : sujet = animaux – Première phase (Janvier) : rage (vaccin, quarantaine) – Seconde phase (Février) : animaux, honte • Twitter : sujet = alimentation – Viande de cheval – Tarte – Publication des contrôles • Permet d’orienter une campagne d’information vers le bon public cible
  • 75. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 75/145 Sentiment analysis • Idée : déterminer si un texte est positif, négatif ou neutre • Domaine de recherche issu de la linguistique computationelle, surtout développé en anglais. Quelques outils en français, peu en néerlandais • Gère mal les fautes d’orthographe, « langage sms », l’ironie • Pas utile à l’échelle d’un message, mais pour des tendances plus larges, des comparaisons • Remarque : on s’exprime plus pour râler que pour complimenter !
  • 76. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 76/145 Forem Lynda Lemay AFSCA Sentiment analysis
  • 77. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 77/145 Sentiment analysis • Évolution ? 3 mars 17-18 février Janvier
  • 78. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 78/145 Sentiment analysis: lessons learned • Donne une information générale, mais technique pas encore très mature en français • Pas utilisable plus « localement »
  • 80. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 80/145 Network analytics : acteurs 12 janvier Aucune réaction 29 janvier Beaucoup de visites uniques Posts Users Comment, like
  • 81. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 81/145 Networks analytics : commentaires 80% users : 1 commentaire 95,5% : ≤ 5 commentaires Posts Users Comment
  • 82. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 82/145 Network analytics : Smals (acteurs) Posts Users Comment, like
  • 83. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 83/145 Network analytics • On pourrait aller plus loin, avec ce qui est accessible sur la version Web mais pas avec l’API • On ne pourra trouver qu’une partie de l’information • Exemple : Relations d’amitié entre les « acteurs » ou les « likers » de la page
  • 84. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 84/145 Network analytics : liens d’amitié Approximation (25% connex. manquantes) Liste privée Liste publique Amitié
  • 85. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 85/145 Network analytics : liens d’amitié Approximation
  • 86. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 86/145 Autre exemple : Student@Work • Student@Work : application de l’ONSS pour les étudiants jobistes • Page Facebook sur laquelle tout le monde peut créer un post • Sert à la fois d’outil de communication et de « service desk » pour les problèmes techniques
  • 87. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 87/145 Student@Work : toutes les interactions Posts sans réponse Student@Work Posts populaires créés par S@W (visiteurs de passage) Posts Users Comment, like
  • 88. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 88/145 Student@Work : sans S@W Posts Utilisateurs La plupart des interactions : un user (qui ne revient pas) avec un post
  • 89. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 89/145 Student@Work : posts et commentaires Uniquement création et commentaires (pas likes) Les grappes : composées essentiellement de likes
  • 90. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 90/145 Network analytics: lessons learned • La grande majorité des commentaires viennent de gens de passage… • … et est condensée sur un seul post • Partie non négligeable des utilisateurs très sensible à la cause animale → pas représentatif de la population en général
  • 91. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 91/145 Page Facebook : l’essentiel Analyse de fréquence : identification des pics de réaction et des évènements liés Sentiment analysis : polarité du message. OK pour analyse macro uniquement Topic extraction : De quoi parle-t-on + évolution Network analytics : qui réagit, à quoi
  • 92. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 92/145 Page Facebook : les outils Pour les gestionnaires de page : - Facebook - Hootsuite (subset+€) Pour analyser d’autres pages : - Engagor (15j+€) - SimplyMeasured (15j+€) - Quintly (15j+€) Pour les plus branchés : API Outils classiques : orientés « performances », plus qu’analyse de problèmes
  • 93. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 93/145 Questions ?
  • 94. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 94/145 Pause !
  • 95. www.socialseomanagement.com Use case 3 : Network Analytics
  • 96. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 96/145 Table des matières Introduction Page Facebook Mots-clé Use case 3 : Network Analytics Introduction Structure Centralité Inférence Reconstruction Évolution Conclusions Vandy Berten
  • 98. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 98/145 Contexte • Les médias sociaux (Facebook en particulier) regorgent d’informations sur leurs utilisateurs : – Des informations qu’ils fournissent eux-mêmes – Des informations fournies par leurs « amis » – Des informations « implicites » (induites ou structurelles) • On ne peut pas totalement contrôler cette information : – Parce qu’elle est divulguée par d’autres – Parce qu’elle est implicite, et qu’on peut la reconstruire à partir d’autres éléments – Parce qu’on en est en général pas conscient
  • 99. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 99/145 Intérêt • Conscientiser sur l’information personnelle disponible • Informations très précieuses pour le hacking par « social engineering », l’usurpation d’identité • Mieux connaitre sa communauté (Facebook, Twitter…) • Améliorer la lutte contre la fraude et la criminalité Avec certaines techniques, il est facile de « dépasser les limites » (P/R vie privée ou EULA Facebook)… à utiliser avec précaution ! Nous utiliserons des informations publiques, sans aucune technique de hacking ou phishing
  • 100. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 100/145 Médias sociaux et délits • Les médias sociaux de plus en plus souvent utilisés dans des enquêtes (policière, fiscales…) • Rarement un preuve, aide à orienter une enquête • Techniques similaires basées sur les réseaux (liens entre entreprises, clients…) déjà utilisées (Fisc, ONSS) • Exemples : – Vol de billet à la Banque de France (sept 2014) : publication de photo de vacances, nouvelle cuisine… – De nombreux délinquants publient eux-mêmes les photos de leur méfaits • Facebook ne fournit pas toujours des données à la justice (Belgique : +/- 30% de refus) ! https://govtrequests.facebook.com/
  • 101. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 101/145 Médias sociaux et fraude • Hypothèse : si on identifie quelques fraudeurs/suspects dans un groupe « fortement connecté », s’intéresse à l’ensemble du groupe • Parmi une population de fraudeurs, identifier les plus influents, les leaders, les « connecteurs » • Recherche d’un « chemin » entre deux personnes (ami, ami d’ami…) • Recherche des liens d’amitié entre un groupe de personnes – Identifiés hors Facebook – Membre d’un groupe, fan d’une page
  • 102. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 102/145 Fil rouge • Pour la suite, on se place dans la peau d’un « attaquant » visant la « cible » vandy.berten : – N’a jamais publié de photo (hormis le profil), ne s’y est jamais taggué (mais l’a été par d’autres) – A « sécurisé » son compte de façon à cacher ses photos, son mur, sa liste d’amis aux « inconnus » – N’a rien mis de visible sur son profil (parcours scolaire…) • On va reconstituer : – Ses groupes d’amis – Ses amis proches, sa famille – Son parcours scolaire, (une partie de) ses loisirs • À partir d’un compte « bidon », sans aucun ami
  • 103. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 103/145 Préambule : « Graph Search » • « Graph Search » : (nouvel) outil de Facebook permettant de faire des recherches (version US) • Par exemple : – « Photos of XXX » – « Photos commented on by XXX » – « XXX's friends who work at Smals » – « People tagged in XXX's photos » – « XXX’s events », « Events that were attended by XXX » – « People who like Hitler Adolph and work at Smals » • Trouve des informations déjà accessibles, mais noyées dans la masse jusqu’ici
  • 104. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 104/145
  • 105. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 105/145 Liste d’amis : très instructif • Liste d’amis : ressource très précieuse • Permet d’identifier les groupes sociaux : famille, travail, étude, loisir… • Permet identifier les liens « forts », ainsi que l’influence/la popularité (notion de centralité) • Même masquée, la liste d’amis peut être reconstruite en grande partie • On peut étudier les « structures » autour d’une personne, d’une page ou d’un groupe
  • 106. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 106/145 Réseau personnel • Réseau de niveau 1.5 : la « cible », ses amis et les connexions entre eux • Pas les amis de amis (non-mutuels) • Facebook : relation symétrique (≠ Twitter) • Via API : uniquement son propre réseau
  • 107. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 107/145 Réseau personnel Suite : • Structure • Centralité • Inférence • Reconstruction • Évolution
  • 108. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 108/145 Outils • On va se servir de l’outil « Gephi » de manipulation/visualisation de graphes • 1er étape : importation d’un compte personnel via l’API (ou une application comme « Netvizz ») • Une partie de la suite se base sur un « crawling » de la version Web
  • 109. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 109/145 Gephi
  • 111. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 111/145 Structures de communauté Communauté « connexe » Agglomérat de petits groupes Communauté peu « connexe »
  • 112. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 112/145 Structures de communauté • À partir d’un graphe, on peut identifier des « partitions » (ou communauté, ou cluster) : sous-ensemble particulièrement connecté • Correspond en général à des « groupes sociaux » dans la réalité : famille, amis des études, d’un loisir, … • Pour comprendre à quoi correspondent ces groupes, il faudra faire de l’inférence
  • 113. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 113/145 Partitions
  • 115. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 115/145 Mesure de centralité • Différentes façons de mesurer l’importance, la popularité, l’influence, la centralité… d’un acteur (personne, page, post, tweet…) • Une personne peut être importante « dans le monde », mais pas dans un groupe social particulier… et vice-versa • Permet aussi d’identifier les « connecteurs » entre plusieurs groupes sociaux
  • 116. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 116/145 Mesure de centralité Degree centrality : #voisins, globalement (#likes, friends, followers…) ou localement (#mutual friends) Betweenness centrality : importance en tant qu’intermédiaire (# de shortest path passant par le noeud) Closeness centrality : Inverse de la distance moyenne à tous les autres noeuds Eigenvector centrality : PageRank de Google http://en.wikipedia.org/wiki/Centrality
  • 117. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 117/145 Mesure de centralité
  • 119. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 119/145 Inférence • Idée : repérer au sein d’une « partition » des informations (publiques) similaires pour caractériser la partition • Puisque la « cible » fait partie de toutes ses partitions, elle possède (probablement) la même caractéristique • Exemple : – 2% des « amis » travaillent (« publiquement ») chez « Smals » → pas significatif – Partition « P » : 40 % travaillent chez « Smals » (info cachée chez les autres), les autres : 0-1% – Partition « P » : probablement les collègues de « Smals » … comme la cible ! (passé ou présent) • Nécessite des techniques avancées, hors API, pas accessibles en quelques clics ! • On sort du cadre des EULA de Facebook !
  • 120. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 120/145 Inférence (About / Work & Education) • Section « About / Work & Education »: publique dans +/- 40% • Pas accessible via l’API, mais sur la version web
  • 121. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 121/145 Inférence (About / Work & Education) Saint-Dominique ULB Taille partition % publique Total 562 38% Partition 1 142 53% Partition 2 83 46% Partition 3 42 50% Partition 4 95 37% 53% 25% 4% 3% 0% 57% 8% 5% 12% 12%
  • 122. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 122/145 Inférence (Groupes) • Idem pour les groupes : appartenance à un groupe (non secret) toujours publique • Graph search : « Vandy Berten’s groups » • Exemple : présence de « Croix-Rouge », « CRB » ou « CR » dans les noms de groupe : – En général : 13% – 3 partitions avec 28%, 35% et 50% – Toutes les autres : 0-1% • Alternative possible : se baser sur les « likes »
  • 123. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 123/145 Inférence (Famille) • En regardant les noms de famille, on peut parfois identifier le réseau « familial » • En général, peu de personnes ont le même nom de famille dans un groupe social … sauf s’il s’agit d’une famille ! • Si le top 3 des noms de famille d’un groupe comprend une proportion élevée, c’est sans doute le groupe familial
  • 125. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 125/145 Reconstruction • On pense parfois pouvoir contrôler ce qui se trouve à son propos sur Facebook • Problème : pas de contrôle sur les autres • Liste d’amis : deux méthodes pour reconstruire une « liste cachée » – Créer un profil « bidon », inviter la cible, puis regarder « People You May Know » (PYMK) – Grâce aux « mutuals friends »
  • 126. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 126/145
  • 127. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 127/145 Reconstruction • Sur la version Web, on voit plus de choses qu’avec l’API • Cas « simple » : liste d’amis visible • Sinon : on apparait dans la liste d’amis de ses (certains de ses) amis ! • Dans quelques conditions, on peut obtenir les « mutual friends » de deux profils • En partant de quelques amis connus, on peut reconstituer une grande partie du réseau d’un compte, en quelques minutes, sans en être ami
  • 128. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 128/145
  • 129. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 129/145 Reconstruction • Liste d’amis de « T » privée • Liste d’amis de « A » publique • La liste d’amis de « T » est vide, mais sur la liste de « A », on voit « T » T A
  • 130. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 130/145
  • 131. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 131/145 Reconstruction • On soupçonne B d’être proche de T (ami direct ou non) • On demande à FB : « Mutual friends of T and B » … il répond A → A et T sont donc amis • On réessaye avec A : « Mutual friends of T and A »… T B A
  • 132. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 132/145 Reconstruction de vandy.berten • Depuis ce compte (via API) : 561 noeuds (298 pub, 53%), 5059 connexions • Si liste privée, « People tagged in… » + « PYMK » : 296 noeuds (52,9%, 99% de ce qui est public !) 1638 connexions (32%) • Si liste publique, par « crawling » : 561 noeuds (100%), 4136 connexions (81%)
  • 133. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 133/145 Reconstruction Réseau reconstruit Réseau original • Entre 85 et 100% des noeuds ont été placés dans la « bonne » partition • Plus de la moitié des différences viennent de deux partitions « proches »
  • 134. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 134/145 Reconstruction : deviner • Peut-on « suspecter » d’autres personnes d’êtres amies avec la cible ? • Hypothèse : deux personnes qui ont beaucoup d’amis communs ont des chances d’être également amis • On recherche les amis d’amis fréquents • Si beaucoup d’amis de T disent être amis avec A (même si A et T cachent leur liste), il y a des chances que A et T se connaissent
  • 135. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 135/145 Reconstruction : deviner Amis d’amis Amis de la « cible » A B C F E D
  • 136. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 136/145 Reconstruction : deviner • Sur vandy.berten : • Impossible de le savoir en général ! • Autre possibilité : « Friendship page » (https://www.facebook.com/user1?and=user2) Seuil Amis FB (cachés) Connus (hors FB) Inconnu/ vague Total 15 61 8 3 72 10 120 32 21 173
  • 138. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 138/145 Évolution • On peut voir depuis quand deux personnes sont « Facebook friends » • www.facebook.com/o*****n?and=vandy.berten : • La dynamique des réseaux est très souvent instructive
  • 139. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 139/145 Et alors ? • On pourrait appliquer la même technique pour deviner la religion, les préférences politiques ou l’orientation sexuelle de quelqu’un • Sans doute pas un problème chez nous … pas anodin si on a des amis vivant dans des régimes plus « sévères » • Même chez nous : un « cambrioleur » pourrait se servir des profils de vos amis pour savoir que vous n’êtes pas chez vous ! • Usurpation d’identité facilitée
  • 140. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 140/145 Amélioration du phishing ? Bonjour XXX Ce week-end j'ai discuté avec YYY et ZZZ à la fête de AAA, qui m'ont dit que tu serais intéressé par cette application/ce site web … Votre nom Un ami avec une haute centralité de degré Autre ami ayant bcp d'amis en commun avec YYY Grâce à des photos ou évènements trouvés par « Graph Search »
  • 141. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 141/145 Network analytics: l’essentiel Grande quantité d’informations sur des individus et sur leur relations Même avec une « cible » méfiante Peut être long, mais pas de matériel complexe/puissant Petit exemple des possibilités montrées ici
  • 142. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 142/145 Network analytics: les outils Extraction compte : - Netvizz - NameGenWeb - Twitter : NodeXL Analyse de son compte : - wolframalpha.com/ facebook - Touchgraph Visualisation, partitions, centralité… : Gephi Pour les plus branchés : - API Facebook - Web crawling : selenium (Python)
  • 144. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 144/145 Conclusions Souvent, méta-information plus intéressante que l’info elle-même Les citoyens s’expriment sur les médias sociaux, il est nécessaire de les suivre Prise de connaissance d’un problème/évènement plus rapide qu’avec les médias « traditionnels » La quantité de données rend l’information difficile à comprendre… mais des outils sont disponibles
  • 145. Intro – Mots-clé – Page Facebook – – Network Analytics – Conclusions Oct. 2014 - 145/145 Vandy Berten 02/787.57.32 vandy.berten@smals.be More on Smals Research : Website : www.smals.be Blog : www.smalsresearch.be Twitter : @SmalsResearch Blog (www.smalsresearch.be/author/berten/) - Contacter un citoyen sur Facebook ? - La vie privée selon Facebook - Ce qu’un réseau social peut nous apprendre - Facebook : peut-on vraiment cacher sa liste d’amis ? [6/11]