Nous présentons dans cet article une analyse exploratoire dans l’objectif d’identifier les patrons de collaboration au sein des réseaux sociaux pour l’accès à l’information. Nous nous focalisons sur le cas de la gestion de crise au travers de la plateforme sociale Twitter. Nous nous appuyons ainsi sur deux types de crises : une catastrophe naturelle (l’ouragan Sandy) et une crise sanitaire (Ebola). Nous proposons une méthodologie en trois étapes qui permet 1) d’analyser les structures de collaboration, 2) d’identifier les thématiques de collaboration et 3) de présenter les réseaux latents de collaboration sur l’ensemble du réseau. Les résultats montrent paradoxalement que le périmètre de la collaboration est réduit, que les sujets sousjacents sont diversifiés et impliquent des utilisateurs qui peuvent être à l’interface de différents sujets.
An Exploratory Study on Using Social Information Networks for Flexible Litera...
Accès à l’information dans les réseaux sociaux : quelles formes de collaboration ?
1. Accès à l’information dans les
réseaux sociaux : quelles
formes de collaboration ?
Lynda Tamine, Laure Soulier, Lamjed Ben Jabeur , Frédéric
Amblard, Chihab Hanachi, Gilles Hubert, Camille Roth
1
2. Tendances des réseaux sociaux
2
20millions
241millions
1+milliard
200millions
540millions
300millions
Réseaux sociaux : outils de communication grand public
40% «Bavardage inutile »
38% Conversations
4% Nouvelles
Source: Pear Analytics,2009
source: Leverage 2015
3. Réseaux sociaux lors des crises
3
Ouragan Sandy
22 octobre 2012 – 31 octobre 2012
20Millions
People sent more than 20 million Tweets about the
storm between Oct 27 & Nov 1. Terms tracked:
"sandy", "hurricane", #sandy, #hurricane.
Communiquer durant une catastrophe naturelle
12. Collaboration pour la gestion de crise
• Besoins collectifs pour l’accès à l'information pour une meilleure
gestion de la crise
• Emergence de groupes de collaboration
• Intentions explicites (besoins en information)
• Intentions implicites (partages d’information)
• Médiation par les conventions utilisateurs (hashtag)
12
13. Quelles formes de collaboration?
• Hypothèses de recherche
Les acteurs sociaux ont besoin de collaborer directement pour gérer la
crise
Social + collaboration → amélioration du résultat collectif
• Questions de recherche
1. Comment construire les réseaux de collaboration ?
2. Quel modèle d’accès/partage collaboratif d’information en temps réel ?
• Etude exploratoire des réseaux de collaboration
• Etude structurelle : formes et motifs de collaboration
• Etude sémantique : objectifs et thématiques de collaboration
13
h1
h2
14. Collections de données
Tweets publiés lors de deux événements de crises à grande échelle
14
Ouragan #Sandy
Octobre 2012
Epidémie de virus #Ebola
2013-2014
Statistiques descriptives des jeux de données
1 1
15. Quel tweet utile pour la collaboration?
Annotation manuelle de tweets
15
Utile Inutile Ne sait pas
Collection Utile Inutile Ne sait pas Total
Ebola 1635 132 33 1800
Sandy 725 954 121 1800
Total 3546 1619 235 5400
16. Quel tweet utile pour la collaboration?
16
Classification automatique des tweets
Contenu1
• Nombre de Hashtags
• Nombre de médias partagés
• Nombre d’Urls
Typographie2
• Présence de mots tout en majuscule
• Le texte commence par une majuscule
• Présence de smiley
• Présence de lettre(s) dupliquée(s) (ex: looooool)
• Nombre de ponctuation (? !)
• Présence de forme(s) contractée(s) (ex : don’t)
Contenu de tweet3
• Nombre de termes du tweet présents dans le dictionnaire de chaque catégorie.
Dictionnaire = Top 1000 termes Useful ou Top 1000 termes Useless
#Hashtag
looool :)
17. Groupes de collaboration
Hypothèse
« Une collaboration est matérialisée par une conversation»
• Reconstruire une conversation
17
t
@ @RT
@
RT
@ @ @ RT
@
Cogan et al. (2012)
H
@ RT
18. Conversation profonde
18
Intervalle du temps entre la publication du tweet et la racine
∆t
Ratio commun (n∆t, (n+1)∆t)
Utilisateurs en commun pour une même conversation à deux contraintes temporelles successives
t
@RT
@ @
@
t0
t1
%
20. Saturation des conversations
20
les conversations «saturées» : ratio commun égal à 100% au bout de 2h
les conversations «non saturées» : ratio commun inférieur à 100%.
2h
23. Thèmes de collaboration
23
Extraction des sujets de conversations
• Algorithme d’allocation latente de Dirichlet (Blei et al., 2003)
• Nombre optimal de thèmes selon la mesure de perplexité
LDA
Conversations
tweet
tweet
…
tweet
27. Conclusion
• Analyse exploratoire des formes de collaboration
• Interactions sociales sur la plate-forme Twitter
• crises sanitaires et/ou naturelles
• échange instantané d’informations
• collaborations spontanées entre citoyens lors de différentes
• Analyse des réseaux de collaboration
• La taille des groupes de collaboration est réduite (2 à 7)
• Les sujets sont diversifiés
• Des utilisateurs impliqués dans divers sujets
27
28. Perspectives
• Médiation entre utilisateurs
• Répartition selon les intérêts, expertise et rôle
• Collaboration au-delà du voisinage sociale
• Définition d’une ontologie de collaboration
• Sujets de collaboration
• Actions de collaboration
28