L’analyse des réseaux sociaux permet de mieux comprendre le comportement des acteurs et des communautés : quelle est la place de l’acteur ((Les acteurs peuvent être des sites web, des personnes dans un site de réseau social, ou des mots clés.)) au sein de l’ensemble ? Est-il central ? périphérique ? Fait-il le lien entre différentes communautés ? Comment est organisée la communauté ? En plusieurs groupes ? Est elle homogène ? Dense ?

Une image du buzz #jeansarkozy partout sur TwitterCette analyse permet de comprendre en profondeur le fonctionnement des communautés en ligne. C’est une méthode d’analyse quantitative puissante qui complète l’empirisme avec lequel les community manager animent leurs communautés. Elle permet de faire apparaitre des dynamique après coup ou

L’analyse des réseaux sociaux se fait en trois temps distincts : la récupération des données, leur analyse et leur visualisation. Chaque temps a ses outils propres même si certains outils combinent plusieurs temps.

Sur de petits graphes, il est possible de faire la récupération des données a la main. Mais cela devient fastidieux dès l’instant ou l’on a un nombre important de données à renseigner. Par ailleurs, avec les sites de réseaux sociaux, les données sont souvent déjà là. Ceux qui savent programmer pourront les récupérer en discutant avec l’API. Les autres utiliseront des outils dédiés.

Les données qui sont récupérées concernent le lien : qui est lié à qui ou à quoi, mais on pourra également s’intéresser au volume d’information produits, à sa fréquence et faire quelques corrélations. Cela permettra de répondre a des questions comme vaut-il mieux avoir un petit réseau extrêmement dense ou un large réseau disparate ? Y-a-til un lien entre la taille d’un réseau social et la volume d’information produit par l’acteur ?

 

image Navicrawler est une extension Firefox qui explore le contenu et la structure des pages web. Il est développé principalement par Mathieu Jacomy  sous licence GPL 3. L’exportation des données se fait en plusieurs formats : Guess, Pajek, et Navicrawler. Un des choses sympathiques de Navicrawler est qu’il est développé par des français, ce qui facilite grandement les choses. Sur Web-mining.fr vous trouverez une communauté accueillante qui vous soutiendra dans vos projets Navicrawler

Un guide méthodologique complet de Navicrawler (PDF) réalisé par TIIC-Migrations | La documentation de la version 1.0de Navicrawler (PDF) | L’extension Firefox Navicrawler  1.6 beta 4 *Compatible Firefox 3.5 | Proposition de méthodologie

 

Navicrawler n’assurant que la récolte des données, leur traitement doit se faire avec un autre programme : Pajek, Guess, Network Workbench Tool, ou NodeXL.

 

 

Guess est surtout un outil de rendu, mais il permet également de faire quelques calcul. De nombreux scripts ont été développés et facilitent un peu la prise en main. Mais d’une façon générale, Guess est pour ceux qui ont vu la beauté de la ligne de commande. Un langage assez similaire à Python permet d’exécuter les calculs, mais surtout de travailler sur les visualisations

Le tutorial de Guess

 

Pajek est le symétrique de Guess. Il permet surtout de faire des calculs. C’est l’outil d’analyse le plus complet, et sa maitrise demande un peu de travail. La lecture de Exploratory social network with Pajek est chaudement recommandée. Le livre est accompagné d’exemples et d’exercices et permet de s’imprégner peu a peu de la théorie des réseaux sociaux.

Un tutorial Pajek |Le manuel Pajek

 

Network Worlbench Tools est une sorte de couteau suisse de l’analyse des réseaux sociaux. Il permet de faire quelques calculs et propose différent types de rendu de graphes. Les différentes étapes de l’analyse sont clairement tracées

 

NodeXL est un outil open-source développé principalement par Marc Smith et son équipe. Il regroupe les trois moments de l’analyse des réseaux sociaux : la récupération des données, leur traitement et la visualisation. L’ensemble des opérations s’effectue à l’intérieur d’une page Excel. NodeXL permet de récupérer des données sur Twitter à partir d’un mot clé, le réseau social d’un compte, sur FlickR ou encore a partir des archives mail.

NodeXL permet d’effectuer les calculs les plus classiques (degrees, centrality, betweeness…) mais sa force réside plutôt dans la combinaison de l’importation des données et de leur traitement dans un même outil. Un module permet de modifier dynamiquement le graphe en agissant sur des curseurs

NodeXL a un tutorial et une feuille de route.

 

Il existe toute une série d’outils, certains payants, d’autres gratuits. Ils sont recensé sur la page Wikipedia dédiée  aux programmes d’analyse de réseaux sociaux et vous trouverez sans doute votre bonheur.