Voir le Web comme un espace

Alexis Jacomy @ SudWeb 2015

2013 - 2014
  • Analyse visuelle des réseaux
  • Développement de sigma.js
2014 - aujourd'hui
  • Cartographie des réseaux
  • Visualisation de données
  • Tableaux de bords

Un peu de contexte

Août 1991

Premier site Web mis en ligne au CERN

1998

Plus de deux millions de sites en mars
Moteurs de recherche

Septembre 1998

Aujourd'hui

Près d'un milliard de sites

et encore plus de pages Web et de liens hypertextes

Le Web est un énorme graphe

Un graphe, c'est :

Un ensemble de noeuds et un ensemble d'arcs
Chaque arc relie un noeud à un autre noeud

La distance entre A et B

Le nombre de noeuds qu'il faut traverser
pour aller de A à B

Cette distance permet

de cartographier les graphes

On peut explorer

Une petite portion du Web

Grâce à un crawler :

Robot qui parcourt le Web via les liens hypertextes en indexant les pages Web

Exemple :

Cartographier le Web des travailleurs du Web

1. Définition du territoire

Exemple: Les sites francophones des travailleurs du Web

2. Les sources

Exemple: Les résultats d'un moteur de recherche pour :
  • "développeur Web"
  • "intégrateur Web"
  • "designer Web"

3. On récupère les voisins de chaque site

4. On détermine les sites à garder dans le territoire

5. On crawl les nouveaux sites et on recommence

6. On s'arrête lorsque l'on n'a plus de site à crawler

Un outil : Hyphe

Un crawler sous licence libre piloté depuis une interface Web, développé par le médialab de Sciences-Po

Représenter le territoire exploré

en une cartographie du Web

Pour la position des noeuds :

Les Force-based layout

Permettent d'obtenir une projection du graphe, où les paires de noeuds proches dans le graphe sont proches dans la représentation

Pour la couleur des noeuds :

La détection de communautés

Permet d'identifier des communautés internes
Elles correspondent souvent à des thématiques plus précises

Pour la taille des noeuds :

La centralité

Permet d'identifier les noeuds les plus importants du graphe

Pour le traitement :

Gephi

Un logiciel libre d'analyse et de visualisation de réseaux

Pour la publication :

sigma.js

Une bibliothèque libre JavaScript pour l'affichage de graphes

Une cartographie interactive

du Web des travailleurs du Web

(cliquer ici)

Conclusion

Des méthodes qui permettent :

  • De voir le Web différemment
  • De reconnaître certaines formes redondantes
  • D'identifier de nouvelles communautés

Avec des biais certains

  • Choix subjectif des sources
  • Choix subjectif des frontières
  • Interprétation subjective

Et qui peuvent aussi s'appliquer

  • Aux réseaux sociaux
  • À des réseaux financiers
  • À la biologie
  • etc

Merci de votre attention

et bon SudWeb !

Crédits

Présentation réalisée avec Reveal.js

Permalien des slides :
jacomyal.github.io/sudweb-2015
Sources des slides et de la carte :
github.com/jacomyal/sudweb-2015

Page d'accueil

"Un peu de contexte"

"Le Web est un énorme graphe"

"On peut explorer une petite portion du Web"

"Représenter le territoire exploré"

"Conclusion"

"Crédits"