Etude expérimentale de la structure d'un hypertexte obtenu par agrégation

Introduction

Dans ce document, il est rendu compte de la structure du graphe associé à un hypertexte construits par agrégation [1]. Les manipulations sont présentées dans [2] et utilisée pour une analyse de la structure d'hypertextes créés à partir des relations document-concept [3].

L'hypertexte

L'hypertexte est produit par la commande agreg(998,100). Création de 998 Ui (à partir d'un noyau de 2 Ui) et de 100 itérations de "recuit".

Outre 1000 sommets, le graphe (des Ui) associé contient 4948 arêtes.

Les figures 1 et 2 donnent la distribution des liens "sur" et "à partir" d'une Ui.

fig 1. Distribution du nombre de liens sur les Ui

fig 2. Distribution du nombre de liens à partir des Ui

Selon [4], la distribution des liens (ici "sur") suit une loi de puissance. On peut le vérifier de façon grossière en comparant la distribution effective et deux distributions théoriques.

x 1 2 3 4 5 6 7 8 9 10
  711 156 65 40 14 8 2 2 1 1
27000/x^4.7 27000 1038 154 40 14 6 3 1.5 1 0.5
2665* 0.35^x 932 326 114 40 14 5 2 0.6 0.2 0.07
Connexité du graphe non orienté

La multiplicité de la valeur propre 0 du laplacien combinatoire est 52. Le graphe est constitué de 51 sommets isolés et d'une composante connexe composée de 949 sommets.
Autorités et hubs

On observe quelques autorités (avec jusqu'à 58 liens rentrants), mais, "comparativement", ni hub, ni portail.

Structure papillon

Le CORE est consitué de 617 elements

Notes

(c) A. Favre & L.-O. Pochon, IRDP, 2004