Tout hypertexte construit par agrégation peut être considéré comme un hypertexte créé à partir des relations document-concept

Introduction

Le but de cette brève note est de montrer que pour tout hypertexte H "naturel" dont U est l'ensemble des unités d'information, il est possible de construire un ensemble de concepts C tel que H = H(U,C).

Dit autrement: il est possible de construire des matrices D et R (document-concept) telles que la matrice du graphe de l'hypertexte primitif soit G = R*D' .

La construction est très simple, on prend pour C l'ensemble des liens. Si U={ui} et C={lj} on définit:

D = {dij} par dij = 1 si le lien lj arrive sur ui

R = {rij} par rij = 1 si le lien lj part de ui

A noter que la matrice d'incidence du graphe de H: B = R - D .

La recherche d'une structure de connaissance de tout hypertexte revient donc au problème général de la recherche de la structure d'un hypertexte "document-concept", ce qui à son tour revient à extraire une cohérence "globale" à partir de stuctures locales.

(c) A. Favre & L.-O. Pochon, IRDP, 2004