Interprétation

Table des matières

 

La classification hiérarchique descendante sur l’entièreté des Unes en prenant un jour par semaine aléatoirement et en considérant uniquement les articles ayant plus de 300 mots nous donne le dendrogramme suivant:

Fig. 3 Classes pour l’intégralité des Unes entre 1939 et 1997.

 

La grande taille de notre corpus nous permet d’extraire un grand nombre de classes aisément identifiables.

On peut ici grouper nos 22 classes en 4 catégories.

  • Le premier bloc, regroupant 30.1% des segments et composé des classes 20, 10, 9, 19, 8, 12 et 11, représente la culture. On y retrouve notamment la religion (en particulier la chrétienté) (classe 20) ainsi que l’art et la littérature (classe 19).
  • Le groupe composé des classes 21, 14, 13, 4, 1 et 22, comprenant 29.8% des segments, englobe les guerres de la deuxième moitié du 20e siècle.
  • La politique est constituée des classes 5, 6, 7, 15 et 16. Elle est moins représentée, avec 22.6% des segments.
  • Le dernier groupe, réunissant les classes 18, 17, 3 et 2, couvre l’industrie (classe 17) et la finance. C’est le plus petit groupe, avec 17.5% des segments.

 

->