Table des matières
Un des problème majeur auquel nous avons été confronté est la taille de notre corpus pour effectuer des analyses statistiques globales. L’ensemble des données ne pouvaient pas être chargé dans Iramuteq. Afin de pouvoir utiliser cet outil et en tirer des informations pertinentes, nous avons dû nous focaliser sur des intervalles de temps plus réduits, nous forçant à faire des choix sur des événements particuliers, ou effectuer un échantillonnage.
L’analyse locale consistant à aller rechercher dans les archives les événements associés à certains grands pics de certaines classes ne nous permettait pas d’en tirer des conclusion intéressante. Nous pouvions juste confirmer que nos pics sont bien représentatif de la réalité, rien de plus.
Avantages et inconvénients des représentations
Nous avons identifié plusieurs problèmes avec nos représentations. Les graphiques couvrant une grande période et représentant beaucoup de classes deviennent très vite illisibles. Pour que les histogrammes soient plus clairs, nous avons dû inclure une ou deux classes au maximum, mais dans ce cas il est plus difficile de voir les proportions entre les classes qui ne sont pas présentes sur le même graphique.