Résultats et visualisation

Premières visualisations

Nous avons donc d’abord assigné à chaque année a entre 1950 et 1993 le noyau lexical entre a et les années a+1, a+5, a+10, puis nous avons calculé la distance entre ces noyaux selon une formule établie par Vincent Buntinx. Ceci a donné lieu à la visualisation ci-dessous.

Distances entre noyaux

Malheureusement, elle n’est pas évidente à interpréter. Cependant, il se trouve qu’en se penchant simplement sur la taille des noyaux, on obtient un graphique dont la forme est similaire (ci-dessous) et dont la lecture est plus intuitive. Une variation de la quantité de mots dans le noyau correspond à une évolution du langage. En particulier, une diminution de la taille du noyau, associée à une stabilité du nombre d’articles dans le corpus, dénote une accélération de l’évolution linguistique à cette période. De nouveaux termes sont introduits dans le langage, remplaçant les anciens.

Taille des noyaux

On constate sur le graphique ci-dessus une forte diminution de la taille des noyaux entre 1965 et 1975. Cette période correspond à la présence dans le débat public des initiatives Schwarzenbach. Les marqueurs rouges délimitent la période durant laquelle le nom Schwarzenbach est présent chaque année.

Il y a donc ici un intrigant parallèle. Il est cependant difficile d’attribuer l’évolution linguistique aux remous du débat public étant donné que l’on n’a qu’une donnée quantitative. Nous avons donc développé un moyen de découvrir quels mots ont le plus d’influence sur cette évolution.

Mots influents

L’idée est d’étudier l’apparition de nouveaux mots et de déterminer leur influence. Pour ce faire, on considère, pour chaque année a, le complément du noyau linguistique en a. On définit le complément Ca comme Ka,a+5\Ka-5,a (où \ dénote la différence d’ensembles). Il s’agit des mots qui seront utilisés chaque année pendant 5 ans après a, mais n’ont pas été utilisés chaque année pendant 5 ans avant a.

La prochaine étape consiste à assigner à chaque mot d’un ensemble Ca une valeur qui correspond à son influence. Nous avons décidé de considérer qu’un mot est influent si la moyenne de ses occurrences après sa première apparition est plus grande que celle d’avant, combiné avec la taille de son premier pic et le nombre d’années a’ dont ce mot appartient à l’ensemble Ca’.

Les deux visualisations suivantes sont issues de ce processus.

La première visualisation donne une image de l’évolution du noyau linguistique dans le temps. Chaque ligne représente un mot et elle est colorée en orange si le mot est présent dans le noyau, plus ou moins foncé selon la valeur d’influence calculée pour ce mot. Les mots influents y sont notés.

Elle offre une vision d’ensemble, au prix de la facilité de lecture. On y remarque toutefois une légère tendance cyclique dans la vie des mots. La fin des années 80 voit réapparaître un certain nombre de mots. On constate aussi que la majeure partie du vocabulaire nucléaire de notre corpus est établie entre les années 60 et 70. Cela correspond aussi à une augmentation du nombre d’articles en ces périodes.

Evolution du noyau

Afin de clarifier la lecture, nous avons généré une visualisation qui suit le même principe, mais où l’on ne considère que les trois mots les plus influents du complément Ca pour chaque année a.

Les trois mots les plus influents par année

On y constate l’apparition et l’influence de mots liés au thème de l’immigration et cette visualisation donne des indices quant à la politisation du langage. Les exemples Schwarzenbach, emprise et etre solidaire (le fait que être apparaisse sans accent est dû au traitement préalable du texte) montrent une influence (couleur foncée) de courte durée. Ils ne reviennent pas plus tard dans les noyaux et ne sont donc pas entrés dans le vocabulaire de manière permanente.

Forces et faiblesses

Les nouvelles visualisations permettent une analyse plus détaillée de notre problématique et présentent l’avantage d’être applicables à tout corpus et toute période.

Elles pêchent cependant par leur caractère expérimental, en particulier concernant la notion d’influence d’un mot. Il se pourrait aussi que le choix des mots-clés du filtre produise un biais dans les résultats. Il serait souhaitable de mener le travail plus loin et d’en raffiner les concepts.