{"id":560,"date":"2017-05-31T17:01:33","date_gmt":"2017-05-31T15:01:33","guid":{"rendered":"http:\/\/wp.unil.ch\/histoireparlesdonnees\/?page_id=560"},"modified":"2017-05-31T17:27:34","modified_gmt":"2017-05-31T15:27:34","slug":"analyse-et-interpretations","status":"publish","type":"page","link":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/perceptions-du-conflit-israelo-palestinien-dans-la-gazette-de-lausanne-et-le-journal-de-geneve\/analyse-et-interpretations\/","title":{"rendered":"Analyse et interpr\u00e9tations"},"content":{"rendered":"<div style=\"background-color: #ffd9f2;padding: 20px 20px\">\n<h2>Table des mati\u00e8res<\/h2>\n<ul style=\"margin-bottom: 0;padding-bottom: 0\">\n<li><a href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/perceptions-du-conflit-israelo-palestinien-dans-la-gazette-de-lausanne-et-le-journal-de-geneve\">Pr\u00e9sentation du projet<\/a><\/li>\n<li><a href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/perceptions-du-conflit-israelo-palestinien-dans-la-gazette-de-lausanne-et-le-journal-de-geneve\/analyse-et-interpretations\/\">Analyse et interpr\u00e9tation<\/a><\/li>\n<li><a href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/perceptions-du-conflit-israelo-palestinien-dans-la-gazette-de-lausanne-et-le-journal-de-geneve\/critique-des-methodes-utilisees\/\">Critiques des m\u00e9thodes utilis\u00e9es<\/a><\/li>\n<li><a href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/perceptions-du-conflit-israelo-palestinien-dans-la-gazette-de-lausanne-et-le-journal-de-geneve\/bibliographie\/\">Bibliographie<\/a><\/li>\n<\/ul>\n<\/div>\n<h2>Analyse digitale et interpr\u00e9tations<\/h2>\n<h3>Objectif<\/h3>\n<p>Notre \u00e9tude du corpus se d\u00e9roule en deux parties. Premi\u00e8rement, nous comparons l\u2019\u00e9volution de certains champs lexicaux dans les deux journaux, et nous identifions des groupes de mots li\u00e9s par articles communs dans le corpus. Ce travail est effectu\u00e9 \u00e0 l\u2019aide d\u2019IRaMuTeq, un logiciel d\u2019analyse de texte. D\u2019autre part, nous effectuons une analyse de sentiments simple et non-supervis\u00e9e.<\/p>\n<h3>Pr\u00e9paration des donn\u00e9es<\/h3>\n<p><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/02\/1_image2.png\" width=\"287\" height=\"203\" \/><\/p>\n<p><em>Figure 2: Sch\u00e9ma de donn\u00e9es associ\u00e9es \u00e0 un article dans la base de donn\u00e9es Le Temps<\/em><\/p>\n<p>Afin d\u2019utiliser IRaMuTeQ, nous avons transform\u00e9 les donn\u00e9es acquises de l\u2019archive <em>Le Temps<\/em> en corpus lisible par le logiciel avec un script Python, puis agr\u00e9g\u00e9 tous les articles ensemble. Nous \u00e9cartons aussi les articles avec plus de 75% de caract\u00e8res sp\u00e9ciaux<a id=\"fnref4\" class=\"footnoteRef\" href=\"#fn4\"><sup>4<\/sup><\/a>. Apr\u00e8s une analyse d\u2019un \u00e9chantillon, il nous a paru judicieux de les \u00e9liminer de notre corpus (soit une dizaine d\u2019articles par mois).<\/p>\n<h3>Analyse textuelle avec IRaMuTeQ<\/h3>\n<h4>Classification et similitudes<\/h4>\n<p>A l\u2019aide d\u2019IRaMuTeQ, nous appliquons la m\u00e9thode Reinert de classification hi\u00e9rarchique descendante. Celle-ci fonctionne de la mani\u00e8re suivante\u00a0:<\/p>\n<ul>\n<li>Segmenter le texte.<\/li>\n<li>Observer la distribution par segment de chaque forme apr\u00e8s lemmatisation.<\/li>\n<li>Classer les segments de texte dans des cat\u00e9gories diff\u00e9rentes en fonction des mots qu\u2019ils contiennent.<\/li>\n<\/ul>\n<p>Une fois les classes identifi\u00e9es, nous pouvons \u00e9tudier la sp\u00e9cificit\u00e9 de certains mots au fil du temps et ainsi observer comment \u00e9volue le vocabulaire des deux journaux.<\/p>\n<p>Sur notre corpus, effectuons une classification \u00e0 trois niveaux. La premi\u00e8re, en 8 classes, concerne l\u2019ensemble du corpus (voir figure 3) et permet d\u2019effectuer un premier tri des segments de texte.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/02\/1_image3.png\" alt=\"sch\u00e9matisation de la classification, en rouge les classes explor\u00e9es\" width=\"794\" height=\"507\" \/><\/p>\n<p><em>Figure 3: sch\u00e9matisation de la classification, en rouge les classes explor\u00e9es<\/em><\/p>\n<p>Nous restreignons ensuite notre corpus aux segments de texte de la classe \u00ab\u00a0affaires \u00e9trang\u00e8res\u00a0\u00bb et effectuons une nouvelle classification (\u00e0 7 classes) pour raffiner notre analyse. Enfin, en choisissant la classe \u00ab\u00a0Moyen-Orient\u00a0\u00bb, nous observons que celle-ci concerne aussi des textes relatifs \u00e0 des \u00e9v\u00e8nements dont la pertinence au conflit isra\u00e9lo-palestinien est discutable (ex\u00a0: sur l\u2019Arabie Saoudite). Nous effectuons une derni\u00e8re classification (7 classes) pour identifier les segments de textes ne concernant que les relations isra\u00e9lo\u2013palestiniennes (environ 3775 segments).<\/p>\n<p>Nous dressons aussi ci-dessous le graphe des occurrences des mots de cette classe.<a id=\"fnref5\" class=\"footnoteRef\" href=\"#fn5\"><sup>5<\/sup><\/a> En utilisant Gephi et l\u2019algorithme Fruchterman-Reingold, nous obtenons la figure ci-dessous. La taille d\u2019un mot est proportionnelle \u00e0 sa fr\u00e9quence d\u2019occurrence, un lien est trac\u00e9 entre deux mots s\u2019ils se retrouvent dans le m\u00eame segment de texte. L\u2019\u00e9paisseur est proportionnelle au nombre de segments partag\u00e9s.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/02\/1_image4.png\" alt=\"C:\\Users\\arman\\Desktop\\Nouveaudossier\\18209582_1397009307054549_1753691643_o.png\" width=\"564\" height=\"564\" \/><\/p>\n<p><em>Figure 4: Graphe de cooccurrences de la classe \u00ab Isra\u00ebl-Palestine \u00bb<\/em><\/p>\n<p>L\u2019analyse de similitudes permet de visualiser les liens entre les formes d\u2019une m\u00eame classe. Elle donne un aper\u00e7u global de la vision des segments concernant les relations isra\u00e9lo-palestiniennes. Le graphe permet aussi de visualiser la pertinence de la classification.<\/p>\n<p>Sur toute la p\u00e9riode, le mot \u00ab Isra\u00e9lien \u00bb est le plus pr\u00e9sent dans le sous-corpus et a un r\u00f4le central car il est reli\u00e9 \u00e0 la plupart des formes observ\u00e9es. Evidemment, le champ lexical de la guerre est fortement repr\u00e9sent\u00e9, d\u00fb aux dates que nous avons s\u00e9lectionn\u00e9es et qui sont des p\u00e9riodes de conflits. Outre ce champ lexical, on observe aussi un lien fort entre le mot \u00ab\u00a0Isra\u00e9lien\u00a0\u00bb et les mots tels que \u00ab\u00a0territoire\u00a0\u00bb, \u00ab\u00a0arabe\u00a0\u00bb, \u00ab\u00a0gouvernement\u00a0\u00bb, \u00ab\u00a0occuper\u00a0\u00bb, \u00ab\u00a0fronti\u00e8re\u00a0\u00bb, \u00ab\u00a0g\u00e9n\u00e9ral\u00a0\u00bb et \u00ab\u00a0secr\u00e9taire\u00a0\u00bb (pour \u00ab\u00a0secr\u00e9taire g\u00e9n\u00e9ral\u00a0\u00bb). On comprend donc qu\u2019il s\u2019agit l\u00e0 de la l\u00e9gitimit\u00e9 de l\u2019\u00e9tat isra\u00e9lien, de l\u2019\u00e9tat de ses fronti\u00e8res ainsi que de ses relations avec le monde arabe. On peut donc d\u00e9j\u00e0 observer que de mani\u00e8re g\u00e9n\u00e9rale, les journaux auront une vision du conflit davantage centr\u00e9e sur les Juifs et l\u2019\u00e9tat isra\u00e9lien que sur la Palestine ou le monde arabe. On notera par ailleurs l\u2019absence du mot \u00ab Palestine \u00bb ou du champ lexical de la d\u00e9colonisation.<\/p>\n<h4>Sp\u00e9cificit\u00e9s<\/h4>\n<p>Pour compl\u00e9ter notre analyse sur Iramuteq, nous \u00e9tudions aussi la sp\u00e9cificit\u00e9 de certains mots au fil du temps (la sp\u00e9cificit\u00e9 d\u2019un mot est un indicateur de sa pertinence \u00e0 une variable, ici l\u2019ann\u00e9e de publication) ; les valeurs transform\u00e9es \u00e0 l\u2019intervalle [-1, 1] sont donn\u00e9es par la couleur plus ou moins fonc\u00e9e selon qu\u2019une forme est plus ou moins sp\u00e9cifique \u00e0 une ann\u00e9e. Nous avons choisi des mots qui nous paraissent pertinents pour \u00e9valuer l\u2019opinion exprim\u00e9e par les journaux.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/02\/1_image5.png\" alt=\"C:\\Users\\arman\\Desktop\\Nouveaudossier\\plop2.png\" width=\"601\" height=\"584\" \/><\/p>\n<p>Le mot \u00ab\u00a0colonie\u00a0\u00bb, par exemple, voit sa sp\u00e9cificit\u00e9 diminuer progressivement entre 1948 et 1967, indiquant que le th\u00e8me colonial \u00e9tait plut\u00f4t d\u2019actualit\u00e9 en 1948 et qu\u2019il est devenu de moins en moins trait\u00e9 au fil du temps. Cependant, cette analyse est biais\u00e9e par le contexte historique d\u2019apr\u00e8s-guerre, o\u00f9 la question des colonies n\u2019est pas sp\u00e9cifique aux Isra\u00e9liens mais concerne toute l\u2019Europe.<\/p>\n<p>Il est donc int\u00e9ressant de consid\u00e9rer plusieurs mots en m\u00eame temps, comme par exemple \u00ab\u00a0juif\u00a0\u00bb et \u00ab\u00a0isra\u00e9lien\u00a0\u00bb. La premi\u00e8re forme est tr\u00e8s pr\u00e9sente en 1948 et diminue en 1949 avant de disparaitre en 1956. La deuxi\u00e8me forme quant \u00e0 elle apparait en 1949 et augmente fortement jusqu\u2019en 1956-1957. On peut donc penser \u00e0 une substitution dans le vocabulaire du mot \u00ab\u00a0juif\u00a0\u00bb par le mot \u00ab\u00a0isra\u00e9lien\u00a0\u00bb. De plus, nous observons une diminution de la pertinence du mot \u00ab\u00a0Palestine\u00a0\u00bb dans les journaux. La perception du conflit se concentre sur la vision d\u2019Isra\u00ebl et moins sur celle de la Palestine. Le changement de sp\u00e9cificit\u00e9 pour les formes \u00ab\u00a0juif\u00a0\u00bb et \u00ab\u00a0isra\u00e9lien\u00a0\u00bb peut aussi s\u2019expliquer par une \u00e9volution du langage dans le monde occidental, qui refl\u00e8te quand m\u00eame un changement de mentalit\u00e9 et d\u2019opinion quant \u00e0 la l\u00e9gitimit\u00e9 de l\u2019\u00e9tat d\u2019Isra\u00ebl.<\/p>\n<p>D\u2019autres formes en relation avec le conflit ont aussi \u00e9t\u00e9 ajout\u00e9es. Ainsi on observe que \u00ab\u00a0Isra\u00ebl\u00a0\u00bb reste stable au cours du temps, ce qui renforce l\u2019id\u00e9e que le changement de \u00ab\u00a0juif\u00a0\u00bb vers \u00ab\u00a0isra\u00e9lien\u00a0\u00bb n\u2019est pas qu\u2019une \u00e9volution linguistique. Le mot \u00ab\u00a0fronti\u00e8re\u00a0\u00bb conserve une sp\u00e9cificit\u00e9 relativement stable, sugg\u00e9rant que le sujet ne quitte pas l\u2019actualit\u00e9. La sp\u00e9cificit\u00e9 de la forme \u00ab\u00a0arabe\u00a0\u00bb est haute dans les ann\u00e9es o\u00f9 le conflit est actif, mais perd rapidement sa pertinence apr\u00e8s.<\/p>\n<p>Ces diff\u00e9rents \u00e9l\u00e9ments laissent penser que le traitement du conflit isra\u00e9lo-palestinien commence en 1948 avec des positions moins marqu\u00e9es que les ann\u00e9es qui suivent, qui se rapprochent progressivement du point de vue isra\u00e9lien.<\/p>\n<h3>Machine Learning<\/h3>\n<p>Pour r\u00e9pondre \u00e0 la question de l\u2019\u00e9volution des lignes \u00e9ditoriales des journaux, essayons un algorithme d\u2019analyse de sentiment pour estimer la positivit\u00e9 et n\u00e9gativit\u00e9 de certains mots relatifs au conflit, en particulier les mots \u00ab\u00a0Isra\u00ebl\u00a0\u00bb et \u00ab\u00a0Palestine\u00a0\u00bb. Par manque de donn\u00e9es lab\u00e9lis\u00e9es en fran\u00e7ais, nous n&#8217;avons finalement pas pu utiliser de m\u00e9thode supervis\u00e9e. Nous avons donc impl\u00e9ment\u00e9 un mod\u00e8le bas\u00e9 sur des m\u00e9thodes non-supervis\u00e9es, qui est pr\u00e9sent\u00e9 dans le papier de Lin et He.<\/p>\n<p>Le mod\u00e8le est le suivant :<\/p>\n<ul>\n<li>Nous supposons que chaque mot dans chaque texte exprime un sentiment positif avec une certaine probabilit\u00e9. \u00c0 partir de ces probabilit\u00e9s, nous d\u00e9duisons la probabilit\u00e9 qu&#8217;un article ait une connotation positive et celle qu&#8217;un mot exprime un sentiment positif en g\u00e9n\u00e9ral dans le corpus.<\/li>\n<li>Nous estimons ces probabilit\u00e9s utilisant un algorithme de type Markov Chain Monte Carlo. Pour ce faire, nous supposons que certains mots sont toujours positifs ou n\u00e9gatifs\u00a0: bon, bien, agr\u00e9able, \u2026 expriment toujours un sentiment positif, et\u00a0mal, mauvais, malheureux, \u2026\u00a0toujours un sentiment n\u00e9gatif.<\/li>\n<\/ul>\n<p><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/02\/1_image6.png\" alt=\"C:\\Users\\arman\\Desktop\\Nouveaudossier\\will.png\" width=\"601\" height=\"545\" \/><\/p>\n<p>Figure 5: En haut, les courbes relatives au mot \u00ab Palestine \u00bb et en bas les courbes relatives au mot &#8220;Isra\u00ebl&#8221;, les courbes bleues sont celles de la Gazette de Lausanne et en rouge du Journal de Gen\u00e8ve.<\/p>\n<p>Selon notre mod\u00e8le, le mot \u00ab Isra\u00ebl \u00bb est utilis\u00e9 \u00e0 38.4% de mani\u00e8re n\u00e9gative, contre 76.6% pour le mot \u00ab Palestine \u00bb. Dans les 950 articles o\u00f9 ces deux mots apparaissent ensemble, le premier est n\u00e9gatif \u00e0 39.2% du temps et 76.5% pour le second.<\/p>\n<p>Les r\u00e9sultats de notre mod\u00e8le confirment ce que l\u2019analyse pr\u00e9c\u00e9dente sugg\u00e9raient\u00a0: \u00ab\u00a0Palestine\u00a0\u00bb correspond \u00e0 un sentiment plus n\u00e9gatif que \u00ab\u00a0Isra\u00ebl\u00a0\u00bb, et il semblerait que (au moins pour la GDL) cette divergence s\u2019accentue. De mani\u00e8re g\u00e9n\u00e9rale, le JDG semblerait plus neutre, attitude \u00e0 laquelle on s\u2019attendrait de la part d\u2019un journal plus port\u00e9 sur les relations internationales.<\/p>\n<p><img vspace=\"&quot;10\" \/><\/p>\n<ul>\n<li><a href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/perceptions-du-conflit-israelo-palestinien-dans-la-gazette-de-lausanne-et-le-journal-de-geneve\">Page pr\u00e9c\u00e9dente<\/a><\/li>\n<li><a href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/perceptions-du-conflit-israelo-palestinien-dans-la-gazette-de-lausanne-et-le-journal-de-geneve\/critique-des-methodes-utilisees\/\">Page suivante<\/a><\/li>\n<\/ul>\n","protected":false},"excerpt":{"rendered":"<p>Table des mati\u00e8res Pr\u00e9sentation du projet Analyse et interpr\u00e9tation Critiques des m\u00e9thodes utilis\u00e9es Bibliographie Analyse digitale et interpr\u00e9tations Objectif Notre \u00e9tude du corpus se d\u00e9roule en deux parties. Premi\u00e8rement, nous comparons l\u2019\u00e9volution de certains champs lexicaux dans les deux journaux,<\/p>\n","protected":false},"author":1001264,"featured_media":0,"parent":81,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"_seopress_robots_primary_cat":"","_seopress_titles_title":"","_seopress_titles_desc":"","_seopress_robots_index":"","footnotes":""},"class_list":["post-560","page","type-page","status-publish"],"_links":{"self":[{"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/pages\/560","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/users\/1001264"}],"replies":[{"embeddable":true,"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/comments?post=560"}],"version-history":[{"count":0,"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/pages\/560\/revisions"}],"up":[{"embeddable":true,"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/pages\/81"}],"wp:attachment":[{"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/media?parent=560"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}