{"id":269,"date":"2017-05-24T17:25:43","date_gmt":"2017-05-24T15:25:43","guid":{"rendered":"http:\/\/wp.unil.ch\/histoireparlesdonnees\/?page_id=269"},"modified":"2017-05-24T19:07:03","modified_gmt":"2017-05-24T17:07:03","slug":"methodologie","status":"publish","type":"page","link":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/perception-de-la-decolonisation-et-des-nouvelles-independances-dans-la-gazette-de-lausanne-et-le-journal-de-geneve-durant-la-guerre-froide\/methodologie\/","title":{"rendered":"M\u00e9thodologie"},"content":{"rendered":"<p><a href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/perception-de-la-decolonisation-et-des-nouvelles-independances-dans-la-gazette-de-lausanne-et-le-journal-de-geneve-durant-la-guerre-froide\/\">Accueil<\/a>  |  <a href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/perception-de-la-decolonisation-et-des-nouvelles-independances-dans-la-gazette-de-lausanne-et-le-journal-de-geneve-durant-la-guerre-froide\/contexte-historique-et-problematique-du-travail\/\">Contexte historique et probl\u00e9matique du travail<\/a>  |  <a href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/perception-de-la-decolonisation-et-des-nouvelles-independances-dans-la-gazette-de-lausanne-et-le-journal-de-geneve-durant-la-guerre-froide\/methodologie\/\">M\u00e9thodologie<\/a>  |  <a href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/perception-de-la-decolonisation-et-des-nouvelles-independances-dans-la-gazette-de-lausanne-et-le-journal-de-geneve-durant-la-guerre-froide\/interpretation-des-resultats\/\">Interpr\u00e9tation des r\u00e9sultats<\/a>  |  <a href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/perception-de-la-decolonisation-et-des-nouvelles-independances-dans-la-gazette-de-lausanne-et-le-journal-de-geneve-durant-la-guerre-froide\/bibiographie\/\">Bibliographie<\/a>  |  <a href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/perception-de-la-decolonisation-et-des-nouvelles-independances-dans-la-gazette-de-lausanne-et-le-journal-de-geneve-durant-la-guerre-froide\/annexes\/\">Annexes<\/a><\/p>\n<h2><strong>Constitution des sous-corpus d\u2019int\u00e9r\u00eat<\/strong><\/h2>\n<p>Notre premier objectif est d\u2019extraire du corpus initial, constitu\u00e9 des archives de la GDL et du JDG entre 1945 et 1995, les articles pertinents pour notre analyse. Pour ce faire, nous classons les articles en sous-corpus d\u2019int\u00e9r\u00eat ayant trait \u00e0 la d\u00e9colonisation.<\/p>\n<p>Notre premier sous-corpus contient tous les articles mentionnant le terme \u00ab d\u00e9colonisation \u00bb (sous-corpus 1). Ce sous-corpus est th\u00e9matique et a pour vocation de rassembler tous les articles publi\u00e9s dans la GDL et le JDG portant tr\u00e8s vraisemblablement sur la d\u00e9colonisation.<\/p>\n<p>Nous avons ensuite cr\u00e9\u00e9 un second sous-corpus compos\u00e9 d\u2019articles mentionnant \u00e0 la fois le terme \u00ab\u00a0d\u00e9colonisation\u00a0\u00bb et le mot \u00ab\u00a0Suisse\u00a0\u00bb afin d\u2019observer d\u2019\u00e9ventuelles cat\u00e9gories de discours liant la Suisse et la d\u00e9colonisation (sous-corpus 2). Ce sous-corpus devrait pouvoir \u00e9galement mettre en \u00e9vidence les pays d\u00e9colonis\u00e9s plus fortement li\u00e9s au terme \u00ab\u00a0Suisse\u00a0\u00bb dans la presse lib\u00e9rale romande.<\/p>\n<p>Les extractions des sous-corpus ont \u00e9t\u00e9 effectu\u00e9es avec les scripts Python<a href=\"#_ftn1\" name=\"_ftnref1\"><sup>[1]<\/sup><\/a>.<\/p>\n<p>Nous avons \u00e9galement constitu\u00e9 une liste des nouvelles ind\u00e9pendances en Afrique et Asie entre 1945 et 1995. Pour chaque nouvelle ind\u00e9pendance, nous avons ainsi not\u00e9 l\u2019ann\u00e9e de celle-ci, l\u2019ancien nom du territoire, le nom de l\u2019empire colonial qui le contr\u00f4lait, ainsi que le nom de l\u2019\u00e9tat nouvellement proclam\u00e9. Ces informations servent lors de la formation de nos sous-corpus et N-grams, mais peuvent aussi \u00eatre des facteurs explicatifs permettant d\u2019interpr\u00e9ter d\u2019\u00e9ventuelles diff\u00e9rences de discours entre les diff\u00e9rentes d\u00e9colonisations.<\/p>\n<p>&nbsp;<\/p>\n<h2><strong>Traitement des donn\u00e9es<\/strong><\/h2>\n<p>En premier lieu, nous avons g\u00e9n\u00e9r\u00e9 pour chaque pays d\u00e9colonis\u00e9 un n-gram (en utilisant le nom du pays pour la recherche) sur lequel nous avons rapport\u00e9 la date de son ind\u00e9pendance. Pour les pays d\u2019int\u00e9r\u00eat dont le nom a chang\u00e9 lors de leur ind\u00e9pendance, nous avons pris en compte l\u2019ancien et le nouveau nom. Ces 56 n-grams nous permettent de faire une premi\u00e8re observation quant \u00e0 l\u2019int\u00e9r\u00eat suscit\u00e9 par l\u2019accession \u00e0 l\u2019ind\u00e9pendance des diff\u00e9rents pays dans la GDL et le JDG.<\/p>\n<p>&nbsp;<\/p>\n<p><strong>Fig. 1\u00a0<\/strong>: S\u00e9lection de quelques n-grams\u00a0:<\/p>\n<p align=\"justify\"><img alt=\"\" loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-436\" src=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/6_ngrams.png\" alt=\"\" width=\"800\" height=\"600\" srcset=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/6_ngrams.png 800w, https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/6_ngrams-300x225.png 300w, https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/6_ngrams-768x576.png 768w\" sizes=\"auto, (max-width: 800px) 100vw, 800px\" \/><\/p>\n<p>&nbsp;<\/p>\n<p>Dans un deuxi\u00e8me temps, nous avons plus sp\u00e9cifiquement analys\u00e9 les donn\u00e9es des archives de la GDL et du JDG. Ce traitement a comme objectif principal d\u2019\u00e9valuer l\u2019int\u00e9r\u00eat port\u00e9 par les deux journaux aux articles rassembl\u00e9s dans les sous-corpus en employant quelques m\u00e9triques simples. Une premi\u00e8re m\u00e9trique consiste \u00e0 \u00e9valuer la couverture de chaque pays en totalisant les mots de chaque article mentionnant un pays donn\u00e9. Une seconde m\u00e9trique consid\u00e8re le nombre moyen de mots par article pour chaque pays. L\u2019utilit\u00e9 de cette m\u00e9trique repose sur l\u2019hypoth\u00e8se que les articles plus longs indiquent un int\u00e9r\u00eat accru et comportent \u00e9ventuellement une analyse de fond, alors que les articles courts ont tendance \u00e0 \u00eatre plus factuels. Nous mesurons aussi l\u2019\u00e9volution de ces m\u00e9triques pour chaque sous-corpus dans le temps, sans distinguer les pays, mais en indiquant \u00e0 chaque ann\u00e9e le nombre des nouvelles ind\u00e9pendances. Ces m\u00e9triques peuvent \u00e9galement servir \u00e0 diriger certains pointages qualitatifs.<\/p>\n<p>A noter que nous employons des m\u00e9thodes qui permettent \u00e0 la fois d\u2019interroger les donn\u00e9es sur des 386points pr\u00e9\u00e9tablis (p.ex r\u00e9pondant \u00e0 la question : \u00ab A quelles dates et combien de fois est-ce que le Kenya est cit\u00e9 dans le corpus ? \u00bb) et d\u2019utiliser les donn\u00e9es pour faire ressortir des \u00e9l\u00e9ments inconnus des chercheurs (p.ex extraction de th\u00e9matiques par l\u2019analyse automatis\u00e9e d\u2019un sous-corpus).<\/p>\n<p>&nbsp;<\/p>\n<p><strong>Fig. 2\u00a0<\/strong>: Sch\u00e9ma r\u00e9sumant la m\u00e9thodologie suivie\u00a0:<\/p>\n<p align=\"justify\"><span style=\"color: #000000\"><span style=\"font-family: Arial,serif\"><span style=\"font-size: small\"><a href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/6_metodo_schema.png\"><img alt=\"\" loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-364 size-full\" title=\"\" src=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/6_metodo_schema.png\" alt=\"\" width=\"691\" height=\"338\" srcset=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/6_metodo_schema.png 691w, https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/6_metodo_schema-300x147.png 300w\" sizes=\"auto, (max-width: 691px) 100vw, 691px\" \/><\/a><\/span><\/span><\/span><\/p>\n<p>&nbsp;<\/p>\n<h2><strong>Visualisation de donn\u00e9es<\/strong><\/h2>\n<p>Nous utilisons la sortie par classe d\u2019Iramuteq pour visualiser nos donn\u00e9es et leur \u00e9volution dans le temps. L\u2019int\u00e9r\u00eat mesur\u00e9 quantitativement sera indiqu\u00e9 sous forme d\u2019histogramme en fonction p.ex. des pays d\u00e9colonis\u00e9s, des dates de publication, etc. Par ailleurs, des diagrammes \u00e0 barres (\u00ab bar plot \u00bb) nous permettent d\u2019afficher les fr\u00e9quences relatives entre p.ex. co-mention de pays d\u2019int\u00e9r\u00eat et du terme \u00ab d\u00e9colonisation \u00bb. Finalement, nous avons dessin\u00e9 un sch\u00e9ma illustrant l\u2019extraction de nos sous-corpus et le traitement effectu\u00e9 sur ceux-ci.<\/p>\n<p>&nbsp;<\/p>\n<p><strong>Fig. 3\u00a0<\/strong>: Visualisation des classes d\u2019Iramuteq apr\u00e8s le traitement de notre sous-corpus 1\u00a0(tous les articles parlant de d\u00e9colonisation entre 1945 et 1995):<\/p>\n<p align=\"left\"><span style=\"color: #000000\"><span style=\"font-family: Arial,serif\"><span style=\"font-size: small\"><a title=\"\" href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/6_metodo_iramu.png\"><img alt=\"\" loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-371 size-full\" title=\"\" src=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/6_metodo_iramu.png\" alt=\"\" width=\"688\" height=\"519\" srcset=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/6_metodo_iramu.png 688w, https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/6_metodo_iramu-300x226.png 300w\" sizes=\"auto, (max-width: 688px) 100vw, 688px\" \/><\/a><\/span><\/span><\/span><\/p>\n<h2><\/h2>\n<h2>Probl\u00e8mes et limites m\u00e9thodologiques<\/h2>\n<p>Notre analyse porte sur un grand nombre d\u2019articles que nous devons traiter de mani\u00e8re automatis\u00e9e. Cette approche, bien que n\u00e9cessaire, introduit plusieurs biais consid\u00e9rables. Ces biais sont notamment fortement conditionn\u00e9s par le choix des mots-cl\u00e9s servant \u00e0 la constitution des sous-corpus. Par exemple, l\u2019inclusion du mot \u00ab guerre \u00bb dans l\u2019objectif d\u2019identifier des sous-corpus d\u2019articles portant sur les nouvelles ind\u00e9pendances acquises par les armes m\u00e8nerait \u00e0 l\u2019inclusion de nombreux articles ne traitant pas de guerres d\u2019ind\u00e9pendance, mais de guerres internationales (faux positifs). De m\u00eame, l\u2019emploi de certaines p\u00e9riphrases ou l\u2019omission du nom d\u2019un pays (voire emploi d\u2019un nom alternatif non consid\u00e9r\u00e9 au pr\u00e9alable) dans un article donn\u00e9 provoque le rejet de celui-ci lors de la classification en sous-corpus (faux n\u00e9gatif). Dans notre approche, nous privil\u00e9gions la minimisation des faux positifs. Une autre source de biais provient de la supposition qu\u2019un article mentionnant un pays traite de celui-ci. Or, il est tout \u00e0 fait possible qu\u2019un pays mentionn\u00e9 ne joue qu\u2019un r\u00f4le marginal dans l\u2019article analys\u00e9 automatiquement (faux positif). Finalement, l\u2019imperfection de la num\u00e9risation des articles cause de faux n\u00e9gatifs (essentiellement).<\/p>\n<p>L\u2019utilisation des n-grams pour chacun des pays d\u2019int\u00e9r\u00eat nous a \u00e9galement permis de mettre en lumi\u00e8re que certains noms de pays sont d\u00e9licats \u00e0 utiliser car ils peuvent faire r\u00e9f\u00e9rence \u00e0 plusieurs objets. Le mot \u00ab\u00a0Congo\u00a0\u00bb par exemple peut-\u00eatre utilis\u00e9 pour le Congo Belge, la R\u00e9publique du Congo ou encore la R\u00e9publique D\u00e9mocratique du Congo.<\/p>\n<hr \/>\n<div id=\"sdfootnote1\">\n<p align=\"left\"><a href=\"#_ftnref1\" name=\"_ftn1\"><sup>[1]<\/sup><\/a> https:\/\/github.com\/cipri-tom\/decolonisations<\/p>\n<\/div>\n<p><span style=\"color: #000000\"><span style=\"font-family: Arial,serif\"><span style=\"font-size: small\">\u00a0<\/span><\/span><\/span><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Accueil | Contexte historique et probl\u00e9matique du travail | M\u00e9thodologie | Interpr\u00e9tation des r\u00e9sultats | Bibliographie | Annexes Constitution des sous-corpus d\u2019int\u00e9r\u00eat Notre premier objectif est d\u2019extraire du corpus initial, constitu\u00e9 des archives de la GDL et du JDG entre<\/p>\n","protected":false},"author":1001264,"featured_media":0,"parent":68,"menu_order":1,"comment_status":"closed","ping_status":"closed","template":"","meta":{"_seopress_robots_primary_cat":"","_seopress_titles_title":"","_seopress_titles_desc":"","_seopress_robots_index":"","footnotes":""},"class_list":["post-269","page","type-page","status-publish"],"_links":{"self":[{"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/pages\/269","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/users\/1001264"}],"replies":[{"embeddable":true,"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/comments?post=269"}],"version-history":[{"count":0,"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/pages\/269\/revisions"}],"up":[{"embeddable":true,"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/pages\/68"}],"wp:attachment":[{"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/media?parent=269"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}