{"id":641,"date":"2017-05-31T17:16:24","date_gmt":"2017-05-31T15:16:24","guid":{"rendered":"http:\/\/wp.unil.ch\/histoireparlesdonnees\/?page_id=641"},"modified":"2017-05-31T18:31:29","modified_gmt":"2017-05-31T16:31:29","slug":"traitement-informatique","status":"publish","type":"page","link":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/comparaison-du-traitement-mediatique-de-la-guerre-de-coree-et-de-la-guerre-du-vietnam\/traitement-informatique\/","title":{"rendered":"Traitement informatique"},"content":{"rendered":"<p align=\"justify\"><span style=\"font-family: Times New Roman,serif\"><span style=\"font-size: medium\"><span style=\"font-family: Calibri,serif\">??Nous avons, dans un premier temps, t\u00e9l\u00e9charg\u00e9 tous les textes pour les ann\u00e9es choisies. Une fois les articles r\u00e9cup\u00e9r\u00e9s, il a fallu les filtrer pour ne conserver que ceux qui nous int\u00e9ressent. Pour ce faire, nous avons automatis\u00e9 le filtrage \u00e0 l\u2019aide d\u2019un script (en python), c\u2019est \u00e0 dire un programme qui permet de manipuler les fichiers. Il parcourt les articles \u00e0 la recherche de mots-cl\u00e9s. Du fait de la transcription de mots asiatiques en alphabet latin, les mots-cl\u00e9s pour le filtrage ont \u00e9t\u00e9 s\u00e9lectionn\u00e9s en tenant compte des diff\u00e9rentes latinisations possibles. C\u2019est pourquoi nous avons choisi les mots-cl\u00e9s \u2018\u2019Vietnam\u2019\u2019, \u2018\u2019Vi\u00eatnam\u2019\u2019, \u2018\u2019Viet Nam\u2019\u2019 et \u2018\u2019Vi\u00eat Nam\u2019\u2019 pour la Guerre du Vietnam. Lorsqu\u2019un article est s\u00e9lectionn\u00e9, son contenu est directement ajout\u00e9 \u00e0 un fichier texte et format\u00e9 de fa\u00e7on \u00e0 \u00eatre interpr\u00e9table par le logiciel de traitement de corpus utilis\u00e9, Iramuteq, notamment en retirant tous les symboles \u00ab*\u00bb pr\u00e9sents. Enfin, pour permettre une interpr\u00e9tation plus pouss\u00e9e des corpus, nous avons r\u00e9alis\u00e9 un second script qui parcourt les articles s\u00e9lectionn\u00e9s et remplace toutes les occurrences de \u00abVietnam du Sud\u00bb par \u00abVietnam_du_sud\u00bb, \u00abCor\u00e9e du nord\u00bb par \u00abCor\u00e9e_du_nord\u00bb, etc. Nous avons ainsi obtenu quatre corpus, un par journal et par guerre. <\/span><\/span><\/span><\/p>\n<p align=\"justify\"><span style=\"font-family: Times New Roman,serif\"><span style=\"font-size: medium\"><span style=\"font-family: Calibri,serif\">??Dans le but d\u2019analyser ce corpus d\u2019articles, nous avons utilis\u00e9 le logiciel Iramuteq se fondant sur le logiciel de traitement statistique R. Cette m\u00e9thode est bas\u00e9e sur la d\u00e9composition de chaque article en segments de plus petites tailles plus faciles \u00e0 traiter. Les mots de chaque segment sont ensuite lemmatis\u00e9s. Un traitement statistique est appliqu\u00e9 aux segments de texte de fa\u00e7on \u00e0 les regrouper en classes qui sont ensuite hi\u00e9rarchis\u00e9es de mani\u00e8re descendante. Les dendrogrammes des classes sont pr\u00e9sents en pi\u00e8ces jointes par souci de lisibilit\u00e9. Pour notre \u00e9tude, nous avons utilis\u00e9 l\u2019analyse de similitudes de fa\u00e7on \u00e0 visualiser les liens entre les mots dans chaque classe en utilisant la cooccurrence. Plus l\u2019indice de cooccurrence est \u00e9lev\u00e9, plus les mots apparaissent ensemble dans les m\u00eames segments de classes de chaque classe. Ces indices de cooccurrence seront ensuite export\u00e9s de fa\u00e7on \u00e0 les visualiser gr\u00e2ce au logiciel Gephi. <\/span><\/span><\/span><\/p>\n<p align=\"justify\"><span style=\"font-family: Times New Roman,serif\"><span style=\"font-size: medium\"><span style=\"font-family: Calibri,serif\">??Nous avons ensuite analys\u00e9 nos diff\u00e9rentes classes \u00e0 l\u2019aide du logiciel Gephi. Ce logiciel d\u2019analyse et de visualisation de r\u00e9seaux nous a permis d\u2019obtenir des graphes exposant les relations entre les diff\u00e9rents mots utilis\u00e9s au sein du corpus. Pour cela, nous avons utilis\u00e9 les graphes d\u2019analyse de similitudes r\u00e9alis\u00e9s via Iramuteq. Nous avons export\u00e9 ces graphes sur le logiciel Gephi. Nous leur avons appliqu\u00e9 l\u2019algorithme Force Atlas 2, qui permet l\u2019optimisation d\u2019un graphe de fa\u00e7on rapide et pr\u00e9cise. Les visualisations obtenues permettent une analyse diff\u00e9rente de celle de la r\u00e9partition par classes de la m\u00e9thode Reinert. Elles r\u00e9v\u00e8lent la proximit\u00e9 de diff\u00e9rents mots issus d\u2019une m\u00eame classe. <\/span><\/span><\/span><\/p>\n<p align=\"justify\"><span style=\"font-family: Times New Roman,serif\"><span style=\"font-size: medium\"><span style=\"font-family: Calibri,serif\">??Au cours de notre analyse sur le corpus de la Guerre de Cor\u00e9e, nous nous sommes aper\u00e7us que les articles contenant le mot \u00ab?d\u00e9cor\u00e9e?\u00bb ont \u00e9galement \u00e9t\u00e9 s\u00e9lectionn\u00e9s m\u00eame s\u2019il n\u2019avait pas de lien avec le conflit. Cependant, nous avons choisi de ne pas exclure ces articles, \u00e9tant donn\u00e9 que la classification Reinert regroupe les segments de textes similaires, tous les segments de textes contenant \u00ab?d\u00e9cor\u00e9e?\u00bb ont \u00e9t\u00e9 regroup\u00e9 dans une classe ind\u00e9pendante des autres. En effet, il y avait un risque de supprimer des articles utiles \u00e0 notre analyse (par exemple contenant les mots \u00ab?nordcor\u00e9en?\u00bb). <\/span><\/span><\/span><\/p>\n<div style=\"background-color: #eee;padding: 20px 20px\">\n<h2>Table des mati\u00e8res<\/h2>\n<ul style=\"margin-bottom: 0;padding-bottom: 0\">\n<li><a href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/comparaison-du-traitement-mediatique-de-la-guerre-de-coree-et-de-la-guerre-du-vietnam\/\">Comparaison du traitement m\u00e9diatique de la Guerre de Cor\u00e9e et de la Guerre du Vietnam<\/a><\/li>\n<\/ul>\n<ol style=\"margin-bottom: 0;padding-bottom: 0\">\n<li><a href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/comparaison-du-traitement-mediatique-de-la-guerre-de-coree-et-de-la-guerre-du-vietnam\/la-guerre-de-coree\/\">La guerre de Cor\u00e9e<\/a><\/li>\n<li><a href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/comparaison-du-traitement-mediatique-de-la-guerre-de-coree-et-de-la-guerre-du-vietnam\/la-guerre-du-vietnam\/\">La guerre du Vietnam<\/a><\/li>\n<li><a href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/comparaison-du-traitement-mediatique-de-la-guerre-de-coree-et-de-la-guerre-du-vietnam\/definition-des-corpus\/\">D\u00e9finition des corpus<\/a><\/li>\n<li><a href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/comparaison-du-traitement-mediatique-de-la-guerre-de-coree-et-de-la-guerre-du-vietnam\/traitement-informatique\/\">Traitement informatique<\/a><\/li>\n<li><a href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/comparaison-du-traitement-mediatique-de-la-guerre-de-coree-et-de-la-guerre-du-vietnam\/interpretation\/\">Interpr\u00e9tation<\/a>\n<ol>\n<li><a href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/comparaison-du-traitement-mediatique-de-la-guerre-de-coree-et-de-la-guerre-du-vietnam\/interpretation\/guerre-de-coree\/\">Guerre de Cor\u00e9e<\/a><\/li>\n<li><a href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/comparaison-du-traitement-mediatique-de-la-guerre-de-coree-et-de-la-guerre-du-vietnam\/interpretation\/guerre-du-vietnam\/\">Guerre du Vietnam<\/a><\/li>\n<\/ol>\n<\/li>\n<li><a href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/comparaison-du-traitement-mediatique-de-la-guerre-de-coree-et-de-la-guerre-du-vietnam\/conclusion\/\">Conclusion<\/a><\/li>\n<li><a href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/comparaison-du-traitement-mediatique-de-la-guerre-de-coree-et-de-la-guerre-du-vietnam\/bibliographie\/\">Bibliographie<\/a><\/li>\n<\/ol>\n<\/div>\n","protected":false},"excerpt":{"rendered":"<p>??Nous avons, dans un premier temps, t\u00e9l\u00e9charg\u00e9 tous les textes pour les ann\u00e9es choisies. Une fois les articles r\u00e9cup\u00e9r\u00e9s, il a fallu les filtrer pour ne conserver que ceux qui nous int\u00e9ressent. Pour ce faire, nous avons automatis\u00e9 le filtrage<\/p>\n","protected":false},"author":1001264,"featured_media":0,"parent":149,"menu_order":4,"comment_status":"closed","ping_status":"closed","template":"","meta":{"_seopress_robots_primary_cat":"","_seopress_titles_title":"","_seopress_titles_desc":"","_seopress_robots_index":"","footnotes":""},"class_list":["post-641","page","type-page","status-publish"],"_links":{"self":[{"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/pages\/641","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/users\/1001264"}],"replies":[{"embeddable":true,"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/comments?post=641"}],"version-history":[{"count":0,"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/pages\/641\/revisions"}],"up":[{"embeddable":true,"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/pages\/149"}],"wp:attachment":[{"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/media?parent=641"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}