{"id":710,"date":"2017-05-31T18:44:27","date_gmt":"2017-05-31T16:44:27","guid":{"rendered":"http:\/\/wp.unil.ch\/histoireparlesdonnees\/?page_id=710"},"modified":"2017-05-31T19:05:02","modified_gmt":"2017-05-31T17:05:02","slug":"methodes-numeriques","status":"publish","type":"page","link":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/lurss-de-brejnev-vue-par-les-medias-suisses\/methodologie\/methodes-numeriques\/","title":{"rendered":"M\u00e9thodes num\u00e9riques"},"content":{"rendered":"<div style=\"background-color: #eee;padding: 20px 20px;margin: 10px;float: right;width: 300px\">\n<h1 style=\"font-size: 20px;line-height: normal\">L\u2019URSS de Brejnev vue par les m\u00e9dias suisses<\/h1>\n<ul style=\"margin-bottom: 0;padding-bottom: 0\">\n<li><a href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/lurss-de-brejnev-vue-par-les-medias-suisses\/\">Introduction<\/a><\/li>\n<li><a href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/lurss-de-brejnev-vue-par-les-medias-suisses\/contexte-historique\/\">Contexte historique<\/a><\/li>\n<li><a href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/lurss-de-brejnev-vue-par-les-medias-suisses\/methodologie\">M\u00e9thodologie<\/a>\n<ul>\n<li><a href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/lurss-de-brejnev-vue-par-les-medias-suisses\/methodes-numeriques\/\">M\u00e9thodes num\u00e9riques<\/a><\/li>\n<\/ul>\n<\/li>\n<li><a href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/lurss-de-brejnev-vue-par-les-medias-suisses\/interpretation-des-resultats\/\">Interpr\u00e9tation des r\u00e9sultats<\/a><\/li>\n<li><a href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/lurss-de-brejnev-vue-par-les-medias-suisses\/bibliographie\/\">Bibliographie<\/a><\/li>\n<\/ul>\n<\/div>\n<h3>\u00a0Recherche par mots-cl\u00e9 par Python<\/h3>\n<figure id=\"attachment_619\" aria-describedby=\"caption-attachment-619\" style=\"width: 150px\" class=\"wp-caption alignleft\"><a href=\"https:\/\/upload.wikimedia.org\/wikipedia\/commons\/thumb\/0\/0a\/Python.svg\/2000px-Python.svg.png\"><img alt=\"\" loading=\"lazy\" decoding=\"async\" class=\"wp-image-619 size-thumbnail\" src=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/05-Python-150x150.png\" alt=\"\" width=\"150\" height=\"150\" srcset=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/05-Python-150x150.png 150w, https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/05-Python-300x300.png 300w, https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/05-Python-768x768.png 768w, https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/05-Python-1024x1024.png 1024w, https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/05-Python-230x230.png 230w, https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/05-Python-365x365.png 365w, https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/05-Python.png 1200w\" sizes=\"auto, (max-width: 150px) 100vw, 150px\" \/><\/a><figcaption id=\"caption-attachment-619\" class=\"wp-caption-text\">Langage Python, choisi pour sa simplicit\u00e9 et son efficacit\u00e9.<\/figcaption><\/figure>\n<p>Dans les d\u00e9tails, un script python s\u2019occupe de parcourir les\u00a0archives xml \u00e0 la recherche des mots-cl\u00e9s. Ceux-ci doivent \u00eatre cit\u00e9s de mani\u00e8re identique dans le texte et le dictionnaire, au caract\u00e8re pr\u00e8s. Une expression contenant plusieurs mots doit ainsi apparaitre dans le m\u00eame ordre avec tous les mots identiques. Les majuscules ont aussi leur importance et ne sont pas \u00e9quivalentes aux minuscules. C\u2019est pourquoi la construction des dictionnaires rel\u00e8ve d\u2019une grande importance et doit constamment \u00eatre am\u00e9lior\u00e9e gr\u00e2ce \u00e0 de nouvelles analyses.<\/p>\n<h3><\/h3>\n<h3><\/h3>\n<h3>Analyse par Iramuteq et Gephi<\/h3>\n<figure id=\"attachment_617\" aria-describedby=\"caption-attachment-617\" style=\"width: 150px\" class=\"wp-caption alignleft\"><a href=\"https:\/\/s3.amazonaws.com\/zotero.org\/images\/settings\/group\/149661_200px.png\"><img alt=\"\" loading=\"lazy\" decoding=\"async\" class=\"wp-image-617 size-thumbnail\" src=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/05-ira-150x150.png\" alt=\"\" width=\"150\" height=\"150\" \/><\/a><figcaption id=\"caption-attachment-617\" class=\"wp-caption-text\">Logiciel Iramuteq, permet des analyses s\u00e9mantiques sur notre corpus de texte.<\/figcaption><\/figure>\n<p>Le r\u00e9sultat de la recherche par mots-cl\u00e9 par Python est mis en forme dans un unique fichier texte lisible par le logiciel Iramuteq (\u00ab Logiciel Iramuteq \u00bb, <a href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/lurss-de-brejnev-vue-par-les-medias-suisses\/bibliographie\/\">[11]<\/a>) qui effectue des analyses s\u00e9mantiques du corpus. Les principaux apports de ce programme viennent de l\u2019analyse de similitudes et la classification par m\u00e9thode Reinert ou hi\u00e9rarchique descendante(CHD). La premi\u00e8re permet de rendre compte des liens entre les mots, la derni\u00e8re regroupe les occurrences de tous les mots en classes, rendant l\u2019\u00e9tude des textes plus facile.<\/p>\n<p>&nbsp;<\/p>\n<figure id=\"attachment_607\" aria-describedby=\"caption-attachment-607\" style=\"width: 1024px\" class=\"wp-caption alignleft\"><img alt=\"\" loading=\"lazy\" decoding=\"async\" class=\"wp-image-607 size-full\" src=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/05-1stPageAnalysis.png\" alt=\"\" width=\"1024\" height=\"768\" srcset=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/05-1stPageAnalysis.png 1024w, https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/05-1stPageAnalysis-300x225.png 300w, https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/05-1stPageAnalysis-768x576.png 768w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption id=\"caption-attachment-607\" class=\"wp-caption-text\">Fig. 5 : Analyse iramuteq utilisant les variables pour extraire ici les articles de premi\u00e8re page. Utilisation d&#8217;un dictionnaire simple.<\/figcaption><\/figure>\n<p>&nbsp;<\/p>\n<p>L\u2019analyse de similitudes deviendra plus pr\u00e9cise avec l\u2019affinement des dictionnaires. Graphiquement, le logiciel Gephi (\u00ab Logiciel Gephi \u00bb, <a href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux\/lurss-de-brejnev-vue-par-les-medias-suisses\/bibliographie\/\">[10]<\/a>) est utilis\u00e9 pour am\u00e9liorer leur pr\u00e9sentation. De cette mani\u00e8re, les graphiques deviennent plus a\u00e9r\u00e9s et un tri des mots les plus pertinents est possible par l&#8217;utilisateur.<\/p>\n<figure id=\"attachment_740\" aria-describedby=\"caption-attachment-740\" style=\"width: 950px\" class=\"wp-caption alignleft\"><img alt=\"\" loading=\"lazy\" decoding=\"async\" class=\"wp-image-740 size-full\" src=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/05-Ira_Analysis-1.png\" alt=\"\" width=\"950\" height=\"1438\" srcset=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/05-Ira_Analysis-1.png 950w, https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/05-Ira_Analysis-1-198x300.png 198w, https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/05-Ira_Analysis-1-768x1163.png 768w, https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/05-Ira_Analysis-1-676x1024.png 676w\" sizes=\"auto, (max-width: 950px) 100vw, 950px\" \/><figcaption id=\"caption-attachment-740\" class=\"wp-caption-text\">Fig. 6 : R\u00e9sultat d&#8217;une analyse de similitude par Iramuteq, a) avant et b) apr\u00e8s traitement par Gephi. Dictionnaire simple.<\/figcaption><\/figure>\n<figure id=\"attachment_611\" aria-describedby=\"caption-attachment-611\" style=\"width: 1024px\" class=\"wp-caption alignleft\"><img alt=\"\" loading=\"lazy\" decoding=\"async\" class=\"size-full wp-image-611\" src=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/05-CHvsBrej_Simi.png\" alt=\"\" width=\"1024\" height=\"768\" srcset=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/05-CHvsBrej_Simi.png 1024w, https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/05-CHvsBrej_Simi-300x225.png 300w, https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/05-CHvsBrej_Simi-768x576.png 768w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption id=\"caption-attachment-611\" class=\"wp-caption-text\">Fig 7 : Exemple d&#8217;un dictionnaire double qui permet une recherche de corr\u00e9lations entre les mots \u00ab Suisse \u00bb et \u00ab Brejnev \u00bb, puis traitement par Gephi.<\/figcaption><\/figure>\n<p>&nbsp;<\/p>\n<p>&nbsp;<\/p>\n<h3>Extraction de mots dans un contexte et historique des occurrences<\/h3>\n<p>Pour finir la liste des m\u00e9thodes d\u2019analyse, un autre script python se concentrera, lui, exclusivement sur les occurrences de certains mots. Gr\u00e2ce \u00e0 l\u2019utilisation d\u2019un dictionnaire principal, le programme est capable de compter les apparitions de certaines expressions seulement lorsqu\u2019elles sont en pr\u00e9sence d\u2019un mot du dictionnaire. Il permet ainsi d\u2019analyser des mots communs tr\u00e8s r\u00e9currents dans les articles mais uniquement lorsqu\u2019ils sont pertinents face au th\u00e8me recherch\u00e9. Un exemple peut \u00eatre le mot \u00ab paix \u00bb, qui apparait dans une multitude de contextes, mais seul celui de l\u2019Union Sovi\u00e9tique nous int\u00e9resse. De cette mani\u00e8re, le mot \u00ab paix \u00bb qui apparaitrait ailleurs sera ignor\u00e9, et le r\u00e9sultat final devient analysable comme sur la figure 8.<\/p>\n<figure id=\"attachment_614\" aria-describedby=\"caption-attachment-614\" style=\"width: 1140px\" class=\"wp-caption alignleft\"><img alt=\"\" loading=\"lazy\" decoding=\"async\" class=\"size-full wp-image-614\" src=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/05-Exemple_histo.png\" alt=\"\" width=\"1140\" height=\"525\" srcset=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/05-Exemple_histo.png 1140w, https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/05-Exemple_histo-300x138.png 300w, https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/05-Exemple_histo-768x354.png 768w, https:\/\/wp.unil.ch\/histoireparlesdonnees\/files\/2017\/05\/05-Exemple_histo-1024x472.png 1024w\" sizes=\"auto, (max-width: 1140px) 100vw, 1140px\" \/><figcaption id=\"caption-attachment-614\" class=\"wp-caption-text\">Fig 8 : Exemple d&#8217;extraction de mots d\u00e9notant la paix et la coop\u00e9ration. Utilisation d&#8217;un dictionnaire simple li\u00e9 \u00e0 Brejnev. Les diff\u00e9rentes \u00e9volutions temporelles sont normalis\u00e9s et translat\u00e9es pour une meilleure comparaison.<\/figcaption><\/figure>\n<p>Comme on peut le voir, la p\u00e9riode interm\u00e9diaire entre Prague(1968) et le d\u00e9but de la guerre d&#8217;Afghanistan(1979) est plus riches en mots<\/p>\n<h3>Difficult\u00e9s<\/h3>\n<ul style=\"width: 700px;text-align: justify\">\n<li style=\"list-style-type: none\">\n<ul style=\"width: 700px;text-align: justify\">\n<li>Les premi\u00e8res listes de mots-cl\u00e9s furent bas\u00e9es uniquement sur des consid\u00e9rations historiques, il va \u00eatre capital de pouvoir prouver que tous les \u00e9v\u00e9nements importants y sont bien repr\u00e9sent\u00e9s. Si n\u00e9cessaire, quelques adaptations seront effectu\u00e9es.<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<ul style=\"width: 700px;text-align: justify\">\n<li style=\"list-style-type: none\">\n<ul style=\"width: 700px;text-align: justify\">\n<li>Le traitement correct des caract\u00e8res par le script est capricieux : les majuscules par exemple sont diff\u00e9rentes de leurs homologues minuscules. Ceci peut \u00eatre un avantage comme un inconv\u00e9nient : le programme peut rater certains mots qui auraient men\u00e9 \u00e0 un article tr\u00e8s pertinent, mais peut aussi diff\u00e9rencier certains noms propres de leurs homologues communs.<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<ul style=\"width: 700px;text-align: justify\">\n<li style=\"list-style-type: none\">\n<ul style=\"width: 700px;text-align: justify\">\n<li>La programmation en python doit \u00eatre rigoureuse afin de ne pas introduire d\u2019erreurs d\u2019analyse post\u00e9rieure.<br \/>\nLe logiciel Iramuteq a parfois du mal \u00e0 interpr\u00e9ter certaines d\u00e9clinaisons de mots. Par exemple &amp;laquo parti &amp;raquo de parti communiste, qui appara\u00eet un grand nombre de fois, sera interpr\u00e9t\u00e9 comme une d\u00e9clinaison du verbe partir, ce qui n\u2019est pas le cas. Une solution possible, qui fut appliqu\u00e9e a certain corpus, est de filtrer ce type de mots dans les scripts python, de les r\u00e9\u00e9crire avec un tiret bas au lieu de l\u2019espace.<\/li>\n<li>L\u2019interpr\u00e9tation des analyses s\u00e9mantiques d\u2019Iramuteq est laiss\u00e9e \u00e0 l\u2019\u0153 humain. Parfois elle est \u00e9vidente, parfois elle peut \u00eatre tr\u00e8s compliqu\u00e9e. Comme notre d\u00e9marche se base beaucoup sur les r\u00e9sultats ant\u00e9rieurs pour les affiner ensuite, cette \u00e9tape sera tr\u00e8s importante.<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n","protected":false},"excerpt":{"rendered":"<p>L\u2019URSS de Brejnev vue par les m\u00e9dias suisses Introduction Contexte historique M\u00e9thodologie M\u00e9thodes num\u00e9riques Interpr\u00e9tation des r\u00e9sultats Bibliographie \u00a0Recherche par mots-cl\u00e9 par Python Dans les d\u00e9tails, un script python s\u2019occupe de parcourir les\u00a0archives xml \u00e0 la recherche des mots-cl\u00e9s. Ceux-ci<\/p>\n","protected":false},"author":1001264,"featured_media":0,"parent":674,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"_seopress_robots_primary_cat":"","_seopress_titles_title":"","_seopress_titles_desc":"","_seopress_robots_index":"","footnotes":""},"class_list":["post-710","page","type-page","status-publish"],"_links":{"self":[{"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/pages\/710","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/users\/1001264"}],"replies":[{"embeddable":true,"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/comments?post=710"}],"version-history":[{"count":0,"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/pages\/710\/revisions"}],"up":[{"embeddable":true,"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/pages\/674"}],"wp:attachment":[{"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/media?parent=710"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}