{"id":1018,"date":"2018-05-30T16:27:02","date_gmt":"2018-05-30T14:27:02","guid":{"rendered":"http:\/\/wp.unil.ch\/histoireparlesdonnees\/?page_id=1018"},"modified":"2018-05-30T16:57:23","modified_gmt":"2018-05-30T14:57:23","slug":"methodologie","status":"publish","type":"page","link":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux-2017-2018\/la-perception-du-feminisme-par-la-gazette-de-lausanne-le-journal-de-geneve-et-le-nouveau-quotidien-entre-1958-et-1998\/methodologie\/","title":{"rendered":"M\u00e9thodologie"},"content":{"rendered":"<h2><span style=\"font-weight: 400\">Choix des articles du corpus<\/span><\/h2>\n<p><span style=\"font-weight: 400\">En ce qui concerne la m\u00e9thodologie utilis\u00e9e, plusieurs corpus repr\u00e9sentant chacun des acteurs gr\u00e2ce \u00e0 des mots cl\u00e9s (c.f. Annexe) ont \u00e9t\u00e9 constitu\u00e9s. Ces mots cl\u00e9s sont choisis de mani\u00e8re \u00e0 repr\u00e9senter les acteurs de la mani\u00e8re la plus objective possible. Les diff\u00e9rents corpus ainsi constitu\u00e9s Les diff\u00e9rents corpus ainsi constitu\u00e9s sont compos\u00e9s de: <\/span><\/p>\n<ul>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Le f\u00e9minisme : 100% des articles contenant au moins un des mots cl\u00e9s correspondants, soit 3480 articles.<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Les mouvements f\u00e9ministes : 100%, soit 316 articles dont 291 dans l\u2019intersection.<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">L\u2019\u00c9tat : 8%, soit 12 839 articles dont 592 dans l\u2019intersection.<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Les partis politiques : 16%, soit 14 260 articles dont 481 dans l\u2019intersection.<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Les entreprises : 9%, soit 12 226 articles dont 292 dans l\u2019intersection.<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Les personnalit\u00e9s publiques : 8%, soit 9 807 articles dont 332 dans l\u2019intersection.<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Les m\u00e9dias : 8%, soit 13 325 articles dont 622 dans l\u2019intersection.<\/span><\/li>\n<\/ul>\n<p><span style=\"font-weight: 400\">Pour quelques corpus, le nombre d\u2019article \u00e9tait trop grand pour que Iramuteq fonctionne dans un temps raisonnable, il a donc \u00e9t\u00e9 n\u00e9cessaire de prendre qu\u2019une partie de ces articles pour former les corpus. Les pourcentages mentionn\u00e9s repr\u00e9sentent la partie des articles qui ont \u00e9t\u00e9 pris en compte pour la formation de chaque corpus.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Le but est dans un premier temps de constituer des corpus les plus inclusifs possibles sur chacun des acteurs, avant de cr\u00e9er autant de sous-corpus en faisant \u00e0 chaque fois une intersection avec le corpus F\u00e9minisme. <\/span><\/p>\n<h2><span style=\"font-weight: 400\">Analyse quantitative<\/span><\/h2>\n<p><span style=\"font-weight: 400\">Cela permettra de faire des analyses g\u00e9n\u00e9rales par th\u00e8me pour contextualiser chaque sujet avant de chercher s\u2019il y a des diff\u00e9rences notables quand, uniquement des articles parlant du f\u00e9minisme sont consid\u00e9r\u00e9s. Ces sous-corpus permettront ensuite de chercher \u00e0 caract\u00e9riser la perception des relations de chaque acteur avec le f\u00e9minisme. <\/span><\/p>\n<p><span style=\"font-weight: 400\">Une fois ces corpus cr\u00e9\u00e9s, une analyse quantitative selon trois m\u00e9thodes sera faite. La premi\u00e8re, une analyse fr\u00e9quentielle du nombre d\u2019articles par corpus par rapport au temps, permettra de comparer plus pr\u00e9cis\u00e9ment ces corpus et de remarquer des situations potentiellement int\u00e9ressantes. Une seconde analyse aura la forme d\u2019un topic modelling (analyse de Reinert) afin de mettre en \u00e9vidence les th\u00e8mes principaux de chaque corpus. La derni\u00e8re analyse sera une \u00e9tude de sentiments qui permettra de d\u00e9terminer le sentiment g\u00e9n\u00e9ral d\u2019un texte ou d\u2019un corpus ainsi que sa positivit\u00e9 et sa n\u00e9gativit\u00e9. <\/span><\/p>\n<h2><span style=\"font-weight: 400\">Sentiment Analysis<\/span><\/h2>\n<p><span style=\"font-weight: 400\">Cette analyse vise \u00e0 donner \u00e0 chaque texte un score indiquant le niveau de joie, de tristesse, de d\u00e9go\u00fbt ou de col\u00e8re en utilisant une base de donn\u00e9es de mots de vocabulaire \u00e0 connotation. De plus cette m\u00e9thode permet de d\u00e9terminer si le texte est positif ou n\u00e9gatif en utilisant le m\u00eame proc\u00e9d\u00e9. <\/span><\/p>\n<p><span style=\"font-weight: 400\">Un classificateur <\/span><i><span style=\"font-weight: 400\">Naive Bayes <\/span><\/i><span style=\"font-weight: 400\">a \u00e9t\u00e9 entra\u00een\u00e9 sur un jeu de donn\u00e9e FEEL (French Expanded Emotion Lexicon<\/span><span style=\"font-weight: 400\">) puis utilis\u00e9 pour extraire la polarit\u00e9 sentimental des articles. <\/span><\/p>\n<p><span style=\"font-weight: 400\">Toutefois, une analyse qualitative des scores a d\u00e9montr\u00e9 les faiblesses de cette m\u00e9thode. Les articles ont en effet des scores trop similaires, ce qui rend ces derniers inutilisables de m\u00eame que l\u2019\u00e9tude de leur variance. <\/span><\/p>\n<p><span style=\"font-weight: 400\">La m\u00e9thode d\u2019analyse sentimentale quantitative a donc \u00e9t\u00e9 mise de c\u00f4t\u00e9 pour l\u2019analyse de nos hypoth\u00e8ses.<\/span><\/p>\n<p style=\"text-align: center\"><a href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux-2017-2018\/la-perception-du-feminisme-par-la-gazette-de-lausanne-le-journal-de-geneve-et-le-nouveau-quotidien-entre-1958-et-1998\/contextualisation\/\">&lt;<\/a> <a href=\"https:\/\/wp.unil.ch\/histoireparlesdonnees\/les-travaux-2017-2018\/la-perception-du-feminisme-par-la-gazette-de-lausanne-le-journal-de-geneve-et-le-nouveau-quotidien-entre-1958-et-1998\/analyse\/\">&gt;<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Choix des articles du corpus En ce qui concerne la m\u00e9thodologie utilis\u00e9e, plusieurs corpus repr\u00e9sentant chacun des acteurs gr\u00e2ce \u00e0 des mots cl\u00e9s (c.f. Annexe) ont \u00e9t\u00e9 constitu\u00e9s. Ces mots cl\u00e9s sont choisis de mani\u00e8re \u00e0 repr\u00e9senter les acteurs de<\/p>\n","protected":false},"author":1001793,"featured_media":0,"parent":1005,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"_seopress_robots_primary_cat":"","_seopress_titles_title":"","_seopress_titles_desc":"","_seopress_robots_index":"","footnotes":""},"class_list":["post-1018","page","type-page","status-publish"],"_links":{"self":[{"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/pages\/1018","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/users\/1001793"}],"replies":[{"embeddable":true,"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/comments?post=1018"}],"version-history":[{"count":0,"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/pages\/1018\/revisions"}],"up":[{"embeddable":true,"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/pages\/1005"}],"wp:attachment":[{"href":"https:\/\/wp.unil.ch\/histoireparlesdonnees\/wp-json\/wp\/v2\/media?parent=1018"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}