Regression-based approach to test missing data mechanisms.
Détenteur d’un Master en statistique de l’Université de Neuchâtel, Serguei Rouzinov a été doctorant (2015-2019) et statisticien (2019) au sein du Pôle de recherche national LIVES à l’Université de Lausanne. Il a soutenu sa thèse de doctorat le 13 novembre 2019, sous la direction du Professeur André Berchtold. Ses principaux intérêts de recherche portent sur l’analyse et le traitement des données manquantes dans des cadres transversaux et longitudinaux, ainsi que sur la modélisation statistique et informatique en sciences sociales. Il travaille actuellement comme spécialiste en informatique et méthodes statistiques à l’État de Vaud et est chargé de cours à la Haute école de gestion de Genève.
Les données manquantes sont un important problème en sciences sociales. La connaissance du type des données manquantes est essentielle pour une analyse appropriée des valeurs manquantes. Cette thèse se concentre sur la gestion des mécanismes simples et mixtes des données manquantes et la manière de tester si les données manquantes sont distribuées de manière complètement aléatoire ou non. Une approche alternative, basée sur un modèle de régression et applicable aux données continues et catégorielles, est développée afin de tester les mécanismes des données manquantes. Elle est comparée aux tests les plus usuels couramment utilisés pour évaluer ces mécanismes.
Plusieurs séries de simulations sont présentées afin de mettre en évidence la puissance des approches existantes pour tester les mécanismes des données manquantes en fonction de la taille d’échantillon, du type et de la distribution des données, du nombre, du type et de la génération des données manquantes, ainsi que du niveau de corrélation entre les variables.
Finalement, une procédure complète du traitement des données manquantes est proposée dans le cadre d’une étude réelle avec des données transversales et longitudinales de l’enquête des trajectoires professionnelles.