Droit de regard: un système fondé sur le consentement pour le partage des données en ligne

Read in English: Anglais

La problématique du respect de la vie privée en lien avec le partage de données en ligne, qu’il s’agisse de photos ou de données génomiques, a récemment fait l’objet de nombreuses discussions. La manière de protéger la vie privée de personnes qui figurent dans des données partagées telles que des photos de groupe, mais qui n’ont pas elles-mêmes mis ces données en ligne et n’en sont peut-être même pas informées, constitue un vrai problème.

5 min de lecture

Kévin Huguenin (HEC Lausanne-UNIL), Alexandra-Mihaela Olteanu (HEC Lausanne-UNIL & EPFL) et leurs collègues chercheurs ont trouvé une solution à cette problématique en créant un système sécurisé fondé sur le consentement. Avec ce système, les prestataires de services peuvent ainsi protéger les personnes dont la vie privée est susceptible d’être affectée par le partage de données en ligne.

Kévin Huguenin est professeur en sécurité de l’information et vie privée. Il s’intéresse tant aux aspects techniques, qu’humains et sociaux.
Alexandra-Mihaela Olteanu est assistante-doctorante. Elle s’intéresse au domaine de la vie privée, à l’apprentissage machine, aux algorithmes et à la théorie des jeux.

En avril 2018, Mark Zuckerberg, le PDG et fondateur de Facebook, a montré aux politiciens américains du Capitole de quelle manière Facebook traitait les données des utilisateur·trice·s. Ces audiences ont simplement permis de faire le point sur le débat actuel autour de l’utilisation des données à caractère personnel par les organisations qui hébergent ou collectent ces données. Depuis l’avènement d’Internet, les utilisateurs ont publié librement des données à caractère personnel en ligne, souvent sans réfléchir aux conséquences. Cependant, avec la popularité croissante des réseaux sociaux, des milliards de personnes échangent à présent des données, et la manière dont ces informations sont contrôlées et utilisées suscite de plus en plus d’inquiétudes.

Certaines données semblent être strictement personnelles, mais elles dévoilent en fait des informations concernant d’autres personnes

En principe, tout le monde s’accorde à dire que chaque individu devrait être en droit d’exercer un contrôle par consentement sur les renseignements relatifs à son identité. Toutefois, le problème se complique lorsque les données en question ont des conséquences sur la vie privée d’autres personnes que celui ou celle qui les a mises en ligne. Ce type de données est souvent désigné sous le terme de « données personnelles concernant plusieurs personnes ». Les photos de groupe ou les vidéos dans lesquelles plusieurs personnes apparaissent en sont de bons exemples. Tout comme les données qui semblent être strictement personnelles mais qui dévoilent en fait des informations concernant d’autres personnes, également appelées « données personnelles interdépendantes ». C’est le cas par exemple des données génomiques qui peuvent avoir des conséquences pour les parents de la personne ayant mis les données en ligne.

Chaque fois que quelqu’un partage des données à caractère personnel impliquant plusieurs personnes, comme une photo de groupe, il serait judicieux de s’assurer que quiconque souhaitant préserver sa vie privée puisse le faire, y compris les personnes qui ne sont pas au courant de la mise en ligne des données. En effet, certains pays ont adopté des lois pour protéger la vie privée et éviter l’utilisation en ligne abusive de données, comme les lois qui traitent de la pornographie de vengeance par exemple. Donner aux personnes un contrôle sur ce type de données est toutefois un exploit technique.

Protection de l’identité

C’est le défi que Kévin Huguenin, Alexandra-Mihaela Olteanu et leurs collègues chercheurs tentent de relever avec le système ConsenShare qu’ils ont mis au point (plus de détails dans leur article présenté lors du symposium sur la sécurité des réseaux et des systèmes répartis (NDSS 2018) à San Diego, CA, USA).

Ce système est capable de protéger des personnes qui ignorent que l’on porte atteinte à leur vie privée

Leur solution répond à un certain nombre d’objectifs clés. Elle a été testée pour la mise en ligne d’images, mais elle peut fonctionner avec toutes sortes de données différentes (audio, vidéo, géoréférencement, génome). Elle est capable d’identifier les personnes susceptibles d’être affectées par la divulgation de données, d’obtenir leur consentement avant que les données ne soient publiées et de traiter et partager les données, tout en préservant la vie privée. Dans une large mesure, ce système est capable de protéger des personnes qui ignorent que l’on porte atteinte à leur vie privée et peut même protéger l’identité/la vie privée de personnes à l’encontre les fournisseurs de la plateforme qui héberge le service.

Dans ses principes de base, ConsenShare repose essentiellement sur deux entités. La première est un service de gestion de l’identité (IMS en anglais) qui se charge de l’identification et de la prise de contact avec des personnes. La seconde est un service de gestion de contenu (CMS en anglais) qui traite la mise en ligne et le partage des données, qu’il s’agisse d’une photo ou d’une vidéo par exemple, ainsi que le processus de consentement, y compris toute modification nécessaire des données. Dans le cas des photos, par exemple, Flickr pourrait être le CMS et Facebook l’IMS. Les protocoles régissant la communication entre ces deux éléments principaux garantissent que les informations obtenues par le CMS, l’IMS et les personnes impliquées sont minimales, en particulier lorsque certaines des personnes impliquées ne donnent pas leur consentement.


(cliquer pour agrandir)

Prenons l’exemple de la mise en ligne de photos. À l’origine, les utilisateur·trice·s s’inscrivent pour bénéficier du service en donnant des informations visant à confirmer leur identité. Ensuite, si des données sont mises en lignes par le biais du service, le système détecte les utilisateurs affectés, hormis la personne qui met les informations en ligne. Il contacte ensuite ces personnes, leur propose de donner leur consentement, puis publie le contenu avec les restrictions appropriées en fonction de l’octroi du consentement ou non. Les utilisateurs peuvent établir des règles pour gérer le niveau de consentement qu’ils souhaitent octroyer. Les détails, par exemple le visage, des utilisateurs non-inscrits qui sont incapables d’accorder leur consentement sont brouillés sur l’image. En transmettant quelques photos de son visage à l’IMS, un utilisateur peut profiter de la demande de consentement lorsque des photos et des vidéos sur lesquelles il figure vont être partagées sur le CMS.

Le système parvient à détecter les utilisateurs enregistrés associés à un contenu en particulier

Ainsi le système parvient à détecter les utilisateurs enregistrés associés à un contenu en particulier, en recourant à la technologie appropriée comme la reconnaissance faciale pour les photos. Le système les contacte en privé en ne donnant qu’un minimum d’informations nécessaires pour prendre une décision quant à leur consentement et en toute connaissance de cause (en cachant par exemple les informations qui exigent le consentement d’autres utilisateurs). Il permet aussi d’agir en fonction de la décision de consentement prise: en supprimant par exemple quelqu’un d’une photo ou en l’assombrissant partiellement ou totalement. Ce faisant, le système concilie, pour un même contenu, les décisions de consentement émanant de différentes personnes.

Les auteurs de cette recherche ont conçu le système de telle manière qu’il soit robuste et efficace au niveau de la sécurité et de la confidentialité. Il s’agissait notamment de vérifier qu’il ne soit pas possible de créer de faux comptes et que des personnes mal intentionnées qui voudraient mettre en ligne des informations ne puissent pas contourner le système. Ils se sont assurés aussi de l’aspect pratique et fonctionnel du système en considérant les contraintes imposées aux utilisateurs en matière de ressources processeur et de connexion réseau lors des périodes de pointe.

Demande des utilisateurs

Une enquête menée par l’équipe de chercheur·euse·s semble indiquer qu’il existe un besoin et une demande pour le service ConsenShare. Les résultats ont montré qu’au moins 60% des plus de 300 participants à l’enquête étaient inquiets au sujet du partage de données de géoréférencement, de données multimédia et génomiques. 10% ont été victimes de discriminations ou de préjudices suite à la publication en ligne de contenus les concernant. En outre, seuls 40% des utilisateurs de Facebook ayant pris part à l’enquête ont taggé ou mis des liens vers le profil de leurs amis; autrement dit, ces amis pourraient ne pas être au courant du contenu où ils figurent. Un tiers des participants avait pris contact avec des amis pour leur demander d’enlever le contenu publié. Plus de la moitié des participants, à savoir 54% ont affirmé qu’ils utiliseraient certainement un système tel que ConsenShare.

Comme les auteurs le soulignent, il existe de nombreuses raisons de déployer le service ConsenShare, et un réel argument commercial pour les organisations, puisque son adoption pourrait contribuer à éviter les enquêtes ou les litiges. En mettant en œuvre un service apprécié des utilisateurs, son adoption pourrait augmenter la base d’utilisateurs et par conséquent faire grimper indirectement les recettes. Il serait en outre possible de monétiser le service plus directement. Le fait de savoir que des solutions de ce type existent donnerait par ailleurs aux décideur·euse·s politiques davantage de choix législatifs en matière de protection de la vie privée.


Papier de recherche: Consensual and Privacy-Preserving Sharing of Multi-Subject and Interdependent Data. In Proceedings of the 25th Network and Distributed System Security Symposium (NDSS), San Diego, CA, United States, Feb. 2018. DOI: 10.14722/ndss.2018.23002


Crédit photo: Ldprod | Dreamstime.com