Autour des propositions de Alex Pentland
L’une des idées principales avancées par Pentland et coll. (2021) concerne celle d’une « coopérative de données » et de la nécessité d’un organisme tiers de ce type pour gérer les données des individus. Ces coopératives fonctionneraient à la manière des syndicats de travailleurs qui assurent la défense des droits de leurs membres. Elles s’exerceraient principalement à l’échelle d’une communauté et seraient donc soumises à de fortes contraintes géographiques. Quiconque souhaite en savoir plus sur une communauté donnée et procéder à une analyse de données à son sujet procéderait alors par le biais d’une coopérative de données associée à celle-ci. Si la communauté en question est largement investie dans le recueil du consentement, une requête de ce type pourrait s’avérer fructueuse. Néanmoins, un problème de représentativité de la population se poserait, altérant la qualité et l’utilité de ces données.
Nous estimons que ces questions de qualité pourraient être résolues si les coopératives de données ne se limitent pas à un territoire donné, mais concernent au contraire tous les utilisateurs d’une plateforme, par exemple dans le domaine des réseaux sociaux (avec Facebook) ou des prestataires de soins de santés (le National Health Service : le système de la santé publique du Royaume-Uni). Cela impliquerait que les utilisateurs des plateformes concernées consentent à la gestion de leurs données par un syndicat ne gérant que les données de la dite plateforme. Le concept de la coopérative de données gagnerait en clarté pour les sociétés désireuses d’en utiliser les données à des fins d’analyse : elles pourraient alors demander un type particulier de données qu’elles nécessiteraient pour leur recherche ou leur besoin commercial. En ce qui concerne l’aspect territorial, ces données pourraient être séparées géographiquement en fonction de la région souhaitée. Une telle approche des coopératives de données réglerait la question de la qualité des données. En effet, cela suffirait à assurer une couverture plus complète sur les données ayant trait à la plateforme en question. Éviter des limites d’ordre géographique permettrait à de telles coopératives de gagner en exploitabilité et de s’étendre beaucoup plus rapidement, puisqu’elles ne seraient alors pas limitées à une communauté donnée.
Même si des communautés de données fondées sur la proximité géographique devaient se former, la question de la qualité de ces données n’en demeurerait pas moins. Si une communauté est constituée de personnes d’âges différents par exemple, cela peut mener à collecter des données de types très différents à leur sujet. Étant donné que les générations plus âgées ont des empreintes numériques plus limitées, cela aurait pour effet des données plus dispersées et moins représentatives, menant potentiellement à des biais de représentation, avec une sous-représentation des aînés et d’autres minorités. Si ces données ne décrivent que des points de données ayant trait à des individus, ils ne seront guère utiles aux sociétés qui cherchent à avoir une vision exhaustive.
De surcroît, avoir des coopératives de données autour d’une société ou d’un usage peut inciter les utilisateurs à la rejoindre. Quand les utilisateurs utilisent une plateforme, il suffit d’envisager une mise à jour des conditions générales, à l’instar de ces contrats d’embauche qui comportent une section sur les droits syndicaux du travailleur. Des syndicats de données de ce type pourraient également défendre les droits des utilisateurs contre la plateforme en cas de besoin et gagneraient en puissance puisqu’il ne s’agirait plus d’individus isolés luttant contre une société du type Facebook, mais de millions d’utilisateurs insatisfaits par une politique de données œuvrant ensemble. Il y a déjà eu des cas de rassemblements similaires, lors de situations de fuites de données par exemple.
L’autre aspect important concernant la réussite des coopératives de données concerne l’indifférence des utilisateurs dont les données servent de « capital ». Un grand nombre de personnes ignorent que leurs données sont collectées par le biais de cookies et qu’il existe une option pour s’en soustraire. Probablement très peu de personnes lisent les conditions générales des plateformes sociales sur lesquelles ils s’inscrivent. Il existe une pratique courante selon laquelle des plateformes « gratuites », se font en réalité payer en données personnelles. Même si les coopératives de données liées à des plateformes spécifiques pourraient aider à promouvoir les droits de partage de données personnelles, il apparait indispensable que le partage de données devienne un sujet de préoccupation collective pour que la mise en pratique de changements ait lieu. L’indifférence actuelle vis-à-vis de la sécurité des données émane peut-être d’un manque de culture technologique et de connaissance sur les enjeux des données. La notion de donnée et la teneur des informations collectées reste difficilement compréhensible pour le grand public.
Si certains d’entre nous peuvent se demander pourquoi des règles obsolètes nous gouvernent en ce vingt et unième siècle, par exemple en matière de propriété foncière (Minton, 2009) et d’accès à la nature (Right to Roam, 2022), il convient de comprendre qu’il faudra du temps pour que nous réalisions l’ampleur de ce que nous avons cédé en consentant au partage de nos données et encore plus pour qu’une réglementation suive permette de faire face à la situation. De grands scandales tels que celui de Cambridge Analytica ont mis en lumière cette question, mais il faudra du temps pour mettre en place des réglementations permettant d’éviter ce type de pratiques abusives, en l’absence de tout contrôle. En attendant, la seule manière de demander des comptes aux entreprises passe par le « tribunal » de l’opinion publique.
Une perspective qui se dessine serait d’étudier l’émergence de syndicats de travailleurs aux États-Unis et en Europe, et en particulier la réaction très forte qu’elles ont subie de la part des grandes sociétés aux États-Unis. L’appartenance syndicale a en effet diminué au cours des dernières décennies en raison des mesures agressives prises par les entreprises. La perspective, pour de grandes entreprises internationales d’avoir à renoncer à leur utilisation de données gratuites est susceptible de susciter une réaction similaire, et notamment des actions de lobbying. Afin de surmonter cette difficulté, il sera nécessaire d’avoir une bonne connaissance des processus de négociation et des précédents historiques à l’international où les taux de syndicalisation sont plus élevés, notamment en Suède et au Danemark.
Ce texte a été écrit par Saulė Gabrielė, Nadia Leonova et Lukas Utzig dans le cadre du programme Emerging Leaders.
Saule Gabriele Petraityte est une Data Scientist lituanienne spécialisée sur les données spatiales qui travaille sur des projets de villes « orientées données ». Elle est CEO de Datahood et la co-fondatrice de GovTech Lab Lithuania.
Nadia Leonova est consultante auprès du Dispositif mondial pour la réduction des risques de catastrophe (GFDRR) de la Banque mondiale. Son travail porte sur l’analyse des impacts des catastrophes naturelles dans les environnements urbains. Nadia est titulaire d’un master en villes intelligentes et analyses de données urbaines et une licence en architecture.
Lukas Utzig est chercheur/concepteur et titulaire d’un master en recherche spatiale du Space Syntax Lab d’UCL. Il travaille actuellement comme architecte principal et urbaniste au sein d’un cabinet international. Ses travaux de recherche sont axés sur la compréhension de la répartition spatiale des déplacements, des ségrégations et des réseaux sociaux.