Pour un syndicat de la donnée

  • Publié le 15 janvier 2023
  • Emerging Leaders
  • 8 minutes

De nos jours, nous générons des volumes importants de données simplement en nous promenant avec nos téléphones portables et en consentant à l’utilisation de cookies. Si certaines des données collectées sont utilisées par des chercheurs pour le bien commun, d’autres sont utilisées à des fins de ciblage publicitaire. Face aux sociétés qui font commerce de nos données, il manque un mécanisme permettant aux individus de déterminer ou comprendre l’utilisation de leurs données personnelles et à quelles fins. Un article signé Saulė Gabrielė, Nadia Leonova et Lukas Utzig, Emerging Leaders chez Urban AI.

Découvir la version longue, À qui appartiennent les Données ?

Si l’on peut désirer avoir davantage d’autonomie dans la manière dont nos données personnelles sont collectées et utilisées, nous avons déjà cédé un grand nombre de données sans prendre en compte cette question. Pour qu’une nouvelle modalité de collecte et de conservation des données se mette en place, les mentalités doivent commencer par changer.

Nous examinerons ici comment pourraient avoir lieu la collecte et l’échange de données à l’avenir, notamment en ce qui concerne le contrôle de chacun sur ses propres données et la manière dont les stratégies proposées pourraient influencer l’avenir de la recherche menée par les sociétés privées ou au service du bien commun.

Nous soutenons qu’il n’existe pas aujourd’hui suffisamment d’intérêt et de compréhension de la part du public sur la question de la propriété et de l’usage des données. Nous passerons en revue des idées concernant leur gestion proposées dans Building the New Economy [Construire la nouvelle économie] (Pentland et coll., 2021) et en examinons la faisabilité dans le contexte actuel.

Établir un droit de propriété sur les données

Des données agrégées peuvent livrer des enseignements précieux sur des facteurs socioculturels très variés, servant à identifier et analyser un public cible par exemple. Les points de données individuels n’ont quant à eux pas en soi une grande valeur. Pentland et coll. (2021) soutiennent cependant que les individus devraient être en mesure d’exercer un droit de propriété sur leurs données et qu’ils sont en droit de s’attendre à ce qu’elles soient protégées et sécurisées afin d’éviter d’être identifiés et ciblés. Il est impératif de confier la gestion de l’accès aux données à un organisme tiers pour permettre à tout un chacun de reprendre le contrôle sur leurs données. C’est là l’idée phare mise en avant dans Building the New Economy [Construire la nouvelle économie] (Pentland et coll., 2021).

Pentland (2014) et Pentland et coll. (2021) critiquent la manière dont les données sont cédées par les individus à de grandes structures et, en premier lieu, aux entreprises, sans qu’il n’y ait de processus de négociation pour les consommateurs quant à leur valeur, ni d’enregistrement des permissions données de manière sécurisée et fiable. Ils comparent ce déséquilibre de pouvoir avec la situation des travailleurs pendant la transformation industrielle du dix-neuvième siècle, laquelle avait conduit à la formation de syndicats chargés d’apporter un soutien aux ménages à faible et moyen revenu en matière de prêts et de services financiers : négociation collective des salaires, mise en place de coopératives de crédit et de banques coopératives.

Employant les termes de « syndicat de données » [data union] ou de « coopérative de données » [data cooperative], Pentland et coll. (2021) proposent une stratégie d’organisations communautaires et décentralisées dont les membres partagent un point commun, que ce soit sur le plan géographique, social ou à travers leurs habitudes de consommation. Ces syndicats détiendraient un registre des données de leurs membres, accompagné d’un historique des droits d’utilisation consentis, et représenteraient l’intérêt collectif à la fois sur le plan juridique et financier. Les membres y gagneraient le fait que les données agrégées seraient mises à disposition à des fins d’analyse collective dans le domaine de la santé, du transport, etc., pour permettre des améliorations au service de la communauté tout en négociant une juste indemnisation pour l’utilisation de données personnelles à des fins commerciales par les grandes sociétés.

Dans son ouvrage Social Physics [Physique sociale] (2014), Pentland utilise la notion de « communs informationnels » [public data commons], faisant référence au concept économique d’un bien public commun accessible et utilisable par tous, mais exigeant également qu’on établisse un ensemble de règles strictes que chacun doit suivre. Ce concept a évolué dans son ouvrage ultérieur, Building the New Economy [Construire la nouvelle économie] (Pentland et coll., 2021) puisque les syndicats et les coopératives qu’il y mentionne sont des structures privées, à but non lucratif ne travaillant plus dans l’intérêt de ses membres. Cela témoigne d’un glissement conceptuel d’un système axé sur les utilisateurs individuels et régi par des règles fixées par l’État à un système fluide de négociation entre intérêts divergents. Il met en scène d’une part des grandes sociétés et de l’autre des collectifs comptant de nombreux membres, rétablissant ainsi un équilibre manquant jusqu’à présent.

Autour des propositions de Alex Pentland

L’une des idées principales avancées par Pentland et coll. (2021) concerne celle d’une « coopérative de données » et de la nécessité d’un organisme tiers de ce type pour gérer les données des individus. Ces coopératives fonctionneraient à la manière des syndicats de travailleurs qui assurent la défense des droits de leurs membres. Elles s’exerceraient principalement à l’échelle d’une communauté et seraient donc soumises à de fortes contraintes géographiques. Quiconque souhaite en savoir plus sur une communauté donnée et procéder à une analyse de données à son sujet procéderait alors par le biais d’une coopérative de données associée à celle-ci. Si la communauté en question est largement investie dans le recueil du consentement, une requête de ce type pourrait s’avérer fructueuse. Néanmoins, un problème de représentativité de la population se poserait, altérant la qualité et l’utilité de ces données.

Nous estimons que ces questions de qualité pourraient être résolues si les coopératives de données ne se limitent pas à un territoire donné, mais concernent au contraire tous les utilisateurs d’une plateforme, par exemple dans le domaine des réseaux sociaux (avec Facebook) ou des prestataires de soins de santés (le National Health Service : le système de la santé publique du Royaume-Uni). Cela impliquerait que les utilisateurs des plateformes concernées consentent à la gestion de leurs données par un syndicat ne gérant que les données de la dite plateforme. Le concept de la coopérative de données gagnerait en clarté pour les sociétés désireuses d’en utiliser les données à des fins d’analyse : elles pourraient alors demander un type particulier de données qu’elles nécessiteraient pour leur recherche ou leur besoin commercial. En ce qui concerne l’aspect territorial, ces données pourraient être séparées géographiquement en fonction de la région souhaitée. Une telle approche des coopératives de données réglerait la question de la qualité des données. En effet, cela suffirait à assurer une couverture plus complète sur les données ayant trait à la plateforme en question. Éviter des limites d’ordre géographique permettrait à de telles coopératives de gagner en exploitabilité et de s’étendre beaucoup plus rapidement, puisqu’elles ne seraient alors pas limitées à une communauté donnée.

Même si des communautés de données fondées sur la proximité géographique devaient se former, la question de la qualité de ces données n’en demeurerait pas moins. Si une communauté est constituée de personnes d’âges différents par exemple, cela peut mener à collecter des données de types très différents à leur sujet. Étant donné que les générations plus âgées ont des empreintes numériques plus limitées, cela aurait pour effet des données plus dispersées et moins représentatives, menant potentiellement à des biais de représentation, avec une sous-représentation des aînés et d’autres minorités. Si ces données ne décrivent que des points de données ayant trait à des individus, ils ne seront guère utiles aux sociétés qui cherchent à avoir une vision exhaustive.

De surcroît, avoir des coopératives de données autour d’une société ou d’un usage peut inciter les utilisateurs à la rejoindre. Quand les utilisateurs utilisent une plateforme, il suffit d’envisager une mise à jour des conditions générales, à l’instar de ces contrats d’embauche qui comportent une section sur les droits syndicaux du travailleur. Des syndicats de données de ce type pourraient également défendre les droits des utilisateurs contre la plateforme en cas de besoin et gagneraient en puissance puisqu’il ne s’agirait plus d’individus isolés luttant contre une société du type Facebook, mais de millions d’utilisateurs insatisfaits par une politique de données œuvrant ensemble. Il y a déjà eu des cas de rassemblements similaires, lors de situations de fuites de données par exemple.

L’autre aspect important concernant la réussite des coopératives de données concerne l’indifférence des utilisateurs dont les données servent de « capital ». Un grand nombre de personnes ignorent que leurs données sont collectées par le biais de cookies et qu’il existe une option pour s’en soustraire. Probablement très peu de personnes lisent les conditions générales des plateformes sociales sur lesquelles ils s’inscrivent. Il existe une pratique courante selon laquelle des plateformes « gratuites », se font en réalité payer en données personnelles. Même si les coopératives de données liées à des plateformes spécifiques pourraient aider à promouvoir les droits de partage de données personnelles, il apparait indispensable que le partage de données devienne un sujet de préoccupation collective pour que la mise en pratique de changements ait lieu. L’indifférence actuelle vis-à-vis de la sécurité des données émane peut-être d’un manque de culture technologique et de connaissance sur les enjeux des données. La notion de donnée et la teneur des informations collectées reste difficilement compréhensible pour le grand public.

Si certains d’entre nous peuvent se demander pourquoi des règles obsolètes nous gouvernent en ce vingt et unième siècle, par exemple en matière de propriété foncière (Minton, 2009) et d’accès à la nature (Right to Roam, 2022), il convient de comprendre qu’il faudra du temps pour que nous réalisions l’ampleur de ce que nous avons cédé en consentant au partage de nos données et encore plus pour qu’une réglementation suive permette de faire face à la situation. De grands scandales tels que celui de Cambridge Analytica ont mis en lumière cette question, mais il faudra du temps pour mettre en place des réglementations permettant d’éviter ce type de pratiques abusives, en l’absence de tout contrôle. En attendant, la seule manière de demander des comptes aux entreprises passe par le « tribunal » de l’opinion publique.

Une perspective qui se dessine serait d’étudier l’émergence de syndicats de travailleurs aux États-Unis et en Europe, et en particulier la réaction très forte qu’elles ont subie de la part des grandes sociétés aux États-Unis. L’appartenance syndicale a en effet diminué au cours des dernières décennies en raison des mesures agressives prises par les entreprises. La perspective, pour de grandes entreprises internationales d’avoir à renoncer à leur utilisation de données gratuites est susceptible de susciter une réaction similaire, et notamment des actions de lobbying. Afin de surmonter cette difficulté, il sera nécessaire d’avoir une bonne connaissance des processus de négociation et des précédents historiques à l’international où les taux de syndicalisation sont plus élevés, notamment en Suède et au Danemark.

Ce texte a été écrit par Saulė Gabrielė, Nadia Leonova et Lukas Utzig dans le cadre du programme Emerging Leaders.

 

Saule Gabriele Petraityte est une Data Scientist lituanienne spécialisée sur les données spatiales qui travaille sur des projets de villes « orientées données ». Elle est CEO de Datahood et la co-fondatrice de GovTech Lab Lithuania.

Nadia Leonova est consultante auprès du Dispositif mondial pour la réduction des risques de catastrophe (GFDRR) de la Banque mondiale. Son travail porte sur l’analyse des impacts des catastrophes naturelles dans les environnements urbains. Nadia est titulaire d’un master en villes intelligentes et analyses de données urbaines et une licence en architecture.

Lukas Utzig est chercheur/concepteur et titulaire d’un master en recherche spatiale du Space Syntax Lab d’UCL. Il travaille actuellement comme architecte principal et urbaniste au sein d’un cabinet international. Ses travaux de recherche sont axés sur la compréhension de la répartition spatiale des déplacements, des ségrégations et des réseaux sociaux.

Bibliographie

Minton, A. (2009) Ground control: Fear and happiness in the twenty-first-century city [Contrôle au sol : Peur et bonheur dans la ville du vingt et unième siècle], Penguin Books, Londres

Right to Roam (2022) https://www.righttoroam.org.uk. Site Internet sur le « droit d’errer » (consulté le 10 mai 2022).

Pentland, A (2014) Social physics: How good ideas spread — the lessons from a new science [Physique sociale : comment les bonnes idées se diffusent — Les enseignements d’une nouvelle science], Londres, Penguin Books.

Pentland, A., Lipton, A. et Hardjono, T. (2021) Building the New Economy: Data as Capital [Construire la nouvelle économie : Les données comme capital], Cambridge, MA, MIT Press.

Bibliographie

explore

Article
Article

Complexité et adaptation dans les écosystèmes

La recherche architecturale contemporaine est largement fascinée par le vivant, mais dans une approche où les récents développements de la technologie permettent de dépasser la seule métaphore organique. Alisa Andrasek nous explique ainsi le lien entre la biologie et son travail architectural par son intérêt pour la distribution de l’information dans les processus naturels, complexité qu’elle tente d’approcher par le big data. Son travail de design computationnel est marqué par une convergence entre information et matériaux, dans une synthèse de plus en plus complexe et ouverte qui lui permet de dépasser la production de formes pour aborder les processus dynamiques de la matière elle-même. Alisa Andrasek est architecte, directrice et fondatrice de l’agence Biothing. Elle enseigne à l’AA School of Architecture de Londres.

Découvrir
Article

De l’IA en architecture

Stanislas Chaillou

Article

De l’IA en architecture

Dans son application au bâti et à l’urbain, l’intelligence artificielle suscite autant d’enthousiasme que de peur. Architecte et data scientist, Stanislas Chaillou met en perspective cette innovation en la réinscrivant dans une histoire technologique et en démystifiant son fonctionnement, basé sur l’apprentissage statistique. L’IA apporte trois contributions majeures à l’architecte : l’assistance (pour des tâches fastidieuses), des options (dans le processus itératif de conception), et la relation au contexte (en prenant en compte davantage de données locales). L’IA représente ainsi moins un risque de standardisation que l’opportunité de développer des styles, de s’adapter à des contextes multiples et de décupler les potentiels de l’architecture.

Découvrir
Article

Interactions collaboratives

Yann Moulier-Boutang

Article

Interactions collaboratives

Dès les années 2000, dans son article pour Mutations de Rem Koolhaas, Yann Moulier-Boutang évoquait le capitalisme cognitif, le numérique mais aussi l’environnement, thématique devenue centrale car enfin considérée comme problématique. Il voyait déjà le retour à une quête de sens, une volonté de vivre après le mythe du Progrès et de la croissance continue, pour se tourner vers le bien-vivre. La destruction de l’ère industrielle s’est accélérée et il en appelle aujourd’hui à une écologie de l’esprit, revenant sur l’urbanisation généralisée et ses principaux bouleversements, dont l’affirmation du capitalisme de l’immatériel ou l’importance des externalités. Il nous présente les nouveaux outils conceptuels nécessaires pour penser et survivre dans cette complexité, notamment ses concepts de « pollinisation » ou de « halo », mais aussi l’importance du collaboratif, de la confiance et de l’open data. Yann Moulier-Boutang est économiste et essayiste. Il enseigne à l’université de technologie de Compiègne, à l’université Binghamton de New York, ainsi qu’à l’université de Shanghai UTSEUS, au laboratoire Complexcity.

Découvrir