ÉTHIQUE HEBDO du 29 septembre 2017 – Big Data, pour le bien commun ?

Connaissez-vous l’initiative Big Data for Social Good? Le projet a été lancé en février 2017 lors du Mobile World Congress par GSMA, une association de plusieurs centaines d’opérateurs de téléphonie mobile à travers le monde. Big Data for Social Good réunit des fabricants de téléphones et d’appareils, des éditeurs de logiciels, des fournisseurs d’équipements et des sociétés Internet, dans le but de participer à l’atteinte des objectifs de développement durable de l’Organisation des Nations Unies. Parmi ces objectifs figurent notamment la réduction des impacts liés aux épidémies et aux catastrophes naturelles. Les différents opérateurs, de concert avec des agences de l’ONU et des gouvernements nationaux, réunissent de grands ensembles de données variées pour générer de l’information visant à soutenir la prise de décision rapide en cas de crise. Pour faciliter la mise en œuvre de cette initiative, la Fondation des Nations Unies a mis à la disposition de GSMA ses services de coordination et d’intégration.
 
La semaine dernière, en marge de l’Assemblée générale de l’ONU, GSMA a annoncé l’élargissement de son réseau de partenaires pour ce projet. Cette importante annonce est l’occasion de faire un rapide survol de quelques-uns des enjeux éthiques soulevés par l’utilisation des données massives.
 

Les données massives (Big Data)

Les données massives sont de grands ensembles de données non structurées et générées en continu par une quantité croissante d’appareils électroniques et d’applications qui y sont liées. Par exemple, l’information que l’on génère et diffuse sur les réseaux sociaux tels Facebook et Twitter, et l’information recueillie par les appareils de géolocalisations, par les téléphones mobiles et par tous les objets connectés sont des données non structurées. Grâce à des algorithmes de plus en plus raffinés, ces gigantesques ensembles peuvent être mis en relation et analysés en temps réel.
 

Quelques enjeux éthiques

Une des premières questions qui se posent lorsqu’on pense aux données massives concerne le respect de la vie privée et la confidentialité des données collectées. Même si les données sont anonymisées, c’est-à-dire qu’elles ne peuvent pas servir directement à identifier une personne, les données massives permettent de déduire une foule de renseignements délicats au sujet des gens (ex : orientation politique, revenu familial, état de santé, etc.). Par exemple, l’analyse des données d’achats d’un client peut être utilisée à des fins de profilage marketing en vue d’offrir aux consommateurs des produits de plus en plus personnalisés. C’est ainsi qu’un père de famille qui recevait chez lui des offres d’achat de couches pour bébé a découvert que sa fille était enceinte. Il y a donc eu bris de confidentialité entourant la condition physique de la cliente et atteinte au respect de sa vie privée.
 
La question de la qualité du consentement est également importante. Par exemple, une personne peut accepter de divulguer certains renseignements personnels, nécessaires pour l’utilisation d’une application. Or, si la compagnie propriétaire de l’application décide par la suite de coupler ces données, qu’elle aura au préalable anonymisées, dans un but de recherche sur une clientèle cible, peut-on vraiment dire qu’il y a eu un consentement libre et éclairé de la part de l’utilisateur ?
Mais où est le danger si les données sont anonymes? Les compagnies administratrices de gigantesques bases de données sont généralement bien au fait de l’importance d’anonymiser les données qu’elles possèdent afin de protéger la vie privée de leurs clients. Il en va de leur crédibilité envers la clientèle pour laquelle elles veulent être des institutions dignes de confiance. Toutefois malgré l’existence de mécanismes de protection, elles ne sont pas à l’abri d’un piratage informatique. La question de la sécurité entourant les bases de données qu’elles possèdent se pose alors de façon cruciale. Beaucoup de firmes désireuses de recourir aux données massives afin d’accroître leur efficacité demeurent mal équipées en ce qui a trait à la sécurité informatique.
 
La question de savoir qui est propriétaire de ces ensembles de données et à quelles fins elles sont utilisées est également importante. Une fois mises en commun et formatées de façon à être corrélées et analysées, les données massives peuvent constituer une source d’informations de très grande valeur. Dans son livre Big Data, penser l’homme et le monde autrement, Gilles Babinet rapporte qu’aux États-Unis, une firme bien connue spécialisée dans les biotechnologies agricoles a acquis un fournisseur de matériels et logiciels spécialisés dans l’agriculture de précision, ensuite une compagnie d’analyse climatologique, et finalement une compagnie d’analyse des sols. La mise en commun de l’ensemble de ces données, en provenance de domaines divers (ex. : environnement, variations météorologiques, structures de terrains, etc.), mais ayant toutes une incidence sur l’agriculture, permet à la dite firme de vendre aux agriculteurs des services-conseils concernant le meilleur moment pour semer ou récolter. Or, plusieurs associations d’agriculteurs américains ont remarqué que les tarifs des entreprises d’analyse de terrain et de climatologie ont augmenté peu après leur acquisition par la dite firme. Dans le contexte où l’acquisition des données et leur mise en commun a été faite par une société à but lucratif, on ne peut vraiment s’étonner d’une hausse des prix. Seulement, il en va d’une activité, l’agriculture, qui a un impact direct sur l’offre alimentaire. La propriété des données du domaine agricole à des fins commerciales implique un risque d’augmentation des prix du panier d’épicerie, et ce d’autant plus que cette propriété se concentre entre les mains de quelques compagnies. S’il est vrai que l’utilisation de données massives peut contribuer à bonifier, voire optimiser les cultures agricoles, ne devrait-on pas s’assurer de protéger ces données contre leur appropriation par quelques entreprises à visée lucrative ?
 
Ce ne sont que quelques-uns des enjeux et risques associés à l’utilisation des données massives. Pour en apprendre davantage, notamment sur les possibilités de profilage et de stigmatisation sociale, nous vous invitons à relire l’Éthique-Hebdo du 7 novembre 2014.