Et s’ils utilisaient des photos de votre enfant pour entraîner une intelligence artificielle ?
Le 22 mai dernier, la moitié de l’humanité a reçu un email qui n’est pas passé inaperçu. Facebook, qui compte plus de 3 milliards d'utilisateurs actifs par mois, et Instagram, qui en compte 2 000 autres (même si certains d'entre eux ont probablement aussi Facebook), ont informé leurs utilisateurs que leurs données seraient utilisées pour former des modèles d'intelligence artificielle (IA). sur lequel travaille Meta, la société mère de ces réseaux sociaux.
Meta a ouvert la voie à ceux qui voulaient exercer leur droit de ne pas participer à ce jeu. Cependant, le processus était lourd et, parfois, ne fonctionnait pas. L'autorité irlandaise de protection des données, pays où elle a son siège européen, a demandé à l'entreprise fondée par Mark Zuckerberg de geler son initiative. Finalement, Meta a cédé et l'a paralysé en Europe le 14 juin .
Quatre jours plus tôt, l’ONG Humans Rights Watch (HRW) publiait une enquête révélant que des photographies de mineurs prises sur Internet sans consentement étaient utilisées pour former de « puissants outils d’IA ». Le référentiel d'images LAION-5B, que plusieurs développeurs utilisent pour alimenter leurs bases de données, "contient des liens vers des photos identifiables d'enfants brésiliens", précise l'ONG. « Les noms de certains d’entre eux apparaissent dans la légende ou dans l’URL où est stockée l’image. Dans de nombreux cas, leur identité est facilement traçable, y compris des informations sur le moment et l'endroit où se trouvait l'enfant au moment où la photo a été prise », conclut HRW.
L'organisation a détecté au moins 170 photos de mineurs brésiliens entrées dans la base de données sans autorisation. Après l'avis de HRW, LAION-5B a reconnu qu'il détenait ces images et a procédé à leur suppression de son référentiel. "Les enfants ne devraient pas vivre dans la peur de voir leurs photos volées et utilisées contre eux", a déclaré Hye Jung Han, chercheur à HRW spécialisé dans les enfants et la technologie. Peu de temps après, Hye a trouvé 190 photos de garçons et de filles australiens également introduites dans LAION-5B sans le consentement de leurs parents. Certains d’entre eux provenaient de YouTube.
Le Brésil et l’Australie sont-ils des cas isolés ? L’analyse de Hye suggère que non. Elle n'a examiné qu'environ 5 000 images d'enfants de chaque pays, ce qui représente environ 0,0001 % du référentiel LAION-5B. « Nous ne savons pas que des images d’enfants soient utilisées dans la formation à l’IA en Europe. Cependant, il est très probable que ces images soient collectées et utilisées dans des modèles d'IA sur notre continent », déclare Felix Mikolasch, avocat spécialisé en protection des données chez NOYB (acronyme de None of Your Business , none of your business), une organisation autrichienne dédiée à la protection des données. à défendre les droits numériques des citoyens européens.
Quel type de consentement est requis pour utiliser des photos d’enfants ? « Les mineurs de moins de 14 ans ne peuvent pas donner un consentement valable à ces fins. En dessous de cet âge, le consentement des deux parents, du tuteur ou similaire est requis », explique Jorge García Herrero, avocat spécialisé en protection des données.
"Les modèles ne mémorisent pas d'images, ils apprennent seulement les schémas mathématiques sous-jacents pour fabriquer des images synthétiques précises par rapport à celles de la base de données d'entraînement", explique García Herrero, délégué à la protection des données (personne qui garantit le respect de la réglementation). d'une entreprise qui dispose d'une importante banque d'images. "Si vous faites les choses correctement, vous demandez le consentement des modèles mineurs ou de leurs parents pour utiliser l'image et supprimez le contexte des photos", dit-il, faisant référence aux métadonnées (telles que la date ou le lieu où la photo a été prise). cela peut aider à identifier les sujets.
Que devons-nous faire si nous découvrons la photo d’une personne que nous connaissons dans l’un de ces référentiels ? « Les citoyens peuvent demander directement sa suppression. Vous pouvez également contacter l'AEPD. En outre, il est possible de réclamer des dommages-intérêts devant les tribunaux», explique Mikolasch.
Plaintes à Meta
Quelques heures après que Meta ait envoyé l'e-mail à tous les utilisateurs d'Instagram et de Facebook leur disant que l'entreprise souhaitait utiliser leurs données pour entraîner son IA, l'avocat Luis Gervás de la Pisa a déposé deux plaintes. L’une devant l’Agence espagnole de protection des données (AEPD) et l’autre devant l’autorité irlandaise. « La mesure viole mon droit d'accès et de suppression. Autrement dit, je veux savoir si mes données sont réellement utilisées pour cette tâche et s’ils ne me demandent pas mon consentement pour faire ce qu’ils disent vouloir faire », dit-il. Les plaintes sont désormais arrêtées, tandis que Meta a décidé de geler sa décision.
L'organisation NOYB, pour sa part, a déposé 11 autres plaintes auprès des autorités de protection des données de plusieurs pays de l'UE. « Meta signifie essentiellement que vous pouvez utiliser n'importe quelle donnée provenant de n'importe quelle source à n'importe quelle fin et la rendre accessible à n'importe qui dans le monde, à condition que cela soit fait à l'aide de la technologie de l'IA. C’est clairement le contraire du respect du règlement général sur la protection des données », a déclaré l’avocat Max Schrems, fondateur de NOYB.
Facebook et Instagram ne sont pas les seuls réseaux sociaux à vouloir profiter des données de leurs utilisateurs pour entraîner l'IA de leur maison mère. X, l'ancien Twitter, le fait également par défaut. Ceux qui ne souhaitent pas que leurs tweets et messages privés soient utilisés pour entraîner Grok, l'outil d'IA générative d'Elon Musk , doivent désactiver cette fonction (qui est activée par défaut) dans les paramètres de la plateforme.
MANUEL G. PASCUAL 01 AOÛT 2024 El Pais Espagne