Le CEM a récemment engagé un important chantier pour créer un centre de ressource en ligne permettant de rassembler les études, les analyses, les bonnes pratiques qui permettent à chacun de prendre connaissance des impacts positifs et mesurables de la musique lorsque celle-ci est placée au cœur de la société, en se référant notamment à chacun des 17 Objectifs de développement durable de l’Agenda 2030 des Nation-Unies.
Nous avons souhaité initier la rubrique « Analyses » du centre ressources par une contribution de François Pachet à propos de la musique et l’intelligence artificielle, dans l’esprit de son intervention lors de notre événement à Mafra le 30 avril dernier.
Non, l’IA ne se nourrit pas des œuvres
Ode à la singularité
F. Pachet, chercheur en intelligence artificielle
« L’IA se nourrit de nos œuvres, de celles des artistes qu’elle leur vole. » Cette phrase — ou ses nombreuses variantes — est devenue un refrain chez les défenseurs forcenés du droit d’auteur. Elle est pourtant fausse, dans à peu près tous les sens possibles. Mais pour le comprendre, encore faut-il s’intéresser à ce que ces systèmes font vraiment — et écouter, aussi, ce que ces IA génératives nous disent de nous-mêmes.
Ceux qui prennent le temps de plonger dans les rouages des algorithmes sous-jacents, ces fameux réseaux de neurones profonds, constatent une chose simple : ces machines ne copient pas des œuvres qu’on lui fournit, elles détectent des similarités entre ces oeuvres. Elles apprennent à représenter efficacement ce qui revient, ce qui se répète, ce qui se ressemble.
Prenons le cas des séquences — qu’elles soient textuelles, musicales, ou visuelles. Si l’on nourrit une IA avec des séquences radicalement différentes, sans points communs, le résultat est clair : l’algorithme n’apprend rien. Il ne voit là qu’un chaos ininterprétable, du bruit. Certes, même dans des œuvres qui nous semblent très distinctes, il peut détecter des régularités qui nous échappent : des tournures syntaxiques, des structures harmoniques, des enchaînements récurrents. Mais il ne le fera que si ces régularités sont effectivement présentes.
Surtout, ce qu’il retient, ce qu’il encode, ce ne sont pas les œuvres elles-mêmes. Ce sont ces régularités, ces patterns. L’IA ne conserve ni le style d’un auteur, ni la voix d’un chanteur, ni la touche d’un peintre : elle apprend à produire du “plus de la même chose”, comme le dit Andrej Karpathy dans ses fameuses vidéos pédagogiques. Elle systématise. Elle prolonge. Elle étire ce qui a déjà été fait.
Dès lors, le véritable sujet n’est pas ce que l’IA "vole", mais ce que nous produisons. Et force est de constater que nous produisons beaucoup de “contenus” auto-similaires. Beaucoup de “encore une chanson”, “encore un article”, “encore une série”, comme le regrettait Céline dans une fameuse interview des années 50. Nous vivons dans une société saturée de contenus qui se ressemblent, et c’est précisément cela qui rend l’IA si efficace : parce qu’elle s’entraîne sur un matériau où l’originalité est rare, et les répétitions abondantes.
Imaginez un jeu de données contenant un seul livre de Pascal, un traité de Descartes, une pièce de Shakespeare, une chanson de Brassens, un poème de Lamartine, un discours de De Gaulle. Il est probable que l’IA n’en tirerait pas grand-chose. L’apprentissage serait maigre, et le résultat, peu convaincant. Voilà un beau sujet de thèse, au passage : entraîner une IA sur un corpus volontairement hétérogène, fondamentalement singulier — et observer le désastre à la sortie.
En musique, on estime à plus de 100 millions le nombre de titres disponibles sur les plateformes de streaming, avec près de 100 000 nouveaux morceaux publiés chaque jour. Et la diversité, selon toutes les métriques disponibles, décline (Cf. Pachet & Gitzinger, Why is Music Declining ? Early Production is the Root of all Evils). L’uniformisation est une réalité, objectivable.
Face à cela, vouloir retirer ses œuvres des ensembles d’entraînement, comme le propose l’AI Act européen, est un geste à la fois vain et illusoire. Il y aura toujours des milliers d’autres œuvres qui contiennent les mêmes structures, les mêmes motifs, les mêmes idées — ressassées, recyclées, reproduites. Le problème n’est pas que l’IA nous copie, c’est que nous nous copions nous-mêmes.
Alors, que nous dit l’IA ? Peut-être ceci : si vous voulez qu’on ne puisse pas vous imiter, soyez vraiment originaux. Créez ce que personne ne sait faire. Soyez dissonants. Singuliers. Étonnants. Ce qui est inédit est, par définition, difficile à prédire. Ce qui rompt les habitudes résiste à l’automatisation. Bien sûr, si votre
création devient populaire, elle sera imitée, elle entrera à son tour dans le grand tout digestible par les machines. C’est le prix de la diffusion, de la popularité, et il faut l’accepter: on ne peut avoir le succès, la paternité, et refuser les filiations. Ou alors il fait faire ce que préconise Kafka: rester à sa table, attendre que le monde vienne à nous. Mais cette injonction pourtant si belle ne résiste pas longtemps au désir irrépressible de popularité.
Notre société n’est pas constituée d’individus géniaux et isolés, chacun produisant une œuvre sacrée digne d’une protection éternelle. Nous sommes, avant tout, un réseau d’individus mus par des désirs (parfois mimétiques), des influences partagées, une tendance irrépressible à l’imitation. Il faut le constater — et peut-être même le célébrer.
L’IA peut être vue comme une force punitive, une malédiction payenne, révélant la banalité de nos productions répétées. Mais elle peut aussi être entendue comme un appel : osez sortir des sentiers battus. Cessez de répéter. Incarnez le nouveau. Voilà l’unique manière, aujourd’hui, de rendre l’IA obsolète — ou du moins de la laisser derrière vous, incapable de suivre.