Chargement en cours

Synthèses rédigées par les étudiants du cours de Culture numérique

Vinyle de Another Brick in the Wall de Pink Floyd (1979)
Vinyle de Another Brick in the Wall de Pink Floyd (1979)

L'enjeu des métadonnées musicales

Florian COOL, Ervan ROUSSEL
Le secteur de la musique connaît depuis peu de grands changements liés au numérique. La dématérialisation de la musique a entraîné un appauvrissement des données qui lui sont associées. Divers types de métadonnées (de propriété, commerciales, descriptives, etc.) sont pourtant associés aux fichiers musicaux mais elles sont aujourd'hui insuffisantes pour répondre aux enjeux qui y sont liés : rémunération des artistes et des ayants-droit, augmentation des revenus du secteur, promotion de la diversité culturelle, meilleures suggestions de musique en ligne, etc. Quelques projets sont néanmoins en cours pour tenter d'améliorer la situation.
(déposé le 2014-12-04 13:55:19)

« La musique en ligne n’est que bruit si elle est privée des informations qui la décrivent »
Jean-Robert Bisaillon

« Mettre sa musique sur le net sans métadonnées, c’est comme distribuer des flyers pour un concert sans indiquer le nom de la salle »
Jean-François Bert

Depuis le début des années 2000, le secteur de la musique a connu de grands changements liés au numérique. Alors que la musique circule plus que jamais, sa dématérialisation a néanmoins entraîné une perte des données. En effet, les supports traditionnels de la musique (vinyles, K7, CD, etc.) permettaient de faire figurer, sur le livret ou la pochette, le nom de l’artiste, le nom de l’album, la liste des titres mais également la date d'enregistrement, le nom des musiciens et des producteurs, les paroles des chansons, des informations relatives aux artistes (biographie, photographie), etc.

Vinyle de Another Brick in the Wall de Pink Floyd (1979)

Vinyle de Another Brick in the Wall de Pink Floyd (1979)

Au centre de celui-ci, on trouve un certain nombre d’informations : année d’enregistrement, disque dont est extrait le single, nom des membres, producteurs et co-producteurs, etc.

Aujourd'hui, lorsque l'on télécharge légalement un morceau de musique sur Internet, il n'est pas rare que celui-ci ne contienne que très peu d'informations, le plus souvent simplement le nom de l'interprète et le titre de la chanson. Il en est de même pour les musiques disponibles en streaming, un mode d'écoute de plus en plus plébiscité par les usagers, comme le souligne le rapport Lescure paru en mai 2013 qui indique que « si quelques plateformes font exception, les données disponibles sur un titre en ligne sont généralement beaucoup plus pauvres que celles qui figuraient sur le livret du CD ». Il est pourtant déjà possible d'apporter des informations à l'intérieur des fichiers musicaux en renseignant leurs métadonnées. Étymologiquement, le préfixe grec meta indique l’auto-référence, « métadonnées » signifie donc « données sur les données ». L’association des professionnels de l'information et de la documentation (ADBS) les définit ainsi :

« Ensemble structuré de données créées pour fournir des informations sur des ressources électroniques. Elles peuvent remplir différentes fonctions :

  • a) gestion des ressources décrites (suivi du cycle de vie : création, modification, archivage) ;
  • b) informations sur le contenu de la ressource pour en faciliter la découverte, la localisation, l'accès ;
  • c) suivi de l'utilisation et du respect des droits et conditions d'utilisation associés à la ressource.

Elles peuvent être exprimées dans le même format technique de codage que celui de la ressource qu'elles accompagnent et être disponibles en même temps qu'elle. »

Nous commencerons donc par présenter les différents types de métadonnées musicales et les enjeux qui en relèvent ; puis, nous évoquerons les difficultés rencontrées actuellement par toutes les personnes concernées par le domaine musical ; enfin, nous exposerons les différents projets en cours pour pallier ces carences.

Plan de l'article

Typologie des métadonnées musicales et enjeux associés
                Les métadonnées de propriété
                    L’identification des artistes
                    La rémunération des ayants-droit
                Les métadonnées de gestion/commerciales
                Les métadonnées descriptives
                Les contenus associés
                Les métadonnées d’acoustique
                Tableau récapitulatif

Les carences du système actuel
                Le tag id3
                Le manque de fiabilité des identifiants
                De nombreux acteurs aux intérêts divergents
                La diversité des bases de données et leur absence d'interopérabilité

Les projets en cours pour améliorer le système
                Digital Data Exchange (DDEX)
                Des projets de bases internationales des œuvres
                TagTaMusique (TGiT)

Conclusion

Webographie

Typologie des métadonnées musicales et enjeux associés

Afin de définir les différents types de métadonnées musicales existants, on peut se baser les travaux de deux auteurs :
- Jean-François Bert, expert des droits musicaux, fondateur et président de Transparency, tiers de confiance spécialisé dans la gestion des droits dans l'univers numérique ;
- Hugo Bon, auteur d'un mémoire de M2 Droit du Numérique sur l'encadrement des pratiques et des métadonnées comme nouveaux enjeux de la musique en ligne.

Jean-François Bert propose le premier une ébauche de typologie des métadonnées culturelles en novembre 2011, dans laquelle il distingue :

  • les métadonnées de propriété ;
  • les métadonnées de gestion (ou commerciales) ;
  • les métadonnées descriptives ;
  • les métadonnées d’enrichissement.

Hugo Bon reprend et adapte cette typologie aux métadonnées musicales en septembre 2012 en y ajoutant une cinquième catégorie, celle des métadonnées acoustiques. Dans le même temps (au 3ème trimestre 2012), Jean-François Bert publie un nouvel article dans lequel il réajuste ses définitions :  les contenus associés” viennent remplacer les “métadonnées d’enrichissement”. Notre réflexion s'appuiera sur les définitions fournies dans cet article.


Les métadonnées de propriété

« Les métadonnées de propriété identifient les structures et individus ayant un droit de propriété (commerciale ou intellectuelle) sur le contenu. On les trouve sous forme nominative (nom de l’interprète) ou de codes aux normes ISO (“identifiants”). Dans le secteur musical, trois identifiants sont utilisés :

  • ISRC (International Standard Recording Code) qui caractérise un enregistrement (audio et vidéo) et en indique le producteur et le pays d’enregistrement, il est généré par le producteur de l’enregistrement après attribution d’un code racine par des sociétés de producteurs (SCPP ou SPPF).
  • ISWC (International Standard Musical Work Code) qui caractérise une œuvre (et est rattaché aux IPI et parfois aux interprètes).
  • IPI (Interested Parties Information Code) qui caractérise un créateur ou un éditeur.

L’ISWC et l’IPI sont attribués par la Confédération internationale des sociétés d’auteur et compositeurs (CISAC). »

Ce type de métadonnées soulèvent aujourd'hui deux principaux enjeux : d'une part, l'identification des artistes ayant participé à la création des morceaux et, en découlant, la rémunération de leurs ayants-droit.

L’identification des artistes

Les métadonnées de propriété permettent d'établir la liste de l'ensemble des personnes associées à la paternité d'une œuvre et le rôle de chacun dans celle-ci. Pour cela, on utilisé les codes IPI, eux-même liés aux codes ISWC. Par exemple, une des chansons appelées Emie, ayant le numéro ISWC T-010.171.314-7, a une seule partie intéressée : Benny Hill, dont le numéro IPI est 00014107338. Ce numéro IPI peut être utilisé pour trouver toutes les autres œuvres de cet auteur. En lien avec l'ISWC, chaque partie joue au moins un rôle, qui peuvent être :

  • A : Auteur
  • C : Compositeur
  • CA : Auteur-compositeur
  • AR : Arrangeur
  • E : Éditeur
  • AM : Administrateur
  • SE : Sous-éditeur

Ce standard permet de différencier les créateurs d'une chanson (auteur) et les personnes qui l'adapte (arrangeurs).
Aux trois identifiants décrits par Jean-François Bert est venu s'ajouter, le 6 mars 2012, un quatrième identifiant, transversal, l'ISNI (International Standard Name Identifier, en français le Code international normalisé des noms). Celui-ci permet d’identifier de manière unique un artiste sous ses différents patronymes ou pseudonymes et ce, quelles que soient les variations issues des différentes langues. Cela permettra ainsi de retracer toutes les œuvres d’un même artiste dans les différents domaines culturels, que ce soit en tant qu’auteur ou interprète. Seront ainsi réunies sous un même identifiant :

  • les œuvres de Romain Gary et d'Émile Ajar ;
  • les œuvres de Guillaume Apollinaire et de Wilhelm Albert Włodzimierz Aleksander Apolinary Kostrowicki (son nom de naissance) ;
  • à la fois les chansons et les poèmes de Jim Morrison.

La rémunération des ayants-droit

La piètre qualité des métadonnées de propriété liées aux fichiers musicaux entraîne une mauvaise rétribution de toute la filière. Ainsi, si celles-ci viennent à manquer, à être incomplètes, erronées ou falsifiées, les revenus liés à l'utilisation des œuvres ne seront pas versés, ou bien seulement en partie, ou bien aux mauvaises personnes. Par exemple, on estime qu'en 2010, sur le territoire français, les producteurs et les interprètes se sont répartis près de 88 millions d'euros, les créateurs de musique et les éditeurs seulement 9. Or, si la qualité de ces métadonnées avait été meilleure, la part des créateurs, des interprètes et des petits producteurs aurait été bien supérieure. En effet, sur internet, ce sont ceux qui apparaissent dans les métadonnées qui sont rémunérés : c'est l'enjeu de l'équité financière.
Se pose également la question de la mise en ligne par les auteurs eux-mêmes de leurs œuvres sur des plateformes telles que Bandcamp, Soundcloud ou YouTube. Ces derniers ont ouvert le marché de la rémunération en direct en développant un système de versement de redevances clair, efficace et sans intermédiaire. Ces acteurs entrent directement en concurrence avec les sociétés de perception et de répartition des droits (SPRD) comme la Société des auteurs, compositeurs et éditeurs de musique (SACEM). Il existe toutefois un danger que ces plateformes créent de nouveaux monopoles.

Champs de métadonnées proposés sur Soundcloud

Champs de métadonnées proposés sur Soundcloud

Les artistes déposant leurs travaux sur Soundcloud sont invités à remplir eux-mêmes les métadonnées de leurs fichiers.
Soundcloud
Licence : Tous droits réservés -- Copyright

Les métadonnées de gestion/commerciales

« Les métadonnées commerciales sont implémentées par les producteurs, les distributeurs et les sites, dans une logique qui est propre à chaque intervenant afin de faciliter la gestion au quotidien, tant au niveau de son propre système d’information que de celui de ses partenaires. On retrouve ainsi les codes tarifaires, promotionnels, les territoires d’utilisation, tout ce qui peut concerner les licences d’autorisation et plus généralement toutes les codifications internes. »

Ces métadonnées permettent aux producteurs et aux distributeurs d'indiquer le prix de chaque titre, le prix de l'album, mais aussi les autorisations de diffusion en fonction des territoires et des différentes plateformes. Par exemple, Deezer, comme d'autres plateformes, a la possibilité de « géobloquer » une partie de ses contenus en fonction du territoire sur lequel se trouve l'adresse IP de l'internaute.

Les métadonnées descriptives

« Les métadonnées descriptives sont destinées à optimiser l’utilisation des fichiers par les moteurs de recherche, les sites et les applications. Elles permettent à l’utilisateur d’obtenir des résultats de recherche plus pertinents, de composer des programmes de radio/listes de lectures plus performants (sur des répertoires beaucoup plus étroits et profonds), etc.
Elles peuvent être implémentées par les producteurs, les distributeurs, les moteurs de recherche, les sites, ceux qui utilisent les applications, et parfois les utilisateurs eux-mêmes.

Les métadonnées descriptives peuvent être :

  • objectives (nom des différents intervenants, année de production, durée, rythme, type d’instruments utilisés, etc.) ;
  • culturelles (genre et sous-genre, thématiques abordées, etc.) ;
  • comportementales (“les internautes qui aiment ce fichier aiment aussi celui-là”). »

L'enjeu des métadonnées descriptives est d'abord de permettre un meilleur référencement de la musique. Mais, dans un contexte de web social, cela permet également aux utilisateurs d'obtenir des suggestions en fonction de ce qu'ils écoutent, de se voir proposer des listes de lecture ou de proposer les leurs aux autres usagers. Ainsi, sur la plupart des plateformes d'écoute en ligne, on peut se voir proposer des artistes similaires à ceux que l'on écoute, parce que le genre de musique indiqué dans les métadonnées est identique, ou, par exemple, parce que deux artistes ont le même guitariste. Les plateformes proposent également des « tops » par style de musique ou en fonction du succès des chansons (nombre d'écoutes par les autres usagers). Enfin, des descriptions plus précises dans les métadonnées descriptives comportementales permettent par exemple à Spotify de proposer aux usagers des playlists en fonction de leur humeur :

Playlists en fonction de l'humeur sur Spotify

Playlists en fonction de l'humeur sur Spotify

Licence : Tous droits réservés -- Copyright

Ces suggestions sont d'autant plus importantes que, pour choisir une plateforme d'écoute, l'internaute tient compte des suggestions qui lui sont faites. Il attend de ces plateformes qu'elles lui proposent des œuvres correspondant vraiment à ses goûts. Pour cela, ces plateformes recherchent toujours plus de croisements possibles entre les données des utilisateurs et des métadonnées musicales de plus en plus précises. Il en va également de l'enjeu de la diversité culturelle, car les œuvres proposées sont celles dont les métadonnées sont les mieux renseignées.

Les contenus associés

« Les contenus associés peuvent être « figés » et liés à des contenus (traductions, photos, livrets, biographies d’artistes, interviews, discographies ou filmographies, vidéos, chansons ou scènes supplémentaires, etc.). Ils peuvent prendre la forme de liens vers les sites officiels des artistes (actualités) et des tourneurs (dates de concerts), les médias officiels (articles de presse), les partenaires commerciaux (publicité, vente...), les sites sociaux (Wikipédia, Facebook), etc. Ils sont implémentés par les producteurs, les distributeurs, les moteurs de recherche, les sites, ceux qui utilisent les applications, et parfois les utilisateurs eux-mêmes. »

Les principaux intéressés de ces contenus associés sont bien souvent les utilisateurs. Ce sont ces contenus associés qui ressemblent le plus aux pochettes et aux livrets des supports traditionnels, voire à leurs éditions « Deluxe ». C'est ainsi que, face au manque d'implication des professionnels de la musique, on constate l'essor de communautés de fans qui renseignent des bases de données collaboratives à partir des contenus associés qu'ils possèdent.
De leur côté, les plateformes cherchent justement à développer de plus en plus les contenus associés aux artistes afin d'attirer un plus grand nombre d'utilisateurs. C'est par exemple le cas de Deezer qui propose désormais des biographies de chaque artiste :

Biographie de Marylin Manson sur Deezer

Biographie de Marylin Manson sur Deezer

Licence : Tous droits réservés -- Copyright

Les métadonnées d’acoustique

Selon Hugo Bon, les métadonnées d'acoustique sont des métadonnées non textuelles attachées à un fichier, relevant de l’analyse du signal. Ces métadonnées sont permises par les nouvelles technologies d’analyse et de description audio qui permettent de créer une empreinte digitale audio de chaque composition, identifiant et conservant les caractéristiques, uniques, de chaque enregistrement.
L’application phare et précurseuse en la matière est Shazam. Ce logiciel est très apprécié du grand public puisqu’il permet de mettre un nom d’artiste sur un morceau que l’on ne connaît pas et propose ensuite un lien vers plusieurs plateformes d’écoute en ligne ou de téléchargement (iTunes, YouTube ou Spotify). Son principe est le suivant : une large base de données sonores (20 millions de titres) est analysée, tous les titres sont échantillonnés et des repères apposés (fréquence, accords, rythmicité, périodicité, etc.) selon une grille prédéfinie. Quand le logiciel capte une nouvelle entrée, il l’analyse selon les éléments prédéfinis en amont et relève le plus grand nombre de repères connus. En croisant ces résultats et ceux de sa base de données, il peut, si le son est connu, restituer son identification à l’utilisateur.

Tableau récapitulatif

En guise de résumé, voici l'excellent tableau synthétique d'Hugo Bon :

Tableau synthétique des types de métadonnées

Tableau synthétique des types de métadonnées

Les carences du système actuel

Les problèmes rencontrés actuellement avec les métadonnées musicales sont dus à plusieurs facteurs : d'une part, la faiblesse du tag id3 et le manque de fiabilité des identifiants complique leur enregistrement ; ensuite, la présence d'une chaîne d'acteurs complexe crée un manque de communication entre eux ; enfin se pose le problème de l'absence de normalisation des bases de données.

Le tag id3

Actuellement, il existe six principaux formats de fichiers audio qui sont le MP3, le Wav, le Ogg, le FLAC (tous neutres), le WMA (promu par Microsoft) et le AAC (promu par Apple). Plusieurs types de tags permettent d’inclure des métadonnées dans ces fichiers musicaux : les Vorbis Comments, les tags MPEG-4, WMA, APE et surtout le plus connu d'entre eux, le tag ID3.
Le tag ID3 peut être inséré dans un fichier musical comme le mp3. Conçu par Eric Kemp en 1996, le tag ID3 permet, dans sa première version, d'indiquer le titre de la chanson, le nom de l'interprète, le nom de l'album, l'année de parution, de choisir le genre musical parmi les 80 proposés et d'émettre un commentaire sur la chanson.

Edition des tags id3 d'un fichier musical

Edition des tags id3 d'un fichier musical

On peut y modifier le nom de l'artiste, de l'album, l'année, le genre, le numéro de piste, de disque, la pochette et ajouter un commentaire.
Licence : Tous droits réservés -- Copyright


Une seconde version a rajouté la possibilité d’indiquer les paroles de la chanson, la pochette de l'album, l’auteur, le compositeur, le chef d'orchestre, etc. Seulement aucune mise à jour n’a eu lieu depuis 2000 et ces données s’avèrent aujourd’hui bien insuffisantes par-rapport à ce qu’on serait en droit d’attendre. Certains considèrent même les tags ID3 comme les plus mauvaises métadonnées existant dans le monde.

Le manque de fiabilité des identifiants

Les identifiants utilisés pour indiquer les œuvres et leurs créateurs (ISWC, IPI) sont rarement indiqués. De plus, dans le cas des créateurs indépendants, les identifiants d'enregistrement (ISRC) sont également souvent absents, de même que chez certaines grandes maisons de disques, lorsqu'il s'agit de diffuser rapidement les enregistrements sur Internet à des fins de promotion.
Lorsqu'ils ne sont pas absents, ces enregistrements sont souvent erronés à cause d'erreurs de saisie voire d'appropriation litigieuse. Sans compter qu'un nom d'artiste ou de chanson peut parfois s'écrire de nombreuses façons différentes : on peut en juger avec l'exemple de Last.fm qui a recensé par moins de 100 manières d'orthographier Knockin' on heaven's door par Guns N' Roses.
Un autre problème se pose avec la multiplication de numéros ISRC pour un même enregistrement à cause de compilations, de singles ou repressages locaux.
Le tout récent numéro ISNI fait déjà l'objet de problèmes de ce type. Sur plusieurs essais avec des auteurs classiques, nous avons constaté plusieurs dysfonctionnements, notamment de doublons.
L’absence ou la malfaçon d’identifiants peut générer des problèmes pour la rémunération précise des ayants-droit par les maisons de disques, ce qui entraîne des tensions entre acteurs et des rémunérations non adéquates, le plus souvent pour les artistes moins connu, ce qui nuirait à la diversité culturelle.
Cela pose également des soucis de recoupement avec les métadonnées d'autres bases de données, dont résulte une mauvaise exploitation des enregistrements (mauvaises affectations, doublons, bruit ou silence documentaire).

De nombreux acteurs aux intérêts divergents

En juin 2013, le québecois Jean-Robert Bisaillon a tenté dans un essai de dégager les raisons principales expliquant pourquoi « la problématique complexe de la création et de l'usage des métadonnées tarde à être soulevée et solutionnée ». Selon lui, il y a d'abord un manque de compréhension à l'égard du problème lui-même, mais surtout une chaîne d'acteurs complexe et aux intérêts, ce qui entraîne une faiblesse de la concertation sur le sujet.

  • Ayants-droits/auteurs : Rémunération, visibilité et diffusion de leurs œuvres
  • Pouvoirs publics : Proposer une diversité culturelle la plus importante possible pour valoriser les petits artistes
  • Maisons de disques : Rémunération
  • Plateformes de diffusion : Effectuer de meilleures suggestions et proposer un contenu de plus en plus riche à leurs auditeurs
  • Usagers : Obtenir le plus d'informations possible sur les artistes, musiques, etc
  • Bibliothécaires / Documentalistes : Référencement, catalogage avec de bonnes métadonnées

Pour les professionnels de la musique, il s'agit également d'un problème politique. En effet, celui qui va gérer ces données va prendre le pouvoir, ce qui explique les difficultés rencontrées pour trouver un terrain d’entente entre les différents acteurs. Si les sociétés de consommateurs ne prennent pas cette place, ce sont les sociétés privées, comme Apple, qui vont s'en emparer.

Du point de vue des documentalistes se pose la question de la fiabilité des sources. Il est important, pour établir un catalogage précis des œuvres, de retrouver les interprètes originaux de certaines chansons. Prenons l'exemple de la chanson Hey Joe, qui a été reprise par de nombreux artistes. Billy Roberts est le premier à en avoir fait un succès en 1962 et c’est la version de Tim Rose, que reprendra Jimi Hendrix qui la popularisa de manière planétaire, mais l’auteur original reste inconnu. De plus, quand Johnny Hallyday l’interprète en 1967, c'est en hommage à Jimi Hendrix et non à son auteur original, qui n'aura même jamais bénéficié de droits d’auteur. Or, les formats actuels de métadonnées ne permettent pas d'apporter autant de précisions.

La diversité des bases de données et leur absence d'interopérabilité

Dans le cadre de son étude, Jean-Robert Bisaillon a produit deux tableaux disponibles en ligne sous Licence Creative Commons :

La grande diversité de bases de données et des champs de métadonnées de ces bases entraîne leur non-interopérabilité. Le problème est le même dans les services publics. En France, deux grandes bases données de données discographiques cohabitent, à savoir celle de la BNF avec le dépôt légal et celle de Radio-France alimentant les radios du groupe. Or, ces deux bases ne communiquent ni entre elles ni avec les autres. Chacun remplit alors sa base de son côté en écrivant les mêmes informations ce qui génère à la fois une perte de temps et d'argent.
Face à l'énorme quantité de travail requise pour mettre à jour toutes les bases de données, il est nécessaire de mettre en place un travail collaboratif. Une des bases de données les plus célèbres est la Compact Disc Data Base (CDDB) qui regroupe des informations utiles pour renseigner des tags id3. Originellement collaborative, elle a été rachetée en 1998-1999 par la société Gracenote. CDDB est maintenant une marque déposée et elle fournit un service d'accès à différents partenaires logiciels (iTunes, Winamp), autoradio, téléphone, baladeur audio, périphérique multimédia.
En réaction à ce rachat, afin que les données restent libres, a été créée une nouvelle base de données collaborative et librement diffusable : MusicBrainz. Elle référence des enregistrements d’œuvres et non des œuvres elles-mêmes. D'autre part, un changement de licence de la part de CDDB avait déjà motivé une part des programmeurs a créer un projet libre et gratuit sous licence GNU, freedb.
Cet exemple illustre bien un problème par-rapport aux biens communs, au-delà de la musique : une société privée peut être mettre la main sur un travail collaboratif pour poser ses droits dessus ?

Description de l'album Discovery de Daft Punk sur le site MusicBrainz

Description de l'album Discovery de Daft Punk sur le site MusicBrainz

A défaut d'être interopérables, les différentes bases de données musicales en ligne mentionnent des liens vers les autres bases, ici dans le menu de droite.
Licence : Tous droits réservés -- Copyright

Les projets en cours pour améliorer le système


Digital Data Exchange (DDEX)

Le Digital Data Exchange (DDEX) est un organisme à but non lucratif créé en 2006 et constitué des plus importantes maisons de disques (EMI Music, Sony BMG Music Entertainment, Universal Music Group et Warner Music Group), de sociétés de gestion de droits, d'éditeurs ou encore de fournisseurs de services de musique numérique.
L’enjeu est la standardisation des échanges commerciaux entre ces différents opérateurs à l’échelle mondiale. Pour cela, l'objectif est d'avoir un protocole commun qui permette aux ordinateurs de gérer les achats et les ventes et de répartir ainsi les droits générés.
Quatre premières normes ont été définies fin 2006 :

  • l’ERN (Electronic Release Notification Message Suite Standard), permet aux producteurs de renseigner le contenu de leurs fichiers musicaux à l’aide de metatag (balises de données) ;
  • la DSR (Digital Sales Report Message Suite) permet aux fournisseurs de contenus en ligne de transmettre les informations liées aux ventes des fichiers musicaux à leur producteurs (maison de disque) ainsi qu’aux sociétés de gestion de droits (comme la SACEM, par exemple) ;
  • la troisième norme constitue le dictionnaire de données qui recense et explique les termes utilisés ;
  • la quatrième permet d’identifier les différents intervenants de la chaîne de valeur.

Le but premier de cette standardisation est une optimisation de l'efficacité des échanges de données pour réduire les coûts. Une étude de 2013 a montré que les fournisseurs de musique numérique adoptant les normes d’échange de données DDEX ont réduit leurs dépenses opérationnelles clés de 66 % sur les cinq dernières années.

Des projets de bases internationales des œuvres

L'idée d'une seule et grande base de données référençant l'ensemble des œuvres musicales et devant permettre à toutes les sociétés de gestion collective d’aller chercher l’information à la même source n'est pas nouvelle. Plusieurs projets ont vu le jour avec cet objectif, notamment le consortium GRD (Global Repertoire Database), créé en 2011. Il semblerait cependant que ce projet ne voit pas le jour malgré les investissements effectués, comme en atteste un communiqué officiel transmis en juillet 2014. Un autre projet, baptisé International Music Registry (IMR), est en cours depuis 2012 sous l'égide de l'Organisation Mondiale de la Propriété Intellectuelle (OMPI). Il doit aboutir à la base ultime des œuvres dans tous les pays, sans considération de problème de langues ou de caractères alphabétiques.

TagTaMusique (TGiT)

Suite aux constats effectués dans son essai, Jean-Robert Bisaillon a mis en place en 2013 le projet logiciel TagTaMusique (TGiT) pour améliorer les métadonnées. Il permet d'encapsuler plus de 40 champs d'information directement dans les fichiers musicaux MP3 et FLAC, il supporte les paroles et les images et permet de recherche et/ou d'assigner l'identifiant ISNI. Il redonne leur place aux premiers ayants-droit des œuvres et des contenus en leur permettant de sauvegarder eux-mêmes les métadonnées dans les fichiers sonores.

Description de l'album Reflektor d'Arcade Fire dans le logiciel TGiT

Description de l'album Reflektor d'Arcade Fire dans le logiciel TGiT

Par-rapport au tag id3, on a la possibilité d'assigner un numéro ISNI, d'indiquer les musiciens du groupe, de rajouter la maison de disque, le studio d'enregistrement, le réalisateur, le mixeur, etc.
Jean-Robert Bisaillon
Licence : Tous droits réservés -- Copyright

Ce logiciel s'appuie sur le principe du crowdsourcing : ce terme fait référence à divers procédés de mise en commun d’informations et de savoirs, ainsi qu’à leur mise à disposition collective, dans le but d’enrichir la connaissance dans un esprit d’intérêt général. Face au chaos informationnel régnant dans les métadonnées des fichiers audionumériques, la collaboration entre les acteurs professionnels et la foule peut parfois être utilisée pour accomplir des tâches pour lesquelles il n’existe pas de responsabilité sectorielle définie (par exemple, la rémunération des ayants-droit) et qui représentent une somme de travail trop importante. Des usagers mélomanes possèdent des connaissances très fines sur les artistes, les époques, les esthétiques musicales ; certains collectionneurs possèdent des exemplaires physiques d’enregistrement très rares permettant de retrouver des informations sur des œuvres que les acteurs industriels ont relégué aux catalogues inactifs. Le plus grand frein à la mise en place d’initiatives de production collaborative demeure la réticence des acteurs professionnels à céder une portion de la maîtrise d’œuvre aux amateurs.

Conclusion

    Si les différents types de métadonnées nécessaires pour répondre aux enjeux actuels du secteur musical ont bien été définis par Jean-François Bert et Hugo Bon, on constate néanmoins que celles-ci ne toujours pas correctement implémentées. Le tag id3, utilisé pour la majorité des fichiers musicaux, ne peut contenir l'ensemble de ces métadonnées. D'autre part, les identifiants utilisés pour distinguer les artistes et les enregistrements manquent de fiabilité, y compris le dernier d'entre eux, l'ISNI. La présence d'une chaîne d'acteurs complexe crée également des divergences d'intérêt entre eux. Enfin, l'absence de normalisation des bases de données nuit à leur interopérabilité. Plusieurs projets (normes de standardisation des échanges commerciaux, base internationale des œuvres, indexation de contenus musicaux basée sur le crowdsourcing) sont en cours pour tenter de remédier à tous ces problèmes.

Webographie

BERT Jean-François (2011.11.25) Les métadonnées : enjeu majeur de la culture, https://web.archive.org/web/20130216200810/http://www.jf-bert.com/blogs/blog5.php? [copie d'écran du 16.02.2013]

BERT Jean-François (2012) Un concert de métadonnées, @rabesques n°67, pp. 14-16, http://www.abes.fr/content/download/2378/10090/version/2/file/ABES+N67+sommaire.pdf [consulté le 12.12.2014]

BISAILLON Jean-Robert (2013) Un projet logiciel d'indexation de métadonnées pour la mise en valeur du répertoire musical, http://fr.scribd.com/doc/132264313/Livre-Blanc-TGiT [consulté le 12.12.2014]

BISAILLON Jean-Robert (2013.11.14) Les métadonnées musicales : le produit d'avenir, Musique.Monde.Connectés., http://www.bloguesocan.ca/fr/music-metadata-a-product-with-a-future/ [consulté le 12.12.2014]

BISAILLON Jean-Robert, PLAMONDON Josée (2014) Des métadonnées communes pour faciliter l'accès à la musique, Argus n°43, pp. 20-23, http://fr.scribd.com/doc/243708380/Des-metadonnees-communes-pour-faciliter-l-acces-a-la-musique [consulté le 12.12.2014]

BON Hugo (2012.05) Encadrement des pratiques et des métadonnées : les nouveaux enjeux de la musique de ligne, http://www.patrimoine-immateriel.fr/wp-content/uploads/2012/06/Encadrement_pratiques_metadonnees_nouveaux_enjeux_juridiques_musique_en_ligne_Hugo_Bon.pdf [consulté le 12.12.2014]

BON Hugo (2012.09.04) Les métadonnées de la musique, un trésor bien protégé, MyScienceWork, https://www.mysciencework.com/news/7806/les-metadonnees-de-la-musique-un-tresor-bien-protege [consulté le 12.12.2014]

BON Hugo (2012.09.20) A qui appartiennent les métadonnées ?, MyScienceWork, https://www.mysciencework.com/news/8156/a-qui-appartiennent-les-metadonnees [consulté le 12.12.2014]

BOUTON Rémi (2011.04.04, màj 2014.09.09) L'enjeu des métadonnées musicales, La musique n'est pas qu'un fichier son, Centre d'Information et de Ressources pour les Musiques Actuelles (IRMA), http://www.irma.asso.fr/L-ENJEU-DES-METADONNEES-MUSICALES [consulté le 12.12.2014]

CHOUGNET Pauline (2014) l'ISNI prend son essor, @rabesques n°76, pp. 9-11, http://www.abes.fr/content/download/3110/12931/version/1/file/Arabesques76.pdf [consulté le 12.12.2014]

FANEN Sophian (2012.04.09) La musique en ligne accro à la métadonnée, Libération.fr, http://ecrans.liberation.fr/ecrans/2012/04/09/la-musique-en-ligne-accro-a-la-metadonnee_948696 [consulté le 12.12.2014]

IRMA (2014.01.30) "Le streaming est en train de transformer l'industrie musicale", http://www.irma.asso.fr/Le-streaming-est-en-train-de [consulté le 12.12.2014]

REES Marc (2014.02.25 màj 2014.06.16) A. Filippetti lance le chantier des registres ouverts de métadonnées, NextInpact, http://www.nextinpact.com/news/86140-aurelie-filippetti-lance-chantier-registres-ouverts-metadonnees.htm [consulté le 12.12.2014]

 

Documents associés complémentaires

Metadata song
Metadata song (Vidéo)

Vidéo

Chanson écrite par un étudiant pour une présentation finale sur les métadonnées... Enjoy :)
Licence : YouTube Standard Licence
TGIT Pourquoi indexer une musique ?
TGIT Pourquoi indexer une musique ? (Vidéo)

Vidéo

Jean-Robert Bisaillon décrit brièvement l'intérêt d'indexer de la musique.
Jean-Robert Bisaillon
Licence : YouTube Standard Licence
 

Notes de lecture

Les métadonnées de la musique, un trésor bien protégé

Un concert de métadonnées

Livre blanc TGiT

L'enjeu des métadonnées musicales

Les métadonnées : enjeu majeur de la culture