Recherche d'informations musicales - Music information retrieval

Recherche d'information musicale ( MIR ) est la science interdisciplinaire de la récupération des informations de la musique . Le MIR est un domaine de recherche petit mais en pleine croissance avec de nombreuses applications dans le monde réel. Les personnes impliquées dans MIR peuvent avoir une formation en musicologie , psychoacoustique , psychologie , étude musicale universitaire, traitement du signal , informatique , apprentissage automatique , reconnaissance optique de la musique, intelligence informatique ou une combinaison de ceux-ci.

Applications

MIR est utilisé par les entreprises et les universitaires pour catégoriser, manipuler et même créer de la musique.

Classement musical

L'un des sujets de recherche classiques du MIR est la classification des genres, qui classe les éléments musicaux dans l'un des genres prédéfinis tels que le classique, le jazz, le rock, etc. La classification de l'humeur, la classification des artistes et l'étiquetage de la musique sont également des sujets populaires.

Systèmes de recommandation

Plusieurs systèmes de recommandation pour la musique existent déjà, mais étonnamment peu sont basés sur des techniques MIR, utilisant plutôt la similitude entre les utilisateurs ou une compilation de données laborieuse. Pandora , par exemple, utilise des experts pour marquer la musique avec des qualités particulières telles que "chanteuse" ou "ligne de basse forte". De nombreux autres systèmes trouvent des utilisateurs dont l'historique d'écoute est similaire et suggèrent aux utilisateurs de la musique inédite de leurs collections respectives. Les techniques MIR pour la similitude dans la musique commencent maintenant à faire partie de tels systèmes.

Séparation des sources musicales et reconnaissance des instruments

La séparation des sources musicales consiste à séparer les signaux originaux d'un signal audio mixte. La reconnaissance des instruments consiste à identifier les instruments impliqués dans la musique. Divers systèmes MIR ont été développés qui peuvent séparer la musique en ses pistes composantes sans accès à la copie principale. De cette façon, par exemple, des pistes de karaoké peuvent être créées à partir de pistes musicales normales, bien que le processus ne soit pas encore parfait en raison du fait que les voix occupent une partie du même espace de fréquence que les autres instruments.

Transcription musicale automatique

La transcription automatique de la musique est le processus de conversion d'un enregistrement audio en notation symbolique, telle qu'une partition ou un fichier MIDI . Ce processus implique plusieurs tâches d'analyse audio, qui peuvent inclure la détection multi-hauteur, la détection d' apparition , l'estimation de la durée, l'identification de l'instrument et l'extraction d'informations harmoniques, rythmiques ou mélodiques. Cette tâche devient plus difficile avec un plus grand nombre d'instruments et un plus grand niveau de polyphonie .

Génération musicale

La génération automatique de musique est un objectif soutenu par de nombreux chercheurs du MIR. Des tentatives ont été faites avec un succès limité en termes d'appréciation humaine des résultats.

Méthodes utilisées

La source de données

Les partitions donnent une description claire et logique de la musique à partir de laquelle travailler, mais l'accès aux partitions, qu'elles soient numériques ou non, est souvent peu pratique. La musique MIDI a également été utilisée pour des raisons similaires, mais certaines données sont perdues lors de la conversion en MIDI à partir de tout autre format, à moins que la musique n'ait été écrite en tenant compte des normes MIDI, ce qui est rare. Les formats audio numériques tels que WAV , mp3 et ogg sont utilisés lorsque l'audio lui-même fait partie de l'analyse. Les formats avec perte tels que mp3 et ogg fonctionnent bien avec l'oreille humaine, mais peuvent manquer de données cruciales pour l'étude. De plus, certains encodages créent des artefacts qui pourraient être trompeurs pour tout analyseur automatique. Malgré cela, l'omniprésence du mp3 a signifié que de nombreuses recherches dans le domaine les impliquent comme matériau source. De plus en plus, les métadonnées extraites du Web sont incorporées dans MIR pour une compréhension plus complète de la musique dans son contexte culturel, et cela consiste récemment en une analyse des balises sociales pour la musique.

Représentation des caractéristiques

L'analyse peut souvent nécessiter un certain résumé, et pour la musique (comme pour de nombreuses autres formes de données), cela est réalisé par extraction de caractéristiques , en particulier lorsque le contenu audio lui-même est analysé et que l'apprentissage automatique doit être appliqué. L'objectif est de réduire la quantité de données à un ensemble gérable de valeurs afin que l'apprentissage puisse être effectué dans un délai raisonnable. Une caractéristique commune extraite est le Mel-Frequency Cepstral Coefficient (MFCC) qui est une mesure du timbre d'un morceau de musique. D'autres caractéristiques peuvent être utilisées pour représenter la clé , les accords, les harmonies, la mélodie , la hauteur principale , les battements par minute ou le rythme de la pièce. Il existe un certain nombre d'outils d'extraction de fonctionnalités audio disponibles ici

Statistiques et apprentissage automatique

  • Méthodes de calcul pour la classification, le regroupement et la modélisation — extraction de caractéristiques musicales pour la musique mono et polyphonique , similarité et correspondance de motifs , récupération
  • Méthodes formelles et bases de données — applications d' identification et de reconnaissance automatisées de la musique , telles que le suivi des partitions , l'accompagnement, le routage et le filtrage automatiques pour les requêtes musicales et musicales, les langages de requête, les normes et autres métadonnées ou protocoles pour la gestion et la récupération d' informations musicales , les systèmes multi-agents , recherche distribuée)
  • Logiciels de recherche d'informations musicales — Web sémantique et objets numériques musicaux, agents intelligents, logiciels collaboratifs, recherche sur le Web et recherche sémantique , requête par bourdonnement / Recherche par son , empreinte acoustique
  • Analyse musicale et représentation des connaissances — résumé automatique, citation, extrait, déclassement, transformation, modèles formels de musique, partitions et représentations numériques, indexation musicale et métadonnées .

Autres issues

  • Interaction et interfaces homme-machine — interfaces multimodales, interfaces utilisateur et convivialité , applications mobiles, comportement de l'utilisateur
  • Perception musicale, cognition, affect et émotions — métriques de similarité musicale , paramètres syntaxiques, paramètres sémantiques, formes musicales, structures, styles et méthodologies d'annotation musicale
  • Archives musicales, bibliothèques et collections numériques — bibliothèques musicales numériques , accès public aux archives musicales, références et bases de données de recherche
  • Droits de propriété intellectuelle et musique — questions de droit d'auteur nationales et internationales , gestion des droits numériques , identification et traçabilité
  • Sociologie et économie de la musique — industrie musicale et utilisation du MIR dans la production, la distribution, la chaîne de consommation, profilage des utilisateurs, validation, besoins et attentes des utilisateurs, évaluation des systèmes IR de la musique, constitution de collections de tests, conception expérimentale et métriques

Activité académique

Voir également

Les références

Liens externes

Exemples d'applications MIR