<aside>
❄️ Autotag est un outil conçu pour la classification automatique de collections musicales utilisant des techniques de deep learning (Essentia / TensorFlow).
</aside>
Utilisation
- Les fichiers audio sont chargés et traités séquentiellement.
- Pour chaque fichier, plusieurs attributs sont extraits et classés.
- Les résultats sont ensuite exportés en csv/json pour analyse ou utilisation ultérieure.
Détail
- Autotag distingue les attributs simples (instrumental ou vocal, triste ou joyeux, dansant ou non, le tempo, …) et les attributs à choix multiples (les genres musicaux, les types d’instruments, les émotions).
- Pour les attributs à choix multiples, une moyenne des prédictions est calculée et les meilleures valeurs sont sélectionnées en Top5 ou Top10.
Traitement
- Analyse Audio : Nous utilisons la librairie Essentia pour le traitement initial des fichiers audio. Elle permet de charger et de transformer les fichiers audio en formats compatibles avec les modèles de deep learning.
- Deep Learning : TensorFlow est un framework open-source pour l'apprentissage automatique exécutant des modèles pré-entraînés de deep learning. Ces modèles reconnaissent et classent diverses caractéristiques musicales à partir de fichiers audio.
- Des modèles spécifiques (Discogs-EffNet, MSD-MusiCNN, TempoCNN) ****sont utilisés pour analyser des caractéristiques telles que le genre, le tempo, l'humeur, le thème, et d'autres attributs pertinents.