music recommendation web application based on rhythmic similarity using locality sensitive hashing - Application Web de recommandation musicale basée sur la similitude rythmique à l'aide de la loc

music recommendation web application based on rhythmic similarity using locality sensitive hashing

Données du site Web

1.0.0

Télécharger

Application Web de recommandation musicale basée sur la similitude rythmique à l'aide de hachage sensible à la localité (LSH):

Ce référentiel contient une application Web qui s'intègre à un système de recommandation musicale, qui exploite un ensemble de données de 3 415 fichiers audio, chacun durant trente secondes, en utilisant une mise en œuvre de hachage sensible à la localité (LSH) pour déterminer la similitude rythmique, dans le cadre d'une affectation pour le cours fondamental de l'évolution de l'analyse des mégadonnées (DS2004).

Dépendances:

Cahier Jupyter (installation)
librosa (installer)
Ipython (installer)
pandas (installation)
Numpy (installation)
Scipy (installer)
TQDM (installation)
Scikit-Learn (Installer)
Agacer (installer)
Flash (installation)

Introduction:

Le domaine de la recherche d'informations musicales présente un défi en raison des différentes façons dont l'audio peut être représenté, ce qui rend difficile de déterminer les fonctionnalités que les fonctionnalités doivent être prioritaires dans les requêtes. Pour simplifier ce problème, notre implémentation se concentre spécifiquement sur le rythme des chansons en tant que seule fonctionnalité de requête. Bien que les recherches antérieures aient exploré la requête musicale basée sur le rythme, les méthodes actuelles souffrent d'inefficacité, car elles nécessitent l'interrogation de l'ensemble de la structure de données pour correspondre aux rythmes de la chanson. Pour surmonter cette limitation, nous proposons l'utilisation du hachage sensible à la localité (LSH), une technique qui identifie efficacement des éléments similaires dans de grands ensembles de données sans nécessiter de recherches exhaustives.

Où notre solution diffère:

Le hachage sensible à la localité (LSH) est une technique largement adoptée pour se rapprocher des recherches les plus proches. Il identifie efficacement des éléments similaires dans de grands ensembles de données en les cartographiant dans un espace de dimension inférieure. Cependant, traditionnellement, le hachage sensible à la localité (LSH) utilise une méthode différente appelée Minhash (ou le schéma de hachage indépendant de la permutations indépendantes) pour estimer la similitude des ensembles. Minhash est couramment utilisé dans l'exploration de données et la récupération des informations. Bien que Minhash soit généralement efficace pour estimer la similitude des ensembles, il a certaines limites qui peuvent entraver son efficacité dans des applications spécifiques.

Pour répondre à ces limitations, nous avons choisi de mettre en œuvre l'approche LSH en utilisant une autre technique efficace appelée approximation des voisins les plus proches (ANN). Cette technique est bien adaptée à la recherche de voisins les plus proches approximatifs dans de grands ensembles de données. En utilisant les voisins les plus proches (Ann) approximatifs au lieu de Minhash, nous visons à améliorer l'efficacité et les performances de la mise en œuvre de hachage sensible à la localité (LSH) dans notre projet.

Les inconvénients de Minhash Notre approche vise à atténuer:

Compromis entre précision et calcul: Minhash est une technique approximative qui introduit la possibilité de faux positifs ou de faux négatifs lors de l'estimation de la similitude des ensembles. La précision de ces estimations repose sur des facteurs tels que la taille des signatures de hachage et le nombre de fonctions de hachage utilisées. Cependant, l'augmentation de ces paramètres entraîne également des coûts de calcul plus élevés.
Sensibilité au choix des fonctions de hachage: la qualité des résultats de Minhash est fortement influencée par la sélection des fonctions de hachage qui cartographient les éléments de la signature. Des fonctions de hachage inexactes ou de mauvaise qualité peuvent entraîner des estimations imprécises, sapant l'efficacité de la méthode.
Difficulté à gérer les ensembles pondérés: Minhash suppose que tous les éléments d'un ensemble sont tout aussi importants, ce qui peut ne pas être vrai dans diverses applications où les éléments possèdent des poids ou des niveaux importants différents. Dans de tels cas, la qualité des résultats de Minhash peut être compromise car elle ne tient pas compte de ces variations.
Difficulté à gérer les ensembles de grande dimension: L'efficacité de Minhash diminue lorsqu'il s'agit de séries qui ont un grand nombre de dimensions. Cela peut entraîner des signatures de hachage clairsemées et une précision réduite, un phénomène souvent appelé «malédiction de la dimensionnalité».

Pourquoi notre approche est-elle meilleure?

Les voisins les plus proches (Ann) approximatifs offrent une solution plus polyvalente pour le hachage sensible à la localité (LSH) car il peut se rapprocher des voisins les plus proches pour diverses mesures de distance. En revanche, Minhash est spécialement conçu pour la similitude de Jaccard. Cette applicabilité plus large permet à notre approche de fournir des estimations plus précises des voisins les plus proches par rapport à Minhash, en particulier lorsqu'ils traitent des ensembles de données à haute dimension qui nécessitent des recherches de similitude basées sur différentes mesures de distance comme la distance euclidienne ou la similitude du cosinus.

En ce qui concerne la complexité du temps, les approches approximatives des voisins les plus proches (ANN) et Minhash mettent finalement en œuvre un tableau de hachage avec un hachage sensible à la localité (LSH), résultant en une complexité temporelle O (1) pour la récupération dans les deux cas. Cependant, notre objectif réside davantage sur l'efficacité de la mémoire, où l'approche approximative des voisins les plus proches (Ann) surpasse Minhash. Cet aspect est particulièrement crucial pour notre implémentation, car l'ensemble de données audio que nous avons utilisé est assez grand, pesant 3,3 GIB.

Par conséquent, en utilisant des voisins les plus proches (Ann) approximatifs au lieu de Minhash, nous atteignons une précision améliorée dans l'estimation des voisins les plus proches tout en maintenant un temps de récupération efficace et une meilleure efficacité de la mémoire, assurant des performances optimales pour notre implémentation avec l'ensemble de données audio de grande taille.

Usage:

Music Recommendation Based on Rhythmic Similarity Using Locality-Sensitive Hashing (LSH).ipynb - contient l'implémentation de notre implémentation de hachage sensible à la localité (LSH) pour former et évaluer un système de recommandation musicale sur l'ensemble de données audio.
app.py - Code source de l'application Web (FLASK) qui accompagne le système de recommandation musicale.
templates - Contient les codes source pour les pages Web, à savoir index.html et predict.html , qui sont rendues par l'application Web (FLASK).
static - contient toutes les icônes et éléments visuels utilisés par l'application Web (FLASK).
staticfiles - répertoire où les fichiers audio téléchargés par les utilisateurs de l'application Web (FLASK) sont stockés.
features.pkl - Fichier d'objets qui contient les fonctionnalités des coefficients CEPSTRAL (MFCC) MEL-Frequency de tous les fichiers audio utilisés pour la formation.
music.ann - Fichier MAPT-Mapte (MMAP) qui contient l'objet ENTAYINDEX pour le système de recommandation musicale en utilisant les voisins les plus proches approximatifs (ANN).

Instructions (exécution):

Exécutez le fichier app.py et accédez au lien donné vers le port hôte.
Téléchargez n'importe quel fichier audio dans le système.
Une fois que vous aurez atteint la page /predict , vous recevrez à la fois les meilleures et les pires recommandations pour le fichier audio téléchargé.
De plus, un fichier nommé pied_piper_download.csv sera enregistré dans le répertoire actuel, qui comprendra des segments audio similaires identifiés à partir du fichier audio téléchargé.

Contributeurs:

Ce projet existe grâce aux gens extraordinaires qui y ont contribué.

Mohammad Abubakar Siddiq ([email protected])
Mahoror Zahid Raja ([email protected])

Références:

Bernhardsson, E. (2013) Spotify / ENATY: approximativement les voisins les plus proches en C ++ / Python optimisé pour l'utilisation de la mémoire et le chargement / la sauvegarde sur le disque, GitHub. Spotify. Disponible sur: https://github.com/spotify/annoy (consulté: 15 février 2023).
Tang, Ya et Cori, P. (2020) Rétablissement de la musique par similitude rythmique avec le hachage sensible de la localité. technologie. Santa Clara, Californie: Santa Clara University School of Engineering, pp. 1–33. Disponible sur: https://www.cse.scu.edu/~m1wang/projects/mining_lsh4musicsimilarity_20w.pdf (consulté: 15 février 2023).
Wang, J. et Lin, C. (2015) «Hachage sensible à la localité personnalisée basée sur MapReduce pour les jointures de similitude sur des données à grande échelle», Computational Intelligence and Neuroscience , 2015, pp. 1–13. Disponible sur: https://doi.org/10.1155/2015/217216.

Développer

Informations supplémentaires

Version 1.0.0
Type Données du site Web
Date de mise à jour 2025-07-10
taille 4.98MB
Provenant de Github

Applications connexes

yt music archive

2024-11-11
Musique pour VK

2024-11-09
NetEase Music download

2024-11-06
Apple Music Classique

2024-02-21
Coureur de musique

2022-08-31
1PLUS DE MUSIQUE

2022-08-16

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
Twitter Sentiment Analysis on Flask App

Données du site Web

1.0.0
data science app road accident analysis

Données du site Web

1.0.0
static web apps cli

Données du site Web

v2.0.2
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout