music recommendation web application based on rhythmic similarity using locality sensitive hashing - Aplicación web de recomendación musical basada en la similitud rítmica utilizando la localidad sens

music recommendation web application based on rhythmic similarity using locality sensitive hashing

Datos del sitio web

1.0.0

Descargar

Aplicación web de recomendación musical basada en la similitud rítmica utilizando hashing sensible a la localidad (LSH):

Este repositorio contiene una aplicación web que se integra con un sistema de recomendación de música, que aprovecha un conjunto de datos de 3,415 archivos de audio, cada uno duradero treinta segundos, utilizando un curso de hashes de hashessensible (LSH) sensible a la localidad para determinar el curso rítmico, como parte de una asignación para el curso fundamental de Big Data Analytics (DS2004).

Dependencias:

Notebook Jupyter (instalación)
Librosa (instalación)
Ipython (instalación)
pandas (instalación)
Numpy (instalación)
Scipy (instalar)
TQDM (instalación)
Scikit-Learn (instalar)
Molestar (instalar)
Frasco (instalar)

Introducción:

El campo de la recuperación de la información del campo de la música presenta un desafío debido a las diversas formas en que el audio puede representarse, lo que dificulta determinar qué características deben priorizarse en las consultas. Para simplificar este problema, nuestra implementación se centra específicamente en el ritmo de las canciones como la única función de consulta. Si bien investigaciones anteriores han explorado la consulta musical basada en el ritmo, los métodos actuales sufren de ineficiencia, ya que requieren consultar toda la estructura de datos para que coincidan con los ritmos de la canción. Para superar esta limitación, proponemos la utilización del hashing sensible a la localidad (LSH), una técnica que identifica de manera eficiente elementos similares dentro de grandes conjuntos de datos sin requerir búsquedas exhaustivas.

Donde nuestra solución difiere:

El Hashing sensible a la localidad (LSH) es una técnica ampliamente adoptada para aproximar las búsquedas de vecino más cercano. Identifica de manera eficiente elementos similares dentro de grandes conjuntos de datos al asignándolos a un espacio dimensional inferior. Sin embargo, tradicionalmente, el hashing sensible a la localidad (LSH) emplea un método diferente llamado Minhash (o el esquema de hash de hashidad de localidad independiente de Min-Wise Permutations) para estimar la similitud establecida. Minhash se usa comúnmente en minería de datos y recuperación de información. Si bien Minhash es generalmente efectivo para estimar la similitud establecida, tiene ciertas limitaciones que pueden obstaculizar su efectividad en aplicaciones específicas.

Para abordar estas limitaciones, hemos optado por implementar el enfoque LSH utilizando otra técnica eficiente llamada Vecinos más cercanos (ANN). Esta técnica es adecuada para encontrar vecinos más cercanos aproximados en grandes conjuntos de datos. Al utilizar vecinos más cercanos (ANN) aproximados en lugar de Minhash, nuestro objetivo es mejorar la efectividad y el rendimiento de la implementación del hashess sensible a la localidad (LSH) en nuestro proyecto.

Desventajas de Minhash Nuestro enfoque tiene como objetivo aliviar:

La compensación entre precisión y cálculo: Minhash es una técnica aproximada que introduce la posibilidad de falsos positivos o falsos negativos al estimar la similitud establecida. La precisión de estas estimaciones se basa en factores como el tamaño de las firmas hash y el número de funciones hash utilizadas. Sin embargo, aumentar estos parámetros también conduce a mayores costos computacionales.
Sensibilidad a la elección de las funciones hash: la calidad de los resultados de Minhash está fuertemente influenciada por la selección de funciones hash que mapean elementos de la firma. Las funciones hash inexactas o de mala calidad pueden dar lugar a estimaciones imprecisas, socavando la efectividad del método.
Dificultad para manejar conjuntos ponderados: Minhash supone que todos los elementos dentro de un conjunto son igualmente importantes, lo que puede no ser cierto en varias aplicaciones donde los elementos poseen diferentes pesos o niveles de importancia. En tales casos, la calidad de los resultados de Minhash puede verse comprometida ya que no tiene en cuenta estas variaciones.
Dificultad para manejar conjuntos de alta dimensión: la efectividad de Minhash disminuye cuando se trata de conjuntos que tienen una gran cantidad de dimensiones. Esto puede conducir a firmas de hash escasas y una precisión reducida, un fenómeno a menudo denominado "maldición de la dimensionalidad".

¿Por qué es mejor nuestro enfoque?

Los vecinos aproximados más cercanos (ANN) ofrecen una solución más versátil para el hashing sensible a la localidad (LSH), ya que puede aproximar a los vecinos más cercanos para varias métricas de distancia. En contraste, Minhash está diseñado específicamente para la similitud de Jaccard. Esta aplicabilidad más amplia permite que nuestro enfoque proporcione estimaciones más precisas de los vecinos más cercanos en comparación con Minhash, especialmente cuando se trata de conjuntos de datos de alta dimensión que requieren búsquedas de similitud basadas en diferentes métricas de distancia como la distancia euclidiana o la similitud de coseno.

Con respecto a la complejidad del tiempo, tanto los enfoques aproximados de vecinos más cercanos (ANN) como Minhash eventualmente implementan una tabla hash con hashing sensible a la localidad (LSH), lo que resulta en una complejidad de tiempo O (1) para la recuperación en cualquier caso. Sin embargo, nuestro enfoque se encuentra más en la eficiencia de la memoria, donde el enfoque aproximado de vecinos más cercanos (ANN) supera a Minhash. Este aspecto es particularmente crucial para nuestra implementación, ya que el conjunto de datos de audio que utilizamos es bastante grande, con un peso de 3.3 GIB.

Por lo tanto, al utilizar vecinos más cercanos (ANN) aproximados en lugar de Minhash, logramos una mayor precisión en la estimación de los vecinos más cercanos al tiempo que mantienen un tiempo de recuperación eficiente y una mejor eficiencia de memoria, asegurando un rendimiento óptimo para nuestra implementación con el conjunto de datos de audio considerable.

Uso:

Music Recommendation Based on Rhythmic Similarity Using Locality-Sensitive Hashing (LSH).ipynb : contiene la implementación de nuestra implementación de hashing (LSH) sensible a la localidad para entrenar y evaluar un sistema de recomendación de música en el conjunto de datos de audio.
app.py - Código fuente para la aplicación web (Flask) que acompaña al sistema de recomendación de música.
templates : contiene los códigos de origen para las páginas web, a saber, index.html y predict.html , que son representados por la aplicación web (frasco).
static : contiene todos los iconos y elementos visuales utilizados por la aplicación web (frasco).
staticfiles : directorio donde se almacenan los archivos de audio cargados por los usuarios en la aplicación web (frasco).
features.pkl : archivo de objeto que contiene las características de coeficientes Cepstrales MEL-Frequency (MFCC) de todos los archivos de audio utilizados para la capacitación.
music.ann -Memory Mapped (MMAP) que contiene el objeto MolnetIndex para el sistema de recomendación de música que utiliza vecinos más cercanos (ANN).

Instrucciones (Ejecución):

Ejecute el archivo app.py y acceda al enlace dado al puerto de host.
Cargue cualquier archivo de audio en el sistema.
Una vez que llegue a la página /predict , recibirá las mejores y peores recomendaciones para el archivo de audio cargado.
Además, un archivo llamado pied_piper_download.csv se guardará en el directorio actual, que incluirá segmentos de audio similares identificados desde el archivo de audio cargado.

Colaboradores:

Este proyecto existe gracias a las personas extraordinarias que contribuyeron a él.

Mohammad Abubakar Siddiq ([email protected])
Mahnoor Zahid Raja ([email protected])

Referencias:

Bernhardsson, E. (2013) Spotify/molesto: aproximados vecinos más cercanos en C ++/Python optimizado para el uso de la memoria y la carga/guardado en el disco, Github. Spotify. Disponible en: https://github.com/spotify/annoy (consultado: 15 de febrero de 2023).
Tang, Ya y Cori, P. (2020) Recuperación musical por similitud rítmica con el hashes sensibles a la localidad. Tecnología. Santa Clara, California: Escuela de Ingeniería de la Universidad de Santa Clara, pp. 1–33. Disponible en: https://www.cse.scu.edu/~m1wang/projects/mining_lsh4musicsimilarity_20w.pdf (consultado: 15 de febrero de 2023).
Wang, J. y Lin, C. (2015) "La localidad personalizada basada en MapReduce el hashing sensible a la similitud para la similitud se une a datos a gran escala", Computational Intelligence and Neuroscience , 2015, pp. 1-13. Disponible en: https://doi.org/10.1155/2015/217216.

Expandir

Información adicional

Versión 1.0.0
Tipo Datos del sitio web
Fecha de actualización 2025-07-10
tamaño 4.98MB
Proviene de Github

Aplicaciones relacionadas

yt music archive

2024-11-11
Música para VK

2024-11-09
NetEase Music download

2024-11-06
Apple Música Clásica

2024-02-21
corredor de música

2022-08-31
1MÁS MÚSICA

2022-08-16

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Twitter Sentiment Analysis on Flask App

Datos del sitio web

1.0.0
data science app road accident analysis

Datos del sitio web

1.0.0
static web apps cli

Datos del sitio web

v2.0.2
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo