music recommendation web application based on rhythmic similarity using locality sensitive hashing Download - Aplicativo da Web Recomendação de Música Com base na similaridade rítmica usando a localid

music recommendation web application based on rhythmic similarity using locality sensitive hashing

Dados do site

1.0.0

Baixar

Aplicativo da Web Recomendação de Música com base na similaridade rítmica usando o Hashing sensível à localidade (LSH):

Este repositório contém um aplicativo da Web que se integra a um sistema de recomendação musical, que aproveita um conjunto de dados de 3.415 arquivos de áudio, cada um com duração de trinta segundos, utilizando uma implementação de hash (LSH) sensível à localidade (LSH) para determinar o curso rítmico.

Dependências:

Notebook Jupyter (instalação)
Librosa (instalação)
Ipython (instalação)
Pandas (instalação)
Numpy (instalação)
Scipy (instalação)
TQDM (instalação)
Scikit-Learn (instalação)
Irritar (instalar)
Flask (instalação)

Introdução:

O campo da recuperação de informações musicais apresenta um desafio devido às várias maneiras pelas quais o áudio pode ser representado, dificultando a determinação de quais recursos devem ser priorizados em consultas. Para simplificar esse problema, nossa implementação se concentra especificamente no ritmo das músicas como o único recurso de consulta. Embora pesquisas anteriores tenham explorado a consulta musical baseada em ritmo, os métodos atuais sofrem de ineficiência, pois exigem consultar toda a estrutura de dados para combinar com os ritmos da música. Para superar essa limitação, propomos a utilização do hash sensível à localidade (LSH), uma técnica que identifica eficientemente itens semelhantes em grandes conjuntos de dados sem exigir pesquisas exaustivas.

Onde nossa solução difere:

O hash sensível à localidade (LSH) é uma técnica amplamente adotada para aproximar as pesquisas mais próximas do vizinho. Ele identifica eficientemente itens semelhantes em grandes conjuntos de dados, mapeando-os para um espaço inferior dimensional. No entanto, tradicionalmente, o hash sensível à localidade (LSH) emprega um método diferente chamado MINHASH (ou o esquema de hash de permutações independentes do Min-Wise, sensível à localidade) para estimar a similaridade do conjunto. Minhash é comumente usado na mineração de dados e recuperação de informações. Embora o MINHASH seja geralmente eficaz na estimativa de similaridade do conjunto, ele possui certas limitações que podem prejudicar sua eficácia em aplicações específicas.

Para abordar essas limitações, optamos por implementar a abordagem LSH usando outra técnica eficiente chamada de vizinhos aproximados mais próximos (RNA). Esta técnica é adequada para encontrar vizinhos aproximados mais próximos em grandes conjuntos de dados. Ao utilizar os vizinhos aproximados mais próximos (RNA) em vez de MINHASH, pretendemos melhorar a eficácia e o desempenho da implementação de Hashing (LSH) sensível à localidade em nosso projeto.

As desvantagens de Minhash nossa abordagem visa aliviar:

Trade-off entre precisão e computação: MINHASH é uma técnica aproximada que introduz a possibilidade de falsos positivos ou falsos negativos ao estimar o conjunto de similaridade. A precisão dessas estimativas depende de fatores como o tamanho das assinaturas de hash e o número de funções de hash usadas. No entanto, aumentar esses parâmetros também leva a custos computacionais mais altos.
Sensibilidade à escolha das funções de hash: a qualidade dos resultados do minhash é fortemente influenciada pela seleção de funções de hash que mapeiam elementos definidos para a assinatura. As funções de hash de qualidade imprecisa ou baixa podem resultar em estimativas imprecisas, minando a eficácia do método.
Dificuldade no manuseio de conjuntos ponderados: Minash assume que todos os elementos dentro de um conjunto são igualmente importantes, o que pode não se manter verdadeiro em várias aplicações em que elementos possuem diferentes pesos ou níveis de importância. Nesses casos, a qualidade dos resultados do minhash pode ser comprometida, pois não explica essas variações.
Dificuldade em lidar com conjuntos de alta dimensão: a eficácia de Minash diminui ao lidar com conjuntos que têm um grande número de dimensões. Isso pode levar a assinaturas esparsas de hash e precisão reduzida, um fenômeno frequentemente chamado de "maldição da dimensionalidade".

Por que nossa abordagem é melhor?

Os vizinhos aproximados aproximados (RNA) oferecem uma solução mais versátil para o hash sensível à localidade (LSH), pois pode se aproximar dos vizinhos mais próximos para várias métricas de distância. Por outro lado, Minash é projetado especificamente para a semelhança de Jaccard. Essa aplicabilidade mais ampla permite que nossa abordagem forneça estimativas mais precisas dos vizinhos mais próximos em comparação com o minhash, especialmente ao lidar com conjuntos de dados de alta dimensão que requerem pesquisas de similaridade com base em diferentes métricas de distância, como distância euclidiana ou similaridade de cosseno.

Em relação à complexidade do tempo, as abordagens aproximadas dos vizinhos mais próximos (Ann) e Minash acabam implementando uma tabela de hash com hash sensível à localidade (LSH), resultando em uma complexidade do tempo O (1) para recuperação em ambos os casos. No entanto, nosso foco reside mais na eficiência da memória, onde a abordagem aproximada dos vizinhos mais próximos (Ann) supera Minash. Esse aspecto é particularmente crucial para a nossa implementação, uma vez que o conjunto de dados de áudio que utilizamos é bastante grande, pesando 3,3 GIB.

Portanto, ao utilizar os vizinhos aproximados mais próximos (RNA) em vez de MINHASH, alcançamos maior precisão na estimativa dos vizinhos mais próximos, mantendo o tempo de recuperação eficiente e a melhor eficiência da memória, garantindo o desempenho ideal para nossa implementação com o conjunto de dados de áudio considerável.

Uso:

Music Recommendation Based on Rhythmic Similarity Using Locality-Sensitive Hashing (LSH).ipynb -contém a implementação de nossa implementação de Hashing (LSH) sensível à localidade para treinar e avaliar um sistema de recomendação musical no conjunto de dados de áudio.
app.py - Código -fonte do aplicativo da Web (Flask) que acompanha o sistema de recomendação musical.
templates - contém os códigos de origem para as páginas da web, nomeadamente index.html e predict.html , que são renderizados pelo aplicativo da web (Flask).
static - contém todos os ícones e elementos visuais utilizados pelo aplicativo da web (Flask).
staticfiles - diretório em que os arquivos de áudio carregados pelos usuários no aplicativo da web (Flask) são armazenados.
features.pkl -O arquivo de objeto que contém os recursos de coeficientes cepstrais de frequência Mel (MFCC) de todos os arquivos de áudio utilizados para treinamento.
music.ann -Arquivo MMAP mapeado de memória (MMAP) que contém o objeto Irpersindex para o sistema de recomendação musical, utilizando vizinhos aproximados mais próximos (RNA).

Instruções (execução):

Execute o arquivo app.py e acesse o link fornecido na porta do host.
Carregue qualquer arquivo de áudio no sistema.
Depois de atingir a página /predict , você receberá as melhores e as piores recomendações para o arquivo de áudio carregado.
Além disso, um arquivo chamado pied_piper_download.csv será salvo no diretório atual, que incluirá segmentos de áudio semelhantes identificados no arquivo de áudio carregado.

Colaboradores:

Este projeto existe graças às pessoas extraordinárias que contribuíram para ele.

Mohammad Abubakar Siddiq ([email protected])
Mahnoor Zahid Raja ([email protected])

Referências:

Bernhardson, E. (2013) Spotify/Irrive: aproximar os vizinhos mais próximos no C ++/Python otimizados para uso de memória e carregamento/salvamento no disco, github. Spotify. Disponível em: https://github.com/spotify/annoy (acessado: 15 de fevereiro de 2023).
Tang, Ya e Cori, P. (2020) Recuperação musical por similaridade rítmica com o hash sensível à localidade. tecnologia. Santa Clara, Califórnia: Escola de Engenharia da Universidade de Santa Clara, pp. 1–33. Disponível em: https://www.cse.scu.edu/~m1wang/projects/mining_lsh4musicsimilarity_20w.pdf (acessado: 15 de fevereiro de 2023).
Wang, J. e Lin, C. (2015) “MapReduce Basey Personalized Localized Sensitive Hashing for Similarity Juns em dados em larga escala”, Computational Intelligence and Neuroscience , 2015, pp. 1–13. Disponível em: https://doi.org/10.1155/2015/217216.

Expandir

Informações adicionais

Versão 1.0.0
Tipo Dados do site
Data da Última Atualização 2025-07-10
tamanho 4.98MB
Vindo de Github

Aplicativos Relacionados

yt music archive

2024-11-11
Música para VK

2024-11-09
NetEase Music download

2024-11-06
Música Clássica da Apple

2024-02-21
Piloto de música

2022-08-31
1MAIS MÚSICA

2022-08-16

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Twitter Sentiment Analysis on Flask App

Dados do site

1.0.0
data science app road accident analysis

Dados do site

1.0.0
static web apps cli

Dados do site

v2.0.2
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos