music recommendation web application based on rhythmic similarity using locality sensitive hashing - Rekomendasi Musik Aplikasi Web Berdasarkan Kesamaan Ritmik Menggunakan Lokalitas Sensitif

music recommendation web application based on rhythmic similarity using locality sensitive hashing

Data situs web

1.0.0

Unduh

Rekomendasi Musik Aplikasi Web Berdasarkan Kesamaan Ritmik Menggunakan Locality-Sensitive Hashing (LSH):

Repositori ini berisi aplikasi web yang terintegrasi dengan sistem rekomendasi musik, yang memanfaatkan dataset 3.415 file audio, masing-masing berlangsung tiga puluh detik, memanfaatkan implementasi hashing-sensitif (LSH) untuk menentukan kesamaan ritmis, sebagai bagian dari penugasan untuk analitik data besar (DS2).

Ketergantungan:

Jupyter Notebook (Instal)
librosa (instal)
Ipython (instal)
panda (instal)
Numpy (instal)
Scipy (instal)
TQDM (instal)
scikit-learn (instal)
Mengganggu (instal)
Flask (instal)

Perkenalan:

Bidang pengambilan informasi musik menghadirkan tantangan karena berbagai cara audio dapat diwakili, sehingga sulit untuk menentukan fitur mana yang harus diprioritaskan dalam kueri. Untuk menyederhanakan masalah ini, implementasi kami berfokus secara khusus pada ritme lagu sebagai fitur satu -satunya. Sementara penelitian sebelumnya telah mengeksplorasi permintaan musik berbasis ritme, metode saat ini menderita inefisiensi, karena mereka mengharuskan meminta seluruh struktur data agar sesuai dengan ritme lagu. Untuk mengatasi keterbatasan ini, kami mengusulkan pemanfaatan hashing sensitif lokalitas (LSH), sebuah teknik yang secara efisien mengidentifikasi item serupa dalam set data besar tanpa memerlukan pencarian lengkap.

Di mana solusi kami berbeda:

Locality-sensitive hashing (LSH) adalah teknik yang diadopsi secara luas untuk mendekati pencarian tetangga terdekat. Ini secara efisien mengidentifikasi item serupa dalam dataset besar dengan memetakannya ke ruang dimensi yang lebih rendah. Namun, secara tradisional, hashing sensitif lokalitas (LSH) menggunakan metode yang berbeda yang disebut MinHash (atau skema hashing yang sensitif terhadap permutasi minimal-minim) untuk memperkirakan kesamaan yang ditetapkan. Minhash umumnya digunakan dalam penambangan data dan pengambilan informasi. Sementara Minhash umumnya efektif dalam memperkirakan kesamaan yang ditetapkan, ia memiliki batasan tertentu yang dapat menghambat keefektifannya dalam aplikasi tertentu.

Untuk mengatasi keterbatasan ini, kami telah memilih untuk mengimplementasikan pendekatan LSH menggunakan teknik efisien lain yang disebut perkiraan tetangga terdekat (ANN). Teknik ini sangat cocok untuk menemukan perkiraan tetangga terdekat dalam set data besar. Dengan memanfaatkan perkiraan tetangga terdekat (JST) alih-alih Minhash, kami bertujuan untuk meningkatkan efektivitas dan kinerja implementasi hashing sensitif-lokalitas (LSH) dalam proyek kami.

Kerugian Minhash Pendekatan kami bertujuan untuk meringankan:

Pertukaran antara akurasi dan perhitungan: MinHash adalah teknik perkiraan yang memperkenalkan kemungkinan positif palsu atau negatif palsu ketika memperkirakan kesamaan yang ditetapkan. Keakuratan perkiraan ini bergantung pada faktor -faktor seperti ukuran tanda tangan hash dan jumlah fungsi hash yang digunakan. Namun, meningkatkan parameter ini juga mengarah pada biaya komputasi yang lebih tinggi.
Sensitivitas terhadap pilihan fungsi hash: Kualitas hasil minhash sangat dipengaruhi oleh pemilihan fungsi hash yang memetakan elemen yang ditetapkan ke tanda tangan. Fungsi hash yang tidak akurat atau berkualitas buruk dapat menghasilkan perkiraan yang tidak tepat, merusak efektivitas metode ini.
Kesulitan dalam menangani set tertimbang: Minhash mengasumsikan bahwa semua elemen dalam satu set sama pentingnya, yang mungkin tidak berlaku dalam berbagai aplikasi di mana elemen memiliki bobot atau tingkat kepentingan yang berbeda. Dalam kasus seperti itu, kualitas hasil minhash dapat dikompromikan karena tidak memperhitungkan variasi ini.
Kesulitan dalam menangani set dimensi tinggi: Efektivitas Minhash berkurang ketika berhadapan dengan set yang memiliki sejumlah besar dimensi. Hal ini dapat menyebabkan tanda tangan hash yang jarang dan berkurangnya akurasi, sebuah fenomena yang sering disebut sebagai "kutukan dimensi."

Mengapa pendekatan kita lebih baik?

Perkiraan Neighbors terdekat (ANN) menawarkan solusi yang lebih fleksibel untuk hashing sensitif lokalitas (LSH) karena dapat mendekati tetangga terdekat untuk berbagai metrik jarak. Sebaliknya, Minhash dirancang khusus untuk kesamaan Jaccard. Penerapan yang lebih luas ini memungkinkan pendekatan kami untuk memberikan perkiraan yang lebih akurat dari tetangga terdekat dibandingkan dengan Minhash, terutama ketika berurusan dengan kumpulan data dimensi tinggi yang memerlukan pencarian kesamaan berdasarkan berbagai metrik jarak seperti jarak Euclidean atau kesamaan kosinus.

Mengenai kompleksitas waktu, perkiraan tetangga terdekat (JST) dan pendekatan Minhash pada akhirnya menerapkan tabel hash dengan hashing sensitif lokalitas (LSH), menghasilkan kompleksitas waktu O (1) untuk pengambilan dalam kedua kasus. Namun, fokus kami lebih terletak pada efisiensi memori, di mana pendekatan dekat tetangga terdekat (JST) mengungguli Minhash. Aspek ini sangat penting untuk implementasi kami karena dataset audio yang kami gunakan cukup besar, dengan berat 3,3 Gib.

Oleh karena itu, dengan menggunakan perkiraan tetangga terdekat (JST) alih -alih Minhash, kami mencapai akurasi yang lebih baik dalam memperkirakan tetangga terdekat sambil mempertahankan waktu pengambilan yang efisien dan efisiensi memori yang lebih baik, memastikan kinerja optimal untuk implementasi kami dengan dataset audio yang cukup besar.

Penggunaan:

Music Recommendation Based on Rhythmic Similarity Using Locality-Sensitive Hashing (LSH).ipynb -berisi implementasi implementasi hashing-hashing-sensitif lokal kami untuk melatih dan mengevaluasi sistem rekomendasi musik pada dataset audio.
app.py - Kode sumber untuk aplikasi web (flask) yang menyertai sistem rekomendasi musik.
templates - Berisi kode sumber untuk halaman web, yaitu index.html dan predict.html , yang diterjemahkan oleh aplikasi web (flask).
static - berisi semua ikon dan elemen visual yang digunakan oleh aplikasi web (Flask).
staticfiles - Direktori di mana file audio diunggah oleh pengguna pada aplikasi web (flask) disimpan.
features.pkl -File objek yang berisi fitur Cepstral Coefficients (MFCC) Mel-frekuensi dari semua file audio yang digunakan untuk pelatihan.
music.ann -File yang dipetakan memori (MMAP) yang berisi objek gangguan untuk sistem rekomendasi musik yang menggunakan perkiraan tetangga terdekat (Ann).

Instruksi (eksekusi):

Jalankan file app.py dan akses tautan yang diberikan ke port host.
Unggah file audio apa pun ke dalam sistem.
Setelah Anda mencapai halaman /predict , Anda akan menerima rekomendasi terbaik dan terburuk untuk file audio yang diunggah.
Selain itu, file bernama pied_piper_download.csv akan disimpan di direktori saat ini, yang akan mencakup segmen audio serupa yang diidentifikasi dari file audio yang diunggah.

Kontributor:

Proyek ini ada berkat orang -orang luar biasa yang berkontribusi padanya.

Mohammad Abubakar Siddiq ([email protected])
Mahnoor Zahid Raja ([email protected])

Referensi:

Bernhardsson, E. (2013) Spotify/GERRIST: Perkiraan tetangga terdekat di C ++/Python yang dioptimalkan untuk penggunaan memori dan memuat/menghemat ke disk, github. Spotify. Tersedia di: https://github.com/spotify/annoy (diakses: 15 Februari 2023).
Tang, Ya dan Cori, P. (2020) Pengambilan musik dengan kesamaan berirama dengan hashing sensitif lokalitas. Tech. Santa Clara, California: Sekolah Teknik Universitas Santa Clara, hlm. 1–33. Tersedia di: https://www.cse.scu.edu/~m1wang/projects/mining_lsh4musicsimilarity_20w.pdf (diakses: 15 Februari 2023).
Wang, J. dan Lin, C. (2015) “Hashing sensitif lokalitas yang dipersonalisasi dengan MapReduce untuk kesamaan bergabung dengan data skala besar,” Computational Intelligence and Neuroscience , 2015, hlm. 1–13. Tersedia di: https://doi.org/10.1155/2015/217216.

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Data situs web
Waktu Pembaruan 2025-07-10
ukuran 4.98MB
Berasal dari Github

Aplikasi Terkait

yt music archive

2024-11-11
Musik untuk VK

2024-11-09
NetEase Music download

2024-11-06
Apple Musik Klasik

2024-02-21
Pembalap Musik

2022-08-31
1 MUSIK LEBIH BANYAK

2022-08-16

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
Twitter Sentiment Analysis on Flask App

Data situs web

1.0.0
data science app road accident analysis

Data situs web

1.0.0
static web apps cli

Data situs web

v2.0.2
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua