Demonstrasi pencarian semantik menggunakan Pinecone Database Vektor dan Dataset MusicCaps dari Google AI.
Langkah melalui notebook init-pinecone-index.ipynb ke
Catatan:
YOUR_API_KEY dan YOUR_REGION dengan nilai yang ditunjukkan dari tab Keys API di konsol Pinecone. Ada kueri sampel di akhir buku catatan. Ganti nilai query untuk bereksperimen dengan pencarian semantik di seluruh dataset MusicCaps.
query = 'lively eastern european folk music with strings outdoors'
search_pinecone ( query ){ 'matches' : [{ 'id' : '5327' ,
'metadata' : { 'aspect_list' : "['romanian folk music', 'live "
"performance', 'instrumental', "
"'accordion', 'upright bass', "
"'acoustic guitar', 'percussion', "
"'fiddle', 'lively', 'upbeat', "
"'joyful']" ,
'audioset_positive_labels' : '/m/0mkg' ,
'author_id' : 9.0 ,
'caption' : 'This is the live performance of a '
'Romanian folk music piece. It is '
'instrumental. There is an accordion '
'playing the leading melody while the '
'fiddle, acoustic guitar and the upright '
'bass play in the background. There is a '
'percussive element in the rhythmic '
'background. The atmosphere is lively '
'and joyful.' ,
'end_s' : 30.0 ,
'is_audioset_eval' : False ,
'is_balanced_subset' : False ,
'start_s' : 20.0 ,
'ytid' : 'xR2p3UED4VU' },
'score' : 0.658422887 ,
'values' : []},
...
],
'namespace' : '' } Anda akan merasakan hasil untuk membaca bidang caption dan mencatat score . ytid adalah ID Video YouTube dan start_s menentukan titik awal untuk video yang relevan.
streamlit run search-app.py 
Untuk menjalankan aplikasi pencarian, Anda harus melakukannya
git clone https://github.com/ben-ogden/musiccaps.git
cd musiccaps
pipenv shell
pipenv install pinecone-client streamlit
streamlit version
...
Streamlit, version 1.22.0 Buat file rahasia di ~/.streamlit/secrets.toml dan atur PINECONE_KEY dan PINECONE_ENV Anda
PINECONE_KEY = "..." streamlit run search-app.py 
Dataset ini bisa menjadi kandidat yang baik untuk bereksperimen dengan pencarian hibrida atau menggunakan pemfilteran metadata menggunakan nilai -nilai dalam metadata aspect_list sebagai kata kunci.