Download SpotifyTranscripts - Download Kode Sumber SpotifyTranscripts

SpotifyTranscripts

Kode sumber lainnya

1.0.0

Unduh

Transkrip Spotify:
AI menghasilkan subtitle dan bab -bab tersegmentasi untuk podcast.

Fitur utama

Transkrip: Pengenalan Pidato untuk Mengubah Pidato menjadi Teks dan Penghentian.
Cari: Cari transkrip dan lompat ke bagian tertentu dari percakapan.
Bab: memecah episode menjadi bab yang dihasilkan secara otomatis berdasarkan topik.
Subtitle: Buat podcast dapat diakses oleh orang -orang dengan kesulitan pendengaran.

Tentang proyek

Proyek ini adalah hasil dari kombinasi dan lanjutan pengembangan dua proyek saya sebelumnya:

Topik Spotify: Selama musim panas 2020, saya berpartisipasi dalam hackathon musim panas Spotify dan mengembangkan alat yang memungkinkan Anda maju cepat ke cap waktu di mana topik -topik tertentu sedang dibahas.
Subtitle Spotify: Pada tahun 2022, saya terus bereksperimen dengan membangun subtitle untuk podcast berdasarkan ide fitur yang menerima 4500+ upvotes di Forum Komunitas Spotify.

Pada tahun 2023, di tengah -tengah hype chatgpt, saya mendapat inspirasi untuk menggabungkan dua proyek saya sebelumnya menjadi satu pemain podcast dan memperbaikinya dengan memanfaatkan API AI yang terbuka.

FYI: Spotify kemudian merilis solusi serupa untuk subtitle dan bab podcast, baca lebih lanjut di sini.

Teknologi digunakan

Teknologi yang digunakan dalam proyek ini dapat ditemukan dalam tabel di bawah ini.

Teknologi	Gunakan kasing
Bereaksi	Kerangka kerja frontend
Tailwind	Perpustakaan Styling CSS
Python	Backend untuk menangani logika transkripsi
Labu	Menghubungkan backend python dengan react frontend
Spotify API	Untuk mendapatkan informasi tentang episode podcast
API Pengenalan Pidato Google	Mengubah ucapan menjadi teks, yaitu menyalin podcast
Buka API GPT 3.5 AI	Transkrip segmen ke bab -bab berdasarkan transkrip

Saya ingin belajar cara menghubungkan frontend bereaksi ke backend python jadi saya menggunakan proyek ini sebagai kesempatan belajar untuk melakukan itu. Akibatnya, saya melakukan beberapa rekayasa berlebihan dengan membangun API saya sendiri untuk menangani transkripsi pada backend Python alih-alih memanggil API plug-and-play di frontend.

Lebih khusus lagi, frontend melakukan panggilan ke Spotify API dan mendapatkan URL podcast yang diminta. URL dikirim sebagai permintaan ke backend yang mengunduh podcast sebagai MP3 untuk memprosesnya.

Alasan mengapa MP3 perlu diproses adalah karena saya perlu mendapatkan cap waktu untuk setiap kalimat untuk menampilkannya pada waktu yang tepat di subtitle. Saya mengidentifikasi kalimat dalam transkrip dengan mendengarkan keheningan (<14 desibel) lebih dari 500 ms. Ketika keheningan diidentifikasi, saya membagi file audio asli untuk membuat satu set file audio yang lebih kecil, satu untuk setiap kalimat. Dengan melakukan ini, saya dapat menghitung waktu awal dan akhir setiap kalimat dengan melihat panjang setiap file audio yang lebih kecil, lihat gambar di bawah ini.

Semua file audio sekarang dikirim ke API pengenalan ucapan Google dan mengembalikan serangkaian audio yang ditranskripsikan. Transkripsi sekarang dikirim kembali ke frontend yang membuat permintaan untuk membuka API AI untuk segmen transkrip dan mengidentifikasi topik potensial untuk membagi episode menjadi beberapa bab.

Batasan

API Spotify tidak memungkinkan Anda untuk mengunduh episode podcast lengkap, hanya pratinjau 30 detik. Ini membuat aplikasi sangat terbatas untuk digunakan dan karena itu hanya bukti konsep.

Memulai

Langkah 1: Daftar untuk Kunci API

Spotify
Buka AI

Langkah 2: Tambahkan tombol API ke file .env

Buat file .env di direktori root dan tambahkan tombol API Anda:

 REACT_APP_SPOTFY_CLIENT_ID=YOUR_SPOTIFY_CLIENT_ID_GOES_HERE
REACT_APP_OPEN_AI_KEY=YOUR_OPEN_AI_KEY_GOES_HERE

Langkah 3: Jalankan proyek

Gunakan perintah berikut untuk menjalankan proyek. Mulai frontend di satu terminal dan backend di terminal lain.

Backend

 export FLASK_APP=backend
export FLASK_DEBUG=1
flask run

Frontend

 cd frontend
npm start

Demo

Tonton demo proyek 1 menit di sini.

? Tangkapan layar

Halaman Beranda dengan Otentikasi Spotify

Halaman penemuan

Layar Memuat

Layar episode

Subtitle di layar penuh

Tinjauan Bab Dalam Suatu Episode

Pemain audio dibagi dengan bab

Transkrip Cari

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-02-28
ukuran 44.6MB
Berasal dari Github

Aplikasi Terkait

Google Dorks

2025-03-10
shepherd

2025-06-04
hidusbf

2025-02-14
mongo express

2025-06-04
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Kode sumber lainnya

1.0.0
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Kode sumber lainnya

1.0.0

Informasi Terkait Semua

SpotifyTranscripts

Transkrip Spotify: AI menghasilkan subtitle dan bab -bab tersegmentasi untuk podcast.