Download Stage Whisper - Unduh Kode Sumber Stage Whisper

Stage Whisper

Kode sumber lainnya

1.0.0

Unduh

Panggung-whisper

Ini adalah repo utama untuk bisikan panggung-aplikasi transkripsi audio yang gratis, open-source, dan mudah digunakan. Tahap Whisper menggunakan model pembelajaran mesin bisikan openai untuk menghasilkan transkripsi file audio yang sangat akurat, dan juga memungkinkan pengguna untuk menyimpan dan mengedit transkripsi menggunakan antarmuka pengguna grafis yang sederhana dan intuitif.

QuickStart

Whisper panggung terdiri dari dua komponen yang terhubung:

Backend ular pini
Antarmuka yang bertenaga elektron/elektron

Prasyarat

Rilis 1.0 Tahap Whisper akhirnya akan (idealnya) tidak memerlukan perangkat lunak tambahan. Namun, untuk saat ini, Anda akan perlu diinstal berikut pada mesin Anda untuk mengembangkan Whisper panggung. Saat ini dimungkinkan untuk secara terpisah bekerja pada antarmuka elektron atau backend Python, jadi jika Anda berencana untuk hanya bekerja pada satu atau yang lain, Anda hanya perlu menginstal persyaratan khusus untuk komponen itu.

Node (diperlukan untuk elektron)
Benang (diperlukan untuk elektron)
Python 3.x (diperlukan untuk backend)
Karat (diperlukan untuk backend)
FFMPEG (diperlukan untuk backend)
Puisi (diperlukan untuk backend)

Ada sejumlah cara untuk menginstal semua dependensi ini di workstation Anda, tetapi berikut adalah salah satu contoh bagaimana Anda dapat menginstal semua hal di atas pada Mac (lewati langkah apa pun untuk sesuatu yang telah Anda instal):

 # Install Homebrew
/bin/bash -c " $( curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh ) "

# Install Python, Node, Rust, ffmpeg, and Yarn
brew install python node rust ffmpeg yarn

# Install Poetry
curl -sSL https://install.python-poetry.org | POETRY_HOME=/etc/poetry python3 -

Menjalankan backend Python

Instal dependensi:

 cd backend
poetry install

Sementara tujuan utama backend adalah berjalan sebagai layanan untuk aplikasi elektron untuk terhubung, itu juga dapat dijalankan sebagai skrip mandiri. Untuk melakukannya, jalankan:

poetry run python stagewhisper --input /path/to/audio/file.mp3

Menjalankan Antarmuka Elektron

 cd electron
yarn
yarn dev

Sasaran

Awal tahun ini, OpenAI merilis Whisper, sistem pengenalan wicara otomatis (ASR) yang dilatih pada "680.000 jam data yang diawasi multibahasa dan multibuual yang dikumpulkan dari web." Anda dapat mempelajari lebih lanjut dengan membaca makalah [PDF] atau melihat contoh -contoh di situs web Openai.

Seperti yang dicatat Dan Nguyen di Twitter, ini bisa menjadi "anugerah untuk ruang redaksi."

Satu -satunya masalah, seperti yang ditunjukkan oleh @petersterne, adalah bahwa tidak semua jurnalis (atau orang lain yang dapat mengambil manfaat dari jenis alat transkripsi ini) nyaman dengan baris perintah dan memasang dependensi yang diperlukan untuk menjalankan bisikan.

Tujuan kami adalah mengemas bisikan dengan cara yang lebih mudah digunakan sehingga lebih sedikit pengguna teknis dapat memanfaatkan jaring saraf ini.

Peter datang dengan nama proyek, Whisper panggung.

Siapa yang terlibat

@Petersterne dan @filmgirl (Christina Warren) menciptakan proyek, dan @harrislapiroff dan @crazy4pi314 (Sarah Kaiser) memimpin pengembangan dengan @oenu (Adam Newton-Blows) memimpin pengembangan frontend.

Kami ingin berkolaborasi dengan siapa saja yang memiliki ide tentang bagaimana kami dapat dengan mudah mengemas bisikan dan membuatnya mudah digunakan untuk pengguna non-teknis.

Status proyek

Proyek ini sedang dalam tahap awal pengembangan. Kami memiliki prototipe kerja yang menggunakan kerangka kerja elektron dan mantin untuk membuat aplikasi yang memungkinkan pengguna untuk memasukkan file audio, menyalinnya menggunakan Whisper, dan kemudian mengelola dan mengedit transkripsi yang dihasilkan. Aplikasi ini akan tersedia untuk macOS, Windows, dan Linux. Kami saat ini sedang berupaya menerapkan peningkatan besar dan berharap untuk segera merilis versi beta.

Meminta fitur atau mengajukan pertanyaan tentang diskusi proyek di GitHub.
Temukan bug? Buka masalah sehingga kita dapat melihat bagaimana kita dapat memperbaikinya.
Ingin berkontribusi? Lihatlah masalah pertama kami yang baik dan panduan berkontribusi kami.
Bergabunglah dengan server Discord kami untuk membahas perencanaan dan pengembangan proyek.

Lisensi

Kode apa pun yang kami bagikan akan bersumber terbuka dan mengikuti ketentuan lisensi dari salah satu proyek yang kami gunakan. Whisper dilisensikan MIT, tetapi beberapa dependensi (FFMPEG) dilisensikan dengan istilah yang berbeda. Kami pasti akan mematuhi persyaratan lisensi/semua lisensi dan jika kami tidak dapat menggabungkan FFMPEG dengan Whisper panggung, kami akan membuatnya mudah diperoleh sebanyak mungkin untuk pengguna akhir. Kode spesifik Whisper-spesifik tahap apa pun akan dilisensikan di bawah lisensi MIT.

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-03-01
ukuran 1.86MB
Berasal dari Github

Aplikasi Terkait

Widget Foto Panggung Dell

2024-11-09
GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
PANGGUNG WARNA-WARNA HATSUNE MIKU

2024-09-29
Sistem layanan pelanggan online sumber terbuka sepenuhnya PC+akun resmi+APP+H5+layanan pelanggan program mini WHISPER

2022-09-26

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Kode sumber lainnya

1.0.0
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Kode sumber lainnya

1.0.0

Informasi Terkait Semua