sherpa adalah kerangka kerja inferensi teks-ucapan sumber terbuka menggunakan PyTorch, dengan fokus eksklusif pada model end-to-end (E2E), yaitu model berbasis transduser dan CTC. Ini menyediakan API C++ dan Python.
Proyek ini berfokus pada penerapan, yaitu menggunakan model terlatih untuk menyalin ucapan. Jika Anda tertarik pada cara melatih atau menyempurnakan model Anda sendiri, silakan merujuk ke icefall.
Kami juga memiliki proyek serupa lainnya yang tidak bergantung pada PyTorch:
sherpa-onnxdansherpa-ncnnjuga mendukung iOS, Android, dan sistem tertanam.
Silakan merujuk ke dokumentasi di https://k2-fsa.github.io/sherpa/
Coba sherpa dari dalam browser Anda tanpa menginstal apa pun: https://huggingface.co/spaces/k2-fsa/automatic-speech-recognition