Whisper เป็นระบบการรู้จำเสียงพูดแบบโอเพนซอร์ซที่พัฒนาโดย OpenAI
สารบัญ
- เป็นทางการ
- รุ่นรุ่น
- แอพพลิเคชั่น
- เว็บแอพ
- เครื่องมือ CLI
- สนามเด็กเล่น
- แพ็คเกจ
- บทความ
- วิดีโอ
- ชุมชน
- API ของบุคคลที่สาม
- รายการที่เกี่ยวข้อง
เป็นทางการ
- การแนะนำ
- รหัสต้นฉบับ
- กระดาษสีขาว
รุ่นรุ่น
- Whisper.cpp - พอร์ตของ Whisper ใน C ++
- Whisperx - เพิ่มการจดจำลำโพงอัตโนมัติอย่างรวดเร็วด้วยการประทับเวลาระดับคำและการทำให้เป็น diarization ของลำโพง
- เร็วขึ้น - เสียงกระซิบที่เร็วขึ้นโดยใช้ CTRANSLATE2
- Whisper Jax - การใช้งาน JAX ของ Whisper สำหรับการเร่งความเร็วสูงสุด 70x บน TPU
- Whisper-Timestamped-เพิ่มการประทับเวลาระดับคำและคะแนนความมั่นใจ
- Whisper -Openvino - กระซิบวิ่งบน OpenVino
- Whisper.tflite - กระซิบวิ่งบน Tensorflow Lite
- ตัวแปรกระซิบ - เสียงกระซิบต่าง ๆ บนใบหน้ากอด
- Whisper-at-Whisper ที่สามารถรับรู้เหตุการณ์เสียงที่ไม่ใช่คำพูดนอกเหนือจากการพูด
แอพพลิเคชั่น
- AIKO - แอพการถอดเสียงและแอป MacOS
- MacWhisper - แอป MacOS การถอดความเสียง (freemium)
- Whisper Memos - แอพการถอดเสียง iOS (freemium)
- Fouryou - แอพ Audio Journal iOS
- Jojo Transcribe - แอป MacOS การถอดความเสียง
- Buzz - แอพการถอดความเสียงและการแปล MacOS
- Whisperscript - แอป MacOS การถอดความเสียง (freemium ·อิเล็กตรอน)
- Audio Podium - แอพ MacOS การจัดการเสียง/วิดีโอ
- SuperWhisper - แอพเมนู MacOS การถอดความเสียงทั่วโลก
- หมายเหตุคำพูด - แอพการถอดความเสียง Linux
- Fridaygpt - แอป Diction MacOS ขับเคลื่อนโดย OpenAI API
- EasyWhisper - แอพ Windows และ MacOS สำหรับการถอดเสียงและการทำให้เป็นเส้นผ่าศูนย์กลางของลำโพง (freemium)
เว็บแอพ
เป็นเจ้าภาพ
- BigWav - เครื่องมือการถอดรหัสเสียงและคำอธิบายประกอบเสียง
- การถอดความพอดคาสต์ฟรี - ทำงานในท้องถิ่นในเบราว์เซอร์ของคุณ
- Gladia - การถอดความด้วยการประมวลผลแบบเรียลไทม์
โฮสต์
- Subs AI - การสร้างคำบรรยาย
- WAAS - GUI และ API สำหรับ Whisper
- writout.ai - แอพ Laravel เพื่อถอดความและแปลไฟล์เสียง
- Meeper - การถอดความสรุปและอื่น ๆ สำหรับการประชุมและแท็บเบราว์เซอร์ใด ๆ (แอพ Chrome)
เครื่องมือ CLI
- YT -Whisper - การสร้างคำบรรยาย YouTube
- Phonix - สร้างคำอธิบายภาพสำหรับวิดีโอ
- Whisper-Standalone-win-Windows แบบสแตนด์อโลนสามารถทำงานได้สำหรับกระซิบและกระซิบที่เร็วขึ้น
- Whisper-CTRANSLATE2-เครื่องมือบรรทัดคำสั่ง Whisper ตาม CTRANSLATE2 ซึ่งเข้ากันได้กับต้นฉบับ
- เร็วอย่างบ้าคลั่ง-ไวรัส-บรรลุความเร็วในการถอดรหัสใกล้กับ 30x เรียลไทม์พร้อมการปรับให้เหมาะสมหลายครั้ง
- กระซิบ - ไดอารี่ - การรู้จำเสียงพูดอัตโนมัติด้วยการทำให้เป็นลำโพง diarization
สนามเด็กเล่น
- กอดใบหน้า - การสาธิตกระซิบวิ่งบนใบหน้ากอด (แหล่งที่มา)
- MONSTER API - การสาธิต Whisper ที่ทำงานบน Monster API (แหล่งที่มา)
- Web Whisper - Whisper Demo โดย Pluja (แหล่งที่มา)
- การถอดความวิดีโอ YouTube - ทำงานบน colab
แพ็คเกจ
จาวาสคริปต์
- ใช้ - Whisper - React Hook
บทความ
- กระซิบของอนาคตแบบโมดูลาร์ของ AI-อนาคตของการเรียนรู้ของเครื่องจักรอยู่ในโปรแกรมการถอดเสียงคำพูดโอเพนซอร์ซที่ปรับตัวได้และเข้าถึงได้
- วิธีเรียกใช้โมเดลการรู้จำเสียงพูดกระซิบ - อธิบายวิธีการติดตั้งและเรียกใช้โมเดลรวมถึงการวิเคราะห์ประสิทธิภาพเปรียบเทียบเสียงกระซิบกับรุ่นอื่น ๆ
- สร้างแอปคำพูดของคุณเองไปยังข้อความโดยใช้ Flask-บทช่วยสอนแสดงให้เห็นถึงโมเดลคำพูดเป็นข้อความของ Whisper พร้อมการสาธิตเกี่ยวกับการรันในสมุดบันทึกการไล่ระดับสีและคู่มือสำหรับการตั้งค่าแอปขวดพร้อมการปรับใช้ไล่ระดับสี
- แปลงพอดคาสต์เป็นข้อความ-การสอนเกี่ยวกับ Whisper API ด้วย Python สำหรับการถอดความคำพูดเป็นข้อความแสดงการถอดรหัสที่เร็วขึ้นและเทคโนโลยีขั้นสูงของ GPU
วิดีโอ
- Open Whisper ของ AI นั้นยอดเยี่ยมมาก! - บทนำสู่กระซิบ
- วิธีการถอดความคำพูดเป็นข้อความฟรีดีกว่า Google Premium API-บทช่วยสอน
- แอพ Live App - Tutorial
ชุมชน
- การอภิปราย
- ความไม่ลงรอยกัน
API ของบุคคลที่สาม
APIs ที่ใช้ Whisper
- Whisper+ - ส่วนขยายของโมเดล Whisper ซึ่งเพิ่มคุณสมบัติที่ทรงพลังเช่นการระบุคำศัพท์ที่กำหนดเองการสรุปและการสร้างบท
- ทำซ้ำ - ใช้ Whisper ที่ทำงานบนการทำซ้ำ
รายการที่เกี่ยวข้อง
- Awesome -Chatgpt - แหล่งข้อมูล CHATGPT