เสียงพูด
Voice to Speech เป็นบริการฝั่งไคลเอ็นต์ในเบราว์เซอร์ที่แปลงเสียงของผู้ใช้เป็นคำพูดที่สังเคราะห์ขึ้นผ่านการรู้จำเสียงพูดด้วยเสียงหลายร้อยเสียงข้อความเป็นคำพูด (TTS) การแปลอัตโนมัติภาษาและการสนับสนุนซ็อกเก็ต
เบราว์เซอร์ที่รองรับ: Chrome, Edge, Safari
เยี่ยมชม https://shadowforests.github.io/voicetospeech/ เพื่อใช้เสียงพูด
คุณสมบัติ
- การจดจำคำพูดสดผ่าน Web Speech API (เฉพาะใน Chrome)
- เสียงยาวถึงเสียงต่ำโดยใช้ผลลัพธ์การรู้จำเสียงพูดชั่วคราว
- อินพุตทางเลือกข้อความเป็นคำพูดสำหรับการควบคุมเอาต์พุตที่ดี
- การแปลอัตโนมัติจากภาษาเสียงอินพุตเป็นภาษาพูด
- การเลือกภาษาและภาษาถิ่นจำนวนมากสำหรับการรู้จำเสียงพูดและเสียง
- รวมถึงการสนับสนุนเสียงบนคอมพิวเตอร์ของคุณและสร้างขึ้นในเบราว์เซอร์ของคุณ
- ปรับแต่งอุปกรณ์อินพุตและเอาต์พุตเสียง
- ปรับแต่งปริมาณเอาต์พุตเช่นเดียวกับระดับเสียงและอัตราสำหรับเสียงที่เลือก
- ทรานสคริปต์เอาต์พุตคำพูดสดพร้อมการสนับสนุนการเล่นสำหรับรายการการถอดเสียงทั้งหมด
- การเลือกข้อความทั้งหมดในหน้าจะเลือกข้อความการถอดเสียงเท่านั้น
- การวินิจฉัยสดสำหรับผลลัพธ์การจดจำคำพูดความมั่นใจและข้อผิดพลาด
- ใช้ช่องเสียบเว็บเพื่อส่งข้อความเอาต์พุตคำพูดโดยตรงไปยังพีซีของคุณ
- ใช้สองอินสแตนซ์เพื่ออนุญาตการแปลสองทิศทางระหว่างคุณและคนอื่น
ซ็อกเก็ตเว็บ
คุณสามารถตั้งค่าเซิร์ฟเวอร์เว็บซ็อกเก็ตบนพีซีของคุณเพื่อส่งข้อความเอาต์พุตคำพูดไปยังพีซีของคุณโดยตรง คุณสามารถค้นหาตัวอย่างในที่เก็บนี้ที่คุณสามารถเรียกใช้โดยใช้โหนด เริ่มต้นเซิร์ฟเวอร์โดยเรียกใช้ socket/run_server.bat และคำพูดจะถูกส่งไปยัง socket/vts_speech.txt เมื่อใดก็ตามที่คุณใช้ไซต์เสียงพูด
การแปลสองทิศทาง
นี่คือคำแนะนำในการตั้งค่าระบบที่กำหนดเองอนุญาตให้แปลสองทิศทางระหว่างคุณและคนอื่น
- คุณจะต้องติดตั้งเบราว์เซอร์โครเมี่ยมสองตัวแยกกัน ฉันแนะนำ Chrome และ Chrome Beta นี่เป็นเพราะเบราว์เซอร์โครเมี่ยมเดียวสามารถจัดการกับอินพุตเสียงเดียวในแต่ละครั้ง
- คุณจะต้องใช้เราเตอร์เสียงอย่างน้อยสองตัวจาก VB-Cable คุณควรได้รับ ไดรเวอร์ VB-cable เริ่มต้นรวมถึง ไดรเวอร์ VB เพิ่มเติม (Donationware) นี่คือเพื่อให้เราสามารถกำหนดเส้นทางเสียงผ่านช่องทางแยกต่างหากเพื่อหลีกเลี่ยงการชนกันในผลการรู้จำเสียงพูด หลังการตั้งค่าคุณสามารถเปิดตัวเลือกเสียงของคอมพิวเตอร์และเปิดใช้งานการฟังสายเคเบิลจากลำโพงหลักของคุณ สิ่งนี้ช่วยให้ได้ยินสิ่งที่เกิดขึ้นระหว่างการสนทนา
- เปิดไซต์ Voice to Speech บนเบราว์เซอร์ทั้งสอง เปิดเมนูตัวเลือกและเปิดใช้งาน การแปล ในเบราว์เซอร์ทั้งสอง
- ใน Chrome ตั้งค่าอินพุตไปยังไมโครโฟนส่วนบุคคลของคุณและเอาต์พุตไปยัง เอาต์พุตสายเคเบิล จากนั้นตั้งค่าภาษาของคุณเป็นอินพุตและภาษาที่คนอื่นพูดเป็นผลลัพธ์
- ในโปรแกรมการสื่อสารของคุณตั้งค่าไมโครโฟนอินพุตของคุณเป็น เอาต์พุตสายเคเบิล ตอนนี้เมื่อคุณพูดการสังเคราะห์คำพูดจะส่งออกไปยังโปรแกรมการสื่อสารของคุณแทนเสียงของคุณ
- ใน Chrome Beta ตั้งค่าอินพุตเป็น Output Cable-A และเอาต์พุตไปยังลำโพงเริ่มต้นของคุณ จากนั้นตั้งค่าภาษาที่คนอื่นพูดเป็นอินพุตและภาษาของคุณเป็นผลลัพธ์
- หากโปรแกรมการสื่อสารของคุณรองรับเอาต์พุตเสียงการเปลี่ยนเส้นทางให้ตั้งค่าเอาต์พุตเป็น เอาต์พุตเคเบิล A มิฉะนั้นหากคุณใช้ Windows คุณสามารถไปที่ ตัวเลือกการเล่นเสียง ในแอพการตั้งค่าคลิก ระดับเสียงแอพและคุณสมบัติอุปกรณ์ และเปลี่ยนอุปกรณ์เอาต์พุตสำหรับโปรแกรมการสื่อสารของคุณ สิ่งนี้อาจทำให้คุณต้องรีสตาร์ทโปรแกรมของคุณ ตอนนี้เมื่อคนอื่นพูดเสียงของพวกเขาจะถูกเปลี่ยนเส้นทางผ่านเสียงไปยังการพูดและการส่งออกเป็นคำพูดที่แปลผ่านลำโพงของคุณ
- ตอนนี้เสียงของอีกฝ่ายจะได้รับการแปลและพูดคุยกับลำโพงของคุณและเสียงของคุณจะได้รับการแปลโดยอัตโนมัติและพูดผ่านโปรแกรมการสื่อสารของคุณ!
ใบอนุญาต
โครงการนี้ได้รับใบอนุญาตภายใต้ใบอนุญาต MIT - ดูไฟล์ License.md สำหรับรายละเอียด