ดาวน์โหลด VoiceToSpeech - ดาวน์โหลดซอร์สโค้ด VoiceToSpeech

VoiceToSpeech

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

เสียงพูด

Voice to Speech เป็นบริการฝั่งไคลเอ็นต์ในเบราว์เซอร์ที่แปลงเสียงของผู้ใช้เป็นคำพูดที่สังเคราะห์ขึ้นผ่านการรู้จำเสียงพูดด้วยเสียงหลายร้อยเสียงข้อความเป็นคำพูด (TTS) การแปลอัตโนมัติภาษาและการสนับสนุนซ็อกเก็ต

เบราว์เซอร์ที่รองรับ: Chrome, Edge, Safari

เยี่ยมชม https://shadowforests.github.io/voicetospeech/ เพื่อใช้เสียงพูด

คุณสมบัติ

การจดจำคำพูดสดผ่าน Web Speech API (เฉพาะใน Chrome)
เสียงยาวถึงเสียงต่ำโดยใช้ผลลัพธ์การรู้จำเสียงพูดชั่วคราว
อินพุตทางเลือกข้อความเป็นคำพูดสำหรับการควบคุมเอาต์พุตที่ดี
การแปลอัตโนมัติจากภาษาเสียงอินพุตเป็นภาษาพูด
การเลือกภาษาและภาษาถิ่นจำนวนมากสำหรับการรู้จำเสียงพูดและเสียง
รวมถึงการสนับสนุนเสียงบนคอมพิวเตอร์ของคุณและสร้างขึ้นในเบราว์เซอร์ของคุณ
ปรับแต่งอุปกรณ์อินพุตและเอาต์พุตเสียง
ปรับแต่งปริมาณเอาต์พุตเช่นเดียวกับระดับเสียงและอัตราสำหรับเสียงที่เลือก
ทรานสคริปต์เอาต์พุตคำพูดสดพร้อมการสนับสนุนการเล่นสำหรับรายการการถอดเสียงทั้งหมด
การเลือกข้อความทั้งหมดในหน้าจะเลือกข้อความการถอดเสียงเท่านั้น
การวินิจฉัยสดสำหรับผลลัพธ์การจดจำคำพูดความมั่นใจและข้อผิดพลาด
ใช้ช่องเสียบเว็บเพื่อส่งข้อความเอาต์พุตคำพูดโดยตรงไปยังพีซีของคุณ
ใช้สองอินสแตนซ์เพื่ออนุญาตการแปลสองทิศทางระหว่างคุณและคนอื่น

ซ็อกเก็ตเว็บ

คุณสามารถตั้งค่าเซิร์ฟเวอร์เว็บซ็อกเก็ตบนพีซีของคุณเพื่อส่งข้อความเอาต์พุตคำพูดไปยังพีซีของคุณโดยตรง คุณสามารถค้นหาตัวอย่างในที่เก็บนี้ที่คุณสามารถเรียกใช้โดยใช้โหนด เริ่มต้นเซิร์ฟเวอร์โดยเรียกใช้ socket/run_server.bat และคำพูดจะถูกส่งไปยัง socket/vts_speech.txt เมื่อใดก็ตามที่คุณใช้ไซต์เสียงพูด

การแปลสองทิศทาง

นี่คือคำแนะนำในการตั้งค่าระบบที่กำหนดเองอนุญาตให้แปลสองทิศทางระหว่างคุณและคนอื่น

คุณจะต้องติดตั้งเบราว์เซอร์โครเมี่ยมสองตัวแยกกัน ฉันแนะนำ Chrome และ Chrome Beta นี่เป็นเพราะเบราว์เซอร์โครเมี่ยมเดียวสามารถจัดการกับอินพุตเสียงเดียวในแต่ละครั้ง
คุณจะต้องใช้เราเตอร์เสียงอย่างน้อยสองตัวจาก VB-Cable คุณควรได้รับ ไดรเวอร์ VB-cable เริ่มต้นรวมถึง ไดรเวอร์ VB เพิ่มเติม (Donationware) นี่คือเพื่อให้เราสามารถกำหนดเส้นทางเสียงผ่านช่องทางแยกต่างหากเพื่อหลีกเลี่ยงการชนกันในผลการรู้จำเสียงพูด หลังการตั้งค่าคุณสามารถเปิดตัวเลือกเสียงของคอมพิวเตอร์และเปิดใช้งานการฟังสายเคเบิลจากลำโพงหลักของคุณ สิ่งนี้ช่วยให้ได้ยินสิ่งที่เกิดขึ้นระหว่างการสนทนา
เปิดไซต์ Voice to Speech บนเบราว์เซอร์ทั้งสอง เปิดเมนูตัวเลือกและเปิดใช้งาน การแปล ในเบราว์เซอร์ทั้งสอง
ใน Chrome ตั้งค่าอินพุตไปยังไมโครโฟนส่วนบุคคลของคุณและเอาต์พุตไปยัง เอาต์พุตสายเคเบิล จากนั้นตั้งค่าภาษาของคุณเป็นอินพุตและภาษาที่คนอื่นพูดเป็นผลลัพธ์
ในโปรแกรมการสื่อสารของคุณตั้งค่าไมโครโฟนอินพุตของคุณเป็น เอาต์พุตสายเคเบิล ตอนนี้เมื่อคุณพูดการสังเคราะห์คำพูดจะส่งออกไปยังโปรแกรมการสื่อสารของคุณแทนเสียงของคุณ
ใน Chrome Beta ตั้งค่าอินพุตเป็น Output Cable-A และเอาต์พุตไปยังลำโพงเริ่มต้นของคุณ จากนั้นตั้งค่าภาษาที่คนอื่นพูดเป็นอินพุตและภาษาของคุณเป็นผลลัพธ์
หากโปรแกรมการสื่อสารของคุณรองรับเอาต์พุตเสียงการเปลี่ยนเส้นทางให้ตั้งค่าเอาต์พุตเป็น เอาต์พุตเคเบิล A มิฉะนั้นหากคุณใช้ Windows คุณสามารถไปที่ ตัวเลือกการเล่นเสียง ในแอพการตั้งค่าคลิก ระดับเสียงแอพและคุณสมบัติอุปกรณ์ และเปลี่ยนอุปกรณ์เอาต์พุตสำหรับโปรแกรมการสื่อสารของคุณ สิ่งนี้อาจทำให้คุณต้องรีสตาร์ทโปรแกรมของคุณ ตอนนี้เมื่อคนอื่นพูดเสียงของพวกเขาจะถูกเปลี่ยนเส้นทางผ่านเสียงไปยังการพูดและการส่งออกเป็นคำพูดที่แปลผ่านลำโพงของคุณ
ตอนนี้เสียงของอีกฝ่ายจะได้รับการแปลและพูดคุยกับลำโพงของคุณและเสียงของคุณจะได้รับการแปลโดยอัตโนมัติและพูดผ่านโปรแกรมการสื่อสารของคุณ!