ดาวน์โหลด rhvoice proxy - rhvoice proxy Source Source Download

rhvoice proxy

โค้ดแหล่งที่มา AI

0.8.0

ดาวน์โหลด

อินเทอร์เฟซระดับสูงสำหรับห้องสมุด rhvoice

การสร้างสตรีมคำพูดจากข้อความผ่านห้องสมุด Rhvoice โดยไม่ต้องเริ่มต้นเครื่องยนต์อีกครั้ง สิ่งนี้เร็วและสะดวกกว่าโทร rhvoice-test

รูปแบบเสียงที่รองรับ: wav , mp3 , opus , flac และ pcm (เอาต์พุต RAD RHVOICE)

ติดตั้ง

pip3 install rhvoice-wrapper

แพ็คเกจนี้ ไม่ได้ ให้ rhvoice เอง คุณต้องสร้าง (หรือติดตั้ง) rhvoice ภาษาและเสียงด้วยตนเอง ใน Windows คุณต้องระบุเส้นทางสำหรับการทำงาน

Rhvoice-wrapper-bin

คำเตือน ! rhvoice-wrapper-bin ไม่ทำงานใน macOS ติดตั้ง rhvoice ด้วยตนเอง

แทนที่จะเป็น rhvoice คุณสามารถติดตั้ง rhvoice-wrapper-bin นี่เป็นวิธีที่ดีที่สุดสำหรับ Windows หากติดตั้ง rhvoice-wrapper-bin ไลบรารีและข้อมูลจะถูกใช้โดยอัตโนมัติ

pip3 install rhvoice-wrapper[rhvoice]

เอกสาร

ก่อนสร้างวัตถุ TTS:

 from rhvoice_wrapper import TTS

tts = TTS ( threads = 1 )

คุณสามารถตั้งค่าตัวเลือกเมื่อสร้างหรือผ่านสภาพแวดล้อมตัวแปร (Upper Register) ตัวเลือกแทนที่สภาพแวดล้อมตัวแปร ในการตั้งค่าค่าเริ่มต้นใช้ None :

เธรด หรือ เกลียว ถ้าเท่ากับ 1 สร้างวัตถุเธรดหนึ่งวัตถุหากทำงานมากขึ้นในโหมดการประมวลผลแบบมัลติโปรเซสเซอร์และสร้างกระบวนการจำนวนมาก ค่าเริ่มต้น 1 .
force_process หรือ processes_mode : ถ้าเครื่องยนต์ True ทำงานในโหมดการประมวลผลแบบมัลติเพอร์เมนต์หาก False ในโหมดเธรด ค่าเริ่ม False ถ้าเธรด == 1 True โหมดเธรดและเธรด> 1 ทำให้เกิดความผิดพลาดในการแบ่งส่วนหรืออาจส่งคืนข้อมูลที่เสียหาย
lib_path หรือ rhvoicelibpath : เส้นทางสู่ห้องสมุด rhvoice libRHVoice.so ใน Linux, libRHVoice.dylib ใน macOS และ RHVoice.dll ใน Windows
data_path หรือ rhvoicedatapath : เส้นทางสู่โฟลเดอร์ที่มีโฟลเดอร์เสียงและภาษา ค่าเริ่มต้น /usr/local/share/RHVoice
config_path หรือ rhvoiceconfigpath : เส้นทางสู่โฟลเดอร์มี rhvoice.conf ใน linux และ rhvoice.ini ใน Windows ค่าเริ่มต้น /usr/local/etc/RHVoice
ทรัพยากร หรือ rhvoiceresources : รายการเส้นทางสู่ภาษาและข้อมูลเสียง ควรใช้เมื่อไม่สามารถรวบรวมข้อมูลทั้งหมดได้ในที่เดียว ค่าเริ่มต้น [] .
lame_path หรือ lamepath : Path to lame , เป็นทางเลือก ง่อยต้องอยู่สำหรับการสนับสนุน mp3 ง่อยเริ่ม lame
OPUS_PATH หรือ OPUSENCPATH : PATH TO opusenc เป็นทางเลือก ไฟล์จะต้องมีอยู่สำหรับการสนับสนุน opus opusenc เริ่มต้น
FLAC_PATH หรือ FLACPATH : PATH TO flac เป็นทางเลือก ไฟล์จะต้องมีอยู่สำหรับการสนับสนุน flac flac เริ่มต้น
เงียบ หรือ เงียบ : ถ้า True อย่าเอาท์พุทข้อมูล ค่าเริ่ม False
สตรีม หรือ rhvoicestream : การประมวลผลและการส่งชิ้นโดยเร็วที่สุดเท่าที่จะเป็นไปได้มิฉะนั้นการประมวลผลและการส่งข้อมูลเต็มรูปแบบเท่านั้นรวมถึงความยาว: say จะส่งคืนก้อนใหญ่หนึ่งก้อนรูปแบบอื่นนอกเหนือจาก wav และ pcm จะถูกสร้างช้าลงมาก ค่าเริ่มต้น True

การใช้งาน

เริ่มต้นเครื่องกำเนิดการสังเคราะห์และรับข้อมูลเสียง, ก้อนโดยก้อน:

 def generator_audio ( text , voice = 'anna' , format_ = 'wav' , buff = 4096 , sets = None ):
    with tts . say ( text , voice , format_ , buff , sets ) as gen :
        for chunk in gen :
            yield chunk

หรือรับข้อมูลเสียงทั้งหมดในก้อนใหญ่หนึ่งชิ้น:

 data = tts . get ( 'Hello world!' , format_ = 'wav' )
print ( 'data size: ' , len ( data ), ' bytes' )
subprocess . check_output ([ 'aplay' , '-q' ], input = data )

หรือเพียงแค่บันทึกไปยังไฟล์:

 tts . to_file ( filename = 'esperanto.ogg' , text = 'Saluton mondo' , voice = 'spomenka' , format_ = 'opus' , sets = None )

format_ เป็นรูปแบบเสียงเอาต์พุต ต้องอยู่ใน tts.formats

voice เป็นเสียงของลำโพง ต้องอยู่ใน tts.voice_profiles voice='Voice', sets=None equal voice=None, sets={'voice_profile': 'Voice'} , voice ที่สำคัญยิ่งขึ้น

sets อาจตั้งค่าเป็นพารามิเตอร์การสังเคราะห์ตามที่กำหนดไว้ใน SET_PARAMS พารามิเตอร์นี้ใช้ได้เฉพาะกับวลีปัจจุบัน None ค่าเริ่มต้น

ถ้า buff เท่ากับ None or 0 , สำหรับ PCM และ WAV Chunks กลับมาตามที่เป็นอยู่ (อาจเร็วขึ้นเล็กน้อย) สำหรับคนอื่น ๆ ใช้ขนาดก้อนเริ่มต้น (4 kib)

ส่งข้อความเป็นวัตถุที่ทำซ้ำได้

หาก text ที่ทำซ้ำวัตถุชิ้นส่วนทั้งหมดจะประมวลผลอย่างต่อเนื่อง นี่เป็นวิธีที่ดีสำหรับการประมวลผลข้อความที่มีขนาดใหญ่อย่างไม่น่าเชื่อ โปรดจำไว้ว่าเครื่องกำเนิดไฟฟ้าไม่สามารถถ่ายโอนไปยังกระบวนการอื่นได้ ตัวอย่าง:

 def _text ():
    with open ( 'wery_large_book.txt' ) as fp :
        text = fp . read ( 5000 )
        while text :
            yield text
            text = fp . read ( 5000 )

def generator_audio ():
    with tts . say ( _text ()) as gen :
        for chunk in gen :
            yield chunk

วิธีอื่น ๆ

set_params

เปลี่ยนการตั้งค่าการสังเคราะห์เสียง:

 tts . set_params ( ** kwargs )

อนุญาต: voice_profile , absolute_rate , absolute_pitch , absolute_volume , relative_rate , relative_pitch , relative_volume , punctuation_mode , punctuation_list _List, capitals_mode , flags ดูเอกสารรายละเอียดของ Rhvoice สำหรับรายละเอียด

กลับมา True ถ้ามีการเปลี่ยนแปลงอื่น ๆ False

get_params

รับการตั้งค่าการสังเคราะห์เสียง:

 tts . get_params ( param = None )

หาก param คือ None การส่งคืนการตั้งค่าทั้งหมดใน dict ค่าพารามิเตอร์อื่นตามชื่อ หากพารามิเตอร์ไม่พบ Return None

เข้าร่วม

เข้าร่วมเธรดหรือกระบวนการ อย่าใช้วัตถุหลังจากเข้าร่วม:

 tts . join ()

คุณสมบัติ

TTS.formats : รายการรูปแบบที่รองรับ pcm และ wav นำเสนอเสมอ
TTS.thread_count : จำนวนเธรดการสังเคราะห์
TTS.process : ถ้า True TTS จะทำงานในโหมดการประมวลผลแบบมัลติโปรเซสเซอร์
TTS.voices : รายการเสียงที่รองรับ
TTS.voice_profiles : รายการโปรไฟล์เสียงที่รองรับ
TTS.voices_info : พจนานุกรมเสียงที่รองรับพร้อมข้อมูลเสียง
TTS.api_version : เวอร์ชันห้องสมุด Rhvoice ที่รองรับ
TTS.lib_version : เวอร์ชันไลบรารี rhvoice หากไม่ได้อยู่ใน rhvoice_wrapper.rhvoice_proxy.SUPPORT อาจทำงานไม่ถูกต้อง
TTS.cmd : พจนานุกรมการโทรภายนอกตามที่เป็นอยู่