ดาวน์โหลด podcast_tts - ดาวน์โหลดซอร์สโค้ด podcast

podcast_tts

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

พอดคาสต์ TTS

podcast_tts เป็นไลบรารี Python สำหรับการสร้างพอดคาสต์และบทสนทนาโดยใช้ข้อความเป็นคำพูด (TTS) รองรับลำโพงหลายเพลงเพลงประกอบและการผสมเสียงที่แม่นยำสำหรับผลลัพธ์คุณภาพระดับมืออาชีพ

ตัวอย่างพอดคาสต์

คุณสามารถฟังพอดคาสต์ตัวอย่างด้านล่าง:

Example-Podcast_01.mp4

คุณสมบัติ

การสนับสนุนหลายลำโพง : สร้างบทสนทนาด้วยโปรไฟล์ลำโพงที่แตกต่างกัน
Premade Voices : ใช้โปรไฟล์ลำโพง Premade (Male1, Male2, Female2) รวมอยู่ในห้องสมุดหรือสร้างโปรไฟล์ที่กำหนดเอง
การสร้างลำโพงแบบไดนามิก : สร้างโปรไฟล์ลำโพงใหม่โดยอัตโนมัติหากไม่มีลำโพงที่ระบุไว้จะช่วยประหยัดโปรไฟล์ในโฟลเดอร์ย่อย voices เพื่อการใช้งานในอนาคต
การมอบหมายบทบาทที่สอดคล้องกัน : ทำให้มั่นใจได้ถึงความสอดคล้องโดยการกำหนดและนำโปรไฟล์ลำโพงกลับมาใช้ใหม่ตามชื่อผู้พูด
การเล่นเฉพาะช่อง : อนุญาตให้เล่นเสียงทางซ้ายขวาหรือทั้งสองช่องสำหรับการแยกเชิงพื้นที่
การทำให้เป็นมาตรฐานข้อความ : ทำให้ข้อความปกติจัดการการหดตัวและรูปแบบกรณีพิเศษ
การรวมเพลงพื้นหลัง : เพิ่มเพลงประกอบด้วยการจางหายไป/ออกและควบคุมระดับเสียง
การสนับสนุน MP3 และ URL : ใช้ไฟล์ MP3/WAV ในเครื่องหรือดาวน์โหลดเพลงจาก URL ด้วยการแคช
รูปแบบเอาต์พุต : บันทึกเสียงที่สร้างขึ้นเป็นไฟล์ WAV หรือ MP3

การติดตั้ง

 # ensure to have sox, or ffmpeg installed
brew install sox
# install the package
pip install podcast_tts

การใช้งาน

สร้างเสียงสำหรับลำโพงตัวเดียว

 import asyncio
from podcast_tts import PodcastTTS

async def main ():
    tts = PodcastTTS ( speed = 5 )
    await tts . generate_tts (
        text = "Hello! Welcome to our podcast." ,
        speaker = "male1" ,
        filename = "output_audio.wav" ,
        channel = "both"
    )

if __name__ == "__main__" :
    asyncio . run ( main ())

ตัวอย่าง: การสร้างพอดคาสต์ด้วยเพลง

วิธีการ generate_podcast รวมบทสนทนาและเพลงประกอบสำหรับการผลิตพอดคาสต์ที่ไร้รอยต่อ

 import asyncio
from podcast_tts import PodcastTTS

async def main ():
    tts = PodcastTTS ( speed = 5 )

    # Define speakers and text
    texts = [
        { "male1" : [ "Welcome to the podcast!" , "both" ]},
        { "female2" : [ "Today, we discuss AI advancements." , "left" ]},
        { "male2" : [ "Don't miss our exciting updates." , "right" ]},
    ]

    # Define background music (local file or URL)
    music_config = [ "https://example.com/background_music.mp3" , 10 , 3 , 0.3 ]

    # Generate the podcast
    output_file = await tts . generate_podcast (
        texts = texts ,
        music = music_config ,
        filename = "podcast_with_music.mp3" ,
        pause_duration = 0.5 ,
        normalize = True
    )

    print ( f"Podcast saved to: { output_file } " )

if __name__ == "__main__" :
    asyncio . run ( main ())

การกำหนดค่าเพลง:

[ไฟล์/url, full_volume_duration, fade_duration, target_volume]
- ไฟล์/URL : พา ธ ไปยังไฟล์ MP3/WAV ในเครื่องหรือ URL ที่จะดาวน์โหลด
- full_volume_duration : เวลา (วินาที) ที่ระดับเสียงเต็มก่อนที่การสนทนาจะเริ่มต้นและหลังจบ
- fade_duration : เวลา (วินาที) สำหรับเอฟเฟกต์จางลง/ออก
- Target_volum E: ระดับเสียง (0.0 ถึง 1.0) ระหว่างการเล่นบทสนทนา

เสียงที่ทำไว้ล่วงหน้า

Podcasttts รวมโปรไฟล์ลำโพงที่ทำไว้ล่วงหน้าต่อไปนี้:

ชาย 1
ชาย 2
หญิง 2

โปรไฟล์เหล่านี้รวมอยู่ในไดเรกทอรี default_voices ของแพ็คเกจและสามารถใช้งานได้โดยไม่ต้องตั้งค่าเพิ่มเติม

การสร้างลำโพงแบบไดนามิก

เมื่อระบุโปรไฟล์ลำโพง แต่ไม่มีอยู่ไลบรารีจะสร้างโปรไฟล์ลำโพงใหม่โดยอัตโนมัติและบันทึกไว้ในโฟลเดอร์ย่อยของเสียง สิ่งนี้ทำให้มั่นใจได้ว่าบทบาทเสียงที่สอดคล้องกันในการเปิดที่แตกต่างกันในบทสนทนา ตัวอย่างเช่น:

 texts = [
    { "Narrator" : [ "Welcome to this exciting episode." , "left" ]},
    { "Expert" : [ "Today, we'll explore AI's impact on healthcare." , "right" ]},
]
# If "Narrator" or "Expert" profiles do not exist, they will be generated dynamically.

โปรไฟล์จะถูกบันทึกไว้ในไดเรกทอรีเสียงของสคริปต์และนำกลับมาใช้ใหม่โดยอัตโนมัติหากมีการใช้ลำโพงเดียวกันในอนาคตเพื่อความสอดคล้อง

กำลังโหลดโปรไฟล์ลำโพงที่มีอยู่

คุณสามารถโหลดโปรไฟล์ลำโพงใด ๆ ได้โดยระบุชื่อไฟล์ (โดยไม่ต้องขยาย. txt) โปรไฟล์จะถูกเก็บไว้ในโฟลเดอร์ย่อยเสียงดังนั้นคุณไม่จำเป็นต้องระบุเส้นทางอย่างชัดเจน

 # Assuming a speaker profile "Host.txt" exists in the voices subfolder
await tts . generate_tts ( "This is a test for an existing speaker." , "Host" , "existing_speaker.wav" )

หมายเหตุเพิ่มเติม

ห้องสมุดใช้ Chattts สำหรับรุ่น TTS คุณภาพสูง
ข้อความจะถูกทำความสะอาดและแบ่งออกเป็นชิ้นที่จัดการได้โดยอัตโนมัติทำให้ง่ายต่อการสร้างเสียงสำหรับสคริปต์หรือการสนทนาที่ยาวนาน
ไฟล์เสียงที่สร้างขึ้นจะถูกบันทึกในรูปแบบ WAV พร้อมรองรับการเล่นเฉพาะช่อง