โน้ตบุ๊กที่มาจากที่มา

ภาพรวม
สคริปต์ผู้สร้างพอดคาสต์ (โน้ตบุ๊กที่มาจากแหล่งที่มา) ได้รับการออกแบบมาเพื่อทำให้กระบวนการสร้างพอดคาสต์จากเอกสาร PDF เป็นไปโดยอัตโนมัติ มันแยกข้อความจาก PDF สร้างสคริปต์พอดคาสต์โดยละเอียดโดยใช้โมเดล GPT-4 ของ OpenAI แปลงสคริปต์เป็นเสียงแล้วรวมเสียงเข้ากับรูปภาพของหน้า PDF เพื่อสร้างวิดีโอ เอาต์พุตสุดท้ายรวมทั้งไฟล์เสียงและไฟล์วิดีโอที่มีเสียงแบบซิงโครไนซ์
ตัวอย่าง
MISTRAL 7B
Llama2
ความสนใจคือสิ่งที่คุณต้องการ
คุณสมบัติโน้ตบุ๊กที่มาจากที่มา
- การแยกข้อความ PDF : แยกเนื้อหาข้อความจากเอกสาร PDF
- การสร้างสคริปต์ : ใช้โมเดล GPT-4 ของ OpenAI เพื่อสร้างสคริปต์พอดคาสต์โดยละเอียดตามข้อความที่แยกออกมา
- การแปลงแบบข้อความเป็นคำพูด : แปลงสคริปต์ที่สร้างขึ้นเป็นเสียงโดยใช้ความสามารถในการพูดแบบข้อความของ OpenAI
- การประมวลผลเสียง : ประมวลผลเสียงเพื่อให้แน่ใจว่าตรงตามข้อกำหนดที่ต้องการ (เช่นสเตอริโออัตราตัวอย่าง)
- การสร้างวิดีโอ : แปลงหน้า PDF เป็นรูปภาพและรวมเข้ากับเสียงเพื่อสร้างวิดีโอ
- การกำหนดค่าสภาพแวดล้อม : โหลดตัวแปรสภาพแวดล้อมจากไฟล์
.env สำหรับการจัดการคีย์ API ที่ปลอดภัย
เวิร์กโฟลว์
- แยกข้อความจาก PDF : สคริปต์เริ่มต้นด้วยการแยกข้อความจากไฟล์ PDF ที่ให้ไว้
- สร้างสคริปต์พอดคาสต์ : ข้อความที่แยกออกมาใช้เพื่อสร้างสคริปต์พอดคาสต์ที่มีโฮสต์สองโฮสต์อลิซและจอห์นซึ่งมีส่วนร่วมในการสนทนาอย่างละเอียดเกี่ยวกับเนื้อหา
- แปลงสคริปต์เป็นเสียง : สคริปต์ถูกแปลงเป็นเสียงด้วยเสียงที่แตกต่างกันที่ได้รับมอบหมายให้อลิซและจอห์น
- ประมวลผลเสียง : เสียงถูกประมวลผลเพื่อให้แน่ใจว่าอยู่ในรูปแบบและคุณภาพที่ถูกต้อง
- สร้างวิดีโอ : รูปภาพของหน้า PDF ถูกสร้างและรวมกับเสียงเพื่อสร้างวิดีโอ
- บันทึกเอาต์พุต : ไฟล์เสียงและวิดีโอสุดท้ายจะถูกบันทึกลงในเส้นทางเอาต์พุตที่ระบุ
วิธีใช้โน้ตบุ๊กที่มาจากที่มา
เพื่อเรียกใช้โครงการ:
- เติมไฟล์. env
- ในการใช้สคริปต์เพียงจัดเตรียมพา ธ ไปยังไฟล์ PDF และเรียกใช้สคริปต์ สคริปต์จะจัดการส่วนที่เหลือสร้างสคริปต์พอดคาสต์แปลงเป็นเสียงประมวลผลเสียงและการสร้างวิดีโอ
if name == "main" :
pdf_path = "/path/to/your/pdf/document.pdf"
create_podcast_from_pdf ( pdf_path )
poetry run python podcast_creator/main.py
การพึ่งพาอาศัยกัน
-
langchain -
pydantic -
openai -
pydub -
fitz (pymupdf) -
numpy -
subprocess -
tqdm -
PIL (หมอน) -
textwrap -
dotenv
ตรวจสอบให้แน่ใจว่ามีการติดตั้งการพึ่งพาทั้งหมดก่อนเรียกใช้สคริปต์
บทสรุป
สคริปต์ Podcast Creator (Open Sourced Notebooklm) เป็นโซลูชันที่ครอบคลุมสำหรับการแปลงเอกสาร PDF เป็นตอนพอดคาสต์ที่มีส่วนร่วมพร้อมด้วยเสียงและวิดีโอ ด้วยการใช้ประโยชน์จากโมเดล AI ขั้นสูงและเทคนิคการประมวลผลเสียงทำให้ระบบเวิร์กโฟลว์ทั้งหมดโดยอัตโนมัติทำให้ง่ายต่อการสร้างเนื้อหาพอดคาสต์คุณภาพสูงจากเอกสารข้อความ
ใบอนุญาต
มาแชทกันเถอะ)