ดาวน์โหลด podgenai - ดาวน์โหลดซอร์สโค้ด podgenai

podgenai

ซอร์สโค้ดอื่น ๆ

0.8.0

ดาวน์โหลด

Podgenai

Podgenai เป็นแอปพลิเคชั่น Python 3.12 เพื่อสร้างไฟล์ AudioBook/Podcast MP3 ที่ให้ข้อมูลในหัวข้อที่กำหนดโดยใช้ GPT-4 LLM ระยะเวลาเป้าหมายของไฟล์ที่สร้างขึ้นคือหนึ่งชั่วโมงแม้ว่าระยะเวลาที่สร้างจะแตกต่างกันไป จำเป็นต้องมีคีย์ OpenAI API ที่ได้รับทุน

ลิงค์

คำบรรยายภาพ	การเชื่อมโยง
repo	https://github.com/impredicative/podgenai
การเปลี่ยนแปลง	https://github.com/impredicative/podgenai/releases
บรรจุุภัณฑ์	https://pypi.org/project/podgenai
พอดคาสต์	https://podcasters.spotify.com/pod/podgenai
พอดคาสต์ RSS	https://anchor.fm/s/f4868644/podcast/rss

เข้าใกล้

ใช้รุ่น gpt-4o และ tts-1 สำหรับหัวข้อที่กำหนดวิธีการอ้างอิงระดับสูงคือ:

หัวข้อย่อยที่ใช้งานได้แสดงไว้โดยใช้ LLM หากไม่เป็นที่รู้จักของหัวข้อ LLM กระบวนการจะถูกยกเลิก
เสียงถูกเลือกโดยใช้ LLM จากสี่ตัวเลือก
พร้อมกันสำหรับแต่ละหัวข้อย่อยข้อความและคำพูดที่สอดคล้องกันถูกสร้างขึ้นโดยใช้ LLM และ TTS ตามลำดับ
ไฟล์คำพูดถูกต่อกันโดยใช้ ffmpeg

แม้ว่าบางครั้งอาจมีการทำซ้ำความหมายของเนื้อหาในหัวข้อย่อย แต่สิ่งนี้ไม่ได้ตั้งใจ "ปรับให้เหมาะสม" โดยเจตนาเพราะการทำซ้ำจุดสำคัญนี้สามารถช่วยในการเรียนรู้และท่องจำ ในการดำน้ำลึกลงไปในหัวข้อย่อยโดยเฉพาะเราสามารถลองสร้างไฟล์ใหม่ได้

ตัวอย่าง

ไฟล์ MP3 ที่สร้างขึ้นเหล่านี้มีให้ดาวน์โหลด ผลเหล่านี้ยังเป็นชุดทดสอบด้วยตนเองน้อยที่สุดโดยมีวัตถุประสงค์เฉพาะของแต่ละตัวอย่างที่ระบุไว้ เพื่อเป็นการเตือนความจำเสียงถูกเลือกโดย LLM

นอกจากนี้ยังมีพอดคาสต์ที่เกี่ยวข้อง (RSS) ซึ่งตอนในหัวข้อเพิ่มเติมอาจโพสต์ด้วยตนเองเมื่อเวลาผ่านไป

แนะนำให้ใช้ความเร็วในการเล่นที่ 1.05X สำหรับหัวข้อที่ไม่ใช่ด้านเทคนิค 1.0x สำหรับหัวข้อทางเทคนิคและ 0.95x สำหรับหัวข้อภาษาต่างประเทศ

เสียง	ชื่อ	วัตถุประสงค์
ค่าเริ่มต้น	pytorch	การสร้างเนื้อหาทางเทคนิค
ค่าเริ่มต้น	pytorch ขั้นสูง	การสร้างเนื้อหาทางเทคนิคขั้นสูง
ค่าเริ่มต้น	เคล็ดลับการสัมภาษณ์งานวิศวกรซอฟต์แวร์	การเลือกเสียงเริ่มต้น
อารมณ์	นิวยอร์กซิตี้: ปัจจุบันและอนาคต	การสร้างเนื้อหาที่ไม่ใช่ด้านเทคนิค
อารมณ์	มีชีวิตที่ดี	การเลือกเสียงอารมณ์
ค่าเริ่มต้น	ข่าวกรองทั่วไป (AGI): แนวทางและอัลกอริทึม	การบังคับใช้รายการย่อยระดับย่อยแบบแบนแบบแบน
หญิง	ระบบไหลเวียนโลหิตของมนุษย์ (ไม่ติด)	การสนับสนุนหัวข้อโดยนัยสำหรับคำต่อท้ายที่ไม่ได้ย่อ
หญิง	บัฟฟี่ผู้สังหารแวมไพร์	การเลือกเสียงหญิง
ชาย	bitcoin สำหรับ nerds	การเลือกเสียงชาย

การตั้งค่า

การตั้งค่าทั่วไป

ในไดเรกทอรีการทำงานให้สร้างไฟล์ชื่อ .env ด้วยตัวแปรสภาพแวดล้อมที่ต้องการ OPENAI_API_KEY=<your OpenAI API key> หรือตั้งค่าในวิธีที่แตกต่างกัน
ยังเลือกตั้งค่าตัวแปรสภาพแวดล้อม PODGENAI_OPENAI_MAX_WORKERS=32 สำหรับการสร้างที่เร็วขึ้นโดยมีค่าเริ่มต้นเป็น 16
ตรวจสอบให้แน่ใจว่ามี ffmpeg นี่เป็นไปโดยอัตโนมัติหากใช้คำจำกัดความของ DevContainer
ดำเนินการตั้งค่าต่อผ่าน GitHub หรือ PYPI ดังต่อไปนี้

การตั้งค่าผ่าน GitHub โดยใช้ DevContainer

ดำเนินการต่อจากขั้นตอนการตั้งค่าทั่วไป
โคลนหรือดาวน์โหลด repo นี้
สร้างและจัดเตรียม devcontainer ที่กำหนดไว้

การตั้งค่าผ่าน GitHub ด้วยตนเอง

ดำเนินการต่อจากขั้นตอนการตั้งค่าทั่วไป
โคลนหรือดาวน์โหลด repo นี้
ตรวจสอบให้แน่ใจว่า rye การติดตั้งและมีอยู่แล้ว
ในไดเรกทอรี repo ให้เรียกใช้ rye sync --no-lock

การตั้งค่าผ่าน PYPI

ดำเนินการต่อจากขั้นตอนการตั้งค่าทั่วไป
สร้างและเปิดใช้งาน Python 3.12 DevContainer หรือสภาพแวดล้อมเสมือนจริง
ติดตั้งผ่าน PYPI: pip install -U podgenai

การใช้งาน

การใช้งานอาจเป็นแอปพลิเคชันบรรทัดคำสั่งหรือเป็นไลบรารี Python โดยค่าเริ่มต้นไฟล์ MP3 ที่สร้างขึ้นจะถูกเขียนไปยังไดเรกทอรีการทำงานปัจจุบัน ตั้งแต่ปี 2024 ค่าใช้จ่ายทั่วไปต่อรุ่นคือ 1 ถึง 2 USD โดยเฉพาะภายใต้ 0.10 USD ต่อหัวข้อย่อย เวลาใช้เวลาไม่ถึงสามนาที

เคล็ดลับการใช้งาน

หากหัวข้อที่ร้องขอไม่สามารถสร้างหัวข้อย่อยได้เนื่องจากการปฏิเสธให้ลองอีกครั้งถึงสองสามครั้งเนื่องจากอาจประสบความสำเร็จในการพยายามหลายครั้ง หากไม่ได้ลองใช้คำใหม่บางทีอาจจะกว้างขึ้นหรือแคบลงหรือมีความเป็นจริงมากกว่า มีการพยายามมากถึงสองครั้งต่อการวิ่งแม้ว่าความพยายามครั้งแรกจะนำแคชดิสก์กลับมาใช้ใหม่อีกครั้งหากมี
สำหรับรายการย่อยที่ครอบคลุมอีกต่อไปให้พิจารณาต่อท้ายคำต่อท้าย "(unabridged)" กับหัวข้อที่ร้องขอเช่น "pytorch (unabridged)"
ในกรณีที่หัวข้อไม่สามารถพูดได้ในช่วงเริ่มต้นของพอดคาสต์ลบ ./work/<topic>/1.*.mp3 และสร้างผลลัพธ์ใหม่
ในการเลือกสร้างภาพหน้าปกสำหรับหัวข้อของคุณสามารถใช้ GPT ที่กำหนดเองนี้ได้
หากต้องการสร้างความพยายามในภาษาต่างประเทศให้ระบุชื่อในภาษาที่ต้องการพร้อมกับคำนำหน้าแบบวงเล็บของชื่อภาษาเช่น "México (Español)" หากคนรุ่นถูกปฏิเสธครั้งแรกลองอีกครั้ง อ้างถึงและใช้ตัวเลือก --no-markers

การใช้เป็นแอปพลิเคชัน

ความช่วยเหลือในการใช้งานถูกคัดลอกด้านล่าง:

 $ python -m podgenai -h
Usage: python -m podgenai [OPTIONS]

  Generate and write an audiobook podcast mp3 file for the given topic to the given output file path.

Options:
  -t, --topic TEXT                Topic. If not given, the user is prompted for it.
  -p, --path PATH                 Output file or directory path. If an intended file path, it must have an ".mp3"
                                  suffix. If a directory, it must exist, and the file name is auto-determined. If not
                                  given, the output file is written to the current working directory with an auto-
                                  determined file name.
  -s, --max-sections INTEGER RANGE
                                  Maximum number of sections, between 3 and 100. If not given, it is unrestricted.
                                  [3<=x<=100]
  -m, --markers / -nm, --no-markers
                                  Include markers at the start or end of sections in the generated audio. If
                                  `--markers`, markers are included, and this is the default. If `--no-markers`,
                                  markers are excluded, as can be appropriate for foreign-language generation.
  -c, --confirm / -nc, --no-confirm
                                  Confirm before full-text and speech generation. If `--confirm`, a confirmation is
                                  interactively sought as each step of the workflow progresses, and this is the
                                  default. If `--no-confirm`, the full-text and speech are generated without
                                  confirmations.
  -h, --help                      Show this message and exit.

ตัวอย่างการใช้งาน:

 $ python -m podgenai -t "My favorite topic"

$ python -m podgenai -t "My favorite topic" -p ~/Downloads/

$ python -m podgenai -t "My favorite topic" -p ~/Downloads/topic.mp3 -nc

$ python -m podgenai -t "L'histoire de Napoléon Bonaparte (français)" -nm

การใช้เป็นห้องสมุด

 >> > from podgenai import generate_media
>> > import inspect

>> > print ( inspect . signature ( generate_media ))
( topic : str , * , output_path : Optional [ pathlib . Path ] = None , max_sections : Optional [ int ] = None , markers : bool = True , confirm : bool = False ) - > pathlib . Path

>> > print ( inspect . getdoc ( generate_media ))

 Return the output path after generating and writing an audiobook podcast to file for the given topic.

Params:
* `topic`: Topic.
* `path`: Output file or directory path.
    If an intended file path, it must have an ".mp3" suffix. If a directory, it must exist, and the file name is auto-determined.
    If not given, the output file is written to the repo directory with an auto-determined file name.
* `max_sections`: Maximum number of sections to generate. It is between 3 and 100. It is unrestricted if not given.
* `markers`: Include markers at the start or end of sections in the generated audio.
    If true, markers are included. If false, markers are excluded, as can be appropriate for foreign-language generation. Its default is true.
* `confirm`: Confirm before full-text and speech generation.
    If true, a confirmation is interactively sought after generating and printing the list of subtopics, before generating the full-text, and also before generating the speech. Its default is false.

If failed, a subclass of the `podgenai.exceptions.Error` exception is raised.

แคช

เซ็กเมนต์ข้อความและคำพูดถูกแคชในท้องถิ่นบนดิสก์ในไดเรกทอรี . ./work/<topic> พวกเขาสามารถลบด้วยตนเองได้ การลบนี้ไม่ได้เป็นไปโดยอัตโนมัติ นอกจากนี้ยังจำเป็นต้องลบไฟล์แคชที่เกี่ยวข้องอย่างน้อยหนึ่งไฟล์หรือมากกว่าหากจะต้องผ่านแคช

คำเตือน

_{ซอฟต์แวร์นี้มีให้ "ตามสภาพ" โดยไม่มีการรับประกันใด ๆ ไม่ว่าโดยชัดแจ้งหรือโดยนัยรวมถึง แต่ไม่ จำกัด เฉพาะการรับประกันความสามารถในการค้าการออกกำลังกายเพื่อวัตถุประสงค์เฉพาะและการไม่เข้าร่วม ไม่ว่าในกรณีใดผู้เขียนหรือผู้ถือลิขสิทธิ์จะต้องรับผิดชอบต่อการเรียกร้องความเสียหายหรือความรับผิดอื่น ๆ ไม่ว่าจะเป็นการกระทำของสัญญาการละเมิดหรืออื่น ๆ ที่เกิดขึ้นจากหรือเกี่ยวข้องกับซอฟต์แวร์หรือการใช้งานหรือการติดต่ออื่น ๆ ในซอฟต์แวร์}

_{ผู้ใช้ควรทราบว่าทั้งข้อความและเสียงของไฟล์ที่สร้างขึ้นนั้นผลิตโดยปัญญาประดิษฐ์ (AI) ตามอินพุตที่ให้ไว้และข้อมูลที่มีให้กับโมเดล AI ในช่วงเวลาแห่งการสร้าง ดังนั้นความไม่ถูกต้องข้อผิดพลาดหรือเนื้อหาที่ไม่ได้ตั้งใจอาจเกิดขึ้น ผู้ใช้ควรใช้ความระมัดระวังและตรวจสอบความถูกต้องและความเหมาะสมของเนื้อหาที่สร้างขึ้นก่อนการใช้งานหรือการพึ่งพา}

_{คุณต้องรับผิดชอบค่าใช้จ่ายที่เกี่ยวข้องกับการใช้ OpenAI API ตามที่ซอฟต์แวร์กำหนดและคุณต้องปฏิบัติตามข้อกำหนดในการให้บริการ OpenAI API ฟังก์ชั่นของซอฟต์แวร์ขึ้นอยู่กับความพร้อมใช้งานและฟังก์ชั่นของบริการและซอฟต์แวร์ภายนอกรวมถึง แต่ไม่ จำกัด เฉพาะ OpenAI API และ FFMPEG ซึ่งผู้เขียนไม่มีการควบคุม}

_{การใช้คีย์ OpenAI API และเนื้อหาใด ๆ ที่สร้างขึ้นจะต้องปฏิบัติตามกฎหมายและข้อบังคับที่เกี่ยวข้องทั้งหมดรวมถึงกฎหมายลิขสิทธิ์และข้อกำหนดในการให้บริการของแพลตฟอร์ม OpenAI คุณมีความรับผิดชอบเพียงอย่างเดียวในการรับรองว่าการใช้ซอฟต์แวร์และเนื้อหาที่สร้างขึ้นใด ๆ ของคุณสอดคล้องกับข้อกำหนดในการให้บริการของ OpenAI และกฎหมายและข้อบังคับอื่น ๆ ที่เกี่ยวข้อง}

_{ซอฟต์แวร์นี้ได้รับใบอนุญาตภายใต้ใบอนุญาตสาธารณะ GNU Lesser General Public (LGPL) ซึ่งช่วยให้การใช้งานส่วนตัวและเชิงพาณิชย์การดัดแปลงและการกระจายอยู่ภายใต้ข้อกำหนดและเงื่อนไขที่กำหนดไว้ใน LGPL คุณควรได้รับสำเนาใบอนุญาตสาธารณะ GNU Lesser ทั่วไปพร้อมกับโปรแกรมนี้ ถ้าไม่ดู http://www.gnu.org/licenses/}

_{ผู้เขียนไม่เรียกร้องความเป็นเจ้าของเนื้อหาใด ๆ ที่สร้างขึ้นโดยใช้ซอฟต์แวร์นี้ ความรับผิดชอบในการใช้เนื้อหาใด ๆ ที่สร้างขึ้นกับผู้ใช้ ผู้ใช้ควรใช้ความระมัดระวังและตรวจสอบสถานะเพื่อให้แน่ใจว่าเนื้อหาที่สร้างขึ้นไม่ได้ละเมิดสิทธิ์ของบุคคลที่สาม}

_{ข้อจำกัดความรับผิดชอบนี้อาจมีการเปลี่ยนแปลงโดยไม่ต้องแจ้งให้ทราบล่วงหน้า เป็นความรับผิดชอบของคุณในการตรวจสอบการอัปเดตเป็นระยะ}

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 0.8.0
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-03-01
ขนาด 40.67KB
มาจาก Github

แอปที่เกี่ยวข้อง

Google Dorks

2025-03-10
shepherd

2025-06-04
hidusbf

2025-02-14
mongo express

2025-06-04
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

ซอร์สโค้ดอื่น ๆ

1.0.0
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

ซอร์สโค้ดอื่น ๆ

1.0.0

ข้อมูลที่เกี่ยวข้อง ทั้งหมด