เครื่องยนต์พรอมต์ชั่วคราว: ท้องถิ่นโอเพนซอร์ซ, ใช้งานง่าย, เครื่องยนต์พรอมต์ภาพยนตร์ + วิดีโอและการสร้างเสียงสำหรับ Nvidia GPUs
## ตอนนี้มีสคริปต์ Hunyuanvideo 12B ที่กำหนดเองพร้อม MMAUDIO ที่จัดตั้งขึ้นสำหรับการ์ด 80GB
## การอัปเดตจำนวนมากตามคำแนะนำด้านล่างเร็ว ๆ นี้ (12/11/2024)
ฉันกำลังมองหาผู้ช่วยอาสาสมัครหากคุณสนใจเข้าถึงได้ที่ [email protected] - นี่จะเป็นเวอร์ชัน WebApp เร็ว ๆ นี้
สารบัญ
- การแนะนำ
- ภาพรวมคุณสมบัติ
- การติดตั้ง
- คู่มือเริ่มต้นด่วน
- การตั้งค่าคีย์ API
- โหมดเนื้อเรื่อง: ปลดปล่อยเรื่องเล่ามหากาพย์
- กรณีการใช้งานที่สร้างแรงบันดาลใจ
- การควบคุมพลังของ comfyui
- การสร้างวิดีโอในท้องถิ่นโดยใช้ Cogideo
- เข้าร่วมการเดินทาง Temporal Labs
- การบริจาคและการสนับสนุน
- ให้บริการเพิ่มเติม
- การระบุแหล่งที่มาและความอนุเคราะห์
- ติดต่อ
- กิตติกรรมประกาศ
การแนะนำ
ยินดีต้อนรับสู่ เครื่องมือพรอมต์ชั่วคราว ซึ่งเป็นกรอบการทำงานที่ครอบคลุมสำหรับการสร้างการเปลี่ยนแปลงแบบแบตช์หรือลำดับเรื่องราวสำหรับเครื่องกำเนิดไฟฟ้าพร้อมวิดีโอ ความคิดนี้เริ่มต้นขึ้นเป็นเวิร์กโฟลว์ comfyui สำหรับ Cogvideox แต่ได้พัฒนาเป็นเฟรมเวิร์กแบบแยกส่วนที่พิสูจน์แล้วว่าได้ปรับขนาดด้วยโมเดลพื้นฐานและท่อใหม่
ภาพรวมคุณสมบัติ
- วิดีโอภาพยนตร์พรอมต์ : ปรับแต่งทุกแง่มุมของฉากของคุณ - จากประเภทกล้องและเลนส์ไปจนถึงแสงและการวางกรอบ
- การรับรู้ชั่วคราว : เลือกทศวรรษและตัวเลือกกล้องจะเป็นตัวแทนของเวลานั้นเพิ่มความลึกและบริบทให้กับฉากของคุณ
- ตัวแปรแบบไดนามิก : ปรับการตั้งค่าเช่นแสงการเคลื่อนไหวของกล้องแสงเวลาของวันและอื่น ๆ ผ่านตัวเลือกแบบดรอปดาวน์ที่ใช้งานง่าย
- โหมดพิเศษ :
- โหมดเนื้อเรื่อง : การผสมผสานอย่างลงตัวพร้อมกันในเฟรมเพื่อสร้างเรื่องเล่าที่เหนียวแน่นช่วยให้คุณสามารถสร้างเรื่องราวที่ยิ่งใหญ่หรือนิทานที่ใกล้ชิด
- โหมดวันหยุด : สร้างเนื้อหาตามฤดูกาลที่เหมาะกับวันหยุดเหมาะสำหรับการสร้างแบรนด์และการตลาดเทศกาล
- โหมดความโกลาหล : เพิ่มความไม่แน่นอนด้วยโหมดความโกลาหล
- การตั้งค่าที่เชื่อมต่อระหว่างกัน : สัมผัสกับวิธีการเลือกเช่นการเลือกสไตล์ศิลปะโบราณมีอิทธิพลต่อตัวแปรอื่น ๆ เช่นจานสีและพื้นผิวการสร้างเอาต์พุตที่เหนียวแน่นและเป็นของแท้
- ความเข้ากันได้ข้ามแพลตฟอร์ม : พร้อมใช้งานสำหรับ Windows & Linux
การติดตั้ง
การตั้งค่าเครื่องมือพรอมต์ชั่วคราวนั้นง่ายและไม่ยุ่งยากทำให้คุณสามารถมุ่งเน้นไปที่การสร้างได้มากกว่าการกำหนดค่า ส่วนนี้มีขั้นตอนการติดตั้งสำหรับผู้ใช้ Windows
การเตรียมระบบ
คู่มือการตั้งค่า YouTube ตอนที่ 1:
- ระบบปฏิบัติการ : Windows 10 หรือใหม่กว่า
- Python : เวอร์ชัน 3.10.9
- ดาวน์โหลด Python Installer :
- เยี่ยมชมหน้าดาวน์โหลด Python
- ดาวน์โหลดตัวติดตั้ง Python 3.10.9 สำหรับ Windows
- ติดตั้ง Python :
- เรียกใช้ตัวติดตั้ง :
- คลิกสองครั้งที่ไฟล์ติดตั้ง EXE ที่ดาวน์โหลดมา
- สำคัญ :
- หากคุณติดตั้ง Python แล้ว :
- ระมัดระวังเมื่อเพิ่ม Python ลงในเส้นทางเนื่องจากอาจเขียนทับรุ่น Python ที่มีอยู่ของคุณในเส้นทางระบบ
- เพื่อหลีกเลี่ยงความขัดแย้งคุณสามารถติดตั้ง Python 3.10.9 โดยไม่ต้องเพิ่มลงในเส้นทาง ให้ใช้ Launcher Python สำหรับ Windows (
py ) เพื่อระบุเวอร์ชันเมื่อเรียกใช้คำสั่ง
- หากคุณไม่ได้ติดตั้ง Python :
- ทำเครื่องหมายที่กล่อง "เพิ่ม Python ไปยัง Path" ที่ด้านล่างของหน้าต่างติดตั้ง
- คลิก "ติดตั้งทันที"
- ตรวจสอบการติดตั้ง :
- เปิดพรอมต์คำสั่งใหม่
- วิ่ง:
- คุณควรเห็น
Python 3.10.9
## หากคุณต้องการให้ความสามารถในการสร้างวิดีโอทำงานได้คุณจะต้องติดตั้ง Python 3.12.4 ในท้องถิ่นเช่นกัน หากอยู่ในสถานที่การตั้งค่า py จะจัดการทุกอย่าง ## หากคุณต้องการใช้เครื่องยนต์พรอมต์เอ็นจิ้นและเอฟเฟกต์เสียงเท่านั้นคุณจะสบายดีด้วยเพียง 3.10.9 แม้ว่าการตั้งค่า Py จะบ่นเล็กน้อย
ระบบปฏิบัติการ : Windows 10 หรือใหม่กว่า
Python : เวอร์ชัน 3.12.4
- ดาวน์โหลด Python Installer :
- เยี่ยมชมหน้าดาวน์โหลด Python
- ดาวน์โหลดตัวติดตั้ง Python 3.12.4 สำหรับ Windows
- ติดตั้ง Python :
- เรียกใช้ตัวติดตั้ง :
- คลิกสองครั้งที่ไฟล์ติดตั้ง EXE ที่ดาวน์โหลดมา
- สำคัญ :
- หากคุณติดตั้ง Python แล้ว :
- ระมัดระวังเมื่อเพิ่ม Python ลงในเส้นทางเนื่องจากอาจเขียนทับรุ่น Python ที่มีอยู่ของคุณในเส้นทางระบบ
- เพื่อหลีกเลี่ยงความขัดแย้งคุณสามารถติดตั้ง Python 3.10.9 โดยไม่ต้องเพิ่มลงในเส้นทาง ให้ใช้ Launcher Python สำหรับ Windows (
py ) เพื่อระบุเวอร์ชันเมื่อเรียกใช้คำสั่ง
- หากคุณไม่ได้ติดตั้ง Python :
- ทำเครื่องหมายที่กล่อง "เพิ่ม Python ไปยัง Path" ที่ด้านล่างของหน้าต่างติดตั้ง
- คลิก "ติดตั้งทันที"
- ตรวจสอบการติดตั้ง :
- เปิดพรอมต์คำสั่งใหม่
- วิ่ง:
- คุณควรเห็น
Python 3.12.4 - ระบบปฏิบัติการ : Windows 10 หรือใหม่กว่า
- PY -3.12 ถูกใช้โดยสภาพแวดล้อมการสร้างวิดีโอที่สำคัญกระบวนการแบ็คเอนด์
Git : ติดตั้งและกำหนดค่า
- ติดตั้ง Git :
- ดาวน์โหลด git จาก git สำหรับ windows
- เรียกใช้ตัวติดตั้งด้วยการตั้งค่าเริ่มต้น
- ตรวจสอบการติดตั้ง :
- เปิดพรอมต์คำสั่งใหม่
- วิ่ง:
- คุณควรเห็นเวอร์ชัน Git ที่ติดตั้ง
NVIDIA GPU : NVIDIA GPU ที่เปิดใช้งาน CUDA เพื่อประสิทธิภาพที่ดีที่สุด
- ตรวจสอบให้แน่ใจว่าคุณมี Nvidia GPU พร้อมไดรเวอร์ล่าสุด
CUDA Toolkit : เวอร์ชัน 11.8 เข้ากันได้กับ GPU ของคุณและติดตั้ง
- ติดตั้ง CUDA Toolkit :
- ดาวน์โหลด CUDA Toolkit จาก CUDA Toolkit ดาวน์โหลด
- เรียกใช้ตัวติดตั้งและทำตามคำแนะนำบนหน้าจอ
- ตรวจสอบการติดตั้ง :
- เปิดพรอมต์คำสั่งใหม่แล้วเรียกใช้:
- คุณควรดูข้อมูลเวอร์ชันเครื่องมือรวบรวม CUDA
FFMPEG : ติดตั้งและเพิ่มลงใน PATH ระบบ
- ขั้นตอนที่ 1: คลิกที่นี่เพื่อดาวน์โหลดไฟล์ zip ของเวอร์ชันล่าสุด
- ขั้นตอนที่ 2: คลายซิปไฟล์นี้โดยใช้ไฟล์เก็บถาวรไฟล์ใด ๆ เช่น WinRAR หรือ 7Z
- ขั้นตอนที่ 3: เปลี่ยนชื่อโฟลเดอร์สกัดเป็น FFMPEG และย้ายไปยังรูทของไดรฟ์ C:
-
setx /m PATH "C:ffmpegbin;%PATH%" - ตรวจสอบการติดตั้ง :
- เปิดพรอมต์คำสั่งใหม่แล้วเรียกใช้:
- คุณควรดูข้อมูลเวอร์ชัน FFMPEG
Ollama : ดาวน์โหลดจากการตั้งค่า Ollama และทำตามคำแนะนำบนหน้าจอเพื่อติดตั้ง
## [คู่มือวิดีโอการตั้งค่าส่วนที่ 2) [https://youtu.be/_8txlnwa9ak?si=eo73edqxafblqa_o]
คุณพร้อมที่จะเริ่มกระบวนการตั้งค่าอัตโนมัติ:
โคลน repo
git clone https://github.com/TemporalLabsLLC-SOL/TemporalPromptEngine.git
ดาวน์โหลดที่เก็บด้วยตนเอง :
- เยี่ยมชมพื้นที่เก็บข้อมูล GitHub TemporalPromptGenerator
- คลิกที่ปุ่ม "รหัส" และเลือก "ดาวน์โหลด Zip"
- แยกไฟล์ ZIP ที่ดาวน์โหลดไปยังตำแหน่งที่คุณต้องการ (เช่น
C:TemporalPromptEngine )
ปิดท้ายง่ายๆ
เปิดคลังเก็บ (หรือ repo โคลน) และคลิก RUN-FIRST-PRE-FLIGHT-CHECK.bat
- ทำตามพรอมต์บนหน้าจอ สคริปต์จะตั้งค่าสภาพแวดล้อม Python โดยอัตโนมัติติดตั้งแพ็คเกจที่จำเป็นและกำหนดค่าการตั้งค่า
แอปพลิเคชันจะเปิดตัวนำทางคุณผ่านการตั้งค่าเริ่มต้น ในระหว่างการตั้งค่านี้หลังจากที่คุณปิดแอพหรือปฏิเสธที่จะเปิดการเปิดระหว่างการตั้งค่าคุณจะมีตัวเลือกในการเพิ่มทางลัดทางลัดไปยังเดสก์ท็อปของคุณ ปัจจุบันไม่มีไอคอน ที่จะโหลด Env และสคริปต์อย่างน่าเชื่อถือในอนาคต
หรือ
เรียกใช้สคริปต์การตั้งค่าด้วยตนเอง :
- Open Command Prompt และนำทางไปยังไดเรกทอรี
TemporalPromptEngine ที่แยกออกมา: cd C: T emporalPromptEngine-main
- นำทางไปยังโฟลเดอร์
WINDOWS : - เรียกใช้สคริปต์การตั้งค่า:
## คู่มือเริ่มต้นด่วน
หากคุณเพิ่มทางลัดเป็นเดสก์ท็อประหว่างการตั้งค่า
Click the Temporal Prompt Engine Shortcut on your Windows Desktop
หากคุณไม่ได้เพิ่มทางลัดลงในเดสก์ท็อประหว่างการตั้งค่า
เปิดใช้งานสภาพแวดล้อมเสมือนจริง :
cd C: T emporalPromptEngine-main
TemporalPromptEngineEnv S cripts a ctivate
เปิดแอปพลิเคชัน :
python TemporalPromptEngine.py
ป้อนคีย์ API ในแอปพลิเคชัน :
- วางคีย์ API HuggingFace ของคุณเมื่อได้รับแจ้งระหว่างการตั้งค่าของเครื่องยนต์พรอมต์ชั่วคราว
- คุณจะต้องป้อนครั้งเดียวภายในสภาพแวดล้อมการตั้งค่าเอ็นจิ้น คุณสามารถปิดป๊อปอัพนี้ได้ในการใช้งานครั้งต่อไป
ป้อนแนวคิดฉากของคุณ :
ป้อนความคิดสร้างสรรค์หรือคำอธิบายฉากของคุณ (สูงสุด 400 อักขระ)
ตัวอย่าง :
"มองโลกผ่านสายตาของนักดาราศาสตร์โบราณทำแผนที่ดวงดาวด้วยเครื่องมือพื้นฐานภายใต้ท้องฟ้ายามค่ำคืนอันกว้างใหญ่ที่ไม่มีมลทิน"
- ภาพ crypto-animal :
"วิดีโอสไตล์สารคดีที่จับภาพ 'cryptolion ที่เข้าใจยาก' สิ่งมีชีวิตในตำนานที่รวบรวมรูปแบบดิจิตอลและขนที่เรืองแสง"
กำหนดค่าตัวเลือกวิดีโอและเสียง : ปรับแต่งวิดีโอและเสียงของคุณโดยใช้ดรอปดาวน์และฟิลด์อินพุต
สร้างวิดีโอและเสียง :
บันทึกและส่งออก : สื่อและพรอมต์ทั้งหมดจะถูกบันทึกไว้ในไดเรกทอรีผลลัพธ์ที่คุณกำหนด
โหมดเนื้อเรื่อง: ปลดปล่อยเรื่องเล่ามหากาพย์
โหมดเนื้อเรื่อง จัดทำโครงร่างเรื่องราวอย่างแน่นหนาจากนั้นจะเปลี่ยนแต่ละจังหวะภายในลำดับนั้นเป็นวิดีโอที่เต็มเปี่ยมและได้รับการปรับให้เหมาะสมพร้อมที่จะทำให้การประมวลผลแบทช์ไร้รอยต่อของกลุ่มเนื้อหาที่ยาวขึ้น นี่ไม่ใช่แค่การขว้างคำสำคัญลงในพรอมต์ มีตรรกะส่วนหลังหลายชั้นที่มุ่งเน้นไปที่การฝึกฝนภาพยนตร์ทฤษฎีและประวัติศาสตร์
เข้าร่วมการเดินทาง Temporal Labs
สนับสนุนภารกิจในการผลักดันขอบเขตของ AI และเทคโนโลยี เข้าร่วมเป็นนักลงทุนนักพัฒนาหรือลูกค้า
ให้บริการเพิ่มเติม
- มี การสอน การพัฒนาการ ออกแบบการ ให้คำปรึกษา และ การประชุมเชิงปฏิบัติการ เพื่อตอบสนองความต้องการ AI และเทคโนโลยีของคุณ
ติดต่อ
สำหรับคำถามการสนับสนุนโอกาสการทำงานร่วมกันหรือเพื่อหารือเกี่ยวกับวิธีการทำงานร่วมกัน:
กิตติกรรมประกาศ
ต้องขอบคุณนักพัฒนาและชุมชนที่อยู่เบื้องหลัง Git , Python , FFMPEG , Hunyuanvideo , Mmaudio , Ollama , AudioldM2 , Cogvideo , Comfyui และ HuggingFace สำหรับการทำให้โครงการนี้เป็นไปได้