
VoxNovel هو برنامج مبتكر يستفيد من إمكانيات BookNLP لتحليل الأدب ، ويسمة الاقتباسات إلى شخصيات محددة ، وإنشاء كتاب صوتي مصمم حيث يكون لكل حرف صوتًا متميزًا من خلال Coqui TTS. لا يوفر هذا تجربة كتاب مسموع غامرة فحسب ، بل يوفر أيضًا كل شخصية في الحياة بصوت فريد من نوعه ، مما يجعل تجربة الاستماع أكثر جاذبية.
جميع طرز Coqui TTS- (Tacotron ، Tacotron2 ، Glow-TTS ، الكلام السريع ، المحاذاة tts ، fastpitch ، fastspeech ، fastspeech2 ، sc-glowtts ، capacitron ، verflow ، hmm hmm tts ، tts ، ⓧtts ، vits ، yourtts ،؟

(بالإضافة إلى مجلد من ملفات Chatper الفردية MP4 مع صورة الكتاب الاليكتروني المضمنة فيها إذا كنت تريد ذلك)
عروض XTTS V2 عالية الجودة
عروض سلحفاة عالية الجودة
عروض صوتية فائقة الصوتية
** اختبار عالي الجودة مع نماذج دقيقة ضبطها **
يمكنك ضبط طرز XTTS الخاصة بك مع حوالي 6+ دقائق من الصوت مجانًا مع هذا كولاب https://colab.research.google.com/drive/1gii4_x724m8q2w-zz-jxo7cwtv7rfah-
تحرير: هذا الكولاب لا يعمل بعد الآن: استخدم الإصدار الذي يوفر إصلاحًا: https://colab.research.google.com/drive/1sqqzupo2pdjgggkrbm60su6sbfyo3su؟usp=sharing
استكشف وتشغيل النسخة التفاعلية لمشروع Voxnovel Headless مباشرة على Google Colab! ابدأ هنا.


هذا واجهة المستخدم الرسومية مخصصة للتصحيح اليدوي لمهام السماعة إذا تم تعيين عروض الأسعار بشكل غير صحيح بواسطة BookNLP. يقرأ ملف book.csv الذي يحتوي على الكتب المستخرجة من الاقتباسات ومعلومات السماعات ، ويسمح لك بالتفتيش بصريًا وتعديل مهام السماعة حسب الحاجة قبل نقلها إلى خطوة TTS التالية.


استكشف وتشغيل النسخة التفاعلية لمشروع Voxnovel Headless مباشرة على Google Colab! ابدأ هنا.
cd ~
git clone https://github.com/DrewThomasson/VoxNovel.git
sudo docker run -v "$HOME/VoxNovel:/VoxNovel/" -it athomasson2/voxnovel:headless_m1_v2
cd ~
git clone https://github.com/DrewThomasson/VoxNovel.git
sudo docker run -v "$HOME/VoxNovel:/VoxNovel/" -it athomasson2/voxnovel:latest_headless
cd ~
git clone https://github.com/DrewThomasson/VoxNovel.git
sudo docker run --gpus all -v "$HOME/VoxNovel:/VoxNovel/" -it athomasson2/voxnovel:latest_headless
اتبع هذه الخطوات لإعداد مشروع VoxNovel على نظام Windows باستخدام PowerShell:
انتقل إلى دليل ملف تعريف المستخدم الخاص بك:
cd $ env: USERPROFILEاستنساخ مستودع Voxnovel من Github:
git clone https: // github.com / DrewThomasson / VoxNovel.gitلتشغيل تطبيق voxnovel في حاوية Docker على وحدة المعالجة المركزية الخاصة بك:
docker run - v " ${ env: USERPROFILE} /VoxNovel/:/VoxNovel/ " - it athomasson2 / voxnovel:latest_headlessإذا كان لديك وحدة معالجة الرسومات NVIDIA وتريد تسريع المعالجة ، فاستخدم الأمر التالي:
docker run -- gpus all - v " ${ env: USERPROFILE} /VoxNovel/:/VoxNovel/ " - it athomasson2 / voxnovel:latest_headlessgit clone https://github.com/DrewThomasson/VoxNovel.gitsudo docker run --gpus all -e DISPLAY=$DISPLAY -v /tmp/.X11-unix:/tmp/.X11-unix -v /dev/snd:/dev/snd --device /dev/snd -v "$HOME/VoxNovel:/VoxNovel/" -it athomasson2/voxnovel:latestيوفر هذا الدليل إرشادات حول كيفية تشغيل حاوية Docker مع واجهة مستخدم رسومية على MacOS باستخدام Xquartz لإعادة توجيه X11 وتثبيت الصوت.
XQuartz -> Preferences .Security ، تمكين السماح بالاتصالات من عملاء الشبكة .افتح محطة وقم بتشغيل الأمر التالي للسماح بالاتصالات من الجهاز المحلي إلى Xquartz:
xhost + $(ifconfig en0 | grep inet | awk '$1=="inet" {print $2}')
قم بتشغيل الأمر التالي لبدء حاوية Docker الخاصة بك. يقوم هذا الأمر بتكوين واجهة المستخدم الرسومية لعرضه على مضيفك ويصعد الدلائل اللازمة:
cd ~
git clone https://github.com/DrewThomasson/VoxNovel.git
docker run -e DISPLAY=$(ifconfig en0 | grep inet | awk '$1=="inet" {print $2}'):0
-v /tmp/.X11-unix:/tmp/.X11-unix
-v "/Users/$(whoami)/VoxNovel:/VoxNovel"
athomasson2/voxnovel:latest
/Users/$(whoami)/VoxNovel على جهاز Mac. إذا لم يكن الأمر كذلك ، فقم بإنشائه أو اضبط مسار حامل الصوت في أمر Docker حسب الحاجة.تثبيت VCXSRV:
choco install vcxsrvبعد تثبيت VCXSRV ، يتم تشغيله عادةً. يمكنك تأكيد تشغيله عن طريق التحقق من رمزها في علبة النظام ، وعادة ما يقع بالقرب من الساعة في شريط المهام. قد يبدأ أيضًا تلقائيًا عند تسجيل الدخول إلى نظامك.
للتأكد من تكوينه للسماح بالاتصالات من حاويات Docker ، اتبع هذه الخطوات:
باستخدام هذه الإعدادات ، يجب تشغيل VCXSRV وتكوينه للسماح بالاتصالات من حاويات Docker. يمكنك الآن المضي قدمًا في تشغيل أوامر Docker التي تتطلب دعم واجهة المستخدم الرسومية.
تغيير إلى دليل منزلك:
cd $HOMEاستنساخ المستودع:
git clone https://github.com/DrewThomasson/VoxNovel.gitقم بتشغيل حاوية Docker:
docker run -e DISPLAY=host.docker.internal:0 -v " /Users/ $( whoami ) /VoxNovel:/VoxNovel/ " -it athomasson2/voxnovel:latest(لا تستخدم إذا كان لديك بالفعل Miniconda مثبتة.)
لتثبيت voxnovel على Ubuntu ، يمكنك استخدام الأمر الفردي التالي:
yes | wget -O - https://raw.githubusercontent.com/DrewThomasson/VoxNovel/main/shell_install_scripts/Ubuntu-install.sh | bash-يجب أيضًا إنشاء البرنامج النصي التثبيت المفرد أعلاه أيضًا اختصارًا للتطبيق أيضًا.
أو يمكنك تشغيل التطبيق يدويًا في المحطة مع الأمر التالي:
cd ~ /VoxNovel && conda activate VoxNovel && python gui_run.pysudo apt-get install calibresudo apt-get install ffmpegconda create --name VoxNovel python=3.10conda activate VoxNovelgit clone https://github.com/DrewThomasson/VoxNovel.gitcd VoxNovelpip install bs4pip install styletts2pip install tts==0.21.3pip install booknlp==1.0.7.1pip install -r Ubuntu_requirements.txtpython -m spacy download en_core_web_smقم بتثبيت MECAB لـ (LANGLAGES NON LATIN LAGHS SUBER) (اختياري):
sudo apt-get install -y mecab libmecab-dev mecab-ipadic-utf8 (للغات غير اللاتينية TTS دعم) (اختياري)
python -m unidic download
pip install mecab mecab-python3 unidicbash <( curl -s https://raw.githubusercontent.com/DrewThomasson/VoxNovel/main/shell_install_scripts/Steam-Deck_VoxNovel-Install.sh )قم بتنزيل Intel Voxnovel Installer
bash <( curl -s https://raw.githubusercontent.com/DrewThomasson/VoxNovel/main/shell_install_scripts/Intel_Mac_Install_VoxNovel.sh )بمجرد اكتماله ، يجب أن يكون لديك اختصار لسطح المكتب لـ Voxnovel.
لإلغاء التثبيت ، قم بتشغيل الأمر التالي في المحطة الخاصة بك:
bash <( curl -s https://raw.githubusercontent.com/DrewThomasson/VoxNovel/main/shell_install_scripts/uninstall_VoxNovel_Mac.sh )brew install calibrebrew install ffmpegconda create --name VoxNovel python=3.10conda activate VoxNovelgit clone https://github.com/DrewThomasson/VoxNovel.gitcd VoxNovelpip install styletts2pip install tts==0.21.3pip install booknlp==1.0.7.1 9. pip install -r MAC-requirements.txtpip install spacy 11. python -m spacy download en_core_web_smقم بتثبيت MECAB لـ (LANGLAGES NON LATIN LAGHS SUBER) (اختياري):
brew install mecab ، brew install mecab-ipadic (للغات غير اللاتينية TTS دعم) (اختياري)
python -m unidic download
pip install mecab mecab-python3 unidicقم بتنزيل مثبت Apple Silicon Voxnovel
bash <( curl -s https://raw.githubusercontent.com/DrewThomasson/VoxNovel/main/shell_install_scripts/Apple_silicone_VoxNovel_install.sh )بمجرد اكتماله ، يجب أن يكون لديك اختصار لسطح المكتب لـ Voxnovel.
لإلغاء التثبيت ، قم بتشغيل الأمر التالي في المحطة الخاصة بك:
bash <( curl -s https://raw.githubusercontent.com/DrewThomasson/VoxNovel/main/shell_install_scripts/uninstall_VoxNovel_Mac.sh )تشغيل بهذا الترتيب:
brew install calibre (قد تضطر أيضًا إلى تثبيته يدويًا من موقعهم إذا لم ينجح هذا)brew install ffmpegconda create --name VoxNovel python=3.10conda activate VoxNovelgit clone https://github.com/DrewThomasson/VoxNovel.gitcd VoxNovelpip install tensorflow-macos (أيضًا اختياري pip install tensorflow-metal ولكن حتى الآن لم أحصل على تسريع GPU بعدpip install styletts2pip install tts==0.21.3pip install --no-dependencies booknlp==1.0.7.1pip install transformers==4.30.0pip install tensorflowpip install -r MAC-requirements.txtpip install ebooklib bs4 epub2txt pygame moviepy spacypython -m spacy download en_core_web_smقم بتثبيت MECAB لـ (LANGLAGES NON LATIN LAGHS SUBER) (اختياري):
brew install mecab ، brew install mecab-ipadic (للغات غير اللاتينية TTS دعم) (اختياري)python -m unidic downloadpip install mecab mecab-python3 unidicفي PowerShell الخاص بك ، لصق:
wsl --installلتثبيت WSL. (قد يطلب منك نظامك تمكين المحاكاة الافتراضية في BIOS إذا كان متاحًا ، حيث أنه مطلوب لتشغيل WSL على Windows.)
بعد تعيين اسم المستخدم وكلمة المرور الخاصة بك ، افتح WSL واضغط هذا الأمر لتثبيت أمر واحد:
yes | wget -O - https://raw.githubusercontent.com/DrewThomasson/VoxNovel/main/shell_install_scripts/Ubuntu-install.sh | bash(اختياري فقط لبطاقات رسومات NVIDA لا تقم بتشغيل هذا الأمر إذا لم يكن لديك بطاقة رسومات NVIDIA) قم بتثبيت مجموعة أدوات NVIDIA CUDA (مطلوبة لتسريع GPU NVIDIA):
sudo apt install nvidia-cuda-toolkitتأكد من وجودك في بيئة Voxnovel Conda: (إذا لم يتم العثور على "conda: command" ، أي لا يُنظر إلى كوندا كأمر ثم حاول الإغلاق من نافذة PowerShell الحالية وإعادة تشغيل WSL Env مع [WSL -D Ubuntu]
conda activate VoxNovelانتقل إلى مجلد Voxnovel (إن لم يكن هناك بالفعل):
cd ~ && cd VoxNovelالآن فقط قم بتشغيل أحد البرنامجين الموضحة أدناه
python gui_run.pypython headless_voxnovel.pyيمكنك الوصول إلى ملفات WSL Ubuntu مباشرة في مستكشف ملفات Windows عن طريق إدخال المسار التالي في شريط العناوين:
\wsl.localhostUbuntuhome
سيتم تحديد موقع ملفات المخرجات المسموعة تحت VoxNoveloutput_audiobooks في WSL ENV
قم بتشغيل هذا الأمر في PowerShell
Invoke-Expression (Invoke-WebRequest -Uri " https://raw.githubusercontent.com/DrewThomasson/VoxNovel/main/shell_install_scripts/Windows-install-scripts/create_desktop_shortcut.ps1 " ).Contentلإزالة كل شيء ، قم بتشغيل الأمر التالي في PowerShell:
wsl --unregister Ubuntuسيؤدي ذلك إلى إزالة بيئة Ubuntu حيث يتم تخزين التطبيق. ؟
إذا كنت تواجه مشكلة في بيئة WSL:
قائمة جميع بيئات WSL:
wsl --list --verboseقم بإزالة بيئة WSL محددة (على سبيل المثال ، Ubuntu):
wsl --unregister < distro_name >إعادة تثبيت WSL:
wsl --installلإطلاق WSL في أي وقت تحتاج إلى تشغيل هذا البرنامج ، يمكنك استخدام شريط البحث في Windows للعثور على "WSL" أو تشغيله:
wslقم بتثبيت MECAB لـ (LANGLAGES NON LATIN LAGHS SUBER) (اختياري):
sudo apt-get install -y mecab libmecab-dev mecab-ipadic-utf8 (للغات غير اللاتينية TTS دعم) (اختياري)
python -m unidic download
pip install mecab mecab-python3 unidicpython gui_run.pypython headless_voxnovel.pyلتشغيل البرامج النصية المقدمة على نظامك ، اتبع هذه الخطوات بالترتيب:
معالجة الكتب (وحدة المعالجة المركزية فقط):
python 1CPU_Book_processing.pyتوليد الصوت (GPU فقط):
1CPU_Book_processing.py .python 2GPU_Audio_generation.pyعند إجراء اختبار صغير مع ملف EPUB باستخدام الإعداد أعلاه ، لوحظت مقاييس الأداء التالية:
الاختبار على تم القيام به مع ملف mini epub الموجود في example_working_files.zip
| مهمة | إعدادات | الوقت (ثانية) |
|---|---|---|
| معالجة الكتب | GPU فقط (Geforce GTX 980) ، 4 جيجابايت VRAM ، ذاكرة الوصول العشوائي 32GB ، Intel I7-8700K | 2.922 |
| توليد الصوت | GPU فقط (Geforce GTX 980) ، 4 جيجابايت VRAM ، ذاكرة الوصول العشوائي 32GB ، Intel I7-8700K | 128.48 |
| معالجة الكتب | وحدة المعالجة المركزية فقط ، ذاكرة الوصول العشوائي 32 جيجابايت ، Intel i7-8700K | 4.964 |
| توليد الصوت | وحدة المعالجة المركزية فقط ، ذاكرة الوصول العشوائي 32 جيجابايت ، Intel i7-8700K | 391.4227 |
python auto_noGui_run.py
يمكنك الوصول
VoxNovel/output_audiobooks
.epub ، .pdf ، .mobi ، .txt ، .html ، .rtf ، .chm ، .lit ، .pdb ، .fb2 ، .odt ، .cbr ، .cbz ، .prc ، .pml ، .pml ، .snb ، .cbc ، .rb ، و .tcr ،
/final_combined_output_audio: هذا هو المكان الذي سيتم فيه وضع جميع ملفات صوتية الفصل الخاصة بك بترتيب الفصل
/output_audiobooks: هذا هو المكان الذي سيتم فيه تخزين جميع ملفات m4b audiobook
/works_files: يحمل جميع ملفات العمل المستخدمة من قبل البرنامج أثناء تشغيله.
/السلحفاة: يحمل جميع ملفات الصوت
-@sidharthrajaram (لتثبيت pip styletts2 الذي أنشأه ، لم أستطع الإضافة styletts2 بدونه. :)) (https://github.com/sidharthrajaram/styletts2)