โครงการนี้มีแอปพลิเคชัน TTS ไอซ์แลนด์สำหรับบริการ Android TTS สถานะปัจจุบันของโครงการ พร้อมการผลิต
แอพนี้มีอยู่ใน Google Play Store
Símarómurให้การเข้าถึงเสียงเครือข่ายประสาทที่รวมตัวกันผ่านสินทรัพย์
ปัจจุบันมีเสียงผู้ชายหนึ่งเสียงชื่อ Steinn เสียงนี้ไม่เพียง แต่เข้าใจได้สูงเท่านั้น แต่ยังมีน้ำเสียงที่น่ารื่นรมย์และน่าดึงดูดทำให้เป็นตัวเลือกอเนกประสงค์อเนกประสงค์ที่กำหนดมาตรฐานสำหรับเทคโนโลยีการใช้งานแบบ text-to-speech (TTS) ของไอซ์แลนด์ มันเหมาะอย่างยิ่งสำหรับการอ่านทั้งข้อความสั้นและยาวซึ่งมอบประสบการณ์การฟังที่สอดคล้องกัน
ขณะนี้เรากำลังพัฒนาโมเดลหลายลำโพงที่จะรวมถึงเสียงหญิงที่กำหนดไว้สำหรับการเปิดตัวในอนาคต
ผู้ใช้สามารถเพิ่มรายการการทำให้เป็นมาตรฐานเพื่อรองรับการออกเสียงทางเลือกของคำหรือโทเค็น การออกเสียงทางเลือกเหล่านี้มีความสำคัญเหนือกว่ากฎการทำให้เป็นมาตรฐานในตัวโดยใช้การแทนที่ที่ระบุสำหรับคำใด ๆ ที่พบในข้อความที่อ่าน
เพื่อให้การใช้งานง่ายขึ้นการเปลี่ยนสามารถทำได้ในระดับกราฟโดยไม่จำเป็นต้องเข้าใจหรือใช้ไวยากรณ์นิพจน์ทั่วไป ผู้ใช้สามารถได้ยินได้ทันทีว่าคำที่ป้อนและเสียงแทนที่ด้วยเสียงปัจจุบันโดยใช้ปุ่มเล่นได้อย่างไร
โดยค่าเริ่มต้นพจนานุกรมการทำให้เป็นมาตรฐานของผู้ใช้จะเริ่มว่างเปล่า ในปัจจุบันไม่รองรับการนำเข้าหรือส่งออกพจนานุกรม
การทำให้เป็นมาตรฐานข้อความไอซ์แลนด์จะดำเนินการก่อนที่ข้อความจะเข้าสู่ G2P Local Voice G2P เป็นไปตามกฎและใช้งานโดยใช้ C ++ Frameworks Thrax & OpenFST ซึ่งเข้าถึงได้ผ่าน JNI
เปล่งเสียง Flite ที่เลิกใช้งานและเสียงเครือข่ายประสาทในอดีต ทุกวันนี้เสียงฟไลท์ล้าสมัยและเราใช้เสียงเครือข่ายประสาทอย่างหมดจดแทน โครงการ Flite นั้นแทบจะไม่ได้รับการบำรุงรักษาและประสิทธิภาพการทำงานของ Neural Network Voices กำลังปิดเสียง Flite อย่างรวดเร็ว เราสามารถบรรลุความเร็วเรียลไทม์ 25x ด้วยรุ่นเครือข่ายประสาทบนโทรศัพท์ Pixel 6
โมเดลเครือข่ายประสาทจะขึ้นอยู่กับ VITS และได้รับการฝึกฝนผ่าน Piper TTS
โครงการนี้ใช้ OpenFST & Thrax เวอร์ชันของเราพร้อมการแก้ไขที่เหมาะสมเพื่อสร้างสำหรับ Android ภายในสาขา android โปรดสร้างและติดตั้งสิ่งเหล่านี้ก่อนก่อนที่จะรวบรวมSímarómur
สำหรับงาน CI ของเราเราได้สร้างห้องสมุดที่พึ่งพาทั้งหมดไว้แล้วและเผยแพร่เป็นสินทรัพย์รุ่น GitHub ที่เว็บไซต์โครงการที่เกี่ยวข้อง คุณสามารถใช้ประโยชน์จากสิ่งเหล่านี้และติดตั้งในเครื่องภายในไดเรกทอรีโครงการของคุณผ่านขั้นตอนต่อไปนี้:
ตั้งค่าตัวแปรสภาพแวดล้อมสำหรับรุ่นที่ใช้แล้วเช่น:
export OPENFST_TAG=1.8.1-android
export THRAX_TAG=1.3.6-androidจากนั้นเรียกใช้สคริปต์นี้:
.github/scripts/dl_3rdparty.sh สิ่งนี้ควรดาวน์โหลดและแยกไบนารีที่จำเป็นทั้งหมดไปยังไดเรกทอรีย่อย 3rdparty/ndk
ดึงไดเรกทอรีย่อยสินทรัพย์เสียงผ่าน
git submodule update --init จากนั้นสร้างไฟล์ local.properties หากไม่มีอยู่แล้วและเพิ่มตัวแปร 3rdparty.dir สำหรับไลบรารี OpenFST/Thrax ที่ติดตั้งเช่น
3rdparty.dir=/Users/fred/install-android
หรือในกรณีที่คุณดาวน์โหลดการเผยแพร่ของเราผ่าน dl_3rdparty.sh ให้ชี้ตัวแปรเหล่านี้ลงในไดเรกทอรีโครงการของคุณ simaromur/3rdparty/ndk , เช่น:
3rdparty.dir=/Users/fred/projects/simaromur/3rdparty/ndk
มันอาจจำเป็นต้องปรับ/ยกเลิกการเขียนตัวแปร ndkVersion ภายในแอพ/build.gradle ขึ้นอยู่กับรุ่น NDK ที่ติดตั้งของคุณ จากนั้นสร้างโครงการภายใน Android Studio
คุณสามารถมีส่วนร่วมในโครงการนี้ได้โดยการสร้างสาขาและเปิดคำขอดึงใหม่
รหัสทั้งหมดเป็นลิขสิทธิ์© 2021-2024 Grammatek EHF รหัสนี้ได้รับอนุญาตภายใต้ใบอนุญาต Apache
เราใช้ห้องสมุด 3rdparty Sonic สำหรับความเร็วเสียงและการจัดการระดับเสียง Sonic Is Copyright 2010, 2011 โดย Bill Cox และได้รับใบอนุญาตภายใต้ใบอนุญาต Apache Símarómurใช้ THRAX และ OpenFST รุ่นดัดแปลงสำหรับ G2P สิ่งเหล่านี้ยังได้รับใบอนุญาตภายใต้ใบอนุญาต Apache นอกจากนี้เรายังใช้ OpenNLP สำหรับ Tokenization และการแยกประโยค OpenNLP ได้รับใบอนุญาตภายใต้ใบอนุญาต Apache
ส่วนใหญ่ของซอฟต์แวร์นี้ได้รับการพัฒนาภายใต้การอุปถัมภ์ของโปรแกรมเทคโนโลยีภาษา 5 ปีของรัฐบาลไอซ์แลนด์ที่อธิบายไว้ที่นี่และที่นี่ (ภาษาอังกฤษ)