persian tts下載 - persian tts源代碼下載

persian tts

Ai源碼

Initial Android release

下載

波斯文本對講道合成器

波斯TTS是一個簡單的文本到講話綜合引擎和反應式應用程序，我最初是作為我的學士學位畢業項目開發的。

但是，該項目旨在隨著時間的推移逐步改進。

內容

要求
安裝指南
啟動應用程序
項目結構
它如何工作
致謝
貢獻

✅要求

波斯語-TTS應用程序由React Antial供電，因此您需要它才能正確編譯應用程序。要編譯Android版本，在計算機上具有適當的Android SDK是必須的，顯然是彙編iOS變量的需要，您需要在MacOS操作系統供電的機器上擁有一個工作的Xcode副本和功能性的Cocoapods依賴性管理工具。

您還需要擁有一個依賴性管理工具，以訪問NPM和下載項目的依賴項。該項目使用紗線，但也可以使用NPM或其他工具。

？安裝指南

首先，您可以通過克隆來獲取源代碼

git clone [email protected]:amfolio/persian-tts.git

iOS依賴性安裝（可選）

 cd ios
pod install

然後移動到包裝的目錄並使用yarn install或npm install安裝其依賴項

啟動應用程序

要在Android和/或iOS操作系統的模擬器中啟動應用程序，您可以使用以下命令：

安卓

react-native run-android

ios

react-native run-ios

？項目結構

該項目的結構與許多其他反應項目結構相同。下面只是主要結構的全局：

__ -Tests __：開玩笑的單元測試
Android：反應式Android源文件
iOS：反應iOS源文件
SRC：主要項目根
- 組件：可重複使用的反應組件
  - componentName：一個名為文件夾在組件文件上包裝的駱駝
    - index.js：組件入口點，使用ES6模塊導出其內容
    - Styles.js（可選）：組件的反應樣式表
- 屏幕：應用程序屏幕組件
- UTILS：合成器算法和其他語言處理工具
- app.js：主要申請條目
- 路由器。 JS： React-Navigation組件配置
- Voices.json：應用程序寬的可用聲音配置

？它如何工作

不久，該項目使用“串聯合成”評估來實現其目標。在波斯語中，可以通過將“輔音+元音”對構造一組無限的單詞。為了勇敢，我們將這些對稱為“音節”。

為了使綜合作品最初有一組169個音節聲音，從我自己的聲音中重新編碼（所以這不是專業的敘述？）。這個數字被以波紋管的形式驅動：

語音類型	相應的文件計數
元音	6
沉默的輔音	23
音節（輔音+元音）	138
空間	2
全部的	169

然後，通過使用ffmpeg庫串聯音節及其是反應 - ffmpeg包裝器，可以使綜合過程變得可行。這是發生的事情的快速模式。

1️⃣步驟1

在第一步中，使用TextTophonems實用程序函數創建了波斯輸入的語音對應。

 const input = "سلام" ; // means "Hello" in persian
const output = textToPhonems ( input ) ; // ["sa", "lā", "m"];

2️⃣步驟2

步驟1的結果通過phonemstoffmpeg實用程序函數，並獲得有效的ffmpeg conmantation命令：

 const ffmpeg = phonemsToFFMpeg ( output ) ;

結果將是：

ffmpeg 
  -I sa.wav -I lā.wav -I m.wav 
  -filter_complex ‘[0:0][1:0][2:0]concat=n=3:v=0:a=1[out]’ 
  -map ‘[out]’ output.wav

3️⃣步驟3

該應用程序使用React-Native-FFMPEG調用FFMPEG，並且以下步驟在幕後完成：

在串聯之前

sa.wav	lā.wav	M.Wav
升離後

output.wav

4️⃣步驟4

借助React-Native-Sound庫，輸出音頻文件可以通過iOS和Android平台播放。讀取捆綁資源並將其轉移到沙箱/SD卡位置，這也可以歸功於React-Native-fs

？致謝

特別感謝我的項目導演穆罕默德·塔赫里（Mohammad Taheri）博士，他讓我有信心接近這個主題，並指導我採取了最好的步驟，以使其成為可能。沒有他，我可能永遠不會從事這樣的學術研究。

下一個非常感謝的是開發人員社區，他們與他人慷慨地共享尖端技術。僅僅由於這個社區而不再需要重新發明車輪。

這是一個簡短的圖書館清單，他們在發展道路上無限地幫助我：

反應
反應天然
反應導航
反應天然ffmpeg
反應天然fs
反應天然模態
反應本地聲音

？貢獻

該存儲庫最初是為波斯語言開源文本到語音解決方案構建的。我將非常感謝報告對錯誤的問題和改進的任何貢獻。

通過向項目添加更多聲音來貢獻也受到了高度歡迎，您也可以在Voices.json中提及您的名字。

如果有任何必要，請隨時發送拉動請求。

展開

附加信息

版本 Initial Android release
類型 Ai源碼
更新時間 2025-08-25
大小 34.07MB
來自於 Github

相關應用

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
F5 TTS ComfyUI

2024-11-02
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
語音開發英文資料(TTS使用指南Delphi版)

2009-05-28

爲您推薦

chat.petals.dev

其他源碼

1.0.0
GPT Prompt Templates

其他源碼

1.0.0
GPTyped

其他源碼

GPTyped 1.0.5
ML stack

Ai源碼

1.0.0
awesome free chatgpt

Ai源碼

1.0.0
pywin_contextmenu

Ai源碼

Version update
Google Dorks

其他源碼

1.0
shepherd

其他源碼

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

其他源碼

v1.1.0-rc-3

相關資訊全部