mimic recording studio下載 - mimic recording studio源代碼下載

mimic recording studio

Ai源碼

v 0.1.1

下載

模仿錄音室

模仿錄音室
- 軟件快速啟動
  - Windows自我託管快速啟動
  - Linux/Mac自託管快速啟動
    - 安裝依賴項
    - 構建和運行
  - 手動安裝，構建和啟動
    - 後端
      - 依賴性
      - 構建與運行
    - 前端
      - 依賴性
      - 構建與運行
  - 即將推出！
- 數據
  - 錄音
    - WAV文件
    - {uuid} -metadata.txt
  - 語料庫
    - 其他語言的語料庫
- 技術
  - 前端
    - 功能
  - 後端
    - 功能
  - Docker
錄製提示
先進的
- 查詢數據庫結構
  - 表“ AudioModel”
  - 表“ usermodel”
- 修改錄音機UUID
向Mycroft提供您的錄音進行培訓
貢獻
在哪裡獲得支持和幫助

Mycroft開源模擬技術是文本到語音引擎，它們採用書面文本並將其轉換為口語音頻。該技術的最新一代模仿2使用機器學習技術來創建一個可以說特定語言的模型，聽起來像是對其訓練的聲音。

模仿錄音室簡化了來自個人的培訓數據的收集，每個人都可以用來為模仿產生獨特的聲音。

軟件快速啟動

Windows自我託管快速啟動

git clone https://github.com/MycroftAI/mimic-recording-studio.git
cd mimic-recording-studio
start-windows.bat

Linux/Mac自託管快速啟動

安裝依賴項

Docker（社區版很好）
Docker組成

為什麼要碼頭？為了使此超級設置並運行跨平台。

構建和運行

git clone https://github.com/MycroftAI/mimic-recording-studio.git
cd mimic-recording-studio
docker-compose up以構建和運行（注意：您可能需要根據您的分配使用sudo docker-compose up ）
另外，您可以單獨構建和運行。 docker-compose build然後docker-compose up
在您的瀏覽器中，轉到http://localhost:3000

注意： docker-compose up的第一次執行將需要一段時間，因為此命令還將構建Docker容器。隨後的docker-compose up的執行應更快地啟動。

手動安裝，構建和啟動

後端

依賴性

Python 3.5 +
ffmpeg

構建與運行

cd backend/
pip install -r requirements.txt
python run.py

前端

依賴性

節點＆npm
創建反應應用
紗線 - 可選的，用於更快的構建，安裝和啟動

構建與運行

cd frontend/
npm install ，或者yarn install
npm start ，或者yarn start

即將推出！

在線，http：//mimic.mycroft.ai託管版本需要零設置。

數據

錄音

WAV文件

音頻作為WAV文件保存到backend/audio_file/{uuid}/ Directory。後端會使用FFMPEG自動修剪所有WAV文件的開始和結束。

{uuid} -metadata.txt

元數據也保存到backend/audio_file/{uuid}/ 。該文件將WAV文件名映射到說話的短語。這與WAV文件一起是您開始訓練模擬2所需的。

語料庫

目前，我們有一個英語語料庫，可以在backend/prompt/中找到english_corpus.csv 。要使用自己的語料庫，請遵循以下步驟。

使用選項卡（ t ）作為定界符，以與english_corpus.csv相同的格式創建一個CSV文件。
確保語料庫中沒有空線
將您的語料庫添加到backend/prompt目錄中。
將docker-compose.yml中的CORPUS環境變量更改為您的語料庫名稱。

其他語言的語料庫

如果您想用英語以外的語言開發語料庫，則可以使用模擬錄音室來製作其他語言的TTS聲音錄音。如果您正在用英語以外的語言構建語料庫，我們鼓勵您選擇以下短語：

以目標語言自然的日常演講發生
有多種弦樂長度
覆蓋各種音素（基本聲音）

重要的是：目前，您必須重置sqlite數據庫以使用新的語料庫。如果您在另一個語料庫上錄製並想保存該數據，則可以簡單地將backend/db/中的sqlite DB重命名為另一個名稱。後端將檢測到mimicstudio.db不存在，並為您創建一個新的。您可以繼續錄製新語料庫的數據。

技術

前端

Web UI是使用JavaScript構建的，並作為腳手架工具進行了反應和創建反應應用。請參閱CRA.MD，以了解有關如何使用Create-React-App的更多信息。

功能

錄製和播放音頻
生成音頻可視化
計算和顯示指標

後端

Web服務是使用Python，Flask作為後端框架，Gunicorn作為HTTP Weberver和SQLite作為數據庫構建的。

功能

過程音頻
服務語料庫和指標數據
在數據庫中記錄信息
將數據記錄到文件系統

Docker

Docker用於容器化這兩個應用程序。默認情況下，前端使用網絡端口3000而後端使用網絡端口5000 。您可以在docker-compose.yml文件中配置這些。

注意：如果您正在運行docker-registry ，則默認情況下在端口5000上運行，因此您需要更改所使用的端口。

錄製提示

創建聲音需要可實現但巨大的努力。一個人需要記錄15,000-20,000個短語。為了獲得最佳的模仿聲音，錄音需要保持清潔和一致。為此，請遵循以下建議：

記錄在安靜的環境中，並具有降噪材料。如果您的耳朵能聽到外部噪音，那麼麥克風也會聽到噪音。為了獲得最佳效果，也應避免通過通風孔吹氣的聲音。裸露的牆壁創造了微妙的迴聲和混響。一個聲音衰減的攤位是理想的選擇，但是您還可以使用軟件（例如壁櫥中的聲泡沫）創建自製錄音室。也可以有效地使用床罩和床墊！
以一致的音量和速度說話。匆匆穿過短語只會導致質量較低的聲音。
使用優質的麥克風。為了獲得一致的結果，我們建議使用耳機麥克風，以使您的嘴巴始終與MIC相同。
避免發聲疲勞。每天最多記錄4個小時，每半小時休息一下。
定期備份您的模擬錄音局目錄，以避免數據丟失。

先進的

查詢數據庫結構

模擬錄製局局將在/後端/db/下的SQLite數據庫文件中寫入所有記錄。可以使用DBEAVER等數據庫工具打開。

數據庫包括兩個表。

database_table_overview

表“ AudioModel”

所有錄音都持續在此表中

錄製時間戳（create_date）
揚聲器的UUID（匹配/後端/audio_files/id的文件系統路徑）
文件系統中的wav文件名（audio_id）
記錄的短語文本（短語）

該數據庫可用於查詢您的錄音。

以下是一些示例查詢：

 -- List all recordings
SELECT * FROM audiomodel;

-- Lists recordings from january 2020 order by phrase
SELECT * FROM audiomodel WHERE created_date BETWEEN ' 2020-01-01 ' AND ' 2020-01-31 ' ORDER BY prompt;

-- Lists number of recordings per day
SELECT DATE (created_date), COUNT ( * ) AS RecordingsPerDay
FROM audiomodel
GROUP BY DATE (created_date )
ORDER BY DATE (created_date)

-- Shows average text length of recordings
SELECT AVG (LENGTH(prompt)) AS avgLength FROM audiomodel

查詢SQLITE數據庫的方法有很多。例如，在特定時間範圍內尋找錄音可能有助於刪除在不良環境中製作的錄音。

表“ usermodel”

使用相同的SQLITE數據庫文件可以使用多個揚聲器使用模擬記錄工作組。

該表提供以下每個發言人的信息：

揚聲器（UUID）的唯一標識符
揚聲器的名稱（user_name）
最新記錄的行數（提示_num）
總記錄時間（total_time_spoken）
記錄了多少個字符（len_char_spoken）

這些值用於計算指標。例如，與以前的錄音相比，語言節奏可能表明錄製的短語太快還是緩慢。

查詢表“ usermodel”以獲取包括uuid在內的揚聲器列表以及其中一些記錄統計信息。

 SELECT user_name AS [name], uuid FROM usermodel;

database_table_usermodel

修改錄音機UUID

用於記錄您的短語的瀏覽器持續使用了用戶的uuid和localStorage中的name ，以使其與sqlite和filesystem同步。

如果出現問題，並且您的瀏覽器會在模仿錄製局部使用/更改UUID映射，則可能很難繼續上一個錄製會話。然後在瀏覽器的localstorage中更新以下兩個屬性：

uuid（查詢表“ usermodel”或檢查文件系統路徑在/後端/audio_files/）
名稱（查詢表“ usermodel”）

在您的瀏覽器中打開Mimic recording-studio，跳到Web-Developter選項，LocalStorage並將名稱和UUID設置為原始值。

browser_local_storage

之後，您應該能夠在沒有進一步問題的情況下繼續上一個錄製會議。

向Mycroft提供您的錄音進行培訓

我們歡迎您向Mycroft捐贈的語音捐贈，以用於文本到語音應用程序。如果您想提供您的語音錄音，則必須根據CCC0 CC0公共領域許可證將其許可給我們，以便我們可以在TTS聲音中使用它們 - 這是衍生作品。如果您準備捐贈您的語音錄音，請發送電子郵件至[email protected]。

貢獻

公關很高興被接受！

在哪裡獲得支持和幫助

您可以通過模擬錄音室獲得幫助和支持；

Mycroft論壇
在Mycroft聊天中

展開

附加信息

版本 v 0.1.1
類型 Ai源碼
更新時間 2025-08-20
大小 3.42MB
來自於 Github

相關應用

PwR Studio

2024-11-14
langgraph studio

2024-11-09
DiffSynth Studio

2024-11-08
gb studio

2024-11-06
溫度記錄應用程式

2024-05-07
東方音樂錄音

2022-07-29

爲您推薦

chat.petals.dev

其他源碼

1.0.0
GPT Prompt Templates

其他源碼

1.0.0
GPTyped

其他源碼

GPTyped 1.0.5
ML stack

Ai源碼

1.0.0
awesome free chatgpt

Ai源碼

1.0.0
pywin_contextmenu

Ai源碼

Version update
Google Dorks

其他源碼

1.0
shepherd

其他源碼

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

其他源碼

v1.1.0-rc-3

相關資訊全部