TTSTextNormalization
1.0.0
這個存儲庫將我解決了Google的文本歸一化挑戰 - 英語的解決方案。大多數魔術發生在轉換器目錄中,該目錄負責從輸入到輸出令牌的實際轉換。與我的解決方案一起寫了一篇論文。本文的摘要如下:
本文提出了一種解決文本到語音歸一化問題的方法以及解決方案,該方法的重點是將文本從書面表達式轉換為口語形式。該方法通過梯度提升決策樹模型解析輸入令牌,該模型將令牌分類為16種不同類型的令牌之一。然後根據預測的令牌類型對令牌進行轉換,從而導致口語形式的歸一化輸出。進入相關的文本到語音歸一化競爭後,該解決方案的準確度為99.590% ,在260支團隊中或所有提交的前5%以下。
為了運行任何Python文件, data/raw文件夾必須包含來自比賽本身的原始培訓和測試數據。由於競爭的條款和條件,該數據不能在此存儲庫上共享。
該存儲庫充當檔案,不打算更新。
我沒有為此存儲庫做貢獻,因為它被設計為檔案。
此項目已獲得MIT許可證的許可 - 有關詳細信息,請參見許可證文件。