TTSTextNormalization
1.0.0
このリポジトリには、Googleのテキスト正規化課題である英語に対する私のソリューションがあります。マジックのほとんどは、コンバーターディレクトリ内で発生します。これは、入力から出力トークンへの実際の変換を担当しています。コードに沿って、私のソリューションに関して書かれた論文があります。このペーパーの要約は次のとおりです。
このペーパーでは、テキストから書かれた表現の形式への変換に焦点を当てたテキストからスピーチへの正規化問題の解決方法と解決策を提案します。このメソッドは、勾配ブーストされた決定ツリーモデルを介して入力トークンを解析します。これは、トークンを16種類のトークンの1つとして分類します。トークンは、予測されるトークンタイプに基づいて変換され、音声形式の正規化された出力が得られます。関連するテキストからスピーチへの正規化競争に参加すると、ソリューションは99.590%の精度を達成し、260チームのうち12位、またはすべての提出物の上位5%内に配置されました。
Pythonファイルのいずれかを実行するには、 data/rawフォルダーに、競合自体の生のトレーニングとテストデータを含める必要があります。競争の条件により、このデータをこのリポジトリで共有することはできません。
このリポジトリはアーカイブとして機能し、更新することを意図していません。
アーカイブとして設計されているため、このリポジトリに貢献していません。
このプロジェクトは、MITライセンスに基づいてライセンスされています - 詳細については、license.mdファイルを参照してください。