Font VAE
1.0.0
VAEにはモジュール設計があります。エンコーダー、デコーダー、VAEは、重みを共有する3つのモデルです。 VAEモデルをトレーニングした後、エンコーダーを使用して潜在ベクトルを生成できます。デコーダーは、平均= 0およびstd = 1のガウス分布から潜在ベクトルをサンプリングすることにより、フォント画像を生成するために使用できます。
| エンコーダー | デコーダ |
|---|---|
![]() | ![]() |
データセットサイズ=トレーニング5000と各クラスごとに1000
幅、高さ= 112、112
フォントサイズ= 25
使用済み文字= "aabbccdeeffgghhiijjkkllmmnnooppqqrrssttuvvwwxxyzyz"
画像はfont2png.pyで生成されます
フォントはGoogleフォントからのものです
| idx | フォント名 | サンプル画像 |
|---|---|---|
| 0 | エブガラモンド | ![]() ![]() ![]() ![]() ![]() |
| 1 | PT_SERIF | ![]() ![]() ![]() ![]() ![]() |
| 2 | notosans | ![]() ![]() ![]() ![]() ![]() |
| 3 | ロボット | ![]() ![]() ![]() ![]() ![]() |
| 4 | 義人 | ![]() ![]() ![]() ![]() ![]() |
| 5 | バンガー | ![]() ![]() ![]() ![]() ![]() |
| 6 | パシフィコ | ![]() ![]() ![]() ![]() ![]() |
| 7 | dancingscript | ![]() ![]() ![]() ![]() ![]() |
| 8 | Inconsolata | ![]() ![]() ![]() ![]() ![]() |
| 9 | VT323 | ![]() ![]() ![]() ![]() ![]() |
| エポック | 20 | 50 | 200 |
|---|---|---|---|
| ログ | ![]() | ![]() | ![]() |
| 潜在スペース | ![]() | ![]() | ![]() |
1フレーム= 1バッチ
1エポック= 196バッチ
| エポック= 1 | エポック= 2 | エポック= 3 |
|---|---|---|
![]() | ![]() | ![]() |
| エポック= 4 | エポック= 5 | エポック= 6 |
![]() | ![]() | ![]() |

[1] Kingma、Diederik P.、およびMax Welling。 「自動エンコード変異ベイズ。」
[2] Kerasブログ:Kerasの自動エンコーダーの構築
[3]ケラスの例:vae
[4] Erik Bernhardsson。 「深いニューラルネットワークを使用して50Kフォントの分析」
[5] TJ Torres。 「フォンストの航海:敵対的なネットワークを備えた生成フォント」
[6] Julien Despois。 「潜在スペースの視覚化 - ディープラーニングビット#2」