Di bidang kecerdasan buatan, Hume AI baru-baru ini mengumumkan peluncuran produk barunya, Octave, sebuah sistem yang dikenal sebagai sistem teks-ke-unggun pertama yang ditenagai oleh model bahasa besar (LLM). Apa inovasi di Octave adalah bahwa ia tidak hanya dapat menghasilkan suara alami tetapi juga memahami emosi, intonasi, ritme dan ritme dalam konteks, sehingga memberikan pengguna dengan output suara yang lebih jelas dan dimanusiakan.
Alan Cowen, salah satu pendiri dan CEO Hume AI, mengatakan dalam sebuah wawancara dengan media bahwa niat asli dari model oktaf adalah untuk membuat proses pembuatan teks-ke-ucapan lebih alami dan fleksibel. Dia menyebutkan bahwa Octave dapat secara otomatis mengidentifikasi kepribadian dan keadaan emosi karakter berdasarkan konten teks input, dan menyesuaikan kinerja suara yang sesuai. Misalnya, kalimat sarkastik diekspresikan dengan nada sarkastik, sementara konten mendesak disajikan dengan nada terburu -buru.

Octave juga memiliki fitur unik di mana pengguna dapat melakukan penyesuaian yang cermat terhadap suara yang dihasilkan melalui instruksi bahasa alami yang sederhana. Ini berarti bahwa pengguna dapat secara langsung memasukkan deskripsi seperti "lebih bahagia" dan "lebih sedih", sehingga suara yang dihasilkan lebih sesuai dengan harapan mereka. Cowen menambahkan bahwa oktaf dapat segera menghasilkan suara yang sesuai berdasarkan karakteristik karakter, seperti "petani abad pertengahan sarkastik", dan menyesuaikannya dalam ekspresi emosional.

Berbeda dengan model pemrosesan kata demi kata tradisional, koherensi konteks nilai oktaf dan dapat menangkap perubahan emosional pada tingkat kalimat dan antara kalimat. Kemampuan ini membuat Octave berkinerja lebih baik ketika berhadapan dengan emosi dan konteks yang kompleks.
Dengan perkembangan cepat teknologi kecerdasan buatan, sistem oktaf Hume AI telah membawa kemungkinan baru untuk teknologi teks-ke-kebesaran. Ini tidak hanya dapat memberikan dubbing karakter yang lebih realistis untuk industri seperti produksi film dan televisi dan pengembangan game, tetapi juga membuka arahan baru untuk aplikasi di bidang seperti pendidikan dan layanan pelanggan. Inovasi ini di Hume AI ini akan lebih mempromosikan pengembangan teknologi suara dan membantu lebih banyak metode komunikasi alami dan emosional.