Proses generasi sinopsis podcast secara tradisional membutuhkan pencipta, produsen, dan/atau penulis untuk memahami konten, dan secara manual menulis sinopsis, merangkum poin -poin penting dan sorotan sebuah episode. Pendekatan ini memakan waktu dan mungkin melibatkan sesi brainstorming yang membahas tema utama, dan memperbaiki teks sampai secara efektif menyampaikan pesan dan nada podcast (misalnya, podcast komedi dapat menampilkan bahasa atau hiperbola yang lucu dalam ringkasannya).
Repositori ini menggambarkan cara mengotomatisasi sebagian besar proses manual dan memakan waktu ini menggunakan portofolio layanan yang disediakan oleh Azure Cognitive Services, khususnya layanan pidato Azure dan Azure OpenAI digunakan untuk menyalin dan menghasilkan sinopsis , tagline , kata kunci SEO dan terjemahan ke dalam berbagai bahasa. Memasukkan AI untuk mengotomatiskan proses ini tidak menghilangkan peran kreativitas manusia atau pentingnya keterlibatan manusia. Sebaliknya, ini memungkinkan percepatan yang signifikan dalam waktu-ke-pasar dengan memanfaatkan kekuatan AI. Validasi akhir dan persetujuan konten tetap menjadi tanggung jawab spesialis manusia sebelum diterbitkan.

Repositori ini mengimplementasikan arsitektur tingkat tinggi yang akan mengambil audio podcast (Langkah 1-3), menuliskan audio ke dalam teks menggunakan Azure Speech Services (Langkah 4), dan menghasilkan sinopsis berdasarkan transkripsi menggunakan Azure OpenAI GPT-3.5 (Langkah 5). Perhatikan bahwa versi model GPT yang digunakan dapat dengan mudah ditingkatkan ke, misalnya GPT-4, atau versi mendatang.
Ini terdiri dari aplikasi Web React yang memungkinkan pengguna untuk mengunggah file audio (podcast). Aplikasi ini menggunakan titik akhir fungsi Azure (webapihttptrigger) untuk mengunggah file audio ke akun penyimpanan, yaitu wadah raw-files .
Fungsi Azure (audiofileUploadedBlobTrigger) dipicu saat file baru ditambahkan ke wadah raw-files . Fungsi mengunduh file audio dan mengirimkannya ke Azure Speech Services dan menyalin audio ke teks. Kemudian menyimpan transkripsi ke akun penyimpanan yang sama, yaitu wadah transcription .
Fungsi Azure terakhir (TranscriptionFileUploadedBlobTrigger), dipicu ketika file baru ditambahkan ke wadah transcriptions . Fungsi mengunduh file transkripsi dan mengirimkannya ke empat metode OpenAi Azure yang berbeda yang melakukan fungsi -fungsi berikut:
Ini menyimpan hasil sebagai file teks terpisah di akun penyimpanan open-ai-results .
Proyek ini menyambut kontribusi dan saran. Sebagian besar kontribusi mengharuskan Anda untuk menyetujui perjanjian lisensi kontributor (CLA) yang menyatakan bahwa Anda memiliki hak untuk, dan benar -benar melakukannya, beri kami hak untuk menggunakan kontribusi Anda. Untuk detailnya, kunjungi https://cla.opensource.microsoft.com.
Untuk berkontribusi, silakan mulai dengan membuat masalah yang ditugaskan sendiri memberikan gambaran tingkat tinggi tentang apa yang ingin Anda lakukan. Setelah diskusi di sana berakhir, tindak lanjuti dengan PR.
Proyek ini telah mengadopsi kode perilaku open source Microsoft. Untuk informasi lebih lanjut, lihat FAQ Kode Perilaku atau hubungi [email protected] dengan pertanyaan atau komentar tambahan.