Процесс генерации синопсиса подкаста традиционно требует, чтобы создатели, продюсеры и/или писатели понимали содержание и вручную писать обзор, суммируя существенные моменты и основные моменты эпизода. Этот подход занимает много времени и может включать в себя сеансы мозгового штурма, в которых обсуждаются основные темы, и уточнить текст до тех пор, пока он не передает сообщение и тон подкаста (например, комедийный подкаст может включать юмористический язык или гиперболу в его резюме).
Этот репозиторий иллюстрирует, как автоматизировать большую часть этого ручного и трудоемкого процесса с использованием портфеля услуг, предоставляемых Azure Cognitive Services, в частности, Azure Sperive Service и Azure Openai используются для транскрибирования и создания синопсиса , слоганов , ключевых слов SEO и перевода на множественные языки. Включение ИИ для автоматизации этого процесса не устраняет роль творчества человека или важности вовлечения человека. Вместо этого это обеспечивает значительное ускорение в сфере рынка, используя силу ИИ. Окончательная проверка и одобрение контента остаются обязанностью специалистов -людей перед публикацией.

Этот репозиторий реализует архитектуру высокого уровня, которая будет принимать звук подкаста (шаги 1-3), транскрибировать звук в текст, используя Azure Spearch Services (шаг 4) и генерирует синопсис на основе транскрипции с использованием Azure OpenAI GPT-3.5 (шаг 5). Обратите внимание, что используемой версии модели GPT может быть легко обновлена, например, GPT-4 или будущие версии.
Он состоит из веб -приложения React, которое позволяет пользователю загружать аудиофайл (подкаст). Приложение использует конечную точку функции Azure (webapihttptrigger) для загрузки аудиофайла в учетную запись хранения, то есть контейнер raw-files .
Функция Azure (AudioFileUploadedBlobtrigger) Получите запуск, когда в контейнер raw-files добавляется новый файл. The function downloads the audio file and sends it to Azure Speech Services and transcribes the audio to text. Затем он сохраняет транскрипцию в той же учетной записи хранения, то есть контейнер transcription .
Последняя функция Azure (TranscriptionFileUploadedBlobtrigger) запускается при добавлении новых файлов в контейнер transcriptions . Функция загружает файл транскрипции и отправляет его в четыре различных метода Azure Openai, которые выполняют следующие функции:
Он сохраняет результаты в виде отдельных текстовых файлов в контейнере open-ai-results .
Этот проект приветствует вклады и предложения. Большинство взносов требуют, чтобы вы согласились с лицензионным соглашением о участнике (CLA), заявив, что вы имеете право и фактически предоставить нам права на использование вашего вклада. Для получения подробной информации, посетите https://cla.opensource.microsoft.com.
Чтобы внести свой вклад, пожалуйста, начните с создания самоуправленной проблемы, дающей обзор высокого уровня того, что вы хотели бы сделать. После того, как любое обсуждение заключается в завершении, следите за PR.
Этот проект принял код поведения с открытым исходным кодом Microsoft. Для получения дополнительной информации см. Кодекс поведения FAQ или свяжитесь с [email protected] с любыми дополнительными вопросами или комментариями.