Скачать SpotifyTranscripts - SpotifyTranscripts Скачать исходный код

SpotifyTranscripts

Другой исходный код

1.0.0

Скачать

Spotify стенограммы:
ИИ сгенерировал субтитры и сегментированные главы для подкастов.

Ключевые функции

Транскрипты: распознавание речи для преобразования речи в текст и метка времени.
Поиск: Поиск в стенограмме и перейдите к определенной части разговора.
Главы: Разбейте эпизод на авто, сгенерированные главы на основе тем.
Субтитры: Сделайте подкасты доступными для людей с трудностями слуха.

О проекте

Этот проект является результатом комбинации и дальнейшего развития двух моих предыдущих проектов:

Темы Spotify: Летом 2020 года я участвовал в летнем хакатоне Spotify и разработал инструмент, который позволяет вам перейти к временным меткам, где обсуждались определенные темы.
Субтитры Spotify: в 2022 году я продолжал экспериментировать, создавая субтитры для подкастов на основе функциональной идеи, которая получила более 4500 UP -голосов на форуме сообщества Spotify.

В 2023 году, в разгар ажиотажа CHATGPT, я вдохновился объединить два моих предыдущих проекта в один игрок подкаста и улучшить его, используя API Open AIS.

К вашему сведению: Spotify позже выпустил аналогичное решение как для подзаголов, так и глав, прочитайте больше здесь.

Технологии используются

Технологии, используемые в этом проекте, можно найти в таблице ниже.

Технология	Вариант использования
Реагировать	Frontend Framework
Попутный ветер	Библиотека стиля CSS
Питон	Бэкэнд для обработки логики транскрипции
Колба	Подключает бэкэнд Python с Frontend React
Spotify API	Чтобы получить информацию об эпизодах подкаста
API распознавания речи Google	Преобразует речь в текст, т.е. транскрибирует подкаст
Откройте API GPT 3.5 от AI.	Транскрипт сегмента в главы на основе стенограммы

Я хотел научиться подключить фронт реагирования с бэкэнд Python, поэтому я использовал этот проект в качестве возможности обучения, чтобы сделать это. В результате я сделал некоторую перегрузку, создав свой собственный API для обработки транскрипций на бэкэнде Python вместо того, чтобы называть API подключаемого и игрового API на фронте.

Более конкретно, фронт вызовет API Spotify и получает URL -адрес запрошенного подкаста. URL -адрес отправляется в качестве запроса на бэкэнд, который загружает подкаст как MP3, чтобы обработать его.

Причина, по которой MP3 необходимо обработать, заключается в том, что мне нужно получить временные метки для каждого предложения, чтобы отобразить их в правильное время в субтитрах. Я определяю предложения в стенограмме, прислушиваясь к молчанию (<14 децибел) более 500 мс. Когда молчание идентифицируется, я разделил исходный аудиофайл, чтобы создать набор меньших аудиофайлов, по одному для каждого предложения. Делая это, я смог рассчитать время начала и окончания каждого предложения, посмотрев на длину каждого меньшего аудиофайла, см. Рисунок ниже.

Все аудиофайлы теперь отправляются в API распознавания речи Google и возвращает строку транскрибированного звука. Транскрипция теперь отправляется обратно на фронт, который делает запрос открыть API AI для сегментации транскрипта и определения потенциальных тем, чтобы разделить эпизод на разные главы.

Ограничения

API Spotify не позволяет загружать полные эпизоды подкастов, всего 30 секунд. Это делает приложение очень ограниченным для использования, и поэтому это только доказательство концепции.

Начиная

Шаг 1: Зарегистрируйтесь на ключах API

Spotify
Открытый ИИ

Шаг 2: Добавьте ключи API в файл .env

Создайте файл .env в корневом каталоге и добавьте свои клавиши API:

 REACT_APP_SPOTFY_CLIENT_ID=YOUR_SPOTIFY_CLIENT_ID_GOES_HERE
REACT_APP_OPEN_AI_KEY=YOUR_OPEN_AI_KEY_GOES_HERE

Шаг 3: Запустите проект

Используйте следующие команды для запуска проекта. Запустите фронт в одном терминале и на бэкэнд в другом терминале.

Бэкэнд

 export FLASK_APP=backend
export FLASK_DEBUG=1
flask run

Внешний интерфейс

 cd frontend
npm start

Демо

Посмотрите 1 -минутную демонстрацию проекта здесь.

? Скриншоты

Домашняя страница с аутентификацией Spotify

Страница Discovery

Загрузка экрана

Эпизод экран

Субтитры в полноэкранном режиме

Обзор глаз в эпизоде

Аудиоплеер, разделенный на главы

Поиск стенограммы

Расширять

Дополнительная информация

Версия 1.0.0
Тип Другой исходный код
Время обновления 2025-02-28
размер 44.6MB
От Github

Связанные приложения

Google Dorks

2025-03-10
shepherd

2025-06-04
hidusbf

2025-02-14
mongo express

2025-06-04
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

SpotifyTranscripts

Spotify стенограммы:
ИИ сгенерировал субтитры и сегментированные главы для подкастов.

Ключевые функции

О проекте

Технологии используются

Ограничения

Начиная

Шаг 1: Зарегистрируйтесь на ключах API

Шаг 2: Добавьте ключи API в файл .env

Шаг 3: Запустите проект

Бэкэнд

Внешний интерфейс

Демо

? Скриншоты

Google Dorks

shepherd

hidusbf

mongo express

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

hidusbf

Google Dorks

shepherd

hidusbf

SpotifyTranscripts

Spotify стенограммы: ИИ сгенерировал субтитры и сегментированные главы для подкастов.

Ключевые функции

О проекте

Технологии используются

Ограничения

Начиная

Шаг 1: Зарегистрируйтесь на ключах API

Шаг 2: Добавьте ключи API в файл .env

Шаг 3: Запустите проект

Бэкэнд

Внешний интерфейс

Демо

? Скриншоты

Spotify стенограммы:
ИИ сгенерировал субтитры и сегментированные главы для подкастов.