Download do SpotifyTranscripts - SpotifyTranscripts Download de código fonte

SpotifyTranscripts

Outro código-fonte

1.0.0

Baixar

Transcrições do Spotify:
A IA gerou legendas e capítulos segmentados para podcasts.

Principais recursos

Transcrições: reconhecimento de fala para converter fala em texto e um registro de data e hora.
Pesquise: pesquise a transcrição e pule para uma parte específica de uma conversa.
Capítulos: Divida um episódio em capítulos gerados automaticamente com base em tópicos.
Legendas: Torne os podcasts acessíveis a pessoas com dificuldades auditivas.

Sobre o projeto

Este projeto é o resultado de uma combinação e o desenvolvimento contínuo de dois dos meus projetos anteriores:

Tópicos do Spotify: Durante o verão de 2020, participei do Hackathon de verão do Spotify e desenvolvi uma ferramenta que permite que você avançou rapidamente para os registros de data e hora em que certos tópicos estavam sendo discutidos.
Spotify Legenda: Em 2022, continuei a experimentar construindo legendas para podcasts com base em uma ideia de recurso que recebeu mais de 4500 votos no fórum da comunidade do Spotify.

Em 2023, no meio do hype do ChatGPT, fiquei inspirado a combinar meus dois projetos anteriores em um jogador de podcast e melhorá -lo, utilizando as APIs do Open AI.

FYI: O Spotify lançou mais tarde uma solução semelhante para legendas e capítulos de podcast, leia mais aqui.

Tecnologias usadas

As tecnologias usadas neste projeto podem ser encontradas na tabela abaixo.

Tecnologia	Caso de uso
Reagir	Estrutura de front -end
Tailwind	Biblioteca de estilo CSS
Python	Back -end para lidar com a lógica de transcrição
Balão	Conecta o back -end do Python com o React Frontend
Spotify API	Para obter informações sobre episódios de podcast
API de reconhecimento de fala do Google	Converte fala em texto, ou seja, transcreve o podcast
API GPT 3.5 da AIR da IA	Transcrição do segmento em capítulos com base na transcrição

Eu queria aprender a conectar um front -end do React a um back -end do Python, então usei esse projeto como uma oportunidade de aprendizado para fazer isso. Como resultado, fiz um pouco de engenharia excessiva, construindo minha própria API para lidar com transcrições em um back-end do Python, em vez de chamar uma API plug-and-play no front-end.

Mais especificamente, o front -end faz uma chamada para a API do Spotify e recebe o URL do podcast solicitado. O URL é enviado como uma solicitação para o back -end que baixará o podcast como um MP3 para processá -lo.

O motivo pelo qual o MP3 precisa ser processado é que eu preciso obter registros de data e hora para cada frase para exibi -los no momento correto nas legendas. Identino frases na transcrição ouvindo um silêncio (<14 decibéis) com mais de 500 ms. Quando um silêncio é identificado, divido o arquivo de áudio original para criar um conjunto de arquivos de áudio menores, um para cada frase. Ao fazer isso, consegui calcular o horário de início e término de cada frase, olhando para o comprimento de cada arquivo de áudio menor, veja a figura abaixo.

Todos os arquivos de áudio agora são enviados para a API de reconhecimento de fala do Google e retorna uma sequência do áudio transcrito. A transcrição está agora sendo enviada de volta ao front -end, que solicita a API da IA para segmentar a transcrição e identificar possíveis tópicos para dividir o episódio em diferentes capítulos.

Limitações

A API do Spotify não permite que você baixe episódios completos de podcast, apenas 30 segundos visualizações. Isso torna o aplicativo muito limitado ao uso e, portanto, é apenas uma prova de conceito.

Começando

Etapa 1: Inscreva -se para as chaves da API

Spotify
Abra a IA

Etapa 2: Adicione as teclas da API ao arquivo .env

Crie um arquivo .env no diretório raiz e adicione suas chaves da API:

 REACT_APP_SPOTFY_CLIENT_ID=YOUR_SPOTIFY_CLIENT_ID_GOES_HERE
REACT_APP_OPEN_AI_KEY=YOUR_OPEN_AI_KEY_GOES_HERE

Etapa 3: execute o projeto

Use os seguintes comandos para executar o projeto. Inicie o front -end em um terminal e o back -end em outro terminal.

Back -end

 export FLASK_APP=backend
export FLASK_DEBUG=1
flask run

Front-end

 cd frontend
npm start

Demonstração

Assista a uma demonstração de 1 min do projeto aqui.

? Capturas de tela

Página inicial com autenticação do Spotify

Página de descoberta

Tela de carregamento

Tela de episódio

Legendas em tela cheia

Visão geral dos capítulos dentro de um episódio

Player de áudio dividido por capítulos

Transcrição da pesquisa

Expandir

Informações adicionais

Versão 1.0.0
Tipo Outro código-fonte
Data da Última Atualização 2025-02-28
tamanho 44.6MB
Vindo de Github

Aplicativos Relacionados

Google Dorks

2025-03-10
shepherd

2025-06-04
hidusbf

2025-02-14
mongo express

2025-06-04
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Outro código-fonte

1.0.0
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Outro código-fonte

1.0.0

Informações Relacionadas Todos

SpotifyTranscripts

Transcrições do Spotify: A IA gerou legendas e capítulos segmentados para podcasts.