SpotifyTranscriptsダウンロードSpotifyTranscriptsソースコードのダウンロード

SpotifyTranscripts

その他のソースコード

1.0.0

ダウンロード

Spotify転写産物：
AIは、ポッドキャスト用の字幕とセグメント化された章を生成します。

重要な機能

トランスクリプト：音声認識で音声をテキストとタイムスタンプに変換します。
検索：トランスクリプトを検索し、会話の特定の部分にジャンプします。
章：トピックに基づいて、エピソードを自動生成された章に分類します。
字幕：聴覚障害のある人がポッドキャストにアクセスできるようにします。

プロジェクトについて

このプロジェクトは、以前の2つのプロジェクトの組み合わせと継続的な開発の結果です。

Spotify Topics： 2020年の夏、私はSpotifyの夏のハッカソンに参加し、特定のトピックが議論されているタイムスタンプに早送りできるツールを開発しました。
Spotifyの字幕： 2022年、私はSpotifyのコミュニティフォーラムで4500以上のUpvotesを受け取った機能のアイデアに基づいて、ポッドキャストの字幕を構築することで実験を続けました。

2023年、ChatGptの誇大広告の真っin中に、私は以前の2つのプロジェクトを1つのポッドキャストプレーヤーに組み合わせて、Open AIのAPIを利用して改善することに触発されました。

参考までに、Spotifyは後にポッドキャスト字幕と章の両方について同様のソリューションをリリースしました。詳細はこちらをご覧ください。

使用されたテクノロジー

このプロジェクトで使用されているテクノロジーは、下の表にあります。

テクノロジー	使用事例
反応します	フロントエンドフレームワーク
追い風	CSSスタイリングライブラリ
Python	転写ロジックを処理するバックエンド
フラスコ	PythonバックエンドをReact Frontendに接続します
Spotify API	ポッドキャストエピソードに関する情報を取得するには
Googleスピーチ認識API	スピーチをテキストに変換します。つまり、ポッドキャストを転写します
AIのGPT 3.5 APIを開きます	トランスクリプトに基づいた章へのトランスクリプトをセグメントします

React FrontendをPythonバックエンドに接続する方法を学びたかったので、このプロジェクトを学習機会として使用しました。その結果、フロントエンドのプラグアンドプレイAPIを呼び出す代わりに、Pythonバックエンドの転写を処理するために独自のAPIを構築することで、いくつかのオーバーエンジニアリングを行いました。

より具体的には、FrontEndはSpotify APIを呼び出し、要求されたポッドキャストのURLを取得します。 URLは、ポッドキャストをmp3としてダウンロードするバックエンドへのリクエストとして送信され、処理するためにmp3として送信されます。

mp3を処理する必要がある理由は、字幕の正しい時間にそれらを表示するために、各文のタイムスタンプを取得する必要があるためです。 500ミリ秒以上の沈黙（<14デシベル）を聞くことで、転写産物の文を特定します。沈黙が識別されると、元のオーディオファイルを分割して、各文に1つの小さなオーディオファイルを作成します。これを行うことで、各小さなオーディオファイルの長さを見ることで各文の開始時間と終了時間を計算することができました。下の図を参照してください。

すべてのオーディオファイルは、GoogleのSpeech Speechtedation APIに送信され、転写されたオーディオの文字列を返します。転写は現在、フロントエンドに送り返されており、フロントエンドはAIのAPIを開き、トランスクリプトをセグメント化し、潜在的なトピックを特定してエピソードをさまざまな章に分割するように要求しています。

制限

SpotifyのAPIでは、完全なポッドキャストエピソードをダウンロードすることはできません。30秒のプレビューのみです。これにより、アプリは使用に非常に限定されているため、概念実証にすぎません。

はじめる

ステップ1：APIキーにサインアップします

Spotify
AIを開きます

ステップ2：APIキーを.ENVファイルに追加します

ルートディレクトリに.ENVファイルを作成し、APIキーを追加します。

 REACT_APP_SPOTFY_CLIENT_ID=YOUR_SPOTIFY_CLIENT_ID_GOES_HERE
REACT_APP_OPEN_AI_KEY=YOUR_OPEN_AI_KEY_GOES_HERE

ステップ3：プロジェクトを実行します

次のコマンドを使用してプロジェクトを実行します。 1つの端子でフロントエンドを開始し、バックエンドを別の端子に開始します。

バックエンド

 export FLASK_APP=backend
export FLASK_DEBUG=1
flask run

フロントエンド

 cd frontend
npm start

デモ

ここでプロジェクトの1分のデモをご覧ください。

？スクリーンショット

Spotify認証付きのホームページ

発見ページ

画面の読み込み

エピソード画面

フルスクリーンの字幕

エピソード内の章の概要

章で分割されたオーディオプレーヤー

トランスクリプトを検索します

拡大する

追加情報

バージョン 1.0.0
タイプその他のソースコード
更新時間 2025-02-28
サイズ 44.6MB
から Github

SpotifyTranscripts

Spotify転写産物：
AIは、ポッドキャスト用の字幕とセグメント化された章を生成します。

重要な機能

プロジェクトについて

使用されたテクノロジー

制限

はじめる

ステップ1：APIキーにサインアップします

ステップ2：APIキーを.ENVファイルに追加します

ステップ3：プロジェクトを実行します

バックエンド

フロントエンド

デモ

？スクリーンショット

Google Dorks

shepherd

hidusbf

mongo express

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

hidusbf

Google Dorks

shepherd

hidusbf

SpotifyTranscripts

Spotify転写産物： AIは、ポッドキャスト用の字幕とセグメント化された章を生成します。

重要な機能

プロジェクトについて

使用されたテクノロジー

制限

はじめる

ステップ1：APIキーにサインアップします

ステップ2：APIキーを.ENVファイルに追加します

ステップ3：プロジェクトを実行します

バックエンド

フロントエンド

デモ

？スクリーンショット

Spotify転写産物：
AIは、ポッドキャスト用の字幕とセグメント化された章を生成します。