バージョン1ファイル:shallow_langchain_report.py(使いやすさの場合はレポに保管されています)
バージョン2ファイル:shallow_langchain_report_with_audio.py(最新かつ最高!)
shallow_langchain_report_with_audio最初のバージョンとコードの実装を組み合わせて、オーディオファイルをサポートします。したがって、バージョン2を実行してオーディオファイル(M4Aなど)を送信できるようになり、同じディレクトリに「audio_generated_text.txt」というタイトルの.txtファイルが作成されます。そこから、その.txtファイルを読み取り、コンテンツに関する要約レポートを作成します!これはこれまでで最もクールなものではありませんか?
バックエンドがまだ実装されていないため、まだ「浅い」という名前が付けられています。その結果、出力はしばしばカットされます(コンテキストウィンドウはAI出力には大きすぎます)。これはバージョン2で解決され、長いセッションを提供するのに役立つPineconeバックエンドがあります。バージョン3にご期待ください!
リポジトリをクローニングして.pyファイルをダウンロードします。
次に、LLM_Initialization関数(関数呼び出しはメインの最初の行です)を見つけ、「SK -....」と書かれたテキストフィールドにOpenAI APIキーを貼り付けます。
他の唯一の使用要件は、ユーザー入力としてオーディオファイルを提供することです。 iPhoneの「Voice Memos」アプリケーションのファイルである.m4aファイルでテストしました。後で登場するためのさらなるFiletypeテストとサポート。
このツールは、BluePrintのAIツール開発イニシアチブの一部です。彼らに手を差し伸べる:LinkedIn
プロジェクトタイムライン:2023年6月15日 - 2023年7月27日