pippaGPTダウンロードpippaGPTソースコードのダウンロード

pippaGPT

その他のソースコード

v1.1 -

ダウンロード

Pippagpt-パーソナライズされた、摂取、持続性、多型、適応型GPTチャットボット

ピッパのロゴ

Pippaは、Langchainフレームワークに基づいたオープンソースの大手言語モデル（LLM）チャットボットプロジェクトです。パーソナライズされた適応的な会話エクスペリエンスを提供することを目指しています。

Pippaには、チャットボットの性格をカスタマイズする機能、学習のためのドキュメントの摂取、会話の履歴を覚え、異なるキャラクターを切り替え、ユーザーのニーズに適応する機能など、さまざまな機能を組み込んで適応プロセスを強化します。

特徴

パーソナライズ：ユーザーは、より魅力的でカスタマイズされた会話エクスペリエンスのために、チャットボットの個性を調整できます。
摂取：Pippaはドキュメントを摂取してコンテキストを抽出し、ユーザーが独自のドキュメントをチャットボットのナレッジベースに組み込むことができます。
永続的：Pippaは会話の歴史を保持し、ユーザーが過去の会話のコンテキストを再訪できるようにします。
Polymorphic：Pippaは、選択したキャラクターにモーフィングでき、カスタム命令で簡単にカスタマイズできます。
Adaptive：Pippaは、コンテキストに基づいて会話のスタイルと応答を変更することにより、ユーザーのニーズに適応します。

検索QAモジュールは、迅速なエンジニアリングによりLocalgptに触発されました。

プロジェクトの背景

ピッパプロジェクトは、AI娘のキャラクターを作成する可能性を探るための個人的な趣味として始まりました。まだ初期段階にありますが、プロジェクトは新しい機能と改善により定期的に更新されます。 Pippaのデフォルトの役割は、システムメッセージの「システム」、「Pippa」は思いやりのある娘のキャラクター、「Bundy」です。

TTS/STTエンジンを使用する場合、PippaはElevenLabs APIを使用します。無料アカウントにサインアップできます：https：//elevenlabs.io。

より良い体験のために、キャラクターにユニークな声を割り当ててください。

インストール

Python 3.10でテストしました。

Pippaをインストールするには、次の手順に従ってください。

リポジトリをクローンします：

   git clone https://github.com/neobundy/pippaGPT.git

プロジェクトディレクトリに移動します。

   cd pippaGPT

必要な依存関係をインストールします。

   pip install -r requirements.txt

注：エラーが発生した場合は、 ffmpegやportaudioなどの追加の依存関係をインストールする必要がある場合があります。 MacOSでは、Homebrewを使用できます。
それらをインストールするには、次のコマンドを実行します。
brew install ffmpeg
brew install portaudio

プロジェクトのルートフォルダーに.envファイルにenv_sampleを作成またはコピーし、APIキーを追加します。

hugging_face_api_keyは将来使用するためのものであることに注意してください。

OPENAI_API_KEY=
XI_API_KEY=
HUGGING_FACE_API_KEY=
SERPAPI_API_KEY=

または、これらの環境変数を端末にエクスポートすることもできます。

characters_samply.pyをcharacters.pyにコピーしてファイルを編集してAIの名前と性格をカスタマイズします。
settings_private_sample.pyをsettings_private.pyにコピーします。 settings_sample.pyからsettings.pyに編集し、ファイルを編集して設定をカスタマイズします。
settings.pyファイルでLLMSモデルを選択します：

 DEFAULT_GPT_MODEL = "gpt-3.5-turbo"
DEFAULT_GPT_HELPER_MODEL = "gpt-3.5-turbo-16k"
DEFAULT_GPT_QA_HELPER_MODEL = "gpt-3.5-turbo-16k"

default_gpt_model-会話のメインモデル。
default_gpt_helper_model-要約バッファーメモリのモデル。
default_gpt_qa_helper_model-検索QAのモデル。

大規模なコンテキストには、より多くのトークンが必要です。ほとんどの場合、16Kトークンで十分です。

default_gpt_modelのGPT-4モデルは、より良い経験をするために強くお勧めしますが、10倍高価で、プリペイドOpenaiアカウントでのみ利用できることに注意してください。

Zep Vector Store ServerやAudio Server URLなど、 settings_private.pyにあるいくつかの機密またはユーザー固有の設定。

 ZEP_API_URL = "http://localhost:8000"
DEFAULT_MEMORY_TYPE = "Summary Buffer"
AUDIO_SERVER_URL = "http://localhost:5000"

思い出

デフォルトでは、Langchainの「要約バッファ」メモリは、会話のコンテキストを保持するために使用されます。

ピッパは6種類の記憶をサポートしています：

スライドウィンドウ：ConversationBufferWindowMemory-指定された数のメッセージを保持します。
トークンバッファー：ConversationTokenBufferMemory-特定の数のトークンに基づいてメッセージを保持します。
概要バッファ：Conversationsummarybuffermemory-すべてのメッセージも保存しながら、要約された履歴を保持します。
概要：Conversationsummarymemory-概要のみを保持します。
バッファ：ConversationBufferMemory-メッセージの歴史全体をそのまま保存する最も基本的なメモリタイプ。
Zep：ベクトルストア

Zepは、大きなコンテキストに強くお勧めします。 Dockerコンテナとしてローカルに実行できます。 settings_private.pyを編集します。

要約は、ZEPを含む概要タイプメモリが選択されたときに表示されます。要約は、要約GTPヘルパーモデルによって生成されます。

Zepがインデックスを作成して要約を生成するには時間がかかることに注意してください。準備ができていないとき、「要約...我慢してください。」メッセージが表示されます。

 ZEP_API_URL = "http://localhost:8000"

ZEPサーバーは、任意のホストまたはポートで実行できます。別のホストで実行する場合は、 settings_private.pyのZEP_API_URL変数を必ず更新してください。

https://www.getzep.com/にアクセスして、Zepを実行する方法を学びます。

アプリを実行します

Pippaアプリを実行するには、次のコマンドを使用します。

streamlit run main.py

アプリは、ポート5000に耳を傾けるオーディオサーバーを自動的に起動します。必要に応じて、 audio_server.pyを実行してオーディオサーバーを手動で実行できます。

あなたの文書を摂取します

Pippaが学習するために独自のドキュメントを摂取するには、次の手順に従ってください。

ドキュメント（PDF、DOCX、XLSX、TXT、MD、PY）をdocsフォルダーに配置します。
vectordb.pyスクリプトを実行して、Vectorデータベースを作成します。

   python vectordb.py

TTS/STTエンジン - イレブンラブ

ElevenLabs APIキーがある場合は、Pippaを使用してTTS（テキストからスピーチ）エンジンを使用できます。

STT（音声からテキスト）は、OpenaiのWhisper-1モデルによって処理されます。

次の手順に従ってください：

tts.pyスクリプトを実行して、ElevenLabsアカウントから利用可能なボイス名とIDを取得します。

   python tts.py

適切な音声IDを使用して、 settings_private.pyの次の変数を更新します。

 VOICE_ID_AI = ""
VOICE_ID_SYSTEM = ""
VOICE_ID_HUMAN = ""

TTS/STT機能は、フラスコオーディオサーバーとしてサポートされています。サーバーは、アプリが開始されると自動的に実行され、ポート5000でリッスンされます。 audio_server.pyを実行して、手動でサーバーを実行することもできます。
オーディオチェックボックスを使用すると、アプリはオーディオサーバーを使用してテキストをスピーチとスピーチに変換します。 Macでは、アプリがシステム設定でマイクを使用できるようにする必要があります。最初に使用すると、アプリがマイクの使用を許可するように求められます。
録画ボタンは録音を開始し、完了したら[停止]をクリックします。アプリは、録画されたオーディオを自動的にテキストに変換し、チャットボットに送信します。
TTS機能には、任意のメッセージに割り当てられた[スピーチ]ボタンをクリックします。アプリはテキストを自動的にスピーチに変換し、オーディオを再生します。
タイピングモードに戻るには、使用オーディオの使用チェックボックスをチェックしてください。

プロンプトキーワード

settings.pyファイルを編集して、Pippaで使用されるプロンプトキーワードプレフィックスをカスタマイズできます。

PROMPT_KEYWORD_PREFIX_SYSTEM ：一時的なシステムメッセージに使用（デフォルト： "System："）
PROMPT_KEYWORD_PREFIX_CI ：カスタム指示の置換に使用されます（デフォルト： "CI："）
PROMPT_KEYWORD_PREFIX_QA ： docsフォルダーのドキュメントに基づいて取得QAに使用されます（デフォルト： "QA："）
PROMPT_KEYWORD_PREFIX_GOOGLE ：指定された情報のWebの検索に使用されます（デフォルト： "Google："）
PROMPT_KEYWORD_PREFIX_WIKI ：Wikipediaの検索に使用（デフォルト： "wiki："）
PROMPT_KEYWORD_PREFIX_MATH ：数学クエリに使用されます（デフォルト： "Math："）
PROMPT_KEYWORD_PREFIX_MIDJOURNEY ：MidJourneyプロンプトの生成に使用されます（デフォルト： "Midjourney："）

会話とコンテキストウィンドウの管理方法と保存方法

スナップショットを取る：ピッパが応答するたびにスナップショットがキャプチャされます。このスナップショットには、コンテキストウィンドウだけでなく、会話全体が含まれます。
会話の保存：ユーザーが[会話のエクスポート]ボタンをクリックすると、会話フォルダーのJSONファイルとして会話が保存されます。
最後のユーザー入力：最新のユーザー入力は、TEMPフォルダー内のlast_user_input.mdファイルに保存されます。これは、入力をリセットする重要なアプリエラーが発生した場合に最後の入力を復元するために使用されます。
新しい会話の開始：新しい会話を開始するとき、コンテキストウィンドウと会話の両方がリセットされます。「ロード会話」ドロップダウンメニューから以前の会話を選択すると、JSONファイルがロードされ、コンテキストウィンドウが復元されます。ただし、会話全体を復元するには、アプリを再実行する必要があります。 ZEPは他のラングチェーンメモリタイプと互換性がないことに注意してください。進行中の会話中にZEPに切り替える場合は、コンテキストと会話全体をZEPのベクトルストアに復元するために、最新のスナップショットをロードしてください。

ストリーミングとコスト情報

ストリーミングはデフォルトで有効になります。それを無効にするには、次のようにsettings.pyファイルを変更します。

 STREAMING_ENABLED = True

ストリーミングが有効になっている場合、コストはOpenaiのドキュメントに基づいた近似です。正確なコストを取得するには、ストリーミングを無効にする必要があります。

コスト計算には、要約やQAなどの補助GPTモデルが発生する他の費用は含まれていないことに注意してください。

エージェント

settings.pyで次の定数を設定します：

 DEFAULT_GPT_AGENT_HELPER_MODEL = "gpt-4"

！️警告：この操作は、Openaiトークンの点で非常に高価です。

 MAX_AGENTS_ITERATIONS = 8

反復回数は、エージェントが実行される回数を決定します。一般に、より多くの反復がより正確な答えにつながりますが、より多くのトークンも消費します。

Google検索エージェントは、最良の回答を取得するために複数のクエリを実行する必要がある場合があることに注意してください。

たとえば、「韓国、米国、日本の首長の中で最も古いのは誰ですか？」と尋ねると、エージェントは最終回答を得るために少なくとも3〜4回照会する必要があります。

同じモデルが同じクエリに対して異なる反応をする場合があります。「GPT-4」でさえ常に最高のパフォーマンスを発揮するわけではありませんが、強くお勧めします。さまざまなモデルを試してください。

Langchainレベルであっても、非常に実験的であることに注意してください。期待どおりに機能しない場合があります。

Webを検索します

それはあなたのプロンプトスキルに応じて、ヒットまたはミスの状況です。 Google検索機能：https：//serpapi.comを使用するには、SERPAPI APIキーが必要です。提供された最終回答は、メインモデルの中間プロンプトとして機能します。

Wikipediaを検索します

エージェントは、最初に指定されたクエリの関連するウィキペディアページを見つけようとします。見つかった場合、ページの概要を返し、概要内で特定の用語を検索します。

数学

LLMSは数学の習熟度で知られていません。数学エージェントは、非常に複雑な数学の問題に対する正確な回答を提供します。

ベクターDBの管理

Vectorデータベースを管理するには、 vectordb.pyスクリプトを実行します。

   python vectordb.py

次のオプションがあります。

（c）Reate DB： settings.VECTORDB_COLLECTIONという名前のコレクションを備えたsettings.CHROMA_DB_FOLDERフォルダーに新しいベクトルデータベースを作成します。
（e）MBEDの会話： settings.CONVERSATION_SAVE_FOLDERフォルダーから会話をベクトルデータベースに埋め込み、長期メモリとして機能しました。
（d）Elete Collection：Vector Database Collectionを削除します。このアクションは、ベクトルデータベース自体を削除しません。
（q）db：loopのベクトルデータベースをクエリします。「終了」または「終了」を入力して、ループを終了します。

（e）MBED会話オプションを選択すると、既存のエクスポートされた会話のみが*.json snapshot.json除くVectorデータベースに埋め込まれることに注意してください。

トラブルシューティング

アプリを実行するときにエラーが発生した場合は、次の手順を試してください。

pip install --upgrade charset_normalizer
pip install --upgrade openai
pip install --upgrade langchain

ライセンス

PippaはApache 2.0ライセンスの下でリリースされます。個人または商業目的でコードを自由に使用、変更、配布してください。

拡大する

追加情報

バージョン v1.1 -
タイプその他のソースコード
更新時間 2025-03-07
サイズ 7.08MB
から Github

pippaGPT

Pippagpt-パーソナライズされた、摂取、持続性、多型、適応型GPTチャットボット

特徴

プロジェクトの背景

インストール

思い出

アプリを実行します

あなたの文書を摂取します

TTS/STTエンジン - イレブンラブ

プロンプトキーワード

会話とコンテキストウィンドウの管理方法と保存方法

ストリーミングとコスト情報

エージェント

Webを検索します

Wikipediaを検索します

数学

ベクターDBの管理

トラブルシューティング

ライセンス

Google Dorks

shepherd

mongo express

hidusbf

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express