BYOSC Build Your Own Scalable Chatbotsビルドダウンロード-BYOSC BYOSC Build Your Own Scalable Chatbotsする

BYOSC Build Your Own Scalable Chatbots

AI ソースコード

1.0.0

ダウンロード

byosc-build-yourownown-scalable-chatbots

導入

大学の試験の準備の際、パートナーを持つことは、授業中に扱われたトピックに関する知識のギャップを発見し、明確にするために不可欠であることが証明されています。 ChatGpt、Phind、ClodなどのLLMに基づいたチャットボットはすでに学生に助けを提供していますが、学生の大学コースで講義/素材固有のヘルプを提供することはできません。特定のコースの特定の素材でチャットボットを微調整するシステムを作成することを提案します。このおかげで、典型的な大学生のコースの研究仲間を作成し、疑問に答えたり、質問を生み出したりすることができます！

このリンクでチャットボットをテストすることができます。

チャット

プロジェクトの暗黙の範囲（およびコース全体）は、MLOPをホストできるスケーラブルなインフラストラクチャを構築することです。このため、従来のモノリシックMLパイプラインは、機能パイプライン、トレーニングパイプライン、推論パイプラインの3つの異なるプロセスに分割されています。

機能パイプライン

機能パイプラインが担当しています。

パブリック共有フォルダーから新しい利用可能なファイルをダウンロードします
ファイルのトランスクリプトを生成します
Hopsworksに新しいトランスクリプトをアップロードします
GPT 3.5 APIを使用して、基礎モデルの微調整のための有効な命令セットを生成する
このような命令をHopsworksにアップロードします

機能パイプラインの実行

機能パイプラインを実行するには、いくつかのオプションがあります。

FeaturePipeline/Reading.ipynbノートブックを実行します
python3 FeaturePipeline/FeaturePipeline.pyを使用してpython3 FeaturePipeline/FeaturePipeline.pyを実行します

後者のコピーは、Modal [run | deploy] FeaturePipeline/FeaturePipeline_modal.pyを使用してモーダルホスティングサービスで実行可能にするためにmodal [run|deploy] FeaturePipeline/FeaturePipeline.pyファイルでわずかに変更されています。

トレーニングパイプライン

トレーニングパイプラインは次の担当です。

Hopsworksから命令セットを取得します
PEFTとLORAテクニックを使用してトレーナーインスタンスを設定する
トレーニングを実行します
結果をHuggingfaceにアップロードします

トレーニングパイプラインの実行

トレーニングパイプラインを実行するには、ノートブックTrainingPipeline/FineTuning.ipynbを実行します

推論パイプライン

推論パイプラインは以下を担当しています

Streamlit + Langchainを使用して、チャットボットインターフェイスを実行します
Hopsworksから素材のトランスクリプトをダウンロードします
文Bertを使用して、元の素材の埋め込みを計算します
Sente Bertを使用したユーザーの質問の埋め込みを計算します
特定の質問のために、最高のマッチング資料を取得します
ぼろきれを使用してチャットボットの応答を拡張します

推論パイプラインの実行

推論パイプラインを実行するには、 streamlit run chatbot_app.pyを実行します

結論

実験的には、微調整プロセスは、ファインチューニングされていないモデルよりも一貫して基礎モデルを優れたものにするのに十分ではありませんが、Rag対応のチャットボットは、元の素材に従ってユーザーの質問に正しく答えることができるだけでなく、（ほとんど）回答がどこから取られているか、大学の試験を勉強するための本質的な機能を（ほとんど）正しい参照を与えることもできます。