langchain learningダウンロードlangchain learningソースコードのダウンロード

langchain learning

その他のソースコード

1.0.0

ダウンロード

Langchain-Learning

Langchainの研究ノート。頼る：

 openai == 0.27 . 8
langchian == 0.0 . 225

Langchainに似たいくつかのツール：

Danswer-ai/Danswer：自然言語で質問し、Slack、Github、Confluenceなどのツールにバックアップされます。

記事

注：LangchainまたはLangchain-Chatglmの更新により、いくつかのソースコードと説明が異なる場合があります。

いくつかの記事は、リンクを直接掲載し、インターネットから収集しました。

Langchainコンポーネントデータ接続
LangchainコンポーネントモデルIO（モデルIO）
ラングチェーンコンポーネントチェーン
ラングチェーンコンポーネントエージェント
Langchainコンポーネントメモリ
Langchainコンポーネントコールバック
langchain.mdのChatopenaiの後ろに行われています
langchain.load.serializable.py.md
Langchainのいくつかのschema.md
langchain.mdでchatgptのインターフェイスを呼び出す方法
Langchain構造化出力の背後にある原則、MD
langchain.mdでメモリはどのように機能しますか
出力が道徳的期待を満たすことを保証する方法
langchain.mdのllmrouterchainの原理
langchain.mdの埋め込みRouterchain原理
Langchain Integration gptcache.md
Langchain Integrated Mivus Vector Database.md
Langchain.mdのStreamingStdoutCallbackhandler原理
Pydantic.mdの構成の一部の構成
PydanticのSerializableおよびroot_validator.md
python.mdで一般的に使用される魔法の方法
一般的に使用されるPython Typing.md
python.mdの部分的な機能の使用
python.mdでの検査の署名の使用
PythonのArgsとKwargs.md
なぜラングチェーンをあきらめたのですか？ -Zhihu（Zhihu.com）

現在、Langchainに基づいた2つの中国のプロジェクトがあります。

https://github.com/yanqiangmiffy/chinese-langchain
https://github.com/imclumsypanda/langchain-chatglm

私たちはそれから多くを学ぶことができます。

langchain-chatglm

api.mdを使用してlangchain-chatglmを展開する基本
document.mdをアップロードするときに何が起こったのか
Huggingfacembeddings.mdについて
inmemorydocstore.mdについて
CharateTextSplitter.mdについて
textloader.mdについて
Bingの検索インターフェイスを呼び出す方法について
Queryによると、関連するdoc.mdを取得するという原則
クエリドキュメントとクエリに基づいてpropt.mdを生成します
propt.mdに従ってモデルを使用して結果を生成します
ChatGpt小規模なchatglm-6bローカライズされた展開、ローカルナレッジベースエクスペリエンスへのアクセス|

中国の例

カスタマイズされた中国のLLMモデル
カスタマイズされた中国のチャットモデル
中国のsplitter.mdを使用します
クエリdocs.md Queryに従って
Mini-Langchain-chatglm.md
Xiaoai Classmate Assistant.mdのシンプルなバージョンを作成します
chatglmはエージェントコントロールを実装しています
ベクトル検索拡張チャットグラウムズ生成 - ESと組み合わせて
ナレッジグラフ抽出LLM -Zhihu（Zhihu.com）

英語の例

openai emple.md（テキスト翻訳）を使用してlangchain
Openai Call Chatgpt emple.md
Langchainは結果を解析し、output.mdをフォーマットします
Memory.mdとのLangchainダイアログ
langchain.mdで異なるチェーンを使用します
LangchainドキュメントベースのQ＆A MD
GGMLとLangchainを使用して、CPUでQuantized LAMA2を実行します
オープンソースモデルのローカル展開に関する完全なチュートリアル：langchain + streamlit + llama -zhihu（zhihu.com）

PROMEST.MDを促します

最適化されたプロップは、それをチェックすることができます。

yzfly/langgpt：langgpt：プロンプトのプロンプト、構造化されたプロンプトワードになるようになります。（github.com）：構造化された高品質のプロップを構築します

Langchainにはいくつかの問題があるかもしれません

Langchainは私たちにいくらかの利便性を提供しますが、いくつかの問題もあります。

大規模なモデルの基本技術の問題は解決することはできません。主にProptの再利用の問題です。まず第一に、大規模なモデルの多くの問題は大規模なモデルの基本技術の欠陥であり、Langchainが解決できるものではありません。中心的な問題は、大規模なモデル開発の主な作業がProptエンジニアリングであることです。そして、これは非常に再利用可能です。ただし、これらの機能にはすべて、非常にカスタマイズされた手書きのプロップが必要です。チェーン内のすべてのステップには、手書きのプロップが必要です。入力データは、その関数/チェーンステップの適切な出力を生成するために、非常に具体的な方法でフォーマットする必要があります。これらのチェーンを実行するためにDAGオーケストレーションをセットアップすると、作業の5％のみが占められており、作業の95％は実際に調整とデータのシリアル化形式を促すだけです。これらのことは再利用できません。
Langchainの不十分な抽象化と隠れたごみproptは開発の困難を引き起こします。簡単に言えば、Langchainの抽象化作業は十分ではないため、多くの手順を自分で構築する必要があります。さらに、Langchainの組み込みの小道具の多くは悪いので、自分で構築するほど良くありませんが、これらのデフォルトの小道具を隠しています。
Langchainフレームワークはデバッグが困難です。Langchainの多くの方法は、詳細情報を印刷するためのパラメーターを提供しますが、実際にはあまり価値のある情報がありません。たとえば、実際のPROPTまたはLLMクエリを見たい場合は非常に困難です。理由は以前と同じです。したがって、Langchainを使用して開発が悪化し、コードをデバッグしてどのプロンプトに問題があるかを確認したい場合は、難しいでしょう。
Langchainはツールのロックを奨励しています。Langchainは、ユーザーがプラットフォームで開発および操作することを奨励していますが、ユーザーがLangchainドキュメントでカバーされていないワークフローを実行する必要がある場合は、カスタムプロキシを使用しても変更することは困難です。これは、ユーザーがLangchainの使用を開始すると、Langchainの特定のツールや機能に限定され、ニーズにより適した他のツールやプラットフォームに簡単に切り替えることができないことを意味します。

上記のコンテンツは次のとおりです。

Langchainは無意味です|
Langchainを使用して大きなモデル開発を行うことに関するいくつかの問題：Hacker Newsからの激しい議論〜

一部の単純なタスクに関連するプロセスを自分で実装できる場合があり、各部分が自分で制御され、変更が容易になる場合があります。

Langchainを使用して複雑なタスクを解決します

方法1：ドメイン微調整LLM

ドメインデータを使用したLLMの微調整は、コンピューティングリソースとモデルパラメーターのサイズによって制限され、モデルは噂されます。これには、一連の問題が含まれます。

データを取得する方法とデータのクリーンアップ方法。
単語分詞を使用する方法は何ですか。
モデルが採用するアーキテクチャ、トレーニング方法、モデルの評価方法。
モデルを効果的に推測する方法とそれを展開する方法。
ドメインプリトレーニング、ドメイン命令微調整、報酬モデル、および結果アライメント。

方法2：Langchain + LLM +ツール

基本的なアイデア：

1。ユーザーの質問：製品ESTEE LAUDERTソフト修理スキンケアのエッセンスとSK-IIスキンケアのエッセンスを比較してください。

2。ルーターチェーンの問題ルーティング、つまり、質問への回答方法：（ LLMを1回電話）

ルーターチェーンは、適切なソリューションに一致しない場合、LLMまたは埋め込みである可能性があります。
ここでは、製品の比較の問題を一致させ、ソリューションを取得します。（1）製品検索ツールを呼び出して、各製品の紹介を取得します。（2）これらの製品を検索結果を通して比較します。

3.プランナーを使用してステップを生成します：（ LLMを1回呼び出します）

次のようなソリューションに従って適切な手順を生成します。（2）SK-IIスキンケアのエッセンスを検索します。（3）上記の製品を比較します。

4。執行者エグゼキューターは上記の手順を実行します：（コールステップLLM、nは、コールの最大数を示すハイパーパラメーターです）

ツールを提供する必要があり、各ステップの問題は、各ツールの呼び出しパラメーターを生成するためにLLMと呼ばれる必要があります。
結果を取得するにはツールを呼び出します。

5。すべての結果の概要。（LLMに一度電話）

方法3：Langchain + LLM +検索

スキーム1と比較して、ツールを使用せずに、データベースは質問に基づいて直接検索され、取得された結果に回答します。

検索方法は、特定の質問のキーワードに基づいており、ESツールを使用して、大規模なデータベースからの可能な回答でTOPK段落を取得します。これらのTOPK段落を質問とともにLLMに送信して回答します。

検索方法は、最初にベクトル形式に変更されます。すべての既知の情報は、300語に応じて小さな段落に分割されます。これらの段落は、ユーザーの質問をベクトルにエンコードし、これらのパラグラフを検索して、これらの段落を獲得します。

上記の方法の利点と短所：

フィールド微調整LLM ：フィールドでデータとQ＆Aを収集するには多くの人材が必要であり、微調整するには多くのコンピューティング能力が必要です。

LANGCHAIN + LLM + TOULS ：LANGCHAINは、プランナーとエグゼキューターの脳です。問題やツールに基づいてツールを呼び出す場合、LLMの生成は信頼できません。ツールをうまく利用できません。指示に従って適切なツールを呼び出すことはできない場合があり、計画は貧弱で制御が困難な場合があります。利点は次のとおりです。複雑な問題を解決するために使用されます。

Langchain + LLM +検索：利点は現在のフィールドの主流の問題と回答の構造であり、不利な点は、質問に基づいて回答を検索するときに答えを含む可能性のある段落の検索が不正確である可能性があることです。複雑な質問や回答には適していません

要約：最大の問題はLLM自体です：

LLM出力の制御不能性は、後続のステップで逸脱につながります。
LLMのコンテキスト入力の長さ：長さは10億以上に拡張できます。
LLMのトレーニングのコスト：手動の収集と並べ替えに加えて、トレーニングのためにも大規模なモデルを生成できます。
LLM展開の問題：量子化、圧縮、分散型の展開、C ++を使用した展開など、推論を加速する多くの方法もあります。

LLMはシステム全体のベースであり、多くの大規模な中国語モデルがオンラインで開かれていますが、それらのほとんどはスマートな脳を持ちたい場合、モデルのパラメーターの数を保証する必要があります。

上記のリファレンス：https：//mp.weixin.qq.com/s/fvrchit0c0xhysco_d-sda

拡張

考えるためにいくつかの質問を残してください：それはLangchainまたは大きなモデルに関連している可能性があります

**垂直フィールドのデータに基づいて中国の大きなモデルを選択する方法は？ ** 1。 2。各レビューのランキングバージョンによると。 3。独自のフィールドデータを評価します。 4.財務モデル、法的モデル、医療モデルなど、既存の垂直フィールドモデルから抽選
**データへの回答は、一連の接続された文で構成されています。 **例えば：
```
怎么能够解决失眠？
1 、保持良好的心情；
2 、进行适当的训练。
3 、可适当使用药物。
```
1.分割されたテキストの長さを大きくするようにしてください。 2。答えが分割されないようにするために、異なる段落間で特定のテキストを繰り返すように設定できます。 3.最初のTOP_Kドキュメントは、検索中に返すことができます。 4. Fusion LLMを使用して、それらを見つけて要約した複数のテキスト。
垂直フィールドに埋め込みを構築する方法は？
取得した埋め込みを保存する方法は？
LLMをよりよく考えるように導く方法は？使用できます。

参照してください

はじめに|
APIリファレンス - ?? LANGCHAIN 0.0.229
https://mp.weixin.qq.com/s/fvrchit0c0xhysco_d-sda
https://python.langchain.com.cn/docs/modules/agents/how_to/custom_llm_chat_agent

拡大する

追加情報