langchain learning下載 - langchain learning源代碼下載

langchain learning

其他源碼

1.0.0

下載

langchain-learning

langchain的學習筆記。依賴：

 openai == 0.27 . 8
langchian == 0.0 . 225

和langchain相類似的一些工具：

danswer-ai/danswer: Ask Questions in natural language and get Answers backed by private sources. Connects to tools like Slack, GitHub, Confluence, etc.

文章

注意：由於langchain或langchain-ChatGLM的更新，可能導致部分源碼和講解的有所差異。

有的一些文章直接放的是一些鏈接，從網上收集整理而來。

langchain組件-數據連接(data connection)
langchain組件-模型IO(model IO)
langchain組件-鏈(chains)
langchain組件-代理(agents)
langchain組件-內存(memory)
langchain組件-回調(callbacks)
langchain中ChatOpenAI背後做了什麼.md
langchain.load.serializable.py.md
langchain中的一些schema.md
langchain中是怎麼調用chatgpt的接口的.md
langchain結構化輸出背後的原理,md
langchain中memory的工作原理.md
langchain怎麼確保輸出符合道德期望.md
langchain中路由鏈LLMRouterChain的原理.md
langchain中的EmbeddingRouterChain原理.md
langchain集成GPTCache.md
langchain集成Mivus向量數據庫.md
langchain中的StreamingStdOutCallbackHandler原理.md
pydantic中config的一些配置.md
pydantic中的Serializable和root_validator.md
python中常用的一些魔術方法.md
python的typing常用的類型.md
python中functools的partial的用法.md
python中inspect的signature用法.md
python中args和kwargs.md
我為什麼放棄了LangChain？ - 知乎(zhihu.com)

目前基於langchain的中文項目有兩個：

https://github.com/yanqiangmiffy/Chinese-LangChain
https://github.com/imClumsyPanda/langchain-ChatGLM

我們從中可以學到不少。

langchain-ChatGLM

使用api部署langchain-chatglm的基本原理.md
上傳文檔時發生了什麼.md
關於HuggingFaceEmbeddings.md
關於InMemoryDocstore.md
關於CharacterTextSplitter.md
關於TextLoader.md
關於怎麼調用bing的搜索接口.md
根據query得到相關的doc的原理.md
根據查詢出的docs和query生成prompt.md
根據prompt用模型生成結果.md
ChatGPT小型平替之ChatGLM-6B本地化部署、接入本地知識庫體驗| 京東雲技術團隊

中文例子

定制中文LLM模型
定制中文聊天模型
使用中文splitter.md
根據query查詢docs.md
mini-langchain-ChatGLM.md
打造簡易版類小愛同學助手.md
chatglm實現agent控制.md
向量檢索增強chatglm生成-結合ES
知識圖譜抽取LLM - 知乎(zhihu.com)

英文例子

langchain使用openai例子.md（文本翻譯）
openai調用chatgpt例子.md
langchain解析結果並格式化輸出.md
langchain帶有記憶的對話.md
langchain中使用不同鏈.md
langchain基於文檔的問答md
使用GGML和LangChain在CPU上運行量化的llama2
本地部署開源大模型的完整教程：LangChain + Streamlit+ Llama - 知乎(zhihu.com)

prompt工程.md

一個優化的prompt對結果至關重要，感興趣的可以去看看這個。

yzfly/LangGPT: LangGPT: Empowering everyone to become a prompt expert! Structured Prompt，結構化提示詞。 (github.com)：構建結構化的高質量prompt

langchain可能存在一些問題

雖然langchain給我們提供了一些便利，但是也存在一些問題：

無法解決大模型基礎技術問題，主要是prompt重用問題：首先很多大模型應用的問題都是大模型基礎技術的缺陷，並不是LangChain能夠解決的。其中核心的問題是大模型的開發主要工作是prompt工程。而這一點的重用性很低。但是，這些功能都需要非常定制的手寫prompt 。鏈中的每一步都需要手寫prompt。輸入數據必須以非常特定的方式格式化，以生成該功能/鏈步驟的良好輸出。設置DAG編排來運行這些鏈的部分只佔工作的5%，95%的工作實際上只是在提示調整和數據序列化格式上。這些東西都是不可重用的。
LangChain糟糕的抽象與隱藏的垃圾prompt造成開發的困難：簡單說，就是LangChain的抽象工作不夠好，所以很多步驟需要自己構建。而且LangChain內置的很多prompt都很差，不如自己構造，但是它們又隱藏了這些默認prompt。
LangChain框架很難debug ：儘管LangChain很多方法提供打印詳細信息的參數，但是實際上它們並沒有很多有價值的信息。例如，如果你想看到實際的prompt或者LLM查詢等，都是十分困難的。原因和剛才一樣，LangChain大多數時候都是隱藏了自己內部的prompt。所以如果你使用LangChain開發效果不好，你想去調試代碼看看哪些prompt有問題，那就很難。
LangChain鼓勵工具鎖定：LangChain鼓勵用戶在其平台上進行開發和操作，但是如果用戶需要進行一些LangChain文檔中沒有涵蓋的工作流程，即使有自定義代理，也很難進行修改。這就意味著，一旦用戶開始使用LangChain，他們可能會發現自己被限制在LangChain的特定工具和功能中，而無法輕易地切換到其他可能更適合他們需求的工具或平台。

以上內容來自：

Langchain Is Pointless | Hacker News (ycombinator.com)
使用LangChain做大模型開發的一些問題：來自Hacker News的激烈討論~

有時候一些簡單的任務，我們完全可以自己去實現相關的流程，這樣每一部分都由我們自己把控，更易於修改。

使用langchain解決複雜任務

方法一：領域微調LLM

使用領域數據對LLM進行微調，受限於計算資源和模型參數的大小，而且模型會存在胡言亂語的情況。這裡面涉及到一系列的問題：

數據怎麼獲取，怎麼進行數據清理。
分詞使用什麼方式。
模型採用什麼架構，怎麼訓練，怎麼評估模型。
模型怎麼進行有效推理，怎麼進行部署。
領域預訓練、領域指令微調、獎勵模型、結果對齊。

方法二：langchain + LLM + tools

基本思路：

1、用戶提問：請對比下商品雅詩蘭黛特潤修護肌活精華露和SK-II護膚精華？

2、RouterChain問題路由，即使用哪種方式回答問題：（調用一次LLM）

RouterChain可以是一個LLM，也可以是一個embedding，去匹配到合適的解決方案，如果沒有匹配到任何解決方案，則使用模型內部知識進行回答。
這裡匹配到商品對比這一問題，得到解決方案：（1）調用商品搜索工具得到每一個商品的介紹。（2）通過搜索結果對比這些商品。

3、使用Planner生成step：（調用一次LLM）

根據解決方案生成合適的steps，比如：（1）搜索雅詩蘭黛特潤修護肌活精華露。（2）搜索SK-II護膚精華。（3）對比上述商品。

4、執行者Executer執行上述步驟：（調用steps次LLM，n是超參數表明調用的最大次數）

需要提供工具，每個step的問題，需要調用llm生成每個工具的調用參數。
調用工具獲取結果。

5、對所有的結果進行匯總。（調用一次LLM）

方法三：langchain + LLM + 檢索

相比於方案1，不使用工具，直接根據問題進行對數據庫進行檢索，然後對檢索到的結果進行回答。

檢索的方式可以是基於給定問題的關鍵字，使用ES工具從海量數據庫中檢索到可能存在答案的topk段落。把這topk個段落連同問題一起發送給LLM，進行回答。

檢索的方式改成向量的形式，先對所有已知資料按照300個字切分成小的段落，然後對這些段落進行編碼成向量，當用戶提問時，把用戶問題同樣編碼成向量，然後對這些段落進行檢索，得到topk最相關的段落，把這topk個段落連同問題一起發送給LLM，進行回答。

上述方法的優缺點：

領域微調LLM ：需要耗費很多的人力收集領域內數據和問答對，需要耗費很多算力進行微調。

langchain + LLM + tools ：是把LLM作為一個子的服務，LangChain作為計劃者和執行者的大腦，合適的時機調用LLM，優點是解決複雜問題，缺點是不可靠。 LLM生成根據問題和工具調用工具獲取數據時不可靠。可以不能很好的利用工具。可能不能按照指令調用合適的工具，還可能設定計劃差，難以控制。優點是：用於解決複雜的問題。

langchain + LLM + 檢索：優點是現在的領域內主流問答結構，缺點：是根據問題對可能包含答案的段落檢索時可能檢索不准。不適用於復雜問答

總結：最大的問題還是LLM本身：

LLM輸出的不可控性，會導致後續步驟出現偏差。
LLM的輸入的context的長度問題：目前已經可以把長度推廣到10億以上了。
訓練一個LLM需要的成本：對於數據而言，除了人工收集整理外，也可以使用大模型進行生成；對於訓練而言，目前也有不少基於參數有效微調的例子。
LLM的部署問題：也已經有不少加速推理的方法，比如量化、壓縮、使用分佈式進行部署、使用C++進行部署等。

LLM是整個系統的基座，目前還是有不少選擇的餘地的，網上開源了不少中文大語言模型，但大多都是6B/7B/13B的，要想有一個聰明的大腦，模型的參數量還是需要有保證的。

以上參考：https://mp.weixin.qq.com/s/FvRchiT0c0xHYscO_D-sdA

擴展

留出一些問題以待思考：可能和langchain相關，也可能和大模型相關

**怎麼根據垂直領域的數據選擇中文大模型？ **1、是否可以商用。 2、根據各評測的排行版。 3、在自己領域數據上進行評測。 4、借鑒現有的垂直領域模型的選擇，比如金融大模型、法律大模型、醫療大模型等。
**數據的一個答案由一系列相連的句子構成，怎麼對文本進行切分以獲得完整的答案？ **比如：
```
怎么能够解决失眠？
1 、保持良好的心情；
2 、进行适当的训练。
3 、可适当使用药物。
```
1、盡量將劃分的文本的長度設置大一些。 2、為了避免答案被分割，可以設置不同段之間可以重複一定的文本。 3、檢索時可返回前top_k個文檔。 4、融合查詢出的多個文本，利用LLM進行總結。
怎麼構建垂直領域的embedding？
怎麼存儲獲得的embedding？
如何引導LLM更好的思考？可使用： chain of thoughts、self ask、ReAct ，具體介紹可以看這一篇文章：https://zhuanlan.zhihu.com/p/622617292 實際上，langchain中就使用了ReAct這一策略。

參考

Introduction | ?️? Langchain
API Reference — ?? LangChain 0.0.229
https://mp.weixin.qq.com/s/FvRchiT0c0xHYscO_D-sdA
https://python.langchain.com.cn/docs/modules/agents/how_to/custom_llm_chat_agent

展開

附加信息

版本 1.0.0
類型其他源碼
更新時間 2025-02-28
大小 9.25MB
來自於 Github

相關應用

Parameter Efficient Transfer Learning Benchmark

2024-11-06
GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
PHP5學習(Learning PHP)

2009-05-24
OReilly 學習 PHP 和 MySQL 第二版

2009-05-24

爲您推薦

chat.petals.dev

其他源碼

1.0.0
GPT Prompt Templates

其他源碼

1.0.0
GPTyped

其他源碼

GPTyped 1.0.5
Google Dorks

其他源碼

1.0
shepherd

其他源碼

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

其他源碼

1.0.0
Google Dorks

其他源碼

1.0
shepherd

其他源碼

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

其他源碼

1.0.0

相關資訊全部