dspy arxiv
1.0.0
探索使用DSPY從PDF中提取功能的使用。該存儲庫提供了一個簡單的示例,說明如何使用此框架來預測Arxiv的計算機科學紙的子類別。
該數據集是從計算機科學類別中選擇的150份ARXIV論文(元數據 + PDF)。
構建數據庫:
dspy-arxiv目錄中。arxiv.json 。data.ipynb從上到下。最後,您應該有兩個目錄:
如果要在管道中添加抹布,則將數據放在矢量數據庫中以進行快速檢索很方便。查看Database.py ,以獲取一個示例腳本以設置Chromadb並用Arxiv Metadata填充它。
筆記本功能。 IPYNB可以看作是一個簡單的教程,講述瞭如何使用DSPY來編程提示LLM進行功能提取(在這種情況下,預測ARXIV的計算機科學論文的子類別)。
您還可以查看此筆記本產生的幻燈片。