dspy arxiv
1.0.0
PDFSから機能を抽出するためのDSPYの使用を調べてください。このリポジトリは、このフレームワークを使用してArxivのコンピューターサイエンスペーパーのサブカテゴリを予測する方法の簡単な例を提供します。
データセットは、コンピューターサイエンスカテゴリから150のArxiv論文(メタデータ + PDF)の選択です。
データベースを構築するには:
dspy-arxivディレクトリにダウンロードします。arxiv.jsonに変更します。data.ipynb上から下に実行します。最後に、2つのディレクトリが必要です。
PipelineにRAGを追加する場合は、高速検索のためにVectorデータベースにデータを用意するのが便利です。 ChromAdbをセットアップしてArxivメタデータを入力するためのサンプルスクリプトについては、データベースをご覧ください。
Notebook feature.ipynbは、DSPYを使用して機能抽出のためにLLMをプログラム的に促す方法に関する簡単なチュートリアルと見ることができます(この場合、ARXIVのコンピューターサイエンスペーパーのサブカテゴリを予測します)。
また、このノートブックから生成されたスライドをご覧ください。