Este proyecto busca enseñarle cómo construir aplicaciones de Python con funcionalidad de IA generativa utilizando las bibliotecas Langchain y Transformers.
Si bien hay una sección para OpenAI, la mayor parte del código que anteriormente existía allí se ha reutilizado e integrado con las bibliotecas Langchain o Transformers. Este proyecto incluye fragmentos de código, ejemplos de paquetes y cuadernos Jupyter que puede aumentar, copiar o aprender respectivamente.
Si es nuevo en la construcción de aplicaciones con AI, le sugiero que comience jugando y ejecutando el código en los cuadernos Langchain. Ver el código en acción, editarlo usted mismo y hacer una lluvia de ideas creadoras de nuevas ideas es la mejor manera de aprender.
A continuación encontrará enlaces y descripciones de secciones de este proyecto para una fácil navegación.
Este readme:
Langchain:
Fragmentos de código: aquí encontrará componentes de Python enchufables.
Cuadernos: aquí encontrará cuadernos Jupyter que lo guían a través del uso de muchas clases de Langchain diferentes.
MergedDataLoader . En este cuaderno, aprendemos cómo clonar los repositorios de GitHub y raspar la documentación web antes de integrarlos en una tienda vectorial que luego usamos como un retriever. Al final, debe sentirse cómodo usando cualquier fuente como contexto en sus propios proyectos de trapo.Ejemplos de fin a final: Aquí encontrará scripts hechos para funcionar fuera de la caja.
DirectoryLoader para cargar archivos para consultar.PypdfDirectoryLoader para cargar archivos para consultar.FacebookAISimilaritySearch para cargar archivos para consultar.Pinecone "Índice" como un retriever y chatee con sus documentos.OpenAi:
Fragmentos de código: aquí encontrará fragmentos de código utilizando la biblioteca Operai Python.
Cuadernos: aquí encontrarás cuadernos Jupyter que te muestran cómo usar la biblioteca Operai Python.
Transformadores:
Fragmentos de código: aquí encontrará fragmentos de código usando la biblioteca Transformers Python.
pipeline .Cuadernos: aquí encontrarás cuadernos Jupyter que te muestran cómo usar la biblioteca Transformers Python.
Paquetes: aquí encontrará aplicaciones CLI.
Este proyecto se desarrolla utilizando PDM. Puede instalar PDM usando pip :
Comience por navegar al directorio raíz de este proyecto, luego ejecute:
pip install -U pdmEntonces deberá instalar las dependencias usando PDM:
pdm install Este comando creará un entorno virtual en .venv e instalará las dependencias en ese entorno. Si está en MacOS o Linux, puede ejecutar source .venv/bin/activate para activar el entorno. De lo contrario, puede ejecutar el comando .venv/Scripts/activate o .venv/Scripts/activate.ps1 para activar el entorno.
Al utilizar un entorno virtual, evitamos la contaminación cruzada de nuestro entorno global de Python.
Una vez que nuestro entorno virtual está configurado, necesitamos seleccionarlo como nuestro núcleo para el cuaderno Jupyter. Si está en VScode, puede hacerlo en la parte superior derecha del cuaderno. Si está utilizando un IDE diferente, deberá buscar ayuda de configuración en línea.
Al seleccionar el núcleo, asegúrese de elegir el que se encuentra dentro del directorio .venv , y no el entorno global de Python.
Si es totalmente nuevo en la creación de aplicaciones con acceso a IA con acceso a datos externos, específicamente la generación de recuperación aumentada, consulte el cuaderno de conceptos básicos de RAG. Es el cuaderno más directo, y sus conceptos se basan en cualquier otro cuaderno de 'trapo'.
Haga clic en la insignia a continuación para abrir el cuaderno básico de RAG en Colab.