(Este es un POC) Un agente con humano en el bucle que puede buscar información en la Web mientras evita la detección de BOT para sitios privados.
Para comenzar con el repositorio, deberá configurar las variables de entorno necesarias. En particular, deberá crear y establecer las siguientes variables de entorno:
El GPT-3.5 de Openai se usa de forma predeterminada, pero puede usar otros modelos de soporte de Langchain.
* Zenrows: https://zenrows.com
Además, deberá asegurarse de que las dependencias estén instaladas:
python3 -m pip install requirements.txt
Una vez que haya configurado las variables de entorno necesarias e haya instalado el paquete Langchain, puede comenzar a usar el chatbot. Simplemente ejecute el archivo main.py:
python3 main.py
El chatbot le pedirá que siga ciertos requisitos para lograr su objetivo. Si el objetivo no está claro o no está proporcionado, el chatbot le pedirá que le solicite a un "humano" (usted) usando la herramienta "humana", que se incluye de forma predeterminada. Si el objetivo aún no está claro o no está lo suficientemente detallado, el chatbot le pedirá que le solicite al "humano" que proporcione más información.
El chatbot también incluye una herramienta personalizada llamada Ninjasearch que está diseñada para evitar la detección de bot para sitios web privados. La herramienta raspará la URL especificada y devolverá un resumen del contenido de la página.
La herramienta resume la respuesta de la URL en los siguientes pasos:
RecursiveCharacterTextSplitterRetrievalQA ) de LLM y DB para que podamos hacer preguntas del contenido de la página. Si desea contribuir a este proyecto, envíe una solicitud de extracción en GitHub.