O Framework Docs AI é uma poderosa solução SaaS que revoluciona o gerenciamento de documentação para várias estruturas. Ele raspa perfeitamente a documentação da estrutura, cria uma base de conhecimento abrangente e utiliza modelos avançados de linguagem para fornecer respostas precisas e baseadas em recuperação às consultas do usuário.
Clone o repositório:
git clone https://github.com/yourusername/framework-docs-ai.git
cd framework-docs-ai
Instale as dependências necessárias:
pip install -r requirements.txt
Configure sua chave de API do OpenAI:
.env no diretório raiz OPENAI_API_KEY=your_api_key_here
Execute o aplicativo:
python app.py
Abra o navegador da web e navegue para o URL local fornecido (geralmente http://localhost:8501 ).
Comece a explorar a documentação da estrutura e a fazer perguntas!
Você pode adicionar suas próprias estruturas personalizadas aos documentos da estrutura. Siga estas etapas:
Rastreie os URLs (Crawler.py) :
crawler.py usa uma classe DomainCrawler para rastejar sites e coletar URLs. CONFIGS = [
{
"start_url" : "https://your-framework-docs-url.com" ,
"docs_path" : "/" ,
"avoid_keywords" : [ "blog" , "about" , "community" ]
},
# You can add multiple configurations for different sections of your documentation
]
OUTPUT_PATH = "data/Crawled_url/"
FILE_NAME = "YOUR_FRAMEWORK_crawled.json"CONFIGS :start_url : o URL base da documentação da sua estrutura.docs_path : o caminho específico onde a documentação é iniciada.avoid_keywords : lista de palavras -chave a serem evitadas em URLs (por exemplo, postagens de blog, páginas da comunidade).OUTPUT_PATH e FILE_NAME conforme necessário.docs_path especificado.crawler.py para salvar os URLs rastejados no arquivo de saída especificado.Raspe o conteúdo :
scrape.py para extrair conteúdo dos URLs rastejados.scrape.py para corresponder à sua nova estrutura: if __name__ == "__main__" :
Scrape ( "data/Crawled_url/YOUR_FRAMEWORK_crawled.json" , "data/Scraped_data/YOUR_FRAMEWORK_scraped.json" )scrape.py para salvar o conteúdo raspado no diretório data/Scraped_data .Converter em formato de documento Langchain :
save.py para converter o JSON raspado em um arquivo de picles compatível com o esquema de documentos de Langchain.save.py : if __name__ == "__main__" :
convert_json_to_pkl ( 'data/Scraped_data/YOUR_FRAMEWORK_scraped.json' , 'data/Scraped_data/YOUR_FRAMEWORK_scraped.pkl' )save.py para criar o arquivo de picles. Atualizar app.py :
kb_manager_your_framework = initialize_kb ( "Your Framework Name" , "./Vector_DB/YOUR_FRAMEWORK" , "data/Scraped_data/YOUR_FRAMEWORK_scraped.pkl" ) assistant_your_framework = create_assistant ( "Your Framework Name" , api_key , kb_manager_your_framework ) if kb_manager_your_framework else None options = [ "Langchain Python" , "Next.js" , "Vue.js" , "MDN_WEB" , "Pytorch" , "Chainlit" , "Your Framework Name" ], elif selected == "Your Framework Name" and assistant_your_framework :
display_framework ( assistant_your_framework , "Your Framework Name" )Reinicie o aplicativo :
app.py novamente para ver sua nova estrutura em ação.Lembre -se de substituir "Your_framework" e "seu nome de estrutura" pelos nomes apropriados para sua estrutura personalizada.
Congratulamo -nos com contribuições! Consulte o nosso guia contribuinte para obter mais detalhes.
Este projeto está licenciado sob a licença do MIT - consulte o arquivo de licença para obter detalhes.