Download Selective_Context - Selective_Context do download de código fonte

Selective_Context

Outro código-fonte

data dumps to reproduce the results

Baixar

Logotipo do contexto seletivo

Contexto seletivo para LLMS

O contexto seletivo comprime seu prompt e contexto para permitir que o LLMS (como ChatGPT) processe 2x mais conteúdo. É especialmente útil para lidar com documentos longos e em manter longas conversas sem comprometer seu desempenho em várias tarefas!

Este repositório contém o código e os dados do artigo: contexto de compactação para melhorar a eficiência de inferência de grandes modelos de linguagem.

Atualizações !!

9 de outubro de 2023 : Este trabalho foi aceito para os principais procedimentos do EMNLP 2023 ? O link em papel acima é a versão mais recente da conferência. Se você está procurando a versão ARXIV anterior do artigo: desbloqueando restrições de contexto do LLMS.
6 de maio 2023 : Experimente nossa demonstração no espaço do Hugging Sace.

Principais recursos

Gerenciamento eficiente de contexto : o contexto seletivo maximiza a utilidade do comprimento do contexto fixo no LLMS, permitindo que eles processem documentos longos e estendidos com mais eficiência.
Avaliação da informatividade : Nosso método emprega um modelo de linguagem base para calcular a auto-informação para unidades lexicais (frases, frases ou tokens) em um contexto e usá-lo para avaliar sua informatividade.
Avaliação extensiva : Fornecemos avaliações extensas do contexto seletivo em três fontes de dados (artigos ARXIV, artigos de notícias da BBC e transcrições de conversas) e quatro tarefas diferentes de PNL (resumo, resposta a perguntas, reconstrução de contexto original e conversa).

Começando

Para começar, siga estas etapas:

Instale selective-context via Pypi:
```
 pip install selective-context
python -m spacy download en_core_web_sm
```
Se você está processando chinês, execute python -m spacy download zh_core_web_sm também.

Importar SelectiveContext :

 from selective_context import SelectiveContext

Compressa seu rápido e contexto. O context contém o contexto comprimido:

 sc = SelectiveContext(model_type='gpt2', lang='en')
context, reduced_content = sc(text)

Você também pode ajustar a proporção de redução:

 context, reduced_content = sc(text, reduce_ratio = 0.5)

Se você preferir experimentar com a interface da web, tente nosso aplicativo Streamlit:
```
 streamlit run app/app.py
```
Ou visite diretamente nosso espaço para abraçar o hub de rosto.

Estrutura de código

selective_context.py : uma demonstração para realizar redução de contexto usando o contexto seletivo.
context_manager.py : o módulo principal para gerenciar o contexto e implementar o algoritmo de contexto seletivo.
main.py : o principal script para executar experimentos e avaliar a eficácia do contexto seletivo.
qa_manager.py : um módulo auxiliar para gerenciar tarefas de resposta a perguntas durante os experimentos.

Experimentos

Para reproduzir os experimentos do artigo:

Primeiro, você baixa os conjuntos de dados necessários nas experiências:

 wget https://github.com/liyucheng09/Selective_Context/releases/download/v0.1.0rc1/datasets_dumps.zip
unzip datasets_dumps.zip

Você corre:

 python main.py datasets_dumps/arxiv datasets_dumps/news datasets_dump/conversation <output_path_to_save_results> <num_articles> <HF_model_name_or_path>

Conjunto de dados no papel

O conjunto de dados usado no artigo pode ser encontrado em:

ARXIV: HF Hub
BBC News: HF Hub
ShareGPT.com: HF Hub

Os conjuntos de dados são criados por nós mesmos; portanto, se você precisar de citação, basta usar a citação desta ferramenta.

Se você tiver problemas para acessar o HUGGINGFACH HUB, faça o download dos dados via:

 wget https://github.com/liyucheng09/Selective_Context/releases/download/v0.1.0rc1/data_dumps.zip

Citação

Se você achar útil este repositório ou usar nosso método em sua pesquisa, considere citar nosso artigo:

 @misc{li2023compressing,
      title={Compressing Context to Enhance Inference Efficiency of Large Language Models}, 
      author={Yucheng Li and Bo Dong and Chenghua Lin and Frank Guerin},
      year={2023},
      eprint={2310.06201},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

A versão anterior:

 @misc{li2023unlocking,
      title={Unlocking Context Constraints of LLMs: Enhancing Context Efficiency of LLMs with Self-Information-Based Content Filtering}, 
      author={Yucheng Li},
      year={2023},
      eprint={2304.12102},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

Licença

Este projeto está licenciado sob a licença do MIT.

Expandir

Informações adicionais

Versão data dumps to reproduce the results
Tipo Outro código-fonte
Data da Última Atualização 2025-04-19
tamanho 1.84MB
Vindo de Github

Aplicativos Relacionados

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
YuQue_Book_Download

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
Mecanismo de análise de dados Lihua versão gratuita 3.0_search_navigation_collection_public parecer_ranking_api

2022-06-28

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos