Download LLCP - download do código fonte LLCP

LLCP

Outro código-fonte

1.0.0

Baixar

LLCP: Aprendendo processos causais latentes para a resposta em vídeo baseada em raciocínio

Este repositório contém a implementação do ICLR2024 Paper LLCP: Aprendendo processos causais latentes para a pergunta em vídeo baseada em raciocínio Resposta PDF

O LLCP é uma estrutura causal projetada para aprimorar o raciocínio em vídeo, concentrando-se na dinâmica espacial-temporal dos objetos nos eventos, sem a necessidade de extensas anotações de dados. Ao empregar aprendizado auto-supervisionado e alavancar a modularidade dos mecanismos causais, a LLCP aprende um modelo generativo multivariado para a dinâmica espacial-temporais e, portanto, permite a atribuição eficaz de acidentes e a previsão contrafactual de videoQA baseado em raciocínio.

Introdução

Ambiente

Primeiro, instale a versão recente de Pytorch e Torchvision como pip install torch torchvision . Em seguida, você pode instalar outro pacote executando pip install -r requirements.txt

Baixar dados

Fornecemos os recursos processados usados em nossos experimentos. Faça o download dos dados e modelo neste link1 e este link2. Em seguida, descompacte os floders como ./data/ e ./results/ e substitua os floders originais como os baixados.

A estrutura do diretório deve parecer

 LLCP_VQA/
|–– config.py
|–– configs/
|–– data/
|   |–– object_test_feat/
|   |–– object_train_feat/
|   |–– appearance_feat_rn50.h5
|   |–– test_questions.pt
|   |–– train_questions.pt
|   |–– video_noaccident_train.txt
|–– DataLoader.py
|–– models_cvae.py
|–– requirements.txt
|–– results/
|   |–– .../model_cvae49.pt
|–– README.md
|–– train.py
|–– validate.py

Execute scripts

Para treinar o modelo CVAE, você pode executar este comando:

 python train.py --cfg configs/sutd-traffic_transition.yml

Para avaliar o modelo treinado, consulte:

 python validate.py --cfg configs/sutd-traffic_transition.yml

Experiências de simulação de LLCP

Veja simulação de LLCP.

Citação

Se você achar nosso trabalho útil em sua pesquisa, considere citar:

 @inproceedings{chen2024llcp,
  title={LLCP: Learning Latent Causal Processes for Reasoning-based Video Question Answer},
  author={Chen, Guangyi and Li, Yuke and Liu, Xiao and Li, Zijian and Al Surad, Eman and Wei, Donglai and Zhang, Kun}
  booktitle={ICLR},
  year={2024}
}

Reconhecimento

Nossa implementação é baseada principalmente no SUTD-TRAFFICQA e TEM-ADAPTER, agradecemos aos autores a lançar seus códigos.

Expandir

Informações adicionais

Versão 1.0.0
Tipo Outro código-fonte
Data da Última Atualização 2025-02-17
tamanho 148.71KB
Vindo de Github

Aplicativos Relacionados

Google Dorks

2025-03-10
shepherd

2025-06-04
hidusbf

2025-02-14
mongo express

2025-06-04
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Outro código-fonte

1.0.0
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Outro código-fonte

1.0.0

Informações Relacionadas Todos