Este repositório demonstra o uso da adaptação de baixo rank (LORA) para ajustar o modelo básico do Google para duas tarefas de classificação: identificação de itens alimentares e identificação de ação humana . Cada tarefa é treinada e inferida separadamente usando Lora.
Nesta tarefa, utilizamos o modelo do Google Vit google/vit-base-patch16-224-in21k
com cerca de 86M parâmetros. Link para o modelo Base Base de Repo Abraçando Face
Existem alguns requisitos para executar os arquivos. Python com versão> = 3.8 é necessário.
Outros requisitos
transformersdatasetsevaluatepefttorch e torchvision Para fins de ajuste fino, usamos o parâmetro peft eficientes ajustes finos em dois conjuntos de dados diferentes
food101Human-Action-Recognition Consulte o Notebook Vit aqui Para executar a inferência, um aplicativo simples de graduação é implementado. Podemos escolher qualquer adaptador de modelo (alimento / humano) e fazer upload de uma imagem para obter o rótulo de classificação.
Consulte o inference.py e app.py
Para executar a inferência, execute o código a seguir após o download ou clonar o repositório.
python app.py