Clipe-imagearch-ncnn
IDEA : Eu acho que este projeto é muito adequado para a função de pesquisa de álbuns de fotos do Yongcheng Mobile Phone, esgueirando todas as fotos em segundo plano para extrair recursos, para que os resultados possam ser produzidos em segundos quando usados no final. Ele também fornece a probabilidade correspondente de cada imagem, que pode ser exibida de alta a baixa, de acordo com a probabilidade de retornar o resultado do fluxo de imagem.
Por que fazer isso ? (Liderando descaradamente o fluxo GPT2-ChineSechat-NCNN)
Que modelo para fazer : Clip é o mesmo que GPT, com muitas jogabilidades. Quando vi esse projeto, sabia que essa era uma função que nasceu para se encaixar nos álbuns de telefones celulares.
Objetivo do trabalho : use o NCNN para implantar o clipe para recuperar imagens em linguagem natural.
PS : Trabalho ocupado, atualização lenta, apenas uma estrela
Nota : Para facilitar todos para baixar, todos os modelos e arquivos de execução foram enviados para o Github.
Demonstração
Android: APK que pode ser executado diretamente


uso:
- Clique em "Digitalizar o álbum" primeiro e digitalize algumas fotos no seu telefone
- De acordo com o número de imagens em cada período de tempo, selecione uma extração de recurso adequada (o tempo é proporcional ao número, uma imagem em Kirin 970 é 0,5s, lentamente, etc.)
- Digite o conteúdo que deseja pesquisar na caixa inferior, use o inglês! ! !
- Por fim, clique em "Pesquisar" e você obterá os resultados (os resultados serão lançados em 1,5s no Kirin 970)
x86: exe que pode ser executado diretamente

Uso: basta clicar na ordem dos botões, por exemplo:
- Primeiro clique em "1.Select Gallery" e selecione a pasta da galeria do repo
- Em seguida, clique em "2. Extrair os recursos da galeria" para extrair as características de todas as imagens na pasta selecionada.
- Se você inserir uma frase na caixa de texto para descrever a imagem desejada, deve usar o inglês, não importa se quiser.
- Por fim, clique em "4.earch" e o programa retornará automaticamente à imagem que melhor corresponde ao texto de entrada na biblioteca de imagens.
Como funciona
- Use o CLIP Encode_image para extrair os recursos da imagem e construir o vetor de recurso de uma biblioteca
- Use o CLIP Encode_Text para extrair os recursos do texto e construir o text de texto Vector
- Encontre similaridade entre dois vetores de características, que podem ser correspondidos em duas direções, podem ser combinados com o texto ou podem ser combinados com texto
- Você pode obter a semelhança de todas as fotos.
- Após um pouco de modificação, você pode fazer com que ele pesquise imagens no seu álbum móvel.
- Apoia a pesquisa de fotos com fotos, pesquisando fotos com personagens, pesquisando personagens com fotos e até pesquisando personagens com personagens. . . Existem muitas maneiras de jogar, basta usar esses recursos para encontrar problemas semelhantes, para que não entre em detalhes
- A coisa mais demorada é a criação dos vetores de todas as imagens da galeria.
Estrutura de repo
- Android: o código -fonte do programa APK fornecido
- x86: o código -fonte do programa EXE fornecido, com base no QT
- Galeria: uma pequena galeria para teste
- Recursos: Pasta de Recursos Readme
Conteúdo de trabalho
consulte
- ncnn
- GRAMPO
- Pesquisa de imagem-língua natural