tansyqinyrproj
Projeto de Processamento Digital de Imagens
1. Lista de funções
- OCR extrai informações de texto de imagens de cartões de identificação
- Migração de estilo: Candy, Starry Sky, Picasso, Muse, Mosaic, The Great Wave off Kanagawa, Dada Attention, Scream, Feather
- Funções básicas: 39 no total. Ruído sal e pimenta, suavização média, suavização mediana, suavização gaussiana; nitidez de imagem - operador Laplaciano, nitidez de imagem - direção horizontal do operador Sobel, nitidez de imagem - direção vertical do operador Sobel, use bilinear Expanda o método de interpolação, mova a imagem 30 pixels para o esquerda, 50 pixels para baixo, gire 45 graus, o fator de escala é 1, converta para escala de cinza, converta para escala de cinza e depois binarize - método de limite global, Equalização de histograma, histograma em escala de cinza, transformação afim, transformação de perspectiva, inversão de imagem, RGB para HSV, HSV obtém H, HSV obtém S, HSV obtém V, RGB obtém B, RGB obtém G, RGB obtém R, inversão horizontal, inversão vertical, diagonal espelhamento, operação de abertura de imagem, operação de fechamento de imagem, erosão, expansão, operação de cartola, operação de cartola, HoughLinesP realiza detecção de linha, detecção de borda Canny, aprimoramento de imagem, O operador Roberts extrai bordas da imagem, o operador Prewitt extrai bordas da imagem, o operador Laplaciano extrai bordas da imagem e extração de bordas LoG.
2. Pilha de tecnologia
2.1 Desenvolvimento front-end
- Principais linguagens de desenvolvimento: HTML, CSS, JavaScript
- Estrutura de front-end: Vue.js
- Andaime: Vue-CLI
- IU: ElementUI
- Editor de código: IntelliJ IDEA
- Troca de dados: axios
- Gerenciador de pacotes front-end: npm
- Ferramenta de construção de front-end: Webpack
2.2 Desenvolvimento back-end
- Linguagem principal de desenvolvimento: Python
- Estrutura de back-end: Flask
- Editor de código: IntelliJ IDEA
- Sistema de controle de versão: Git
- Ferramentas entre domínios: flask-cors
3. Operação do projeto
3.1 Instalar dependências
- Primeiro, você precisa instalar o tesseract localmente. O projeto usa a versão tesseractV4.0 e usa
tesseract-ocr-setup-4.00.00dev.exe para instalá-lo localmente. PS D:xxx> tesseract -v
tesseract 4.00.00alpha
...
- Baixar pacote de idiomas tesseract.
- Baixe chi_sim.traineddata. Salve o arquivo
chi_sim.traineddata no /安装路径/Tesseract-OCR/tessdata .
3.2 Modificar configuração
Modifique as informações de configuração no arquivo config.py .
3.3 Operação frontal
Primeiro, entre na pasta firstend no terminal e digite os seguintes comandos para iniciar.
# install dependency
npm install
# develop
npm run dev
Se a inicialização falhar, tente excluir a pasta node_modules e o arquivo package-lock.json e execute as etapas acima novamente. Se ainda falhar: tente diminuir a versão local do node.js, estou usando v12.17.0 .
3.4 Operações de back-end
execute app.py no Pycharm ou outras ideias.
4. Exibição de função
Existem funções um pouco mais básicas, que são mostradas em imagens no documento do projeto.
4.1 OCR extrai informações de texto de imagens de cartões de identificação


Transferência de estilo:
doce

céu estrelado

Picasso

musa

mosaico

A Grande Onda de Kanagawa

Dadaísmo

gritar

pena
