tansyqinyrproj
Proyecto de procesamiento de imágenes digitales
1. Lista de funciones
- OCR extrae información de texto de imágenes de tarjetas de identificación
- Migración de estilos: Caramelo, Cielo estrellado, Picasso, Musa, Mosaico, La gran ola de Kanagawa, Atención dadaísta, Grito, Pluma
- Funciones básicas: 39 en total. Ruido de sal y pimienta, suavizado medio, suavizado mediano, suavizado gaussiano; nitidez de imagen: operador laplaciano, nitidez de imagen: dirección horizontal del operador de Sobel, nitidez de imagen: dirección vertical del operador de Sobel, uso bilineal Expanda el método de interpolación, mueva la imagen 30 píxeles al izquierda, 50 píxeles hacia abajo, girar 45 grados, el factor de escala es 1, convertir a escala de grises, convertir a escala de grises y luego binarizar: método de umbral global, Ecualización de histograma, histograma en escala de grises, transformación afín, transformación de perspectiva, inversión de imagen, RGB a HSV, HSV obtiene H, HSV obtiene S, HSV obtiene V, RGB obtiene B, RGB obtiene G, RGB obtiene R, giro horizontal, giro vertical, diagonal duplicación, operación de apertura de imagen, operación de cierre de imagen, erosión, expansión, operación de sombrero de copa, operación de sombrero de abajo, HoughLinesP realiza detección de líneas, detección de bordes Canny, mejora de imágenes, El operador de Roberts extrae los bordes de la imagen, el operador Prewitt extrae los bordes de la imagen, el operador Laplaciano extrae los bordes de la imagen y el operador LoG extrae los bordes.
2. Pila de tecnología
2.1 Desarrollo front-end
- Principales lenguajes de desarrollo: HTML, CSS, JavaScript
- Marco de interfaz de usuario: Vue.js
- Andamiaje: Vue-CLI
- Interfaz de usuario: Elemento UI
- Editor de código: IntelliJ IDEA
- Intercambio de datos: axios
- Administrador de paquetes front-end: npm
- Herramienta de construcción front-end: Webpack
2.2 Desarrollo de back-end
- Lenguaje de desarrollo principal: Python
- Marco de backend: matraz
- Editor de código: IntelliJ IDEA
- Sistema de control de versiones: Git
- Herramientas multidominio: flask-cors
3. Operación del proyecto
3.1 Instalar dependencias
- Primero, debe instalar tesseract localmente. El proyecto usa la versión tesseractV4.0 y usa
tesseract-ocr-setup-4.00.00dev.exe para instalarlo localmente. PS D:xxx> tesseract -v
tesseract 4.00.00alpha
...
- Descarga del paquete de idioma Tesseract.
- Descargue chi_sim.traineddata. Guarde el archivo
chi_sim.traineddata en /安装路径/Tesseract-OCR/tessdata .
3.2 Modificar configuración
Modifique la información de configuración en el archivo config.py .
3.3 Operación frontal
Primero, ingrese a la carpeta firstend en la terminal e ingrese los siguientes comandos para comenzar.
# install dependency
npm install
# develop
npm run dev
Si el inicio falla, intente eliminar la carpeta node_modules y el archivo package-lock.json y realice los pasos anteriores nuevamente. Si aún falla: intente reducir la versión local de node.js, estoy usando v12.17.0 .
3.4 Operaciones de fondo
ejecute app.py en Pycharm u otras ideas.
4. Visualización de funciones
Hay funciones un poco más básicas, que se muestran en imágenes en el documento del proyecto.
4.1 OCR extrae información de texto de imágenes de tarjetas de identificación


Transferencia de estilo:
dulce

cielo estrellado

picasso

musa

mosaico

La gran ola frente a Kanagawa

dadaísmo

gritar

pluma
