Descarga de neoml - Descarga del código fuente neoml

neoml

C/C++

v2.0.5

Descargar

Neoml

Neoml es un marco de aprendizaje automático de extremo a extremo que le permite construir, entrenar e implementar modelos ML. Este marco es utilizado por ABBYY Engineers para tareas de procesamiento de la visión por computadora y el lenguaje natural, incluido el preprocesamiento de imágenes, la clasificación, el análisis de diseño de documentos, la OCR y la extracción de datos de documentos estructurados y no estructurados.

Características clave:

Redes neuronales con soporte para más de 100 tipos de capas
Aprendizaje automático tradicional: más de 20 algoritmos (clasificación, regresión, agrupación, etc.)
Soporte de CPU y GPU, inferencia rápida
Soporte ONNX
Idiomas: Python, C ++, Java, Objective-C
Platforma cruzada: el mismo código se puede ejecutar en Windows, Linux, MacOS, iOS y Android

Contenido

Construir e instalar
- Plataformas compatibles
- Tercero
- Construir una versión C ++ completamente funcional
- Construir versiones de inferencia para Java y Objective-C
Empezando
Descripción de la API
- Principios básicos
  - Independencia de la plataforma
  - Independencia de motores de matemáticas
  - Soporte multiproceso
  - Soporte ONNX
  - Formato de serialización
  - Soporte de GPU
  - Finos
- Interfaz C ++
  - Algoritmos biblioteca neoml
  - Neomatengine
- Módulo de pitón
- Interfaz Java
- Interfaz Objective-C
Licencia

Construir e instalar

Plataformas compatibles

La versión completa de la biblioteca с ++ se ha probado en las plataformas:

OS de destino	Compilador	Arquitectura
Windows 7+ (CPU y GPU)	MSVC 2019+	x86, x86_64
Ubuntu 14+ (CPU)	GCC 5.4+	x86_64
MacOS 10.11+ (CPU)	Apple Clang 12+	ARM64, x86_64
iOS 11+ (CPU, GPU)	Apple Clang 12+	ARM64-V8A, x86_64
Android 5.0+ (CPU), Android 7.0+ (GPU)	CLANG 7+	ArmeBi-V7A, ARM64-V8A, X86, X86_64

La inferencia Java y las versiones de la biblioteca Objective-C se han probado en las plataformas:

OS de destino	Compilador	Arquitectura
iOS 11+ (CPU, GPU)	Apple Clang 12+	ARM64-V8A, x86_64
Android 5.0+ (CPU), Android 7.0+ (GPU)	CLANG 7+	ArmeBi-V7A, ARM64-V8A, X86, X86_64

Tercero

La biblioteca está construida con CMake (versiones recomendadas 3.18 y posterior).

Para el mejor rendimiento de la CPU en Windows, Linux y macOS, usamos Intel MKL.

Al procesar una GPU, puede usar opcionalmente CUDA (versión 11.2 UPD.1) en Windows o Linux y Vulkan (versión 1.1.130 y posterior) en Windows, Linux o Android.

También utilizamos Google Test for Testing y Google Protocol Buffers para trabajar con el formato de modelo ONNX.

Utilizamos un generador muy convincente del código JIT XBYAK para acelerar algunas convoluciones en procesadores X86_64.

Construir una versión C ++ completamente funcional

Consulte aquí para obtener instrucciones sobre la construcción de la versión de la biblioteca C ++ para diferentes plataformas.

Construir versiones de inferencia para Java y Objective-C

Vea aquí para obtener instrucciones sobre la construcción de las versiones Java y Objective-C que solo ejecutarían las redes neuronales entrenadas.

Empezando

Varios tutoriales con código de muestra lo ayudarán a comenzar a trabajar con la biblioteca:

Entrenar y usar una red simple
Clasificación con impulso de gradiente
Clustering de datos con algoritmo de K-means

Descripción de la API

Principios básicos

La biblioteca fue desarrollada con estos principios en mente:

Independencia de la plataforma

La interfaz de usuario está completamente separada de los cálculos de bajo nivel implementados por un motor de matemáticas.

Lo único que debe hacer es especificar al principio el tipo de motor de matemáticas que se utilizará para los cálculos. También puede elegir seleccionar el motor de matemáticas automáticamente, según la configuración del dispositivo detectada.

El resto de su código de aprendizaje automático será el mismo independientemente del motor de matemáticas que elija.

Independencia de motores de matemáticas

Cada red funciona con una instancia de motor de matemáticas, y todas sus capas deberían haberse creado con el mismo motor de matemáticas. Si ha elegido un motor de matemáticas GPU, realizará todos los cálculos. Esto significa que es posible que no elija usar una CPU para cálculos "ligeros" como agregar vectores y una GPU para cálculos "pesados" como matrices multiplicadoras. Hemos introducido esta restricción para evitar sincronizaciones innecesarias e intercambio de datos entre dispositivos.

Soporte multiproceso

La interfaz del motor de matemáticas es segura de subprocesos; La misma instancia se puede usar en diferentes redes y diferentes hilos.

Tenga en cuenta que esto puede implicar alguna sobrecarga de sincronización.

Sin embargo, la implementación de la red neuronal no es segura de hilo; La red solo puede ejecutarse en un hilo.

Soporte ONNX

La biblioteca Neoml también funciona con los modelos creados por otros marcos, siempre que admitan el formato ONNX. Consulte la descripción de la API de importación. Sin embargo, no puede exportar un modelo entrenado con NEOML en formato ONNX.

Formato de serialización

La biblioteca utiliza su propio formato binario (implementado por CArchive , CArchiveFile ) para ahorrar y cargar los modelos capacitados.

Soporte de GPU

El procesamiento en GPU a menudo ayuda a mejorar significativamente el rendimiento de las operaciones matemáticas. La biblioteca Neoml utiliza GPU tanto para capacitar como para ejecutar los modelos. Esta es una configuración opcional y depende de las capacidades de hardware y software de su sistema.

Para trabajar en GPU, la biblioteca requiere:

Windows: tarjeta GPU NVIDIA® con CUDA® 11.2 UPD. 1 Soporte.
iOS: GPU de Apple A7+.
Android: dispositivos con soporte Vulkan 1.0.
Linux/MacOS: todavía no hay soporte para el procesamiento de GPU.

Finos

La Biblioteca Neoml se origina en la infraestructura interna ABBYY. Por varias razones, Abbyy usa un marco multiplataforma llamado FinoBJ. Debido a esto, la versión Open Library utiliza algunas de estas primitivas marco. Ver la descripción de las clases comunes.

Interfaz C ++

Neoml contiene dos bibliotecas C ++:

Algoritmos biblioteca neoml

La biblioteca proporciona objetos C ++ que implementan varios algoritmos de alto nivel. Consiste en varias partes:

Redes neuronales
Algoritmos de clasificación y regresión
Algoritmos de agrupación
Algoritmos auxiliares

Neomatengine

El motor matemático utilizado para los cálculos es un módulo separado que implementa las funciones matemáticas de bajo nivel utilizadas en la biblioteca de algoritmos. El usuario también puede llamar a estas funciones, pero generalmente nunca necesita.

Este módulo tiene diferentes implementaciones para diferentes plataformas. En particular, hay una implementación que utiliza una GPU para los cálculos.

El motor de matemáticas también es un conjunto de interfaces C ++ descritas aquí.