Descarga de ktrain - Descarga del código fuente ktrain

Descripción general | Tutoriales | Ejemplos | Instalación | Preguntas frecuentes | API Docs | Cómo citar

Bienvenido a Ktrain

una "navaja suiza" para el aprendizaje automático

Noticias y anuncios

2024-02-20
- Ktrain 0.41.x se libera y elimina el módulo ktrain.text.qa.generative_qa . Nuestro paquete ONPREM.LLM debe usarse para tareas generativas de preguntas sobre preguntas. Ver Notebook de ejemplo.

Descripción general

Ktrain es un envoltorio ligero para la biblioteca de aprendizaje profundo TensorFlow Keras (y otras bibliotecas) para ayudar a construir, entrenar y desplegar redes neuronales y otros modelos de aprendizaje automático. Inspirado en las extensiones del marco ML como Fastai y Ludwig , Ktrain está diseñado para hacer que el aprendizaje profundo y la IA sean más accesibles y más fáciles de solicitar tanto para los recién llegados como para los profesionales experimentados. Con solo unas pocas líneas de código, Ktrain le permite fácil y rápidamente:

Emplee modelos pre-capitanados rápidos, precisos y fáciles de usar para datos de text , vision , graph y tabular :
- Datos text :
  - Clasificación de texto : Bert, Distilbert, NBSVM, FastText y otros modelos _{^{[cuaderno de ejemplo]}}
  - Regresión de texto : Bert, Distilbert, regresión de texto lineal basada en incrustaciones, FastText y otros modelos _{^{[Notebook de ejemplo]}}
  - Etiquetado de secuencia (NER) : LSTM bidireccional con capa de CRF opcional y varios esquemas de incrustación, como Bert y incrustaciones de palabras FastText e Incruscaciones de caracteres _{^{[Notebook de ejemplo]}}
  - Modelos NER listos para usar para inglés, chino y ruso sin capacitación requerida _{^{[Notorbook de ejemplo]}}
  - Clasificación de pares de oraciones para tareas como detección de paráfrasis _{^{[cuaderno de ejemplo]}}
  - Modelado de temas no supervisado con LDA _{^{[cuaderno de ejemplo]}}
  - Documento de similitud con un aprendizaje de una clase : dados algunos documentos de interés, encontrar y calificar nuevos documentos que sean temáticamente similares a ellos utilizando la clasificación de texto de una clase _{^{[Notebook de ejemplo]}}
  - Motores de recomendación de documentos y búsquedas semánticas : dado un fragmento de texto de un documento de muestra, recomiende documentos que estén semánticamente relacionados con un corpus más grande _{^{[cuaderno de ejemplo]}}
  - Resumen de texto : resumir documentos largos: no se requiere capacitación _{^{[cuaderno de ejemplo]}}
  - Respuesta de pregunta extractiva : haga preguntas de un corpus de texto grande y reciba respuestas exactas usando Bert _{^{[cuaderno de ejemplo]}}
  - Respuesta de pregunta generativa : haga preguntas de un corpus de texto grande y reciba respuestas con citas utilizando modelos locales o abiertos _{^{[cuaderno de ejemplo]}}
  - Motor de búsqueda incorporado fácil de usar : Realice búsquedas de palabras clave en grandes colecciones de documentos _{^{[cuaderno de ejemplo]}}
  - Aprendizaje de disparo cero : clasifique los documentos en temas proporcionados por el usuario sin ejemplos de capacitación _{^{[Notebook de ejemplo]}}
  - Traducción del idioma : traducir el texto de un idioma a otro _{^{[cuaderno de ejemplo]}}
  - Extracción de texto : extraiga texto de PDFS, documentos de Word, etc. _{^{[Notorario de ejemplo]}}
  - Transcripción del habla : extraiga texto de archivos de audio _{^{[cuaderno de ejemplo]}}
  - Extracción de información universal : extraiga cualquier tipo de información de los documentos simplemente redactándola en forma de una pregunta _{^{[cuaderno de ejemplo]}}
  - Extracción de frase de claves : extraer palabras clave de documentos _{^{[cuaderno de ejemplo]}}
  - Análisis de sentimientos : envoltura fácil de usar para el análisis de sentimientos previos a la aparición _{^{[cuaderno de ejemplo]}}
  - AI generativo con GPT : proporcione instrucciones a un modelo ligero tipo CHATGPT que se ejecuta en su propia máquina propia para resolver varias tareas. _{^{[Notebook de ejemplo]}}
- Datos de vision :
  - Clasificación de imagen (por ejemplo, resnet, amplio resnet, inicio) _{^{[cuaderno de ejemplo]}}
  - Regresión de imagen para predecir objetivos numéricos de fotos (por ejemplo, predicción de edad) _{^{[Notorario de ejemplo]}}
  - subtitulación de imágenes con un modelo previo a la aparición _{^{[cuaderno de ejemplo]}}
  - Detección de objetos con un modelo previo a la aparición _{^{[cuaderno de ejemplo]}}
- Datos de graph :
  - Clasificación de nodo con redes neuronales Graph (Graphsage) _{^{[Notorbook de ejemplo]}}
  - Predicción de enlaces con redes neuronales gráficas (Graphsage) _{^{[Notebook de ejemplo]}}
- Datos tabular :
  - Clasificación tabular (p. Ej., Predicción de supervivencia titánica) _{^{[Notebook de ejemplo]}}
  - Regresión tabular (por ejemplo, predicción de precios de la vivienda) _{^{[Notebook de ejemplo]}}
  - inferencia causal usando meta-aprendizaje _{^{[cuaderno de ejemplo]}}
Estima una tasa de aprendizaje óptima para su modelo dados sus datos utilizando un buscador de tasa de aprendizaje
Utilice los horarios de tarifas de aprendizaje, como la política triangular, la política de 1 ciclo y el SGDR para minimizar efectivamente la pérdida y mejorar la generalización.
Construya clasificadores de texto para cualquier idioma (por ejemplo, análisis de sentimientos en árabe con Bert, análisis de sentimientos chinos con NBSVM)
Capacitar fácilmente a los modelos NER para cualquier idioma (por ejemplo, holandés ner)
Cargar y preprocesar datos de texto e imágenes de una variedad de formatos
Inspeccione los puntos de datos que fueron clasificados erróneos y proporcionar explicaciones para ayudar a mejorar su modelo
Aproveche una API de predicción simple para guardar e implementar los modelos y los pasos de preprocesamiento de datos para hacer predicciones sobre los nuevos datos sin procesar
Soporte incorporado para exportar modelos a ONNX y TensorFlow Lite (consulte el cuaderno de ejemplo para obtener más información)

Tutoriales

Consulte los siguientes cuadernos de tutoriales para obtener una guía sobre cómo usar Ktrain en sus proyectos:

Tutorial 1: Introducción
Tutorial 2: Tarifas de aprendizaje de ajuste
Tutorial 3: Clasificación de imágenes
Tutorial 4: Clasificación de texto
Tutorial 5: Aprender de datos de texto sin etiqueta
Tutorial 6: Etiquetado de secuencia de texto para el reconocimiento de entidad nombrado
Tutorial 7: Clasificación de nodo gráfico con redes neuronales gráficas
Tutorial 8: Clasificación y regresión tabulares
Tutorial A1: Trucos adicionales, que cubren temas como la vista previa de los esquemas de aumento de datos, la inspección de la producción intermedia de los modelos Keras para la depuración, el establecimiento de la descomposición global de peso y el uso de devoluciones de llamada incorporadas y personalizadas.
Tutorial A2: Explicando predicciones y errores errores
Tutorial A3: Clasificación de texto con transformadores de la cara abrazada
Tutorial A4: Uso de formatos y modelos de datos personalizados: regresión de texto con regresores adicionales

A continuación se muestran algunos tutoriales de blog y otras guías sobre Ktrain :

Ktrain: un envoltorio ligero para Keras para ayudar a entrenar redes neuronales

Clasificación de texto de Bert en 3 líneas de código

Clasificación de texto con transformadores de cara abrazados en TensorFlow 2 (sin lágrimas)

Construya un sistema de preguntas de preguntas abiertas con Bert en 3 líneas de código

Fineting Bert usando Ktrain para la clasificación de tweets de desastre por Hamiz Ahmed

Ejemplos de la PNL indonesia con Ktrain de Sandy Khosasi

Ejemplos

¿Usando Ktrain en Google Colab ? Vea estos ejemplos de Colab:

Clasificación de texto: una simple demostración de clasificación de texto multiclase con Bert
Clasificación de texto: una simple demostración de clasificación de texto multiclase con transformadores de cara abrazada
Tagging de secuencia (NER): Ejemplo ner usando incrustaciones de palabras transformer
Respuesta de preguntas: respuesta de pregunta de extremo a extremo utilizando el conjunto de datos 20NewsGroups.
Clasificación de imagen: Clasificación de imágenes con gatos contra perros

Tareas como la clasificación de texto y la clasificación de imágenes se pueden lograr fácilmente con solo unas pocas líneas de código.

Ejemplo: Clasificación de texto de reseñas de películas IMDB usando Bert _{^{[ver cuaderno]}}

 import ktrain
from ktrain import text as txt

# load data
( x_train , y_train ), ( x_test , y_test ), preproc = txt . texts_from_folder ( 'data/aclImdb' , maxlen = 500 ,
                                                                     preprocess_mode = 'bert' ,
                                                                     train_test_names = [ 'train' , 'test' ],
                                                                     classes = [ 'pos' , 'neg' ])

# load model
model = txt . text_classifier ( 'bert' , ( x_train , y_train ), preproc = preproc )

# wrap model and data in ktrain.Learner object
learner = ktrain . get_learner ( model ,
                             train_data = ( x_train , y_train ),
                             val_data = ( x_test , y_test ),
                             batch_size = 6 )

# find good learning rate
learner . lr_find ()             # briefly simulate training to find good learning rate
learner . lr_plot ()             # visually identify best learning rate

# train using 1cycle learning rate schedule for 3 epochs
learner . fit_onecycle ( 2e-5 , 3 )

Ejemplo: Clasificación de imágenes de perros y gatos utilizando un modelo RESNET50 previamente practicado _{^{[ver cuaderno]}}

 import ktrain
from ktrain import vision as vis

# load data
( train_data , val_data , preproc ) = vis . images_from_folder (
                                              datadir = 'data/dogscats' ,
                                              data_aug = vis . get_data_aug ( horizontal_flip = True ),
                                              train_test_names = [ 'train' , 'valid' ],
                                              target_size = ( 224 , 224 ), color_mode = 'rgb' )

# load model
model = vis . image_classifier ( 'pretrained_resnet50' , train_data , val_data , freeze_layers = 80 )

# wrap model and data in ktrain.Learner object
learner = ktrain . get_learner ( model = model , train_data = train_data , val_data = val_data ,
                             workers = 8 , use_multiprocessing = False , batch_size = 64 )

# find good learning rate
learner . lr_find ()             # briefly simulate training to find good learning rate
learner . lr_plot ()             # visually identify best learning rate

# train using triangular policy with ModelCheckpoint and implicit ReduceLROnPlateau and EarlyStopping
learner . autofit ( 1e-4 , checkpoint_folder = '/tmp/saved_weights' )

Ejemplo: etiquetado de secuencia para el reconocimiento de entidad nombrado utilizando un modelo LSTM CRF bidireccional inicializado aleatoriamente _{^{[ver cuaderno]}}

 import ktrain
from ktrain import text as txt

# load data
( trn , val , preproc ) = txt . entities_from_txt ( 'data/ner_dataset.csv' ,
                                            sentence_column = 'Sentence #' ,
                                            word_column = 'Word' ,
                                            tag_column = 'Tag' ,
                                            data_format = 'gmb' ,
                                            use_char = True ) # enable character embeddings

# load model
model = txt . sequence_tagger ( 'bilstm-crf' , preproc )

# wrap model and data in ktrain.Learner object
learner = ktrain . get_learner ( model , train_data = trn , val_data = val )


# conventional training for 1 epoch using a learning rate of 0.001 (Keras default for Adam optmizer)
learner . fit ( 1e-3 , 1 )

Ejemplo: Clasificación de nodo en el gráfico Cora Citation utilizando un modelo GraphSage _{^{[ver Notbook]}}

 import ktrain
from ktrain import graph as gr

# load data with supervision ratio of 10%
( trn , val , preproc )  = gr . graph_nodes_from_csv (
                                               'cora.content' , # node attributes/labels
                                               'cora.cites' ,   # edge list
                                               sample_size = 20 ,
                                               holdout_pct = None ,
                                               holdout_for_inductive = False ,
                                              train_pct = 0.1 , sep = ' t ' )

# load model
model = gr . graph_node_classifier ( 'graphsage' , trn )

# wrap model and data in ktrain.Learner object
learner = ktrain . get_learner ( model , train_data = trn , val_data = val , batch_size = 64 )


# find good learning rate
learner . lr_find ( max_epochs = 100 ) # briefly simulate training to find good learning rate
learner . lr_plot ()               # visually identify best learning rate

# train using triangular policy with ModelCheckpoint and implicit ReduceLROnPlateau and EarlyStopping
learner . autofit ( 0.01 , checkpoint_folder = '/tmp/saved_weights' )

Ejemplo: Clasificación de texto con transformadores faciales para abrazos en 20 conjuntos de datos de grupos de noticias usando Distilbert _{^{[ver cuaderno]}}

 # load text data
categories = [ 'alt.atheism' , 'soc.religion.christian' , 'comp.graphics' , 'sci.med' ]
from sklearn . datasets import fetch_20newsgroups
train_b = fetch_20newsgroups ( subset = 'train' , categories = categories , shuffle = True )
test_b = fetch_20newsgroups ( subset = 'test' , categories = categories , shuffle = True )
( x_train , y_train ) = ( train_b . data , train_b . target )
( x_test , y_test ) = ( test_b . data , test_b . target )

# build, train, and validate model (Transformer is wrapper around transformers library)
import ktrain
from ktrain import text
MODEL_NAME = 'distilbert-base-uncased'
t = text . Transformer ( MODEL_NAME , maxlen = 500 , class_names = train_b . target_names )
trn = t . preprocess_train ( x_train , y_train )
val = t . preprocess_test ( x_test , y_test )
model = t . get_classifier ()
learner = ktrain . get_learner ( model , train_data = trn , val_data = val , batch_size = 6 )
learner . fit_onecycle ( 5e-5 , 4 )
learner . validate ( class_names = t . get_classes ()) # class_names must be string values

# Output from learner.validate()
#                        precision    recall  f1-score   support
#
#           alt.atheism       0.92      0.93      0.93       319
#         comp.graphics       0.97      0.97      0.97       389
#               sci.med       0.97      0.95      0.96       396
#soc.religion.christian       0.96      0.96      0.96       398
#
#              accuracy                           0.96      1502
#             macro avg       0.95      0.96      0.95      1502
#          weighted avg       0.96      0.96      0.96      1502

Ejemplo: Clasificación tabular para la predicción de supervivencia titánica utilizando un MLP _{^{[ver cuaderno]}}

 import ktrain
from ktrain import tabular
import pandas as pd
train_df = pd . read_csv ( 'train.csv' , index_col = 0 )
train_df = train_df . drop ([ 'Name' , 'Ticket' , 'Cabin' ], 1 )
trn , val , preproc = tabular . tabular_from_df ( train_df , label_columns = [ 'Survived' ], random_state = 42 )
learner = ktrain . get_learner ( tabular . tabular_classifier ( 'mlp' , trn ), train_data = trn , val_data = val )
learner . lr_find ( show_plot = True , max_epochs = 5 ) # estimate learning rate
learner . fit_onecycle ( 5e-3 , 10 )

# evaluate held-out labeled test set
tst = preproc . preprocess_test ( pd . read_csv ( 'heldout.csv' , index_col = 0 ))
learner . evaluate ( tst , class_names = preproc . get_classes ())

Se pueden encontrar ejemplos adicionales aquí.

Instalación

Asegúrese de que PIP esté actualizado con: pip install -U pip
Instale TensorFlow 2 si aún no está instalado (por ejemplo, pip install tensorflow ).
Instalar ktrain : pip install ktrain
Si usa tensorflow>=2.16 :
- Instalar TF_KERAS : pip install tf_keras
- Establezca la variable de entorno TF_USE_LEGACY_KERAS en verdadero antes de importar ktrain

Lo anterior debe ser todo lo que necesita en los sistemas Linux y los entornos de computación en la nube como Google Colab y AWS EC2. Si está utilizando ktrain en una computadora de Windows , puede seguir estas instrucciones más detalladas que incluyen algunos pasos adicionales.

Notas sobre las versiones de TensorFlow

A partir de tensorflow>=2.11 , solo debe usar optimizadores heredados como tf.keras.optimizers.legacy.Adam . La nueva clase de base tf.keras.optimizers.Optimizer no es compatible en este momento. Por ejemplo, cuando se use TensorFlow 2.11 y arriba, use tf.keras.optimzers.legacy.Adam() en lugar de la cadena "adam" en model.compile . Ktrain lo hace automáticamente cuando se usa modelos listos para usar (por ejemplo, modelos de la biblioteca transformers ).
Como se mencionó anteriormente, debido a los cambios de ruptura en TensorFlow 2.16, deberá instalar el paquete tf_keras y también establecer la variable de entorno TF_USE_LEGACY_KERAS=True antes de importar ktrain (eg, agregar export TF_USE_LEGACY_KERAS=1 en .bashrc o agregar os.environ['TF_USE_LEGACY_KERAS']="1" , etc., etc.

Notas adicionales sobre la instalación

Algunas bibliotecas adicionales y adicionales utilizadas para algunas operaciones se pueden instalar según sea necesario. (Observe que Ktrain está utilizando versiones bifurcadas de las bibliotecas eli5 y stellargraph para admitir TensorFlow2).

 # for graph module:
pip install https : // github . com / amaiya / stellargraph / archive / refs / heads / no_tf_dep_082 . zip
# for text.TextPredictor.explain and vision.ImagePredictor.explain:
pip install https : // github . com / amaiya / eli5 - tf / archive / refs / heads / master . zip
# for tabular.TabularPredictor.explain:
pip install shap
# for text.zsl (ZeroShotClassifier), text.summarization, text.translation, text.speech:
pip install torch
# for text.speech:
pip install librosa
# for tabular.causal_inference_model:
pip install causalnlp
# for text.summarization.core.LexRankSummarizer:
pip install sumy
# for text.kw.KeywordExtractor
pip install textblob
# for text.generative_ai
pip install onprem

KTrain se mueve deliberadamente a una versión inferior de Transformers para incluir soporte para versiones anteriores de TensorFlow. Si necesita una versión más nueva de transformers , generalmente es seguro para usted actualizar transformers , siempre que lo haga después de instalar ktrain .
A partir de V0.30.X, la instalación de TensorFlow es opcional y solo se requiere si capacita redes neuronales. Aunque Ktrain utiliza TensorFlow para el entrenamiento de la red neuronal, también incluye una variedad de modelos Pytorch previos a la aparición y modelos Sklearn, que se pueden usar fuera de la caja sin tener instalado TensorFlow, como se resume en esta tabla:

Característica	Flujo tensor	Pytorch	Sklearn
Capacitación de cualquier red neuronal (por ejemplo, clasificación de texto o imagen)	✅
Pregunta de extremo a extremo (previamente)	✅	✅
Extracción de información basada en el control de calidad (previamente)	✅	✅
Clasificación de disparo cero (previamente)		✅
Traducción del idioma (antes del aparato)		✅
Resumen (previado a la aparición)		✅
Transcripción del habla (previamente)		✅
Subtitulación de imágenes (previamente)		✅
Detección de objetos (pretranada)		✅
Análisis de sentimientos (previamente)		✅
GenerativeAi (transformadores de oraciones)		✅
Modelado de temas (Sklearn)			✅
Extracción de frase de teclas (TextBlob/NLTK/Sklearn)			✅

Como se señaló anteriormente, la respuesta de pregunta de extremo a extremo y la extracción de información en Ktrain se pueden usar con TensorFlow (usando framework='tf' ) o Pytorch (usando framework='pt' ).

Cómo citar

Cite el siguiente documento cuando use ktrain :

 @article{maiya2020ktrain,
    title={ktrain: A Low-Code Library for Augmented Machine Learning},
    author={Arun S. Maiya},
    year={2020},
    eprint={2004.10703},
    archivePrefix={arXiv},
    primaryClass={cs.LG},
    journal={arXiv preprint arXiv:2004.10703},
}

Creador: Arun S. Maiya

Correo electrónico: Arun [at] maiya [dot] net

Expandir

ktrain

Descripción general | Tutoriales | Ejemplos | Instalación | Preguntas frecuentes | API Docs | Cómo citar

Bienvenido a Ktrain

Noticias y anuncios

Descripción general

Tutoriales

Ejemplos

Ejemplo: Clasificación de texto de reseñas de películas IMDB usando Bert _{^{[ver cuaderno]}}

Ejemplo: Clasificación de imágenes de perros y gatos utilizando un modelo RESNET50 previamente practicado _{^{[ver cuaderno]}}

Ejemplo: etiquetado de secuencia para el reconocimiento de entidad nombrado utilizando un modelo LSTM CRF bidireccional inicializado aleatoriamente _{^{[ver cuaderno]}}

Ejemplo: Clasificación de nodo en el gráfico Cora Citation utilizando un modelo GraphSage _{^{[ver Notbook]}}

Ejemplo: Clasificación de texto con transformadores faciales para abrazos en 20 conjuntos de datos de grupos de noticias usando Distilbert _{^{[ver cuaderno]}}

Ejemplo: Clasificación tabular para la predicción de supervivencia titánica utilizando un MLP _{^{[ver cuaderno]}}

Se pueden encontrar ejemplos adicionales aquí.

Instalación

Notas sobre las versiones de TensorFlow

Notas adicionales sobre la instalación

Cómo citar

Google Dorks

shepherd

mongo express

hidusbf

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express

ktrain

Descripción general | Tutoriales | Ejemplos | Instalación | Preguntas frecuentes | API Docs | Cómo citar

Bienvenido a Ktrain

Noticias y anuncios

Descripción general

Tutoriales

Ejemplos

Ejemplo: Clasificación de texto de reseñas de películas IMDB usando Bert [ver cuaderno]

Ejemplo: Clasificación de imágenes de perros y gatos utilizando un modelo RESNET50 previamente practicado [ver cuaderno]

Ejemplo: etiquetado de secuencia para el reconocimiento de entidad nombrado utilizando un modelo LSTM CRF bidireccional inicializado aleatoriamente [ver cuaderno]

Ejemplo: Clasificación de nodo en el gráfico Cora Citation utilizando un modelo GraphSage [ver Notbook]

Ejemplo: Clasificación de texto con transformadores faciales para abrazos en 20 conjuntos de datos de grupos de noticias usando Distilbert [ver cuaderno]

Ejemplo: Clasificación tabular para la predicción de supervivencia titánica utilizando un MLP [ver cuaderno]

Se pueden encontrar ejemplos adicionales aquí.

Instalación

Notas sobre las versiones de TensorFlow

Notas adicionales sobre la instalación

Cómo citar

Ejemplo: Clasificación de texto de reseñas de películas IMDB usando Bert _{^{[ver cuaderno]}}

Ejemplo: Clasificación de imágenes de perros y gatos utilizando un modelo RESNET50 previamente practicado _{^{[ver cuaderno]}}

Ejemplo: etiquetado de secuencia para el reconocimiento de entidad nombrado utilizando un modelo LSTM CRF bidireccional inicializado aleatoriamente _{^{[ver cuaderno]}}

Ejemplo: Clasificación de nodo en el gráfico Cora Citation utilizando un modelo GraphSage _{^{[ver Notbook]}}

Ejemplo: Clasificación de texto con transformadores faciales para abrazos en 20 conjuntos de datos de grupos de noticias usando Distilbert _{^{[ver cuaderno]}}

Ejemplo: Clasificación tabular para la predicción de supervivencia titánica utilizando un MLP _{^{[ver cuaderno]}}