Descarga simple effective text matching - Descargar el código fuente simple effective text matching

simple effective text matching

Otro código fuente

1.0.0

Descargar

RE2

Esta es la implementación original de TensorFlow del documento de ACL 2019, una coincidencia de texto simple y efectiva con características de alineación más ricas. Implementación de Pytorch: https://github.com/alibab-edu/simple-effective-text-matching-pytorch.

Enlaces rápidos

Acerca de
Configuración
Uso

Coincidencia de texto simple y efectiva

RE2 es una arquitectura neuronal rápida y fuerte para aplicaciones de coincidencia de texto de propósito general. En una tarea de coincidencia de texto, un modelo toma dos secuencias de texto como entrada y predice su relación. Este método tiene como objetivo explorar qué es suficiente para un fuerte rendimiento en estas tareas. Simplifica u omite muchos componentes lentos que anteriormente se consideran como bloques de construcción de núcleo en la coincidencia de texto. Logra su rendimiento mediante una idea simple, que mantiene tres características clave directamente disponibles para la alineación y fusión entre secuencias: características alineadas anteriores (vectores de rseidual ), características originales de puntos originales (vectores de ebbedding ) y características contextuales (salida del codador ) .

RE2 logra el rendimiento a la par con el estado del arte en cuatro conjuntos de datos de referencia: SNLI, Scitail, Quora y Wikiqa, a través de tareas de inferencia del lenguaje natural, identificación de paráfrasis y selección de respuestas con ningún o pocas adaptaciones específicas de tareas. Tiene una velocidad de inferencia al menos 6 veces más rápida en comparación con los modelos realizados de manera similar.

La siguiente tabla enumera los principales resultados del experimento. El documento informa la desviación promedio y estándar de 10 corridas y los resultados pueden reproducirse fácilmente. El tiempo de inferencia (en segundos) se mide procesando un lote de 8 pares de longitud 20 en las CPU Intel I7. No se incluye el tiempo de cálculo de las características de POS utilizadas por Csran y Diin.

Modelo	Snli	Caramelo	Quora	Wikiqa	Tiempo de inferencia
Bimpm	86.9	-	88.2	0.731	0.05
Esim	88.0	70.6	-	-	-
Diin	88.0	-	89.1	-	1.79
Csran	88.7	86.7	89.2	-	0.28
RE2	88.9 ± 0.1	86.0 ± 0.6	89.2 ± 0.2	0.7618 ± 0.0040	0.03 ~ 0.05

Consulte el documento para obtener más detalles de los componentes y los resultados del experimento.

Configuración

instalar python> = 3.6 y pip
pip install -r requirements.txt
Instale TensorFlow 1.4 o superior (el archivo de la rueda para la versión TensorFlow 1.4 GPU en Python 3.6 se puede encontrar aquí) aquí)
Descargar Glove Word Vectors (Glove.840b.300d) a resources/

Los datos utilizados en el documento se preparan de la siguiente manera:

Snli

Descargar y descifrar SNLI (preprocesado por Tay et al.) A data/orig .
Descomprima todos los archivos ZIP en la carpeta "Data/Orig/Snli". ( cd data/orig/SNLI && gunzip *.gz )
cd data && python prepare_snli.py

Caramelo

Descargar y Unzip Scitail DataSet a data/orig .
cd data && python prepare_scitail.py

Quora

Descargar y descifrar el conjunto de datos de quora (preprocesado por Wang et al.) A data/orig .
cd data && python prepare_quora.py

Wikiqa

Descargar y descifrar wikiqa a data/orig .
cd data && python prepare_wikiqa.py
Descargar y descifrar scripts de evaluación. Use el comando make -B para compilar los archivos de origen en qg-emnlp07-data/eval/trec_eval-8.0 . Mueva el archivo binario "trec_eval" a resources/ .

Uso

Para entrenar un nuevo modelo de coincidencia de texto, ejecute el siguiente comando:

python train.py $config_file .json5

Los archivos de configuración de ejemplo se proporcionan en configs/ :

configs/main.json5 : replique el resultado del experimento principal en el papel.
configs/robustness.json5 : comprobaciones de robustez
configs/ablation.json5 : estudio de ablación

Las instrucciones para escribir sus propios archivos de configuración:

 [
    {
        name : 'exp1' , // name of your experiment, can be the same across different data
        __parents__ : [
            'default' , // always put the default on top
            'data/quora' , // data specific configurations in `configs/data`
            // 'debug', // use "debug" to quick debug your code  
        ] ,
        __repeat__ : 5 ,  // how may repetitions you want
        blocks : 3 , // other configurations for this experiment 
    } ,
    // multiple configurations are executed sequentially
    {
        name : 'exp2' , // results under the same name will be overwritten
        __parents__ : [
            'default' , 
            'data/quora' ,
        ] ,
        __repeat__ : 5 ,  
        blocks : 4 , 
    }
]

Para verificar solo las configuraciones, use

python train.py $config_file .json5 --dry

Citación

Cite el documento de ACL si usa RE2 en su trabajo:

 @inproceedings{yang2019simple,
  title={Simple and Effective Text Matching with Richer Alignment Features},
  author={Yang, Runqi and Zhang, Jianhai and Gao, Xing and Ji, Feng and Chen, Haiqing},
  booktitle={Association for Computational Linguistics (ACL)},
  year={2019}
}

Licencia

RE2 está bajo la licencia Apache 2.0.

Expandir

Información adicional

Versión 1.0.0
Tipo Otro código fuente
Fecha de actualización 2025-04-19
tamaño 182.22KB
Proviene de Github

Aplicaciones relacionadas

Texto Con Jesús Chino

2023-08-23
Texto con Jesús

2023-08-17
Texto con Jesús versión china

2023-08-17
Texto o morir

2023-07-03
CMS simplificado

2014-02-07
Software colaborativo sencillo

2012-03-15

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo