Cross Domain_NER Télécharger - Cross Domain_NER Téléchargement du code source

Cross Domain_NER

Code Source AI

1.0.0

Télécharger

Cross-domain_ner

Ner inter-domaine à l'aide de la modélisation du langage inter-domaine, code pour le papier ACL 2019.

Introduction

NER est une tâche fondamentale dans la PNL. En raison de la limitation des ressources étiquetées, le Ner inter-domaine a été une tâche difficile. La plupart des travaux antérieurs se concentrent sur le scénario supervisé, utilisant des données étiquetées pour les domaines source et cible. Un inconvénient d'un tel paramètre est qu'ils ne peuvent pas s'entraîner pour des domaines qui n'ont pas de données étiquetées.

Nous abordons ce problème, en utilisant le Domain Cross-Domain comme un domaine croisé de pont pour l'adaptation du domaine NER. Effectuer un transfert de tâches et de domaines croisés en concevant un nouveau réseau de génération de paramètres .

Les expériences sur le jeu de données CBS Scitech News montrent que notre modèle peut permettre efficacement l'adaptation du domaine non supervisé, tout en dérivant l'adaptation du domaine supervisé entre les domaines avec des types d'entités complètement différents (IE News vs Biomedical).

La ligne de base naïve du modèle unique ( STM dans le papier) a principalement suivi NCRF ++.

Pour plus de détails, veuillez consulter notre article:

Ner inter-domaine en utilisant la modélisation du langage inter-domaine
Chen Jia, Xiaobo Liang et Yue Zhang *
(* Auteur correspondant)
ACL 2019

Exigences

 Python 2 or 3 
PyTorch 0.3

La mémoire d'un GPU ne doit pas être inférieure à 8 Go pour s'adapter au modèle.

Incorporation pré-entraînée

GLANT VECTEURS DE MOTS DE LA DIMENDENCE (citez d' ici ).

Ensemble de données

Domaine source:

Conll-2003 données anglaises NER.

Domaine cible

Non supervisé: CBS Scitech News (Test Set) (dans: ` un peu supervisé_domain_adaptation data news_tech tech_test).
Supervisé: ensemble de données BIONLP13PC et ensemble de données BIONLP13CG.

Données brutes LM

Rétraction Les données brutes du domaine sont publiées avec l'ensemble de données CONLL-2003.
Scitech News Domain Raw Data Download.
Reuters News Domain Raw Data Download.

Usage

Commande

supervised_domain_adaptation , unsupervised_domain_adaptation et combined_SDA_and_UDA peut utiliser la commande suivante pour la faire s'exécuter.

 python main.py --config train.NER.config

Le fichier train.NER.config contient un chemin de données et des hyperparamètres de modèle suivant NCRF ++.

Format d'entrée

Nous recommandons d'utiliser le style d'étiquette IBOES pour l'ensemble de données NER.
Nous recommandons d'utiliser un style d'entrée de la phrase par ligne pour les données brutes avec la segmentation des mots.

Citer:

Si vous utilisez nos données ou notre code, veuillez citer notre article comme suit:

 @inproceedings{jia2019cross,
  title={Cross-domain ner using cross-domain language modeling},
  author={Jia, Chen and Liang, Xiaobo and Zhang, Yue},
  booktitle={Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics},
  pages={2464--2474},
  year={2019}
  organization={Association for Computational Linguistics}
}

Mise à jour

V2. Combinant un scénario supervisé et un scénario non supervisé dans combined_SDA_and_UDA .
V1. Le scénario supervisé précédent dans supervised_domain_adaptation ;
Le scénario non supervisé précédent dans unsupervised_domain_adaptation ;

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-09-10
taille 330.64KB
Provenant de Github

Applications connexes

Newsletter_sign up_form

2024-11-01
Version officielle d'Indie Cross

2023-06-01
Domaine binaire

2022-08-28
La Croix

2022-08-27
La Croix d'Or

2022-07-31
Chrono Cross : Édition Les Rêveurs Radicaux

2022-07-24

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout