Téléchargement FinBERT - Téléchargement du code source FinBERT

FinBERT

Autre code source

1.0.0

Télécharger

Finbert

***** 2 juin 2022: Plus de modèles Finbert affinés disponibles *****

Visitez Finbert.ai pour plus de détails sur le développement récent de Finbert.

Nous avons un modèle pré-étiré Finbert ajusté sur plusieurs tâches Financières NLP, tous surperformant des modèles d'apprentissage automatique traditionnels, des modèles d'apprentissage en profondeur et des modèles BERT affinés. Tous les modèles Finbert affinés sont hébergés publiquement à Huggingface ?. Plus précisément, nous avons ce qui suit:

Prétrainé par Finbert : le modèle Finbert pré-entraîné sur le texte financier à grande échelle. lien
Finbert-Sentiment : pour la tâche de classification des sentiments. lien
Finbert-ESG : pour la tâche de classification ESG. lien
Finbert-FLS : pour la tâche de classification des déclarations prospectives (FLS). lien

Dans ce repo github,

Finbert-Demo.ipynb montre comment appliquer le modèle Finbert ajusté sur des tâches NLP spécifiques.
Finetune.ipynb illustre le processus de fin de finbert.

Arrière-plan :

FinBERT est un modèle Bert pré-formé sur le texte de la communication financière. Le but est d'améliorer la recherche et la pratique de la PNL finaincale. Il est formé sur les trois corpus de communication finanique suivants. La taille totale des corpus est de 4,9 milliards de jetons.

Rapports d'entreprise 10-K et 10-Q: 2,5b
Transcriptions des appels de gains: jetons 1.3b
Rapports d'analystes: jetons 1.1b

FinBERT entraîne des performances de pointe sur diverses tâches financières de la PNL, notamment l'analyse des sentiments, la classification ESG, la classification des déclarations prospectives (FLS). Avec la publication de FinBERT , nous espérons que les praticiens et les chercheurs pourront utiliser FinBERT pour un plus large éventail de demandes où l'objectif de prédiction va au-delà du sentiment, tels que les résultats liés aux finances, notamment les rendements boursiers, les volatilités des actions, la fraude d'entreprise, etc.

***** 30 juillet 2021: Migré vers HuggingFace? *****

Le modèle FinBERT ajusté pour la classification des sentiments financiers a été téléchargé et intégré à la bibliothèque transformers de HuggingFace. Ce modèle est affiné sur 10 000 phrases annotées manuellement (positives, négatives, neutres) des rapports d'analystes. Ce modèle obtient des performances supérieures sur la tâche financière Anlaysis. Si vous êtes simplement intéressé à utiliser FinBERT pour l'analyse du ton financier, essayez-le.

 from transformers import BertTokenizer , BertForSequenceClassification
import numpy as np

finbert = BertForSequenceClassification . from_pretrained ( 'yiyanghkust/finbert-tone' , num_labels = 3 )
tokenizer = BertTokenizer . from_pretrained ( 'yiyanghkust/finbert-tone' )

sentences = [ "there is a shortage of capital, and we need extra financing" , 
             "growth is strong and we have plenty of liquidity" , 
             "there are doubts about our finances" , 
             "profits are flat" ]

inputs = tokenizer ( sentences , return_tensors = "pt" , padding = True )
outputs = finbert ( ** inputs ) [ 0 ]

labels = { 0 : 'neutral' , 1 : 'positive' , 2 : 'negative' }
for idx , sent in enumerate ( sentences ) :
    print ( sent , '----' , labels [ np . argmax ( outputs . detach ( ) . numpy ( ) [ idx ] ) ] )
    
'' '
there is a shortage of capital , and we need extra financing -- -- negative
growth is strong and we have plenty of liquidity -- -- positive
there are doubts about our finances -- -- negative
profits are flat -- -- neutral
'' '

***** 16 juin 2020: modèle de finbert pré-entraîné sorti *****

Nous fournissons quatre versions de poids Finbert pré-formés.

Finbert-Finvocab-Oclélé ( recommandé )
Finbert-Finvocab-basé
Finbert-Basevocab-incarné
Finbert-Basevocab-basé

FinVocab est un nouveau vocabulaire de la pièce sur nos corpus finaniques à l'aide de la bibliothèque de phrases. Nous produisons respectivement des versions en boîtier et non cuites de FinVocab , avec des tailles de 28 573 et 30 873 jetons. Ceci est très similaire aux tailles de jetons de 28 996 et 30 522 des tailles d'origine du Bert Bert et BaseVocab non cuites.

Finvocab-
Finvocab basé

Citation

 @misc{yang2020finbert,
    title={FinBERT: A Pretrained Language Model for Financial Communications},
    author={Yi Yang and Mark Christopher Siy UY and Allen Huang},
    year={2020},
    eprint={2006.08097},
    archivePrefix={arXiv},
    }

Contact

Veuillez publier un problème GitHub ou contactez [email protected] si vous avez des questions.

Développer

Informations supplémentaires

Version 1.0.0
Type Autre code source
Date de mise à jour 2025-04-17
taille 22.32KB
Provenant de Github

Applications connexes

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout