entity_aspect_analysis Télécharger - entity_aspect_analysis Code source Télécharger

entity_aspect_analysis

Code Source AI

1.0.0

Télécharger

Aperçu du projet

Entité + Opinion (aspect) Extraction des avis sur le service client ainsi qu'une évaluation contre de véritables étiquettes annotées.

Ensemble de données:

Description: Avis de restauration à service client Yelp Yelp
Nom: train.csv
Contenu: le fichier CSV contient deux colonnes (révision, sentiment / opinion / étiquette d'aspect)
Remarque: seules les revues brutes ont été analysées. L'étiquette de sentiment / opinion a été ignorée car le but du code était de trouver des moyens améliorés de l'extraire.
Remarque: Ce fichier a été utilisé uniquement à des fins d'EDA.

Vraies étiquettes

L'ensemble de données n'a pas subi d'annotation humaine pour générer de vraies étiquettes.
Un fichier sample_review.csv (contenant une seule revue annotée) a été créé pour une comparaison POC des étiquettes True-VS-Pred.

Pièces du projet:

Partie I - Eda

Partie II - Extraction de tuple d'opinion entité

Ce module concerne l'extraction de l'entité en cours d'examen (par exemple, «nourriture») parallèlement à l'opinion du réviseur concernant l'entité (par exemple, «quelque peu savoureuse»).

Partie III - Évaluation

Ce module s'intéresse à l'évaluation de l'extraction de tuple entité-opinion contre les annotations de vérité au sol.

EDA: Insights initiaux et généraux

Num de revue: 1121
Sentiment: ~ 60% (POS); ~ 20% (neutre); ~ 20% (NEG) La plupart des gens présentent des émotions positives concernant leur expérience culinaire.
Longueur du mot: environ. 50% des revues sont de 6 à 15 jetons. La plupart des gens ne prennent pas le temps d'écrire une critique «très approfondie».
EDA étendu - Techniques de PNL supplémentaires qui peuvent être utilisées pour obtenir des informations: modèle de questions / réponses, WordCloud, Nombre de fréquences N-grammes (après les préfixes morphologiques), correspondance floue), algorithmes de clustering (Aspect leicosyntax, semestrie Distinction dans les aliments / boissons, distinction dans les types de repas (petit-déjeuner, déjeuner, dîner), distinction binaire de jetons (adjectifs vs repos), analyse de l'intensificateur adverbial, analyse de dépendance syntaxique, distribution des ponctuations (types, binaire, combinaison avec le sentiment).

Code

EDA - Voir le fichier EDA.ipynb
Extraction d'opinion d'entité + True-VS-Pred Eval. - Projet ( .py Modules)

Instructions

Exécutez le module main.py

Notes:

Assurez-vous de créer un fichier .env pour stocker votre clé API OpenAI.
Utilisez le format suivant: OPENAI_API_KEY = "your_openai_api_key"

Mise en œuvre et alternatives:

Eda

Approches simplistes (rapidement, fournir simplement une vue macro initiale des données)

Distribution du nombre de mots (absolue et normalisée) pour mesurer la durée globale des critiques.
Nuage de mots

Une compréhension plus approfondie

Passer du lexosyntactique à une approche d'interface sémantique-pragmatique

Modélisation de sujets avec bertopique

Extraction de l'entité-opinion

Les modèles NER sont confinés à un ensemble d'entités formées qui ne reflètent pas tout le spectre des entités possibles dans tous les domaines (par exemple, les revues de restaurants). Ils nécessitent un processus fastidieux d'annotations, de révision et de formation.
Les modèles de questions / réponses sont principalement formés sur un ensemble spécifique de questions et de jeux de données et peuvent avoir plus d'erreurs de type I et II que les LLM.

Ingénierie rapide

L'accent a été mis sur ce qui suit:

Cot (chaîne de pensée)
Apprentissage à quelques coups
Système / utilisateur / Assistant Rôle Distinction
Rassurant le modèle

Approche d'évaluation: Extraction LLM contre les annotations de vérité au sol

Transformateurs de phrases Bert pour mesurer la similitude textuelle sémantique en utilisant la similitude du cosinus.

Après avoir testé diverses variations linguistiques des entités et des opinions prédites à VRS (aspects), un seuil de 0,85 a été défini pour accepter la prédiction du modèle dans la production.

Alternatives d'évaluation

Transformateurs de phrases aux côtés de solutions basées sur des règles

Combiner des approches sophistiquées (comme les transformateurs de phrases) avec des approches traditionnelles basées sur des règles afin de renforcer la validité des résultats.

Par exemple, des solutions basées sur les transformateurs combinées à l'analyse de dépendance syntaxique, POS et NER (caractéristiques linguistiques) pourraient aider à s'assurer que le «restaurant» et «le restaurant» sont considérés comme les mêmes (avec / out le déterminant) par opposition à l'exemple «savoureux» et «quelque peu savoureux» d'en haut.

Métriques de classification traditionnelles (rappel, précision, score F1, précision)

Des mesures de classification plus traditionnelles (rappel, précision, score F1, précision) sont moins pertinentes dans ce cas.

De nombreux composants de la matrice de confusion ne sont pas pertinents dans une tâche de classification binaire d'un seul mot / phrase par rapport à une revue entière (une fois pour la reconnaissance de l'entité et une fois pour l'aspect). Cela rend impossible de calculer certaines de ces mesures.

De plus, ces mesures ne parviennent pas à capturer pleinement la sémantique minutieuse influencée par l'inclusion / l'élimination des modificateurs adjectivaux / noms et des intensificateurs adverbiaux. Prenez par exemple, «savoureux» vs «quelque peu savoureux».

De plus, cela soulève la question de savoir s'il faut prendre en compte par rapport aux matchs partiels tels que ceux-ci lors de l'utilisation du rappel, de la précision, du score F1 et de la précision.

Métriques traditionnelles basées sur le N-Gram (similitude lexosyntactique)

Je crois cependant que des mesures traditionnelles basées sur le N-Gram pourraient être utilisées pour établir une base de référence:

Bleu (axé sur la précision)
Rouge (axé sur le rappel)
Meteor (calcule la moyenne harmonique de précision et de rappel aux côtés des pénalités pour les différences de l'ordre des mots et de la phrase)

Viabilité de la solution dans la production

Bien qu'il nécessite des tests plus approfondis, l'approche de similitude en cosinus était utilisée pour mesurer la similitude textuelle sémantique entre les intérêts de phrase Bert intégrés aux côtés d'un seuil relativement strict (qui devrait surtout prendre en compte la présence / absence de modificateurs d'adjectival / nom et d'intensificateurs adverbiaux), pourrait fonctionner dans un environnement de production.

Il existe également des considérations supplémentaires dans un environnement de production, telles que la latence, le temps de calcul, l'hébergement de modèles lourds sur les serveurs et les coûts supplémentaires.

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-06-30
taille 682.98KB
Provenant de Github

Applications connexes

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
Chien_Renard_Lapin

2022-08-01
Moteur d'analyse de données Lihua version gratuite 3.0_search_navigation_collection_public opinion_ranking_api

2022-06-28

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
promptl

Code Source AI

1.0.0
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Autre code source

1.0.0

Actualités connexes Tout