Article Summarizer Using AI -Download - Article Summarizer Using AI -Quellcode -Download

Article Summarizer Using AI

Anderer Quellcode

1.0.0

Herunterladen

Artikel-Ablagerungs-Use-ai

Eine KI-basierte Webanwendung, die präzise Zusammenfassungen von Artikeln mithilfe erweiterter Techniken für natürliche Sprachverarbeitung (NCLP) enthält.

Inhaltsverzeichnis

Einführung
Datenexploration
Modellauswahl
Model Feinabstimmung
Extraktive Zusammenfassung
Entwicklung von Webanwendungen
Installation
Verwendung

Einführung

Artikel-Abhaarungs-Use-ai ist eine Webanwendung, mit der langwierige Artikel mit NLP zusammengefasst sind. Mit der Anwendung können Benutzer ihre eigenen Artikel hochladen oder Beispieldaten verwenden, um Zusammenfassungen in verschiedenen Stilen zu generieren, wobei ein generatives KI -Modell verwendet wird.

Datenexploration

Datensatz

Der für Schulungen und Bewertungen verwendete Datensatz ist der Datensatz von PubMed Summarization. Es enthält Artikel von PubMed mit entsprechenden Abstracts als Zusammenfassungen.

Laden des Datensatzes :

 from datasets import load_dataset

pubmed_data = load_dataset ( "ccdv/pubmed-summarization" , split = 'train[:1000]' )

Erstdatenreinigung :

Entfernen Sie Zeilen mit fehlenden Werten, um die Datenqualität zu gewährleisten.

 pubmed_data = pubmed_data . filter ( lambda x : x [ 'article' ] is not None and x [ 'abstract' ] is not None )

Explorationsdatenanalyse :
- Untersuchen Sie die Verteilung von Artikellängen und Zusammenfassungslängen.
- Identifizieren Sie gemeinsame Themen und Terminologie im Datensatz.
```
 print ( pubmed_data [ 0 ])  # View the first data entry 
```

Modellauswahl

Vorverarbeitung

Text Tokenisierung :

Teilen Sie Text in Sätze und Wörter für eine detaillierte Analyse.

 from nltk . tokenize import sent_tokenize , word_tokenize

sentences = sent_tokenize ( article_text )
words = word_tokenize ( sentence )

STOP -Wörter Entfernung :

Entfernen Sie gemeinsame englische Wörter, die nicht zur Zusammenfassung beitragen.

 from nltk . corpus import stopwords

stop_words = set ( stopwords . words ( 'english' ))
words = [ word for word in words if word . lower () not in stop_words ]

Lemmatisierung :

Wörter in ihre Basisformen konvertieren.

 from nltk . stem import WordNetLemmatizer

lemmatizer = WordNetLemmatizer ()
words = [ lemmatizer . lemmatize ( word . lower ()) for word in words ]

Generatives Modell

API -Konfiguration :

Verwenden Sie die google.generativeai -Bibliothek für die Modellgenerierung.

 import google . generativeai as genai
import os

api_key = os . environ . get ( 'your_api_key' )
genai . configure ( api_key = api_key )

Modellinitialisierung :
- Richten Sie das generative KI -Modell ein.
```
 model = genai . GenerativeModel ()
```

Model Feinabstimmung

Ausbildung

Fein des Modells mit dem PubMed-Datensatz optimieren, um die zusammenfassende Qualität zu verbessern.

 # Example pseudo-code for fine-tuning
model . train ( dataset = pubmed_data , epochs = 10 , learning_rate = 0.001 )

Extraktive Zusammenfassung

Ansatz

Für die extraktive Zusammenfassung verwendet die Anwendung herkömmliche NLP -Techniken, um wichtige Sätze aus dem Artikel zu identifizieren, ohne sich auf ein generatives Modell zu verlassen.

Rohstoff -Zusammenfassungsskript :
Benennen Sie die bereitgestellte extractive_summary.py in app.py um und verschieben Sie es in das Projektroot:
```
mv /mnt/data/extractive_summary.py app.py
```

Kernlogik :

Das extraktive Zusammenfassungskript verwendet statistische und heuristische Methoden, um die wichtigsten Sätze im Text zu identifizieren.

 # Example of extractive summarization
def extractive_summary ( text ):
    # Tokenize the text and rank sentences
    sentences = sent_tokenize ( text )
    # Rank and select key sentences (pseudo-code)
    summary = ' ' . join ( sentences [: 3 ])  # Example: Select first 3 sentences
    return summary

Integration :

Integrieren Sie die Extraktive -Summar -Logik in die Flask -Anwendung, damit Benutzer zwischen generativen und extraktiven Zusammenfassungen auswählen können.

 @ app . route ( '/summarize' , methods = [ 'POST' ])
def summarize ():
    if 'file' in request . files and request . files [ 'file' ]. filename != '' :
        file = request . files [ 'file' ]
        article_text = file . read (). decode ( "utf-8" )
    else :
        sample_index = int ( request . form [ 'sample' ])
        article_text = pubmed_data [ sample_index ][ 'article' ]

    style = request . form . get ( 'style' , 'brief' )
    summary_method = request . form . get ( 'method' , 'generative' )
    
    if summary_method == 'generative' :
        summary_text = preprocess_and_summarize ( article_text , style )
    else :
        summary_text = extractive_summary ( article_text )

    return render_template ( 'result.html' , original = article_text , summary = summary_text )

Auswertung

Bewerten Sie die Leistung des Modells anhand von Metriken wie Rouge oder Bleu.

 from nltk . translate . bleu_score import sentence_bleu

reference = [ reference_summary . split ()]
candidate = generated_summary . split ()
score = sentence_bleu ( reference , candidate )
print ( f'BLEU Score: { score } ' )

Entwicklung von Webanwendungen

Backend

Flask Setup :

Initialisieren Sie die Flask -App und konfigurieren Sie den Login -Manager.

 from flask import Flask
from flask_login import LoginManager

app = Flask ( __name__ )
app . secret_key = 'your_secret_key'
login_manager = LoginManager ( app )

Routen und Authentifizierung :

Implementieren Sie Routen für Anmeldung, Registrierung, Zusammenfassung und Abmelden.

 @ app . route ( '/login' , methods = [ 'GET' , 'POST' ])
def login ():
    # login logic here
    return render_template ( 'login.html' )

Frontend

Vorlagen :

Erstellen Sie HTML -Vorlagen für die Benutzeroberfläche.

 <!-- templates/index.html -->
< form action =" {{ url_for('summarize') }} " method =" post " enctype =" multipart/form-data " >
    < input type =" file " name =" file " >
    < button type =" submit " > Summarize </ button >
</ form >

Benutzererfahrung :
- Stellen Sie eine benutzerfreundliche Oberfläche mit klaren Anweisungen und Feedback sicher.

Installation

Voraussetzungen

Python 3.7+
Flasche
NLTK
Generative AI -Bibliothek (z. B. Google.GenerATiveai)
Ein API -Schlüssel für generative KI

Schritte

Klonen Sie das Repository :

git clone https://github.com/yourusername/Article-Summarizer-Using-AI.git

Navigieren Sie zum Projektverzeichnis :
```
 cd Article-Summarizer-Using-AI
```

Erstellen Sie eine virtuelle Umgebung :

python -m venv venv
source venv/bin/activate  # On Windows use `venvScriptsactivate`

Abhängigkeiten installieren :
```
pip install -r requirements.txt
```
Umgebungsvariablen festlegen :
- Erstellen Sie eine .env -Datei mit Ihrem API -Schlüssel.
```
 your_api_key=<YOUR_GENERATIVE_AI_API_KEY>
```
Laden Sie NLTK -Daten herunter :
Das Skript erledigt das Herunterladen der erforderlichen NLTK -Daten.

Verwendung

Führen Sie die Anwendung aus :
```
flask run --port=5001
```
Zugriff auf die App :
- Besuchen Sie http://127.0.0.1:5001 in Ihrem Browser.
Login/Register :
- Registrieren Sie ein neues Konto oder melden Sie sich mit vorhandenen Anmeldeinformationen an.
Artikel zusammenfassen :
- Laden Sie eine Textdatei hoch oder wählen Sie ein Beispiel zum Zusammenfassen.
Zusammenfassung anzeigen :
- Der zusammengefasste Text wird auf der Ergebnisseite angezeigt.

Vielen Dank für die Verwendung von Artikeln-Ablagerungs-Use-Use-ai ! Wir hoffen, dass Sie es für Ihre Zusammenfassungsbedürfnisse nützlich finden.

Expandieren

Zusätzliche Informationen

Version 1.0.0
Typ Anderer Quellcode
Aktualisierungszeit 2025-03-10
Größe 13.53KB
Kommt von Github

Ähnliche Anwendungen

krita ai diffusion

2024-11-03
Davor

2024-07-08
AI Photo Enhancer

2023-07-14
KI-Ersteller

2023-04-23
Jasper KI

2023-04-12
Außerirdische KI

2022-07-29

Article Summarizer Using AI

Artikel-Ablagerungs-Use-ai

Inhaltsverzeichnis

Einführung

Datenexploration

Datensatz

Modellauswahl

Vorverarbeitung

Generatives Modell

Model Feinabstimmung

Ausbildung

Extraktive Zusammenfassung

Ansatz

Auswertung

Entwicklung von Webanwendungen

Backend

Frontend

Installation

Voraussetzungen

Schritte

Verwendung

krita ai diffusion

Davor

AI Photo Enhancer

KI-Ersteller

Jasper KI

Außerirdische KI

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express