Article Summarizer Using AI -AIソースコードArticle Summarizer Using AIダウンロード

Article Summarizer Using AI

その他のソースコード

1.0.0

ダウンロード

記事とマリアズ・ユスピング・アイ

Advanced Natural Language Processing（NLP）手法を使用した記事の簡潔な要約を提供するAIベースのWebアプリケーション。

導入

article-summarizer-using-aiは、 NLPを使用して長い記事を要約するように設計されたWebアプリケーションです。このアプリケーションにより、ユーザーは独自の記事をアップロードしたり、サンプルデータを使用してさまざまなスタイルで概要を生成したりできます。

データ探索

データセット

トレーニングと評価に使用されるデータセットは、PubMed要約データセットです。これには、要約として使用される対応する要約を含むPubMedの記事が含まれています。

データセットのロード：

 from datasets import load_dataset

pubmed_data = load_dataset ( "ccdv/pubmed-summarization" , split = 'train[:1000]' )

最初のデータクリーニング：

データの品質を確保するために、欠損値のある行を削除します。

 pubmed_data = pubmed_data . filter ( lambda x : x [ 'article' ] is not None and x [ 'abstract' ] is not None )

探索的データ分析：
- 記事の長さと概要の長さの分布を調べます。
- データセット内の一般的なトピックと用語を特定します。
```
 print ( pubmed_data [ 0 ])  # View the first data entry 
```

モデル選択

前処理

テキストトークン化：

詳細な分析のために、テキストを文と単語に分割します。

 from nltk . tokenize import sent_tokenize , word_tokenize

sentences = sent_tokenize ( article_text )
words = word_tokenize ( sentence )

単語の削除を停止：

要約に貢献しない一般的な英語の単語を削除します。

 from nltk . corpus import stopwords

stop_words = set ( stopwords . words ( 'english' ))
words = [ word for word in words if word . lower () not in stop_words ]

一化：

単語をベースフォームに変換します。

 from nltk . stem import WordNetLemmatizer

lemmatizer = WordNetLemmatizer ()
words = [ lemmatizer . lemmatize ( word . lower ()) for word in words ]

生成モデル

API構成：

モデル生成には、 google.generativeaiライブラリを使用してください。

 import google . generativeai as genai
import os

api_key = os . environ . get ( 'your_api_key' )
genai . configure ( api_key = api_key )

モデルの初期化：
- 生成AIモデルを設定します。
```
 model = genai . GenerativeModel ()
```

モデルの微調整

トレーニング

PubMedデータセットでモデルを微調整して、概要の品質を向上させます。

 # Example pseudo-code for fine-tuning
model . train ( dataset = pubmed_data , epochs = 10 , learning_rate = 0.001 )

抽出的な要約

アプローチ

抽出的な要約のために、アプリケーションは従来のNLP手法を使用して、生成モデルに依存せずに記事から重要な文を特定します。

抽出概要スクリプト：
提供されたextractive_summary.pyをapp.pyに変更し、プロジェクトルートに移動します。
```
mv /mnt/data/extractive_summary.py app.py
```

コアロジック：

抽出要約スクリプトは、統計的およびヒューリスティックな方法を使用して、テキスト内の最も重要な文を識別します。

 # Example of extractive summarization
def extractive_summary ( text ):
    # Tokenize the text and rank sentences
    sentences = sent_tokenize ( text )
    # Rank and select key sentences (pseudo-code)
    summary = ' ' . join ( sentences [: 3 ])  # Example: Select first 3 sentences
    return summary

統合：

抽出要約ロジックをフラスコアプリケーションと統合して、ユーザーが生成要約と抽出概要を選択できるようにします。

 @ app . route ( '/summarize' , methods = [ 'POST' ])
def summarize ():
    if 'file' in request . files and request . files [ 'file' ]. filename != '' :
        file = request . files [ 'file' ]
        article_text = file . read (). decode ( "utf-8" )
    else :
        sample_index = int ( request . form [ 'sample' ])
        article_text = pubmed_data [ sample_index ][ 'article' ]

    style = request . form . get ( 'style' , 'brief' )
    summary_method = request . form . get ( 'method' , 'generative' )
    
    if summary_method == 'generative' :
        summary_text = preprocess_and_summarize ( article_text , style )
    else :
        summary_text = extractive_summary ( article_text )

    return render_template ( 'result.html' , original = article_text , summary = summary_text )

評価

ルージュやブルーなどのメトリックを使用して、モデルのパフォーマンスを評価します。

 from nltk . translate . bleu_score import sentence_bleu

reference = [ reference_summary . split ()]
candidate = generated_summary . split ()
score = sentence_bleu ( reference , candidate )
print ( f'BLEU Score: { score } ' )

Webアプリケーション開発

バックエンド

フラスコのセットアップ：

Flaskアプリを初期化し、ログインマネージャーを構成します。

 from flask import Flask
from flask_login import LoginManager

app = Flask ( __name__ )
app . secret_key = 'your_secret_key'
login_manager = LoginManager ( app )

ルートと認証：

ログイン、登録、要約、ログアウト用のルートを実装します。

 @ app . route ( '/login' , methods = [ 'GET' , 'POST' ])
def login ():
    # login logic here
    return render_template ( 'login.html' )

フロントエンド

テンプレート：

ユーザーインターフェイスのHTMLテンプレートを作成します。

 <!-- templates/index.html -->
< form action =" {{ url_for('summarize') }} " method =" post " enctype =" multipart/form-data " >
    < input type =" file " name =" file " >
    < button type =" submit " > Summarize </ button >
</ form >

ユーザーエクスペリエンス：
- 明確な指示とフィードバックを備えたユーザーフレンドリーなインターフェイスを確保します。

インストール

前提条件

Python 3.7+
フラスコ
nltk
生成AIライブラリ（例：Google.generativeai）
生成AIのAPIキー

ステップ

リポジトリをクローンします：

git clone https://github.com/yourusername/Article-Summarizer-Using-AI.git

プロジェクトディレクトリに移動します。
```
 cd Article-Summarizer-Using-AI
```

仮想環境を作成します：

python -m venv venv
source venv/bin/activate  # On Windows use `venvScriptsactivate`

依存関係をインストールします：
```
pip install -r requirements.txt
```
環境変数を設定します：
- APIキーを使用して.envファイルを作成します。
```
 your_api_key=<YOUR_GENERATIVE_AI_API_KEY>
```
NLTKデータのダウンロード：
スクリプトは、必要なNLTKデータのダウンロードを処理します。

使用法

アプリケーションを実行します：
```
flask run --port=5001
```
アプリへのアクセス：
- ブラウザのhttp://127.0.0.1:5001にアクセスしてください。
ログイン/登録：
- 新しいアカウントを登録するか、既存の資格情報でログインします。
記事の要約：
- テキストファイルをアップロードするか、要約するサンプルを選択します。
概要を見る：
- 要約されたテキストは、結果ページに表示されます。

記事のムライザーを使用していただきありがとうございます！要約のニーズに役立つことを願っています。

拡大する

追加情報

バージョン 1.0.0
タイプその他のソースコード
更新時間 2025-03-10
サイズ 13.53KB
から Github

Article Summarizer Using AI

記事とマリアズ・ユスピング・アイ

目次

導入

データ探索

データセット

モデル選択

前処理

生成モデル

モデルの微調整

トレーニング

抽出的な要約

アプローチ

評価

Webアプリケーション開発

バックエンド

フロントエンド

インストール

前提条件

ステップ

使用法

krita ai diffusion

その前に

AIフォトエンハンサー

AIクリエイター

ジャスパーAI

エイリアンAI

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express