Article Summarizer Using AI Download - Article Summarizer Using AI Скачать

Article Summarizer Using AI

Другой исходный код

1.0.0

Скачать

Статья-Суммаризатор-УСЕЛАЯ-АИ

Веб-приложение на основе искусственного интеллекта, которое предоставляет краткие резюме статей с использованием методов расширенного естественного языка (NLP).

Введение

Статья-Summarizer-USING-AI -это веб-приложение, предназначенное для суммирования длинных статей с использованием NLP. Приложение позволяет пользователям загружать свои собственные статьи или использовать образцы данных для генерации резюме в различных стилях, используя генеративную модель искусственного интеллекта.

Исследование данных

Набор данных

Набор данных, используемый для обучения и оценки, является набором данных PubMed Summarization. Он включает в себя статьи из PubMed с соответствующими тезисами, используемыми в качестве резюме.

Загрузка набора данных :

 from datasets import load_dataset

pubmed_data = load_dataset ( "ccdv/pubmed-summarization" , split = 'train[:1000]' )

Первоначальная очистка данных :
- Удалить строки с отсутствующими значениями, чтобы обеспечить качество данных.
```
 pubmed_data = pubmed_data . filter ( lambda x : x [ 'article' ] is not None and x [ 'abstract' ] is not None )
```
Исследовательский анализ данных :
- Изучите распределение длины статьи и суммарных длин.
- Определите общие темы и терминологию в рамках набора данных.
```
 print ( pubmed_data [ 0 ])  # View the first data entry 
```

Выбор модели

Предварительная обработка

Текст -токенизация :

Разделите текст на предложения и слова для подробного анализа.

 from nltk . tokenize import sent_tokenize , word_tokenize

sentences = sent_tokenize ( article_text )
words = word_tokenize ( sentence )

Остановить слова удаление :

Удалите общие английские слова, которые не способствуют сводке.

 from nltk . corpus import stopwords

stop_words = set ( stopwords . words ( 'english' ))
words = [ word for word in words if word . lower () not in stop_words ]

Лемматизация :

Преобразовать слова в их базовые формы.

 from nltk . stem import WordNetLemmatizer

lemmatizer = WordNetLemmatizer ()
words = [ lemmatizer . lemmatize ( word . lower ()) for word in words ]

Генеративная модель

Конфигурация API :

Используйте библиотеку google.generativeai для генерации моделей.

 import google . generativeai as genai
import os

api_key = os . environ . get ( 'your_api_key' )
genai . configure ( api_key = api_key )

Инициализация модели :
- Установите генеративную модель ИИ.
```
 model = genai . GenerativeModel ()
```

Модель тонкой настройки

Обучение

Настраивайте модель с помощью набора данных PubMed, чтобы улучшить качество резюме.
```
 # Example pseudo-code for fine-tuning
model . train ( dataset = pubmed_data , epochs = 10 , learning_rate = 0.001 )
```

Добываемое суммирование

Подход

Для извлечения суммирования приложение использует традиционные методы НЛП для определения ключевых предложений из статьи, не полагаясь на генеративную модель.

Извлечение сводного сценария :
Переименовать предоставленную extractive_summary.py в app.py и переместите его в корень проекта:
```
mv /mnt/data/extractive_summary.py app.py
```

Основная логика :

Сценарий извлечения суммирования использует статистические и эвристические методы для определения наиболее важных предложений в тексте.

 # Example of extractive summarization
def extractive_summary ( text ):
    # Tokenize the text and rank sentences
    sentences = sent_tokenize ( text )
    # Rank and select key sentences (pseudo-code)
    summary = ' ' . join ( sentences [: 3 ])  # Example: Select first 3 sentences
    return summary

Интеграция :

Интегрируйте логику извлечения суммирования с приложением Flask, чтобы позволить пользователям выбирать между генеративными и добывающими резюме.

 @ app . route ( '/summarize' , methods = [ 'POST' ])
def summarize ():
    if 'file' in request . files and request . files [ 'file' ]. filename != '' :
        file = request . files [ 'file' ]
        article_text = file . read (). decode ( "utf-8" )
    else :
        sample_index = int ( request . form [ 'sample' ])
        article_text = pubmed_data [ sample_index ][ 'article' ]

    style = request . form . get ( 'style' , 'brief' )
    summary_method = request . form . get ( 'method' , 'generative' )
    
    if summary_method == 'generative' :
        summary_text = preprocess_and_summarize ( article_text , style )
    else :
        summary_text = extractive_summary ( article_text )

    return render_template ( 'result.html' , original = article_text , summary = summary_text )

Оценка

Оцените производительность модели с использованием таких метрик, как Rouge или Bleu.

 from nltk . translate . bleu_score import sentence_bleu

reference = [ reference_summary . split ()]
candidate = generated_summary . split ()
score = sentence_bleu ( reference , candidate )
print ( f'BLEU Score: { score } ' )

Разработка веб -приложений

Бэкэнд

Установка колбы :

Инициализируйте приложение Flask и настройте диспетчер входа в систему.

 from flask import Flask
from flask_login import LoginManager

app = Flask ( __name__ )
app . secret_key = 'your_secret_key'
login_manager = LoginManager ( app )

Маршруты и аутентификация :
- Реализуйте маршруты для входа в систему, регистрации, суммирования и входа в систему.
```
 @ app . route ( '/login' , methods = [ 'GET' , 'POST' ])
def login ():
    # login logic here
    return render_template ( 'login.html' )
```

Внешний интерфейс

Шаблоны :

Создайте шаблоны HTML для пользовательского интерфейса.

 <!-- templates/index.html -->
< form action =" {{ url_for('summarize') }} " method =" post " enctype =" multipart/form-data " >
    < input type =" file " name =" file " >
    < button type =" submit " > Summarize </ button >
</ form >

Пользовательский опыт :
- Убедитесь, что пользовательский интерфейс с четкими инструкциями и обратной связью.

Установка

Предварительные условия

Python 3.7+
Колба
Nltk
Генеративная библиотека ИИ (например, Google.Generativeai)
Ключ API для генеративного ИИ

Шаги

Клонировать репозиторий :

git clone https://github.com/yourusername/Article-Summarizer-Using-AI.git

Перейдите к каталогу проекта :
```
 cd Article-Summarizer-Using-AI
```

Создайте виртуальную среду :

python -m venv venv
source venv/bin/activate  # On Windows use `venvScriptsactivate`

Установить зависимости :
```
pip install -r requirements.txt
```
Установить переменные среды :
- Создайте файл .env с вашим ключом API.
```
 your_api_key=<YOUR_GENERATIVE_AI_API_KEY>
```
Загрузите данные NLTK :
Сценарий обрабатывает загрузку необходимых данных NLTK.

Использование

Запустите приложение :
```
flask run --port=5001
```
Доступ к приложению :
- Посетите http://127.0.0.1:5001 в вашем браузере.
Войти/регистр :
- Зарегистрируйте новую учетную запись или войдите в систему с существующими учетными данными.
Суммируйте статьи :
- Загрузите текстовый файл или выберите образец для обобщения.
Просмотреть резюме :
- Суммированный текст отображается на странице результатов.

Спасибо, что использовали статью-Summarizer-USING-AI ! Мы надеемся, что вы найдете это полезным для ваших потребностей в суммировании.

Расширять

Дополнительная информация

Версия 1.0.0
Тип Другой исходный код
Время обновления 2025-03-10
размер 13.53KB
От Github

Связанные приложения

krita ai diffusion

2024-11-03
Перед этим

2024-07-08
Усилитель фотографий с искусственным интеллектом

2023-07-14
Создатель ИИ

2023-04-23
Джаспер А.И.

2023-04-12
Чужой ИИ

2022-07-29

Article Summarizer Using AI

Статья-Суммаризатор-УСЕЛАЯ-АИ

Оглавление

Введение

Исследование данных

Набор данных

Выбор модели

Предварительная обработка

Генеративная модель

Модель тонкой настройки

Обучение

Добываемое суммирование

Подход

Оценка

Разработка веб -приложений

Бэкэнд

Внешний интерфейс

Установка

Предварительные условия

Шаги

Использование

krita ai diffusion

Перед этим

Усилитель фотографий с искусственным интеллектом

Создатель ИИ

Джаспер А.И.

Чужой ИИ

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express