Загрузка GPT Awesome List Generator - GPT Awesome List Generator Generut

GPT Awesome List Generator

Другой исходный код

1.0.0

Скачать

Потрясающий генератор списка

Это программа Python, которая автоматически генерирует «потрясающий список» для определенного ключевого слова в качестве файла разметки. «Удивительный список» - это список ресурсов, связанных с конкретной темой. В настоящее время ресурсы включают проекты Github, статьи Google Scholar, видео на YouTube, курсы, слайды и презентации, программное обеспечение и инструменты и подкасты. Удивительный список автоматически генерируется с использованием моделей GPT; Вы можете выбрать между различными моделями для создания списка, таких как GPT 3.5 или GPT 4.

Демонстрация?

Awesome_list.mp4

Настраивать

Убедитесь, что вы используете Python 3.10.
Установите стихи с официального сайта.
Установите зависимости, используя поэзию:
```
poetry install
```
Создайте файл .env в корне проекта и добавьте следующую переменную среды:
```
 OPENAI_API_KEY=<your_openai_api_key>
```

Настройка ключа Google Cloud API и пользовательский идентификатор поисковой системы

Предварительные условия

Учетная запись Google.

Инструкции

Получить ключ Google Cloud API

Посетите Google Cloud Console.
Если вы еще этого не сделали, создайте новый проект, нажав на раскрывающую очередь «Выберите проект» в верхнем правом углу, а затем нажмите «Новый проект».
После того, как ваш проект будет создан и выбран, перейдите в меню навигации (три горизонтальные линии в верхнем левом углу), а затем нажмите «API & Services»> «учетные данные».
Нажмите кнопку «Создать учетные данные» и выберите «Клавиша API». После создания будет отображаться ваш ключ API.
Скопируйте свой ключ API и безопасно сохраните его. Вы используете этот ключ в вашем приложении для аутентификации ваших запросов.

Установите пользовательскую поисковую систему и получите идентификатор поисковой системы

Зайдите в Google пользовательский поиск домашней страницы.
Нажмите «Создать пользовательскую поисковую систему».
В разделе «Сайты для поиска» вы можете указать веб -сайты, которые вы хотите найти или выбрать «Поиск всей сети», чтобы разрешить более широкие возможности поиска. Однако, если вы выберете «Поиск всей Интернета», обязательно переключите «поиск только в разделе« Search »в разделе« Сайты для поиска ».
Заполните другие необходимые поля, такие как название вашей поисковой системы.
Нажмите кнопку «Создать» внизу.
Как только ваша поисковая система будет создана, вы будете направлены на страницу настройки. Здесь найдите и скопируйте «Идентификатор поисковой системы» (также называемый «CX» в некоторых контекстах). Вы используете этот идентификатор в своем приложении, чтобы указать, какую пользовательскую поисковую систему использовать для запросов.

Включите пользовательский поиск API для вашего проекта:

Посетите Google Cloud Console.
Перейдите к «API & Services»> «Библиотека».
Поиск «API пользовательского поиска».
Нажмите на него, и вы должны увидеть кнопку «Включить». Нажмите эту кнопку, чтобы включить пользовательский API поиска для вашего проекта.

Наконец, добавьте следующие переменные среды в файл .env:

    GOOGLE_CLOUD_API_KEY='<google cloud api key>'
    CUSTOM_SEARCH_ENGINE_ID='<custom search engine id>'

Использование

Использование потокового пользовательского интерфейса

We've provided a Streamlit interface for running this application. Чтобы использовать его:

Запустите приложение Streamlit, используя поэзию:
```
poetry run streamlit run streamlit_run.py
```
Открыть http://localhost:8501

Вы можете легко ввести необходимые параметры (например, тип модели, ключевое слово и описание) через пользовательский интерфейс и генерировать свой потрясающий список!

Прямое использование кода

Основным классом, используемым в этом проекте, является AwesomeListGenerator . Этот класс принимает следующие параметры:

keyword : строка, представляющая ключевое слово, для которого будет создан потрясающий список.
description : строка, предоставляющая описание, связанное с ключевым словом.
model : строка, представляющая модель OpenAI, которая будет использоваться для генерации разметки (по умолчанию «GPT-3.5-Turbo-16K»).
data_extraction_batch_size : целое число, представляющее количество элементов данных для обработки в каждой партии (по умолчанию 10). Например, если размер партии составляет 10, то данные будут извлечены из источников данных в партиях 10 (например, 10 проектов GitHub за раз).
number_of_results : целое число, представляющее количество результатов, полученных из каждого источника данных (по умолчанию 20). Количество результатов для извлечения из каждого источника данных (по умолчанию составляет 20). Например, Fetch 20 Github Projects затем обрабатывают их с моделью LLM в партиях на основе DATA_EXTRACTION_BATCH_SIZE.

После инициализации класса с этими параметрами вызовите метод save_and_return_awesome_list , чтобы сгенерировать файл разметки. Вот пример:

 # Initialize an instance of the AwesomeListGenerator
generator = AwesomeListGenerator ( keyword = "Your Keyword" ,
                                 description = "Your Description" ,
                                 model = "gpt-3.5-turbo-16k" ,
                                 data_extraction_batch_size = 10 ,
                                 number_of_results = 20 )
# Generate and save the markdown
markdown_content = generator . save_and_return_awesome_list ()

Программа будет генерировать файл разметки в каталоге output , названном в честь вашего ключевого слова (например, Your_Keyword.md ). Этот файл содержит «потрясающий список», сгенерированный программой.

Как это работает? ️

Программа AwesomeListGenerator работает на двух основных этапах: очистка данных и обработка данных.

Сокращение данных? ️

На этапе очистки данных программа получает ресурсы, связанные с предоставленным вашим ключевым словом из нескольких источников данных. В настоящее время ресурсы включают репозитории GitHub, статьи Google Scholar, видео на YouTube и подкасты. Программа использует специализированные скребки для каждого источника, каждый из которых предназначен для получения наиболее важных и высококачественных ресурсов.

Например, скребок Github приносит репозитории, которые соответствуют ключевому слову, отсортируемому по количеству звезд (общий индикатор релевантности и качества хранилища). Аналогичным образом, Google Scholar Scraper извлекает статьи, связанные с ключевым словом и отсортированным по количеству цитирования.

Обработка данных?

После того, как данные скрещены, они передаются на этап обработки данных. На этом этапе программа использует выбранную модель GPT для обработки извлекаемых ресурсов. Модель фильтрует и оценивает ресурсы на основе актуальности ключевого слова, качества контента и потенциальной полезности для пользователей. Модель GPT также форматирует данные в список разметки, добавляя необходимое форматирование, такое как ссылки и краткие описания.

Примечательно, что операции как соскоба, так и обработки выполняются в партиях. Эта пакетная операция позволяет программе поддерживать столько результатов, сколько необходимо, на основе настройки number_of_results и data_extraction_batch_size . Таким образом, вы контролируете степень обработки данных за раз, обеспечивая эффективное использование ресурсов.

Расширение и вклад

Мы стремимся расширить количество источников данных в будущем. Вот некоторые идеи, которые мы имеем в виду:

Соскажите ресурсы от среднего.
Поиск связанных книг с использованием Google Books или Amazon API.
Получите сообщения в блоге от Dev.to и других платформ, ориентированных на разработчиков.
Получить документы с серверов препринта, таких как arxiv и biorxiv.
Извлеките соответствующие ресурсы с платформ онлайн -курсов, таких как Coursera, Udemy и Khan Academy.

Если вы заинтересованы в содействии, вы можете выбрать одну из вышеуказанных задач или предложить свои собственные идеи. Мы приветствуем всевозможные взносы и ценим ваш интерес к нашему проекту!

Контрольный список TODO

Проекты, созданные с использованием нашего инструмента

Awesome Auto-GPT-этот потрясающий список посвящен Auto-GPT, новаторскому проекту с открытым исходным кодом, который демонстрирует возможности языковой модели GPT-4. Auto-GPT находится на переднем крае ИИ, беспрепятственно объединяет вместе «мысли» с большой языком (LLM), чтобы автономно выполнить любые заданные цели, переопределяя границы того, что может сделать ИИ.
Awesome Automatic11111 (A1111) Стабильный диффузионный Webui - потрясающий список, сосредоточенные на стабильной диффузионной диффузионной Webui Automatic1111111111111111111111 гг. This tool simplifies the process of creating realistic images from textual or visual inputs, and its user-friendly interface, built on Gradio, makes web-based interaction with machine learning models more accessible.
Удивительные разговоры по ИИ - этот удивительный список фокусируется на захватывающей области «Генерации« Говоря », которая включает в себя создание жизненных цифровых представлений о человеческих головах и лицах. Список включает в себя набор ключевых исследовательских работ, современные алгоритмы, важные репозитории GitHub, образовательные видео, проницательные блоги и многое другое. Он служит универсальным ресурсом для исследователей ИИ, специалистов по компьютерной графике или энтузиастов искусственного интеллекта, стремящихся углубиться в мир разговоров.

Нам нравится видеть невероятные удивительные списки, которые создает наше сообщество. Если вы использовали наш инструмент для создания потрясающего списка, не стесняйтесь сообщить нам об этом, и мы представим ваш проект здесь!

Поддержите нас ❤

Вы нашли этот проект полезным? Если это принесло вам ценность, пожалуйста, дайте нам на GitHub. Этот жест не только подтверждает наши усилия, но и помогает этому проекту охватить больше людей и продолжать развитие.

Не стесняйтесь раскошелиться на репозиторий, внести свой вклад, отправив запросы на привлечение или открыть проблему. Ваши отзывы и вклад всегда приветствуются!

Расширять

Дополнительная информация