Пылающий быстрый семантический поиск каналов раздора
ask-discord позволяет пользователям семантически искать набор сообщений о Discord. Есть два основных режима поиска:
Клонировать репозиторий :
git clone https://github.com/yourusername/ask-discord.git
cd ask-discordУстановить зависимости :
pip install -r requirements.txt Установите переменные среды : создайте файл .env в корневом каталоге и добавьте свой клавиша API OpenAI:
OPENAI_KEY = your_openai_api_keyStart Milvus : Следуйте руководству по установке Milvus, чтобы настроить и запустить Milvus. (Требует недавней установки Docker)
Сгенерируйте данные : загрузите ваши интересующие каналы, используя экспортер Chat Discord. Прочитайте это руководство, если у вас есть проблемы с получением идентификатора токена и каналов. Это не одобрение, так как каналы загрузки могут нарушать Discord TOS.
Загрузите данные : убедитесь, что файл данных JSON находится в правильном пути, указанном в configs . При необходимости измените путь в основном файле.
Запустите приложение Streamlit :
streamlit run ask-discord.py Доступ к приложению : Откройте свой веб -браузер и перейдите на http://localhost:8501 .
Chatbot , который обрабатывает запросы Milvus и взаимодействие с режимом Raw/LLM. Конфигурации управляются через словарь в ask-discord.py . К ним относятся:
OPENAI_CLIENT : экземпляр клиента Openai.CHAT_MODEL : модель для использования для чата (например, gpt-4o ).EMBEDDING_MODEL : модель для использования для генерации встраиваний.JSON_DATA_PATH : Путь к файлу данных JSON.EMBEDDING_DIMENSIONS : векторные размеры.MAX_MESSAGE_LENGTH : максимальное количество символов в сообщении, которое нужно учитывать.MIN_MESSAGE_LENGTH : минимальное количество символов в сообщении, которое нужно учитывать.COLLECTION_NAME : имя коллекции Milvus.MAX_SIMILAR_EXAMPLES : максимальное количество аналогичных сообщений для извлечения.SIMILARITY_SCORE_CUTOFF : отсечка для оценки сходства. Взносы приветствуются! Пожалуйста, отправьте запрос на привлечение или откройте вопрос, чтобы обсудить любые изменения.
Этот проект лицензирован по лицензии MIT. Смотрите файл лицензии для получения более подробной информации.