Un système open source pour décrire automatiquement les images envoyées par les utilisateurs sur les plateformes multimédias populaires. Prend en charge la discorde, la prise en charge de Slack, Messenger, Telegram, d'autres plates-formes à venir bientôt!
Décrivez automatiquement les images envoyées par les utilisateurs sur les plateformes multimédias populaires. Incroyablement utile pour les handicaps visuellement, le descripteur ingérera automatiquement les images et l'utilisera GPT-4-VISION, interprétera les images et la convertira en une représentation textuelle lisible par l'homme qui vise à donner aux utilisateurs une compréhension holistique de l'image sans avoir besoin d'être dépendant de la visuellement de voir l'image elle-même.
Prise en charge de la configuration de bot et serveur de démonstration: rejoindre ici
Python 3.9 et au-dessus sont pris en charge
Pour vous opérer avec le bot, vous devez installer les exigences, configurer vos variables d'environnement et démarrer le bot. Pour installer les exigences:
python3.9 -m pip install -r requirements.txt Ensuite, renommez sample.env à .env et remplissez-le avec vos clés API correspondantes:
DISCORD_TOKEN = " MTE..... "
OPENAI_API_KEY = " sk-....... "
DESCRIBED_CHANNELS = " mute-this-testing,blank-test "
ALLOWED_GUILDS = " 1061370086331523176 "
ADMIN_ROLES = " Admin "Les guildes autorisées sont des valeurs séparées de virgules des ID de guilde. Vous pouvez récupérer les ID de guilde en cliquant avec le bouton droit sur un serveur en haut à gauche de votre fenêtre Discord, puis en cliquant sur "Copier ID". Les noms de canaux et admin_RORES sont également sensibles à la casse et séparés par la virgule.
Vous pouvez obtenir une clé API Openai ici et apprendre à créer un bot Discord ici
Pour démarrer le bot du répertoire racine du repo, exécutez:
python -m discord_service.botUne fois que d'autres plates-formes seront prises en charge, il y aura plus de commandes pour exécuter les bots pour les autres plates-formes. De plus, une commande tout-en-un sera créée qui exécute tout.
Dans un serveur Discord, seuls les utilisateurs qui ont des rôles définis dans ADMIN_ROLES dans votre fichier d'environnement sont capables d'activer et de désactiver les descriptions d'images. Par défaut pour un serveur, les descriptions d'images sont désactivées. Vous pouvez les allumer avec:
/describe status:on
Vous pouvez les éteindre avec
/describe status:off