Described
1.0.0
一种开源系统,用于自动描述用户在流行媒体平台上发送的图像。目前支持Discord,Slack,Messenger,Telegram和其他平台即将推出的不和谐!
自动描述用户在流行媒体平台上发送的图像。对于视力障碍的,描述者将自动摄入图像并使用GPT-4视觉效果非常有用,将解释图像并将其转换为可读的文本表示,旨在使用户对图像有整体理解,而无需依赖视觉上的图像本身。
机器人设置支持和演示服务器:在此处加入
支持Python 3.9及以上
要使用机器人进行启动并运行,您需要安装需求,设置环境变量并启动机器人。安装要求:
python3.9 -m pip install -r requirements.txt然后,将sample.env重命名为.env并用相应的API键填充:
DISCORD_TOKEN = " MTE..... "
OPENAI_API_KEY = " sk-....... "
DESCRIBED_CHANNELS = " mute-this-testing,blank-test "
ALLOWED_GUILDS = " 1061370086331523176 "
ADMIN_ROLES = " Admin "允许的公会是公会ID的逗号分开值。您可以通过右键单击Discord窗口左上方的服务器,然后单击“复制ID”来检索公会ID。频道名称和admin_roles也对病例敏感,逗号分开。
您可以在此处获取OpenAI API密钥,并在此处学习如何创建Discord Bot
要从回购的根目录启动机器人,请运行:
python -m discord_service.bot一旦支持其他平台,就会有更多命令来运行其他平台的机器人。此外,将创建一个运行所有内容的多合一命令。
在Discord Server中,仅在环境文件中ADMIN_ROLES中定义角色的用户能够打开和关闭图像描述。默认情况下,服务器的描述关闭了。您可以将它们打开:
/describe status:on
您可以将它们关闭
/describe status:off