대중 미디어 플랫폼에서 사용자가 보낸 이미지를 자동으로 설명하기위한 오픈 소스 시스템. 현재 Discord, Slack, Messenger, Telegram, 기타 플랫폼에 대한 지원을 지원합니다!
대중 미디어 플랫폼에서 사용자가 보낸 이미지를 자동으로 설명합니다. 시각 장애인에 엄청나게 유용한 설명자는 이미지를 자동으로 수집하고 GPT-4 vision을 사용하여 이미지를 해석하고 이미지 자체를 시각적으로 볼 필요없이 이미지에 대한 전체적인 이해를 제공하는 사람이 읽을 수있는 텍스트 표현으로 변환합니다.
봇 설정 지원 및 데모 서버 : 여기에 가입하십시오
파이썬 3.9 이상이 지원됩니다
봇으로 시작하고 실행하려면 요구 사항을 설치하고 환경 변수를 설정 한 다음 봇을 시작해야합니다. 요구 사항을 설치하려면 :
python3.9 -m pip install -r requirements.txt .env 다음 sample.env 로 이름을 바꾸고 해당 API 키로 채우십시오.
DISCORD_TOKEN = " MTE..... "
OPENAI_API_KEY = " sk-....... "
DESCRIBED_CHANNELS = " mute-this-testing,blank-test "
ALLOWED_GUILDS = " 1061370086331523176 "
ADMIN_ROLES = " Admin "허용 길드는 길드 ID의 쉼표로 분리 된 값입니다. 불일치 창의 왼쪽 상단에 서버를 마우스 오른쪽 버튼으로 클릭 한 다음 "복사 ID"를 클릭하여 길드 ID를 검색 할 수 있습니다. 채널 이름과 admin_roles는 또한 대소 문자에 민감하고 쉼표가 분리되어 있습니다.
여기서 OpenAI API 키를 얻고 여기서 Discord 봇을 만드는 방법을 배울 수 있습니다.
Repo의 루트 디렉토리에서 봇을 시작하려면 실행하십시오.
python -m discord_service.bot다른 플랫폼이 지원되면 다른 플랫폼의 봇을 실행하도록 더 많은 명령이 있습니다. 또한 모든 것을 실행하는 올인원 명령이 만들어집니다.
Discord 서버 내에서는 환경 파일의 ADMIN_ROLES 에 정의 된 역할이있는 사용자 만 이미지 설명을 켜거나 끕니다. 서버의 경우 기본적으로 이미지 설명이 꺼져 있습니다. 다음과 같이 켜질 수 있습니다.
/describe status:on
당신은 그것들을 꺼질 수 있습니다
/describe status:off