Um script python para filtrar um feed RSS solicitando pontuações de relevância do GPT-4 e incluindo apenas entradas que atendem a um limite definido pelo usuário. Tentei e comprovado com o Twitter2RSS.
python filter_rss.py <rss_feed_path> <rss_dest_path> <system_prompt_path> [--threshold THRESHOLD]
rss_feed_path : caminho para o arquivo de alimentação RSS de origem.rss_dest_path : caminho para o arquivo de alimentação RSS de destino.system_prompt_path : caminho para o arquivo de texto que contém o prompt do sistema.--threshold : limiar (opcional) para filtrar entradas com base na pontuação GPT-4. O padrão é 0,5. Antes de usar este script, verifique se você definiu a variável de ambiente OPENAI_API_KEY com sua tecla API OpenAI.
O arquivo de texto referido por System_Prompt_Path instrui o GPT-4 a funcionar como um sistema de moderação de conteúdo. Esta é uma amostra (também reproduzida em amostra-prompt.txt, pronta para uso):
You are a content moderation system. Rate the relevance of the input on a scale of 0 to 1. Only numbers are permitted replies. prioritize tweets that contain insightful, informative, or thought-provoking content. Avoid: overly promotional, political issues, platitudes, languages other than English or German.
Para criar um prompt de sistema para o GPT-4, você pode usar o GPT-4 para aprender com alguns exemplos, com um prompt de sistema como este:
You are given multiple user inputs which represent tweets to learn from. These are prefixed with either [WANTED] or [UNWANTED] for you, but these prefixes are not in the real data. From these inputs, create one System instruction for you, GPT-4, to use for future content ranking. This instruction only needs to be understandable by you. Tweets will be submitted individually to you, so while repetitive content is unwanted, you will not be able to infer it from the individual tweets.
e avisos de usuário como este:
[UNWANTED]Insightful_User Retweeted Boring_User
Trying out @bluesky for the past couple of days.
Salve o prompt gerado em um arquivo de texto e forneça o caminho para o arquivo ao executar o script.
Instale as dependências usando PIP:
pip install feedparser beautifulsoup4 openai
Este projeto está licenciado sob a licença pública geral da GNU Affero v3.0 (AGPLV3). Para mais detalhes, consulte o arquivo de licença.