Un script Python pour filtrer un flux RSS en demandant des scores de pertinence de GPT-4 et n'incluant que des entrées qui répondent à un seuil défini par l'utilisateur. Essayé avec Twitter2RSS.
python filter_rss.py <rss_feed_path> <rss_dest_path> <system_prompt_path> [--threshold THRESHOLD]
rss_feed_path : Chemin vers le fichier de flux RSS source.rss_dest_path : Chemin vers le fichier de flux RSS de destination.system_prompt_path : chemin vers le fichier texte contenant l'invite système.--threshold : (facultatif) Seuil pour filtrer les entrées basées sur le score GPT-4. La valeur par défaut est 0,5. Avant d'utiliser ce script, assurez-vous d'avoir défini la variable d'environnement OPENAI_API_KEY avec votre touche API OpenAI.
Le fichier texte mentionné par System_Prompt_Path demande à GPT-4 de fonctionner comme un système de modération de contenu. Il s'agit d'un échantillon (également reproduit dans un échantillon-PROMPT.txt, prêt à l'emploi):
You are a content moderation system. Rate the relevance of the input on a scale of 0 to 1. Only numbers are permitted replies. prioritize tweets that contain insightful, informative, or thought-provoking content. Avoid: overly promotional, political issues, platitudes, languages other than English or German.
Pour créer une invite système pour GPT-4, vous pouvez utiliser GPT-4 lui-même pour apprendre de quelques exemples, avec une invite système comme celle-ci:
You are given multiple user inputs which represent tweets to learn from. These are prefixed with either [WANTED] or [UNWANTED] for you, but these prefixes are not in the real data. From these inputs, create one System instruction for you, GPT-4, to use for future content ranking. This instruction only needs to be understandable by you. Tweets will be submitted individually to you, so while repetitive content is unwanted, you will not be able to infer it from the individual tweets.
et les invites utilisateur comme ceci:
[UNWANTED]Insightful_User Retweeted Boring_User
Trying out @bluesky for the past couple of days.
Enregistrez l'invite générée dans un fichier texte et fournissez le chemin d'accès au fichier lors de l'exécution du script.
Installez les dépendances à l'aide de PIP:
pip install feedparser beautifulsoup4 openai
Ce projet est autorisé en vertu de la licence publique générale de GNU Affero v3.0 (AGPLV3). Pour plus de détails, consultez le fichier de licence.