L'Université de Stanford a mis en open source son nouveau système de rédaction d'IA STORM&Co-STORM. Ce système peut intégrer des informations multi-sources pour générer de longs articles de haute qualité basés sur une saisie de sujet simple, améliorant considérablement l'efficacité de la rédaction de recherches scientifiques. STORM utilise des questions et réponses multi-angles par des « experts LLM » et des « modérateurs LLM » pour générer des articles de manière itérative, tandis que Co-STORM génère des cartes mentales dynamiques via un dialogue multi-agents pour garantir des informations complètes. Le système permet aux utilisateurs de sélectionner librement les modes et de générer de longs articles structurés en 3 minutes, et offre la fonction de visualisation du processus de brainstorming et des exemples d'articles.
La technologie de base du système STORM&Co-STORM inclut la prise en charge de la recherche Bing et de GPT-4o mini. Son processus d'écriture automatisé est divisé en trois étapes : génération de questions multi-perspectives, génération et amélioration de plans, et génération de texte intégral. Bien que le système intègre des informations provenant de sources multiples, celles-ci peuvent être biaisées en faveur du grand public et contenir du contenu promotionnel. Co-STORM vise à résoudre le problème de l'omission d'informations et à améliorer l'efficacité de l'apprentissage. Les tests utilisateurs montrent qu'il réduit considérablement la charge cognitive. Actuellement, le système ne prend en charge que l'anglais et sera étendu à plusieurs langues à l'avenir. Le système open source STORM&Co-STORM apporte de nouvelles possibilités d'apprentissage personnalisé, rendant l'acquisition de connaissances plus pratique et efficace.

Les utilisateurs n'ont qu'à saisir des mots de sujet en anglais et le système peut générer de longs articles de haute qualité intégrant des informations multi-sources, similaires aux articles Wikipédia. Pour découvrir le système STORM, les utilisateurs peuvent choisir librement entre les modes STORM et Co-STORM. Après un sujet donné, STORM peut former un long article structuré et de haute qualité en 3 minutes.
De plus, les utilisateurs peuvent également visualiser le processus de brainstorming des différents rôles LLM en cliquant sur « Voir le processus de brainstorming ». Dans la colonne « Découvrir », les utilisateurs peuvent se référer à des articles et à des exemples de discussions générés par d'autres chercheurs, et des articles et des enregistrements de discussions générés personnellement peuvent également être trouvés dans la barre latérale « Ma bibliothèque ».

Le processus de rédaction automatisé du système STORM est divisé en trois étapes principales : la génération de questions multi-perspectives, la génération et l'amélioration des grandes lignes et la génération du texte intégral. Le système consulte les articles Wikipédia pertinents pour identifier diverses perspectives couvrant le sujet, puis simule une conversation entre un écrivain Wikipédia et un expert sur la base de sources en ligne fiables. Sur la base des connaissances inhérentes au LLM, le contenu du dialogue collecté sous différents angles est finalement soigneusement compilé dans un plan d'écriture.

Bien que STORM découvre diverses perspectives lors de la recherche sur un sujet donné, les informations collectées peuvent toujours provenir de sources grand public sur Internet et contenir du contenu promotionnel. Une autre limite de l’étude est que, même si les chercheurs se sont concentrés sur la génération d’articles de type Wikipédia à partir de zéro, ils ont uniquement envisagé de générer du texte librement organisé. Les articles Wikipédia de haute qualité rédigés par des humains contiennent généralement des données structurées et des informations multimodales.
Co-STORM vise à améliorer le problème de l'omission d'informations dans la collecte et l'intégration d'informations afin de promouvoir grandement l'efficacité de l'apprentissage. Il aide les utilisateurs à comprendre et à participer à l'organisation de l'information grâce à des modules de dialogue collaboratif multi-agents, de cartographie mentale dynamique et de génération de rapports. Les chercheurs ont mené des évaluations humaines sur 20 volontaires, comparant les performances de Co-STORM avec celles des moteurs de recherche traditionnels et du RAG Chatbot. Les résultats montrent que Co-STORM améliore considérablement la profondeur et l'étendue des informations, et 70 % des utilisateurs préfèrent Co-STORM, estimant qu'il réduit considérablement la charge cognitive.
Actuellement, le système STORM&Co-STORM ne prend en charge que l'interaction en anglais et pourrait être étendu à des capacités d'interaction multilingues à l'avenir. L'open source de ce système est le signe que nous vivons dans une époque extraordinaire où l'accès à l'information peut être entièrement adapté au niveau individuel, permettant d'apprendre n'importe quoi.
Adresse papier : https://www.arxiv.org/pdf/2408.15232
Dans l’ensemble, l’open source du système STORM&Co-STORM a apporté de nouvelles avancées dans le domaine de l’écriture assistée par intelligence artificielle, et ses fonctionnalités efficaces et pratiques méritent d’être attendues. À l'avenir, avec la mise en œuvre du support multilingue et l'amélioration continue des fonctions, ce système jouera un rôle plus important dans la recherche universitaire et dans l'écriture quotidienne.