
TextNets représente les collections de textes comme des réseaux de documents et de mots. Cela offre de nouvelles possibilités de visualisation et d'analyse des textes.
Réseau des sénateurs américains et des mots utilisés dans leurs déclarations officielles à la suite du vote d'acquittement lors du procès de la destitution du Sénat en 2020 (source).
TextNets est un logiciel libre en vertu des termes de la licence publique générale GNU v3.
Les idées sous-jacentes de réseaux de texte sont présentées dans cet article:
Christopher A. Bail, «combinant le traitement du langage naturel et l'analyse des réseaux pour examiner comment les organisations de plaidoyer stimulent la conversation sur les réseaux sociaux», Actes de l'Académie nationale des sciences des États-Unis d'Amérique 113, no. 42 (2016), 11823–11828, doi: 10.1073 / pnas.1607151113.
Initialement commencé comme une implémentation Python du package TextNets de Chris Bail pour R, TextNets comprend désormais plusieurs fonctionnalités uniques pour l'extraction des termes et la pesée, la visualisation et l'analyse.
TextNets s'appuie sur Spacy, une bibliothèque de pointe pour le traitement en langue naturelle et IGRAPH pour l'analyse du réseau. Il utilise l'algorithme Leiden pour la détection de la communauté, qui est capable d'effectuer une détection de communauté sur le réseau bipartite (Word-Groupe).
TextNets est installable à l'aide des gestionnaires de packages pip et nix . Il nécessite Python 3,9 ou plus.
TextNets s'intègre parfaitement à l'excellente pile scientifique de Python. Cela signifie que vous pouvez utiliser TextNets pour analyser et visualiser vos données dans des cahiers Jupyter!
Lisez la documentation pour en savoir plus sur les fonctionnalités du package.
Utiliser des titres dans une publication savante? Veuillez citer ce document:
@article { Boy2020 ,
author = { John D. Boy } ,
title = { textnets } ,
subtitle = { A {P}ython Package for Text Analysis with Networks } ,
journal = { Journal of Open Source Software } ,
volume = { 5 } ,
number = { 54 } ,
pages = { 2594 } ,
year = { 2020 } ,
doi = { 10.21105/joss.02594 } ,
}| Documentation | https://textnets.readthedocs.io/ |
| Dépôt | https://github.com/jboynyc/textnets |
| Problèmes et idées | https://github.com/jboynyc/textnets/issues |
| PYPI | https://pypi.org/project/textnets/ |
| Fosdem '22 | https://fosdem.org/2022/schedule/event/open_research_textnets/ |
| Doi | 10.21105 / joss.02594 |
| Archive | 10.5281 / Zenodo.3866676 |