text_cleaner Télécharger - text_cleaner CODE Téléchargement

text_cleaner

Code Source AI

1.0.0

Télécharger

Nettoyage de texte avec traitement du langage naturel

? en cours

Bibliothèque Python utilisant le traitement du langage naturel (NLP) pour nettoyer facilement et rapidement le texte.

Tokenize automatique du texte, supprimer la ponctuation et les caractères spéciaux, normaliser le cas, supprimer les mots arrêtés dans divers langages, les mots STEM ... avec cette bibliothèque simple mais personnalisable.

Usage

Installer :

pip install pytext_cleaner

Exemple :

 from pytext_cleaner import TextCleaner

cleaner = TextCleaner()
cleaner.settings = ['rm_punctuation', 'rm_numeric', 'lowerize']
cleaner.lang_setting = ['italian', 'french']
clean_text = cleaner.clean_text(string_to_clean)

Personnaliser

Paramètres par défaut : ['rm_punctuation', 'rm_numeric', 'lowerize', 'rm_stopwords']

Les paramètres disponibles sont:

rm_punctuation
RM_NUMERIC
baisser
RM_STOPWORDS
stem_words
RM_LONG_WORDS

Paramètres de la langue par défaut : ['english']

Pour inclure ou exclure les mots arrêtés :

 cleaner.white_list = ['words', 'to', 'include']
cleaner.black_list = ['words', 'to', 'exclude']

Modifier le type de retour :

Par défaut, Text_Cleaner renvoie une chaîne modifiée.

Pour revenir de la liste des jetons, ajoutez Tokenize = true:

cleaner.clean_text(string_to_clean, tokenize=True)

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-09-02
taille 5.53KB
Provenant de Github

Applications connexes

Texte avec Jésus

2023-08-17
Envoyez un SMS ou mourez

2023-07-03
Nettoyant pour la maison Nettoyant pour la maison

2023-06-05
Nettoyeur de disque sage

2009-06-22
Nettoyeur de doublons

2009-06-03
Nettoyeur de registre sage

2009-05-30

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout