text_cleaner download - text_cleaner source codes download

text_cleaner

AI-Quellcode

1.0.0

Herunterladen

Textreinigung mit natürlicher Sprachverarbeitung

? im Gange

Python -Bibliothek mit natürlicher Sprachverarbeitung (NLP), um den Text einfach und schnell zu reinigen.

Automatische Tokenize -Text, die Interpunktion und Sonderzeichen entfernen, den Fall normalisieren, Stopwords in verschiedenen Sprachen entfernen, MINT -Wörter ... mit dieser einfachen, aber anpassbaren Bibliothek.

Verwendung

Installation :

PIP Installieren Sie PyText_Cleaner

Beispiel :

 from pytext_cleaner import TextCleaner

cleaner = TextCleaner()
cleaner.settings = ['rm_punctuation', 'rm_numeric', 'lowerize']
cleaner.lang_setting = ['italian', 'french']
clean_text = cleaner.clean_text(string_to_clean)

Anpassen

Standardeinstellungen : ['rm_punctuation', 'rm_numeric', 'lowerize', 'rm_stopwords']

Verfügbare Einstellungen sind:

RM_PUNKTUUNG
rm_numeric
senken
RM_Stopwords
STEM_WORDS
rm_long_words

Standardspracheinstellungen : ['english']

Stopwords einschließen oder ausschließen :

 cleaner.white_list = ['words', 'to', 'include']
cleaner.black_list = ['words', 'to', 'exclude']

Rückgabetyp ändern :

Standardmäßig gibt text_cleaner eine modifizierte Zeichenfolge zurück.

Um die Liste der Token zurückzugeben, fügen Sie Tokenize = true hinzu:

cleaner.clean_text(string_to_clean, tokenize=True)

Expandieren

Zusätzliche Informationen

Version 1.0.0
Typ AI-Quellcode
Aktualisierungszeit 2025-09-02
Größe 5.53KB
Kommt von Github

Ähnliche Anwendungen

Text mit Jesus

2023-08-17
Text oder stirb

2023-07-03
Haushaltsreiniger Haushaltsreiniger

2023-06-05
Wise Disk Cleaner

2009-06-22
Duplikatreiniger

2009-06-03
Wise Registry Cleaner

2009-05-30

text_cleaner

Textreinigung mit natürlicher Sprachverarbeitung

Verwendung

Anpassen

Text mit Jesus

Text oder stirb

Haushaltsreiniger Haushaltsreiniger

Wise Disk Cleaner

Duplikatreiniger

Wise Registry Cleaner

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express